ResNet学习心得
544 字
3 分钟
ResNet学习心得
在上一章节,我们着重介绍了有关卷积神经网络的计算原理与优化方法,这一章,我们将介绍ResNet这一个里程碑式的神经网络,它解决了朴实神经网络在训练中的层数增加导致的深度神经网络训练中的梯度消失/爆炸问题和网络深度增加时准确度饱和甚至下降的现象(退化问题)
ResNet被发明于2015年,它的优化方法大大加速了机器学习领域的研究进度,下面我将介绍它的核心创新点:残差学习。

从图中图像我们可以观测到:随着网络层增加,训练集和测试集的loss都有增加(准确度下降),那么,是什么导致了这一点呢?我们来假设是因为过拟合或梯度消失/梯度爆炸这两种原因来进行分析:
1、过拟合:过拟合现象指的是在训练集上表现的很好,但是在测试集上表现差的情况,但是从图中分析可知:数据在测试集和训练集上表现的都比较差,所以这并非训练数据不足或模型复杂度过高导致的过拟合现象。
2、梯度下降/梯度爆炸:在传统神经网络中,如果出现传递的值过小或过大,随着层数加深会导致结果失真的问题,通过前几章介绍的归一化处理可以很好的解决这个问题。

通过跳跃连接的方法,我们可以用这种映射的方式来进行计算,
果网络已经足够好**:F(x) 会接近 0,输出就是 0+x=x,相当于”我停在原地,不往下走”,不会让性能变差。 如果网络还能优化**:F(x) 会学习到需要调整的部分,比如上面例子中的 0.1。 梯度传播**:在反向传播时,梯度可以通过 x 直接传回,不会因为多层传递而消失,就像给梯度开了一条”高速公路”
优化设计:


支持与分享
如果这篇文章对你有帮助,欢迎分享给更多人或打赏支持!
相关文章 智能推荐
1
第一章-全连接神经网络
深度学习 在深度学习领域里,我们接触的第一个基础模型就是全连接神经网络,它具有层层传递的网状结构,通过一步步精密的传递运算来得到一个综合性的结果,下面我们来介绍一下全连接神经网络的构成与相关的函数用法。
前言
在正式开始之前,我们先要明确一个概念:在众多深度学习的内容当中,我们要把我们所要得的结果看作一...
2
第三章--卷积神经网络下
深度学习 在上一章中,我们介绍了卷积神经网络的图像识别原理,通道构成和计算方式,这一张我们接着上一讲的内容,继续讲解相关知识:填充,特征图计算公式,池化和多通道运算。
填充操作
在介绍填充操作之前,我们先回顾一下上一章最后的内容:步幅。步幅是卷积核在特征图中的移动“速度”。那么,在多次卷积运算过后,我们...
3
第二章卷积神经网络上
深度学习 这一章,我们将要介绍卷积神经网络。在深度学习领域里,相比于全连接神经网络,卷积神经网络是一种更加高效的形式呢,同时在结构上卷积神经网络更加适用于图像的识别,区别于全连接神经网络每次只能操一维向量,卷积神经网络可以一次性传入图片(经卷积核优化计算),更加适用于图片领域。
图像的认识
图片的构成...
4
多进程编程总结
Linux编程 本章记录笔者在多进程编程中的实验心得与感受。
1、多进程的相关概念:
1进程是程序一次执行的过程,有一定的生命周期,分为:创建态,就绪态,执行态,挂起态和死亡态。
2进程是计算机资源分配的基本单位,系统会给每个进程分配04G的虚拟内存,其中03G是用户空 间,34G是内核空间
3其中多个进程...
5
拓展单向循环链表
数据结构 —————————————本文旨在讨论计算机知识欢迎指正——————————————— 书接上回:我们已经了解了链表如何编写与前置节点和头指针两种表示方式,下面,我们来了解进阶写法———如何实现单向循环链表。 下面,我们来梳理一下循环链表的实现方式: 这是朴素的链表实现形式:
这是我们理想中的循环...
随机文章 随机推荐