第二章卷积神经网络上
这一章,我们将要介绍卷积神经网络。在深度学习领域里,相比于全连接神经网络,卷积神经网络是一种更加高效的形式呢,同时在结构上卷积神经网络更加适用于图像的识别,区别于全连接神经网络每次只能操一维向量,卷积神经网络可以一次性传入图片(经卷积核优化计算),更加适用于图片领域。
图像的认识
图片的构成原理
在讲解卷积神经网络之前,我们先要梳理一下图像的概念:所谓图像,就是用深浅不一的同色色块拼接起来再多层覆盖形成的产物。我们先从灰度图像开始讲起:


如图所示,左侧是我们的视觉域所看到的图像,而右侧则是计算机眼里的图像,我们可以观察到——它是由多个数字组成的数组矩阵,这些[0-255]的数字表示像素点的深浅,把它们拼接起来再映射对应的颜色程度,就组成了我们所看到的黑白图片。此时,只有一种颜色,我们称之为单通道。


讲完了灰度图像的概念,现在我们讲讲我们日常里最常用的RGB图像。为了显示出多种颜色,同时我们也要符合计算机显像原理(计算机显示器的内部由红绿蓝三色组成),RGB图像应运而生。我们现在看到的RGB图像是通过把三个单通道的红绿蓝图像叠在一起实现的,如上图所示(单通道图片原理与灰度相同,显然这里的RGB图片是三通道图片)
通道的的概念
此时,许多同学可能有疑惑:既然通道是图片组成的图层,那为什么我们浏览的代码所显示的channel有时候的数值远大于3(例如2565,1025),RGB可以组成所有颜色为何要如此多此一举?那么你我们需要做一个区分——此处代码所指向的通道并非是只能图层,而是经过卷积核处理过后的特征值。
全连接神经网络具有的问题
在全连接神经网络中,计算常常为一维矩阵,所以我们的处理方式是把图像裁剪拼接成一个一维矩阵进行训练,最后再拆开为训练图。但这种方法会造成数据偏移从而导致图像失真,具体方法如图所示:

这个时候我们在想,是否有一种方法能够直接进行图像训练,而不用繁杂而吃力不讨好的全连接预处理呢?于是卷积神经网络应运而生。
卷积神经网络的运算原理:
运算方法
我们将卷积核看作是一个由多个权重w组成的矩阵,而输入则选定一个子矩阵以固定步幅移动并与卷积核上权重相乘再相加所得的特征值,(有时到最后一步之前,每个输出块要加上一个偏置b)。

对于此类卷积神经网络的反向传播运算,仍是更新权重w:
w=w-a*(d(J)/dw);
b=b-a*(d(J)/dw);
y=h(wx+b);
步幅:

如图,对于44的图像特征值矩阵,步幅代表矩阵的子矩阵每次移动的幅度。如图所示,步幅为2,答案为22矩阵,若每次只移动一位,则步幅为1,答案为3*3矩阵。
以上就是卷积神经网络(上)的内容了,我们下期再见——👋
支持与分享
如果这篇文章对你有帮助,欢迎分享给更多人或打赏支持!
