叠加的多个特征映射
到目前为止,为了简单起见,我们已经将每个卷积层表示为一个薄的二维层,但是实际上它是由几个相同大小的特征映射组成的,所以使用3D图表示其会更加准确(见图 13-6)。 在一个特征映射中,所有神经元共享相同的参数(权重和偏置,权值共享),但是不同的特征映射可能具有不同的参数。 神经元的感受野与前面描述的相同,但是它延伸到所有先前的层的特征映射。 简而言之,卷积层同时对其输入应用多个卷积核,使其能够检测输入中的任何位置的多个特征。
事实上,特征地图中的所有神经元共享相同的参数会显着减少模型中的参数数量,但最重要的是,一旦 CNN 学会识别一个位置的模式,就可以在任何其他位置识别它。 相比之下,一旦一个常规 DNN 学会识别一个位置的模式,它只能在该特定位置识别它。
而且,输入图像也由多个子图层组成:每个颜色通道一个。 通常有三种:红色,绿色和蓝色(RGB)。 灰度图像只有一个通道,但是一些图像可能更多 - 例如捕捉额外光频(如红外线)的卫星图像。
具体地,位于给定卷积层L中的特征映射k的i行,j列中的神经元连接到前一层(L-1)位于 行, 列的神经元的输出。请注意,位于同一行第i
列和第j
列但位于不同特征映射中的所有神经元都连接到上一层中完全相同神经元的输出。
公式 13-1 在一个总结前面解释的大的数学公式:它展示了如何计算卷积层中给定神经元的输出。它是计算所有投入的加权总并且加上偏置。
是卷积层(L层)特征映射k中位于第
i
行第j
列的神经元的输出.如前所述, 和 是垂直和水平的步幅, 和 是感受野的高度和宽度, 是前一层(第
l - 1
层)的特征映射的数量。是位于层
L-1
,i'
行,j'
列,特征映射k'
(或者如果前一层是输入层的通道k'
)的神经元的输出。是特征映射
k
的偏置项(在L
层中)。您可以将其视为调整特征映射k
的整体亮度的旋钮。是层
L
的特征映射k
中的任何神经元与位于行u
,列v
(相对于神经元的感受野)的输入之间的连接权重,以及特征映射k’。