CNN 作为一种多层神经网络框架,已经在计算机视觉的很多任务上取得了当前最好的结果。面对不同的视觉任务,衍生出很多变种,但是其中一些主要的部件并没有发生变化。本文主要总结这些基本部件的基本原理。
卷积层(convolution layer)
输入:HxWxCxN (H: 高,W:宽 C:通道数量 N:输入数据的数量)
卷积核:FxFxCxK (F: 高、宽 C:通道数量 K:卷积核的数量)
卷积步长:S
零边:P
输出:H’=(H-F+2P)/S+1 W’=(W-f+2P)/S+1 C’=K N’=N
激活层(activaction layer)
#### 降采样层(Pooling layer)
输入:HxWxCxN (H: 高,W:宽 C:通道数量 N:输入数据的数量)
核:FxF (F: 高、宽)
卷积步长:S
零边:P
输出:H’=(H-F+2P)/S+1 W’=(W-f+2P)/S+1 C’=C N’=N
归一化层(normalization layer)
分类层(classificaion layer)
目标函数层(loss layer)
本作品采用知识共享署名 2.5 中国大陆许可协议进行许可,欢迎转载,但转载请注明来自 Sunshine 并保持转载后文章内容的完整。本人保留所有版权相关权利。