deep dive into images and convolutional models
Share Parameters across space
取图片的一小块,在上面做神经网络分析,会得到一些预测
将切片做好的神经网络作用于图片的每个区域,得到一系列输出
可以增加切片个数提取更多特征
在这个过程中,梯度的计算跟之前是一样的
Patch/Kernel:一个局部切片
Depth: 数据的深度,图像数据是三维的,长宽和RGB,神经网络的预测输出也属于一维
Stride: 移动切片的步长,影响取样的数量
在边缘上的取样影响Conv层的面积,由于移动步长不一定能整除整张图的像素宽度,不越过边缘取样会得到Valid Padding, 越过边缘取样会得到Same Padding
在Convnet上套Convnet,就可以一层一层综合局部得到的信息
将一个deep and narrow的feature层作为输入,传给一个Regular神经网络
将不同Stride的卷积用某种方式合并起来,节省卷积层的空间复杂度。
LENET-5, ALEXNET
在一个卷积层的输出层上,加一个1x1的卷积层,这样就形成了一个小型的神经网络。
对同一个卷积层输出,执行各种二次计算,将各种结果堆叠到新输出的depth方向上