关于3×3空洞卷积算法的引用
日期:2022/09/21  

《科技新时代》2022年8期

甘子阳  仁昊  郝福同

山东协和学院    山东济南   250109

摘要: 空洞卷积也叫做膨胀卷积, 或者扩张卷积。空洞卷积最初是为了解决图像分割的问题而提出的。在通用目标检测算法中,空洞卷积不仅能控制 感受野和分辨率,还能有效地提升网络的感受野,在保持特征图不变的情况下,有效利用多尺度信息,继而能够提升算法的性能。

关键词:空洞卷积、目标检测算法、3×3

 


空洞卷积是标准卷积神经网络算子的一种变体,可以控制与小的感受 并处理对象的大尺度方差, 不需要引入额外的计算。在不做 pooling 损失 信息和相同的计算条件下的情况下 加大了感受野,让每个卷积输出都包 含较大的范围的信息。空洞卷积经常使用在实时图像分割中。当网络层需 要比较大的感受野时,但计算资源有限而无法提高卷积核数量或大小时可 考虑空洞卷积。

 image.png

(a)图对应 3×3 的 1-dilated conv,和普通的卷积操作一样。 (b)图  3×3 的 2-dilated conv, 实际的卷积 kernel size 还是 3×3, 但是空洞为 一,需要注意的是空洞的位置全填进去 0,填入之后再卷积即可。此变化 (c)是 4-dilated conv 操作。

1. 为什么需要空洞卷积

扩大感野:在 deep net 如果为了增加感受野并且能够降低计算量, 就要进行降采样(pooling 或 s2/conv),但是这样虽然可以增加感受野,但 它使空间辨率降低了。 所以能在不丢失分辨率的情况下还能扩大感受野, 感受野如果能增大的话可以检测分割大目标,还有提高了分辨率,可以精 确定位目标。空间卷积就发挥了作用。并且空间卷积的运用在检测和分割 任务中也能起到不小的作用

捕获尺度上下文信息: 空洞卷积中有一个参数可以设置 dilationrate, 来说就是在卷积核中填充 dilationrate-1个 0,因此,当设置不同 dilation rate 时,感受野就会不一样,也即获取了多尺度信息。多尺度信息在视觉 任务中非常重要。

2. 特征图变,如何能利用多尺度信息

我们知道,神经元感受野的值越大就表示其能够接触到的原始图像的 范围就越大, 也就是说它可能蕴含更为全局, 语义层次更高的特征; 相反, 值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用 来大致判断每一层的抽象层次。1个 7 x 7 的卷积层的正则等效于 3 个 3 x 3 的卷积层的叠加。而这样的设计可以大幅度的减少参数,有正则化的效 果,参数少了就没那么容易发生过拟合。这也是现在绝大部分基于卷积的 层网络都在用小卷积核的原因, 常常使用 3 x 3 的卷积核一般每一层的卷 都是用 3 x 3 大小的,而每一层只要设置不同 dilation rate 时,感受野 就会不一样,也即获取了多尺度信息,当然这样操作并不影响特征图的尺 寸,这样一来,又避免下采样那样造成信息损失,同时也利用到多尺度信 息。

3. 分析不同数据集的影响

目标检测中的假阴性描述了探测器未正确定位和分类的目标。其中有 五种“假阴性”,用于识别探测器体系结构中未能检测到对象的特定组 利用这些机制, 探索不同的计算机视觉数据集(Microsoft COCO、Pascal VOCExDarkObjectNetCOD10K) 及其固有特性如何影响对象检测器假 阴性机制。我们具体分析了不同数据集中误报机制分布的变化,以及目 类和目标大小等数据集。针对实时语义分割提出的网络结构,深度分离 与空洞卷积的组合, ESPNet 上做的实验。并且说明简单的组合会带来 精度的降低,由于局部信息的丢失。为此,在深度分离空洞卷积之前,使 用了两级一维分离卷积捕获局部信息。

结果表明,目标大小和类别会影响物体检测器的假阴性机制。我们还 表明,在不同的数据集中比较单个对象类的假阴性机制可以突出数据集中 潜在的未知偏差。

4. 提出空洞卷积

在卷积中间填充 0,扩大感受野。

(1)1-dilated conv,等普通 3×3 卷积,没有填充空洞 0

(2) 2-dilated conv,卷积核 3×3, 空洞 1, 1-dilated +2-dilated =7× 7conv 小的感受野。只用 2 倍空洞卷积会忽略掉很多点, 可以与 1 倍的结 起来用。

(3)4-dilated conv卷积核 3×3,空洞 4,1-dilated + 2-dilated + 4-dilated = 15×15conv。每个元素的感受野为 15×15,与每个层相关联的 参数的数量是相同的,感受野呈指数增长,而参数数量呈线性增长。

对比统的 conv 操作,3 层 3×3 的卷积加起来,stride 为 1 的话,只 能达(kernel-1)*layer+1=7 的感受野(7->5->3),也就是和层数 layer 成线性系,而 dilated conv 的感受野是指数级的增长。

Dilated Conv 的潜在问题: kernel 并不连续, 也就是并不是所有的 pixel 会被计算到,同样会忽略掉一些点的信息。

只采用大 dilation rate conv 检测小体积效果不理想,很多像素点考虑 不到。可以做多尺度的变换,但会增加网络复杂度。

在空洞卷积提出以前,大部分的空间尺寸恢复工作都是由上采样或 卷积实现。前者通常是通过线性或双线性变换进行插值, 虽然计算量小, 但是效果有时不能满足要求;后者则是通过卷积实现, 虽然精度高,但是 参数计算量增加了。总结来说空洞卷积其实是调整感受野(多尺度信息) 同时控制分辨率的神器。

(1)控制感受野

下图是空洞卷积结构的示意图,从左到右比率(rate)分别 1、6 和 24,比率可以粗暴理解为卷积核内相邻两个权重之间的距离。从图中可以 看出,当比率为 1 的时候,空洞卷积退化为常见的卷积。

 image.png

(2)控制分辨率

除了维持空间分辨率,空洞卷积也可以像标准卷积一样通过设置输出 步长(output_stride)实现输特征图分辨率的控制。

在图像分割领域, 图像输 CNN(典型的网络比如 FCN[3]) 中,FCN 传统的 CNN一样对图像做出卷积在 pooling,降低图像尺寸的同时增大 感受野。由于图像分割预测是 pixel-wise 的输出,所以要将 pooling 后较 小的图尺寸 upsampling 到原始的图像尺寸进行预测。

FCN两个关键: 一个是 pooling 减小图像尺寸增大感受野, 另一  upsampling 扩大图像尺寸。

5. 结语

在本文中,我们提出了一个新的思路,关于空洞卷积算法的引用, 其他算法相比,我们是通过空洞卷积来实现算法的应用,空洞卷积算法的 完善与引用对今后算法检测会产生一定的作用。

考文献:

[1]邓永沧,基于卷积神经网络的数字病理图像乳腺癌识别方法研究[J]. 算机软件及计算机应用, 2021.

[2]杜井龙,基于深度卷积神经网络的 3D-MRI  图像超分辨率重建算法 研究[J].医药卫生科技, 2022.01

[3]孙霞,基于全卷积神经网络的目标检测算法研究[J].计算机软件及计 机应用, 2021.01

者简介:

阳, (2003.06— ),女,山东济宁, 主要研究方向: 医药卫生科技

苑仁昊, (2001.12— ),男,山东菏泽,主要研究方向:计算机软件及 计算机应用

同, (2003.08— ),男,山东济宁, 主要研究方向: 医学影像技术

指导老师:张桂霞,女,副教授,数字媒体技术




上一篇:没有了
下一篇:痴呆中的“重女轻男”究竟为何?
神经病学与精神病学文章

网络出版服务许可/互联网信息服务资格/中国期刊数据库/信息网络传播视听节目许可证
Copyright ©2010- 中文学术期刊源数据库 鲁ICP备2022025313号-1
本站部分信息来源于互联网,若侵犯了您的权益,请告知我们删除