首页手记 ROI Pooling的相关理解及Fast...

ROI Pooling的相关理解及Fast R-CNN与R-CNN的简单对比

标签：

机器学习深度学习

ROI Pooling介绍

ROI Pooling是Pooling的一种。在CNN中，Pooling层的作用主要有两个：

引入invariance，包括translation-invariance，rotation-invariance，scale-invariance。
完成feature map的聚合，实现数据降维，防止过拟合。

ROI Pooling将不同输入尺寸的feature map（ROI）通过分块池化的方法得到固定尺寸的输出，其思想来自于SPPNet。
rbg大神在Fast RCNN中使用时，将sppnet中多尺度的池化简化为单尺度，只输出固定尺寸为（w, h）的feature map。

Fast R-CNN architecture

在Fast R-CNN网络中，原始图片经过多层卷积与池化后，得到整图的feature map。而由selective search产生的大量proposal经过映射可以得到其在feature map上的映射区域（ROIs），这些ROIs即作为ROI Pooling层的输入。

ROI Pooling时，将输入的h * w大小的feature map分割成H * W大小的子窗口（每个子窗口的大小约为h/H，w/W，其中H、W为超参数，如设定为7 x 7），对每个子窗口进行max-pooling操作，得到固定输出大小的feature map。而后进行后续的全连接层操作。

ROI Pooling的实现可以参考github上Caffe版本的代码：roi_pooling_layer.cpp

ROI Pooling层的加入对R-CNN网络的改进

在R-CNN中，整个检测的流程是：

R-CNN System

R-CNN网络的主要问题有：

使用selective search产生proposal，操作耗时，且不利于网络的整体训练和测试
产生的proposal需要经过warp操作再送入后续网络，导致图像的变形和扭曲
每一个proposal均需要单独进行特征提取，重复计算量大

现在再回头看一下图1中Fast R-CNN的结构。对比图2可以看出，ROI Pooling的加入，相对于R-CNN网络来说，至少有两个改善：

由于ROI Pooling可接受任意尺寸的输入，warp操作不再需要，这有效避免了物体的形变扭曲，保证了特征信息的真实性
不需要对每个proposal都提取特征，采用映射方式从整张图片的feature map上获取ROI feature区域

除了上述两个改进外，其实还有一点。R-CNN中在获取到最终的CNN特征后先采用SVM进行类别判断，再进行bounding-box的回归得到位置信息。整个过程是个串行的流程。这极大地影响了网络的检测速度。Fast R-CNN中则将Classification和regression的任务合二为一，变成一个multi-task的模型，实现了特征的共享与速度的进一步提升。

不知大家注意没有，Fast R-CNN只是解决了R-CNN中的两点问题，而仍然沿用了R-CNN中selective search生成proposal的方法。这一方法产生的proposal即使经过NMS也会达到2k~3k个。一方面生成过程耗时耗力，另一方面给存储也带来压力。

那么，有没有办法改进呢？答案当然是Yes。那就是Faster R-CNN的提出。

作者：Kaami
链接：https://www.jianshu.com/p/9db81f1bb439

点击查看更多内容

为 TA 点赞

若觉得本文不错，就分享一下吧！

评论

评论

共同学习，写下你的评论

评论加载中...

展开查看更多评论

作者其他优质文章

正在加载中

隔江千里

手记
篇

粉丝

39

获赞与收藏

182

关注作者，订阅最新文章

阅读免费教程

后端通用面试教程

41个小节 31416 348

网络编程入门教程

20个小节 12873 242

Pandas 入门教程

25个小节 18758 351

推荐

评论

收藏

共同学习，写下你的评论



感谢您的支持，我会继续努力的～

扫码打赏，你说多少就多少

赞赏金额会直接到老师账户

支付方式

打开微信扫一扫，即可进行扫码打赏哦

今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与放弃机会

点击
抽奖

慕课手记新用户专享福利

恭喜你，你的运气太好了，居然抽中了 100个积分！

恭喜你，抽中了价值元的专栏！

太棒了，直接落到你账户里！

积分商城里的罗技鼠标、机械键盘、
Kindle 阅读器、小米平衡车
Apple iPad （10.2英寸）、大额优惠券
在等着你去兑换了噢

作者：

免费赠送

兑换码：1111222211 复制

优惠券可用于购买实战课、体系课
无门槛使用

先去看看，有什么好东西马上兑换我爱学习，选课去


热搜

最近搜索清空

ROI Pooling的相关理解及Fast R-CNN与R-CNN的简单对比

ROI Pooling介绍

ROI Pooling层的加入对R-CNN网络的改进

阅读免费教程