fastrcnn论文 fastrcnn论文原文
2025-04-12 14:36 - 立有生活网
您好,今天小深来为大家解答以上的问题。fastrcnn论文相信很多小伙伴还不知道,现在让我们一起来看看吧!
fastrcnn论文 fastrcnn论文原文
fastrcnn论文 fastrcnn论文原文
1、目标检测是人工智能的一个重要应用,就是在中要将里面的物体识别出来,并标出物体的位置,一般需要经过两个步骤:1、分类,识别物体是什么2、定位,找出物体在哪里除了对单个物体进行检测,还要能支持对多个物体进行检测,如下图所示:这个问题并不是那么容易解决,由于物体的尺寸变化范围很大、摆放角度多变、姿态不定,而且物体有很多种类别,可以在中出现多种物体、出现在任意位置。
2、因此,目标检测是一个比较复杂的问题。
3、最直接的方法便是构建一个深度神经网络,将图像和标注位置作为样本输入,然后经过网络,再通过一个分类头(Classification head)的全连接层识别是什么物体,通过一个回归头(Regression head)的全连接层回归计算位置,如下图所示:但“回归”不好做,计算量太大、收敛时间太长,应该想办法转为“分类”,这时容易想到套框的思路,即取不同大小的“框”,让框出现在不同的位置,计算出这个框的得分,然后取得分的那个框作为预测结果,如下图所示:根据上面比较出来的得分高低,选择了右下角的黑框作为目标位置的预测。
4、但问题是:框要取多大才合适?太小,物体识别不完整;太大,识别结果多了很多其它信息。
5、那怎么办?那就各种大小的框都取来计算吧。
6、如下图所示(要识别一只熊),用各种大小的框在中进行反复截取,输入到中识别计算得分,最终确定出目标类别和位置。
7、这种方法效率很低,实在太耗时了。
8、那有没有高效的目标检测方法呢?一、R- 横空出世R-(Region ,区域卷积神经网络)可以说是利用深度学习进行目标检测的开山之作,作者Ross Girshick多次在PASCAL VOC的目标检测竞赛中折桂,2010年更是带领团队获得了终身成就奖,如今就职于Facebook的人工智能实验室(FAIR)。
9、R-算法的流程如下1、输入图像2、六、训练每张图像生成1K~2K个候选区域3、对每个候选区域,使用深度网络提取特征(AlextNet、VGG等都可以)4、将特征送入每一类的SVM 分类器,判别是否属于该类5、使用回归器精细修正候选框位置下面展开进行介绍1、生成候选区域使用Selective Search(选择性搜索)方法对一张图像生成约2000-3000个候选区域,基本思路如下:(1)使用一种过分割手段,将图像分割成小区域(2)查看现有小区域,合并可能性的两个区域,重复直到整张图像合并成一个区域位置。
10、优先合并以下区域:3、类别判断4、位置精修目标检测的衡量标准是重叠面积:许多看似准确的检测结果,往往因为候选框不够准确,重叠面积很小,故需要一个位置精修步骤,对于每一个类,训练一个线性回归模型去判定这个框是否框得完美,如下图:R-将深度学习引入检测领域后,一举将PASCAL VOC上的检测率从35.1%提升到53.7%。
11、继2014年的R-推出之后,Ross Girshick在2015年推出Fast R-,构思精巧,流程更为紧凑,大幅提升了目标检测的速度。
12、Fast R-和R-相比,训练时间从84小时减少到9.5小时,测试时间从47秒减少到0.32秒,并且在PASCAL VOC 2007上测试的准确率相无几,约在66%-67%之间。
13、Fast R-主要解决R-的以下问题:1、训练、测试时速度慢R-的一张图像内候选框之间存在大量重叠,提取特征作冗余。
14、而Fast R-将整张图像归一化后直接送入深度网络,紧接着送入从这幅图像上提取出的候选区域。
15、这些候选区域的前几层特征不需要再重复计算。
16、2、训练所需空间大1、在特征提取阶段, 通过(如AlexNet)中的conv、pooling、relu等作都不需要固定大小尺寸的输入,因此,在原始上执行这些作后,输入尺寸不同将会导致得到的feature map(特征图)尺寸也不同,这样就不能直接接到一个全连接层进行分类。
17、在Fast R-中,作者提出了一个叫做ROI Pooling的网络层,这个网络层可以把不同大小的输入映射到一个固定尺度的特征向量。
18、ROI Pooling层将每个候选区域均匀分成M×N块,对每块进行max pooling。
19、将特征图上大小不一的候选区域转变为大小统一的数据,送入下一层。
20、这样虽然输入的尺寸不同,得到的feature map(特征图)尺寸也不同,但是可以加入这个神奇的ROI Pooling层,对每个region都提取一个固定维度的特征表示,就可再通过正常的softmax进行类型识别。
21、2、在分类回归阶段, 在R-中,先生成候选框,然后再通过提取特征,之后再用SVM分类,再做回归得到具置(bbox regression)。
22、而在Fast R-中,作者巧妙的把的bbox regression也放进了神经网络内部,与区域分类合并成为了一个multi-task模型,如下图所示:实验表明,这两个任务能够共享卷积特征,并且相互促进。
23、Fast R-很重要的一个贡献是成功地让人们看到了Region Proal+(候选区域+卷积神经网络)这一框架实时检测的希望,原来多类检测真的可以在保证准确率的同时提升处理速度。
24、三、Faster R-更快更强继2014年推出R-,2015年推出Fast R-之后,目标检测界的领物Ross Girshick团队在2015年又推出一力作:Faster R-,使简单网络目标检测速度达到17fps,在PASCAL VOC上准确率为59.9%,复杂网络达到5fps,准确率78.8%。
本文到这结束,希望上面文章对大家有所帮助。
足球篮球类自媒体 足球自媒体写手

今天小然来给大家分享一些关于足球自媒体写手方面的知识吧,希望大家会喜欢哦 足球篮球类自媒体 足球自媒体写手 足球篮球类自媒体 足球自媒体写手 足球篮球类自媒体 足球自媒体写手 1、很荣···
金桔树怎么修剪枝条_金桔树怎么修剪枝条好看

盆栽金橘树去心和打顶的时间和方法 金桔树在结果期间还需继续培养树冠,并对密集的果实和枝梢进行疏剪,以促进果实的膨大,并加强枝叶间的通透性,加快树冠的形成,从而提高金桔树的产量···
私募通过互联网机构引流_互联网私募基金的投

涉及私募基金投资行为的办法有哪些 募集办法总体上是采用较为严格的行为监管。同时,募集办法也体现出了适应互联网时代募集方式的特点。募集办法中,的亮点是有条件认可了互联网基金推介···