基于深度学习的姿态估计方法头条

ctolib 发布于11月前 阅读826次
0 条评论

原文名称:Fast Single Shot Detection and Pose Estimation 

原文链接:https://arxiv.org/abs/1609.05590

 Patrick Poirson 1 , PhilAmmirato 1 , Cheng-Yang Fu 1 , Wei Liu 1 , Jana Koˇseck ́a 2 , Alexander C.Berg. Fast Single Shot Detection and Pose Estimation.

 

摘要

       在导航感知的应用中,我们往往不仅要获得目标的检测框,还要估计出该目标的姿态。许多研究方案也都是基于关键点提取或跟踪的估计方法做姿态估计。在本文中,我们建立一个基于快速检测的CNN网络模型,在检测目标的同时估计出该目标的姿态。该算法的关键点就在于目标的检测以及目标框及姿态角度的估计。该方法快速准确,在跟踪和定位对象及导航上可以作为一种有效的检测和估计手段。

 

相关工作    

 

        目标检测可以通过两种策略算法完成:一种为双阶段检测器,如Faster R-CNN[2],另一种为单次检测器,如SSD[3], YOLO[4]。

        Faster R-CNN[2]在PASCAL VOC,MSCOCO和ILSVRC检测取得领先结果,这种流程成为检测领域的里程碑,具有更深的特征。尽管准确,但这些方法对于嵌入式系统来说计算量过大,即使对于高端硬件,对于实时或接近实时的应用来说也太慢。 这些方法的检测速度通常以每秒帧数为单位进行测量,高精度检测器(基础 Faster R-CNN[2])最快仅以每秒7帧(FPS)运行。YOLO[4]和SSD[3]都属于单次检测器,但相比YOLO[4],SSD[3]在差不多的速度下提高了检测的准确度,具有更高的性价比。(在VOC2007测试中, 58 FPS下 72.1%mAP,对Faster R-CNN[2] 7 FPS 下mAP 73.2%,YOLO[4] 45 FPS 下mAP 63.4%)。 

        在本文中,我们以SSD[3]检测手段为蓝本,在预测边界框中的对象类别和偏移的同时,估计出该目标的姿态,来实现高速检测。

需要 登录 后回复方可回复, 如果你还没有账号你可以 注册 一个帐号。