智能科学与技术学报 ›› 2022, Vol. 4 ›› Issue (2): 246-254.doi: 10.11959/j.issn.2096-6652.202227

• 专题:自主智能体灵巧精准操作学习 • 上一篇    下一篇

基于点云的类级别物体姿态估计

栗仁武1,2, 张凌霄1,2, 高林1,2, 李淳芃1,2, 蒋浩1,2   

  1. 1 中国科学院计算技术研究所,北京 100190
    2 中国科学院大学,北京 100049
  • 出版日期:2022-06-15 发布日期:2022-06-01
  • 作者简介:栗仁武(1998− ),男,中国科学院计算技术研究所、中国科学院大学硕士生,主要研究方向为点云处理和几何深度学习
    张凌霄(1995− ),男,中国科学院计算技术研究所助理工程师,主要研究方向为计算机图形学和几何处理
    高林(1987− ),男,博士,中国科学院计算技术研究所副研究员,主要研究方向为计算机图形学和几何处理
    李淳芃(1980− ),男,博士,中国科学院计算技术研究所副研究员,主要研究方向为虚拟现实、人机交互和计算机图形学
    蒋浩(1982− ),男,博士,中国科学院计算技术研究所副研究员,主要研究方向为群体行为模拟
  • 基金资助:
    科技创新2030—“新一代人工智能”重大项目(2018AAA0103002);中科院科技服务网络计划(KFJ-STS-QYZD-129)

Category-level object pose estimation from depth point cloud

Renwu LI1,2, Lingxiao ZHANG1,2, Lin GAO1,2, Chunpeng LI1,2, Hao JIANG1,2   

  1. 1 Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China
    2 University of Chinese Academy of Sciences, Beijing 100049, China
  • Online:2022-06-15 Published:2022-06-01
  • Supported by:
    The National Key Research and Development Program of China(2018AAA0103002);Science and Technology Service Network Initiative, CAS(KFJ-STS-QYZD-129)

摘要:

针对类级别的物体姿态估计问题,提出一种仅将深度相机扫描的点云作为输入,在仅知道目标物体点云类别的情况下,准确估计目标物体三维位姿的方法。该方法不需要依赖大量的带标签的人工标注数据集,仅使用虚拟仿真技术模拟生产的数据,即可在真实数据集上取得较高的精度。该方法首先对输入点云进行背景噪声过滤,之后通过中心预测模块对点云做标准归一化,再使用基于对应类别模板点云变形的方法预测其标准坐标系坐标,最后通过最小二乘法获得目标物体的三维位姿。实验结果表明,该方法在真实数据上具有更好的泛化性能和更高的精度。

关键词: 姿态估计, 点云处理, 深度学习, 模式识别

Abstract:

Aiming at the problem of category-level object pose estimation, a method was proposed to accurately estimate the pose of the target object by only taking the point cloud scanned by the depth camera as the input, with knowing the category of input point cloud only.The method did not reply on a huge amount of labeled dataset, but used virtual data produced by simulation instead, which achieved better accuracy on real-world dataset.This method first filtered the background noise of the input point cloud.Then standardized the point cloud through the well-designed center prediction module.After that, the normalized object coordinate space would be estimated through a shape template deformation module.Finally, the pose would be obtained from least squares.Experiments on real-world dataset demonstrates that the method achieve higher accuracy and better generalization ability.

Key words: pose estimation, point cloud processing, deep learning, pattern recognition

中图分类号: 

No Suggested Reading articles found!