家政机器人可以精准拿起桌面的杯子,清洁好再准确地放回去;咖啡机器人可以像真人服务员一样,把做好的咖啡递到顾客手里……在具身智能的发展过程中,机器视觉起着至关重要的作用。
近日,位于菊园新区“嘉定科创核”的科研院所中国科学院上海微系统与信息技术研究所在机器视觉领域取得重要进展,该所仿生视觉系统实验室李嘉茂研究员团队提出全新双目立体深度估计方法,可有效提升视差预测效率和精度。
机器视觉与人类视觉原理相似,分别单独使用左右眼去观察一个物体。被视物体在两个视角中的相对位置会存在一定的偏移,人类视觉系统可以根据偏移去判断该物体的距离远近。机器视觉则使用图像采集机器模拟人眼,通过算法来判断物体的大小以及相互间的距离,并根据结果控制设备的动作。该技术是自主智能机器人、智能驾驶、元宇宙、工业检测、医疗自动化等众多领域的基础关键技术。
以往,在机器视觉进行距离判断的过程中,对采集的图像有着十分严格的精度标准。但是在实际应用环境中,图像采集往往会受到诸如碰撞、机械振动和温度变化等因素的影响,导致参数发生偏移,从而显著降低估计精度,甚至导致算法的崩溃。
“双目深度估计的主流做法是在使用前进行离线标定,对标定与校正精度要求也很高,如果在使用中出现问题就需要返厂重新标定,这在很多应用中是不现实的。”李嘉茂研究员介绍,团队另辟蹊径,基于频率滤波,降低对高标准图像的依赖性,提出全新的立体匹配方法进行预估。
在自采集数据集上,团队算法显著提升视差预测精度
频率滤波是常用的数字图像技术,通过改变图像中不同频率的成分,达到图像增强、去噪等目的。全新立体匹配方法在添加合成误差的公开数据集KITTI2015、KITTI2012、Middlebury、ETH3D和带有真实误差的自采集数据上进行验证,均表现了良好的性能,有效保证了视差预测精度。
据介绍,中国科学院上海微系统与信息技术研究所仿生视觉系统实验室主要开展无人系统视觉感知、芯片及系统关键技术研究及应用。“目前,具身智能、低空经济等未来产业快速发展,双目视觉微系统具有较为广阔的应用空间。我们提出的新方法不依赖此前的预处理,能更好地保证应用的稳定性。”李嘉茂说。
中国科学院上海微系统与
信息技术研究所双目视觉微系统
据介绍,该研究成果已被机器人领域顶级国际学术会议2025 IEEE国际机器人与自动化会议录用,这一研究得到了科技部科技创新2030、国家自然科学基金、上海市自然基金、中国科学院青促会、上海市优秀学术带头人等项目的支持。
喜欢就点个“赞”吧~↓↓↓↓