明亮公司 05-21
纬钛机器人李瑞:以视触觉传感器为核心底座,打造具身智能「手感」
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

作者:MD

出品:明亮公司

过去几年,无论是工业机器人还是人形机器人,视觉、模型和运动控制持续成为行业焦点。但在真实场景中,机器人要完成抓取、插拔、装配、旋拧、处理柔性物体等任务,真正决定成败的往往并不是"看到了什么",而是"接触后如何调整动作、控制力度并稳定执行"。换句话说,机器人距离"像人一样干活",还缺一双真正有"手感"的手。

成立于2024年的纬钛机器人,"视触觉"传感器为核心底座,向上延展至夹爪、灵巧手、整机末端、手眼协同算法和多模态数据采集设备,试图为具身智能构建一套围绕"接触智能"的底层基础设施。

需要提及的是,纬钛机器人创始人、CEO李瑞是"视触觉"这一技术路线的重要开创者之一。据李瑞在2026天使投资大会上的演讲介绍,他在MIT攻读博士期间,与导师共同开创了机器人视触觉研究方向,并发明出全球首款分辨率可超越人类手指的视触觉传感器。此后十余年间,团队围绕该方向持续深耕,并推动这一原本偏学术的技术逐步走向产业化。

所谓"视触觉",即"基于视觉的触觉传感"其基本逻辑是,在传感器内部放置模拟人类手指的弹性体,当弹性体接触物体发生形变时,由内置微型摄像头捕捉图像变化,再通过算法将其还原为力、纹理、滑动等触觉信息。

与电阻、电容、霍尔效应等传统阵列式触觉传感方案相比,视触觉的核心优势在于,它将触觉问题转化为图像采集与计算问题,从而获得远高于传统方案的分辨率,并具备对法向力和切向力的多维感知能力。

这一路线的意义不止于"灵敏"。在工业和服务机器人场景中,许多高价值任务都依赖切向力信息。例如,USB或连接器插拔需要判断是否对准孔位、是否插到底;抓取不同材质和形状的物体需要实时判断是否打滑;处理衣物、线缆和食品等柔性物体时,则需要更精细的接触反馈。传统系统中,不少所谓摩擦力或切向力数据往往依赖间接估算,而视触觉则有机会提供更原生的接触信息。对于具身智能而言,这意味着机器人控制系统第一次能够以更接近人类方式理解"接触"本身。

纬钛机器人的商业化思路并非只停留在单一传感器层面。根据公司介绍,其当前产品体系大致分为三层:最底层是不同规格的视触觉传感器;中间层是搭载视触觉的夹爪、灵巧手和末端执行器;再往上则是结合机械臂、视觉系统和手眼协同算法的场景解决方案,以及多模态、跨本体的数据采集设备。公司推出的GF225、GF220等产品可装配于夹爪,使传统夹爪具备类人的感知能力;GF515则面向五指灵巧手场景,帮助灵巧手从"有结构"走向"有手感"。

从应用角度看,纬钛机器人当前主要瞄准三类任务:一是自适应抓取,即面对不同大小、硬度、形状和表面特性的物体时,机器人可以自行调整力度和姿态;二是精准放置、插拔、装配、旋拧等高接触任务;三是柔性物体处理,如衣物、线缆和易碎食品等。

对资本市场而言,纬钛机器人更值得关注的或许不是单个产品,而是它所处的位置。

公司投资方恒松资本董事长娄刚指出,具身智能未来无论采用何种上层模型和终端形态,都绕不开手眼协同与接触反馈,而原生切向力数据可能是其中最关键的底层入口之一。从这个角度看,纬钛机器人所争夺的不仅是一个传感器市场,而可能是未来具身智能生态中的关键数据接口与能力标准。

这一点也解释了公司在成立后迅速获得资本关注的原因。根据公开信息,纬钛机器人成立于2024年,成立以来已连续完成多轮融资,投资机构包括小米战投、恒松资本、祥峰、雅瑞、上海天使会等知名产业和财务投资机构。

李瑞表示,新一轮融资正在顺利推进中,但具体融资金额、估值与轮次细节尚未正式对外披露。

在2026天使投资大会期间,「明亮公司」与李瑞进行了一番交流,以下为精编整理后的访谈内容:

李瑞(来源:受访人提供)

触觉传感器关键是能让机器人干活

Q:中国和全球范围内的具身智能机器人,在进入规模化和商业化的过程中,主要瓶颈是什么?触觉传感器在解决哪些核心问题?

李瑞:我喜欢从第一性原理思考。机器人要真正服务于千行百业,需要具备的核心能力总结为"心灵手巧"。在手巧这部分,触觉传感器对人做很多操作是非常关键的。我们做90%以上的操作时,都需要手和眼的配合——触觉能感知物体的性质、大小、软硬、形状、重量,也能感知接触状态、法向力、切向力、滑动等信息。

如果只有视觉、没有触觉,你可以做一些demo,看着好像还行,但要稳定落地、达到99.999%的成功率,触觉是非常关键的闭环能力。所以我们做的东西不是可有可无的,而是未来机器人要实现像人一样操作能力的必须品。我们是具身智能生态里非常核心的一个卡位。

Q:从整个价值链来讲——大脑、小脑,还有具体的执行末端——大概的价值分布是什么?您怎么看公司的市场空间和增长空间?

李瑞:大脑(心灵)和手(手巧)是硬币的两面,缺一不可。我们做的手巧,十几年前就已经有了技术储备,但为什么到今天才开始落地?因为大模型来了,心灵这方面有了可能性,我们的手巧跟心灵搭配,才能让机器人更好地干活。

从市场空间来讲,一个通用机器人有两只胳膊、两只手,每只手就对应多个触觉传感器。假设有100万台机器人(其实100万台不算多),就对应1,000万个传感器、200万只手。这个规模是非常大的。特斯拉公开说现在最难的部分就是手,这也印证了这个方向的重要性。

Q:有一种说法是做具身本体必须做全栈。作为一个关键部件的创新企业,怎么看这一布局思路?

李瑞:大家会有不同的生态位——有的公司强调大脑,有的强调本体,有的强调手本身。我们做的是软硬件结合、手眼协同——不仅仅是传感器本身,我们还有手眼协同的软件算法,让传感器和手真正结合起来能够产生价值、能够干活。我们一直强调的是"干活",而不是说简单的"我是一家传感器公司"。我们研发人员有相当一部分在做软件算法,让手眼协同、手眼脑结合,真正能做很多操作。

应用场景:先ToB再ToC

Q:规模化落地的场景优先级是什么?最优先的场景在哪里?

李瑞:先ToB,再ToC。ToC最难,真的进入千家万户,里面的难点非常多。ToB方面,工业场景、物流场景、商业场景等,相对可控,而且单价的价值量比较高,账比较好算,所以相对更容易先落地。

从我们客户的需求来讲,分为三类:第一类是工业物流等ToB场景;第二类是灵巧手公司,我们提供核心传感器以及配套的SDK和软件算法;第三类是带视触觉的数采设备。这三方面需求现在都在爆发。

Q:能举一个在工业场景里面的具体案例吗?

李瑞:我们有非常多头部制造业客户,很多还没有公开。可以说的一个例子是小米——他们已经公开了,在手机生产线的某些环节用到了我们的技术和产品。

总体来讲,我们对应的场景可以分为三大类:

第一大类,自适应抓取——什么东西都可以抓,就像小孩3岁以前就能抓各种食物、玩具,抓的种类可以特别多。物流分拣、上下料等都属于这一类。

第二大类,精准放置——不仅能抓起来,还能精准地放到另外一个零部件上,对应工业里的插拔装配。就像小孩会拼乐高了,可以把一个乐高块精准放到另一个乐高块上。

第三大类,柔性物体操作——衣服、线缆、食物等可变形物体。就像小孩会叠衣服、会做饭了。

具身智能赛道中国优势在于产业链、软件算法、场景数据

Q:中国和美国在整个具身智能或人形机器人产业链上,差异主要在哪里?中国相对美国的优势是什么?

李瑞:美国总体上比较偏前沿性的软件算法研究,偏"大脑"这一类。像Physical Intelligence(π)、Figure等,他们宣传时强调的是大脑有多智能,会开源一些模型。中国则相对偏在硬件基础上叠加软件算法的产品化路径。

中国的优势主要有三个:

第一,产业链优势。中国有非常丰富的上下游机器人产业链,可以快速迭代。从上春晚、翻跟头,到现在机器人跑步速度超过人类,这都得益于中国丰富的供应链,可以快速迭代。

第二,软件算法前沿性。中国在软件算法上也有非常多前沿研究,与美国的差距在缩小,在某些排行榜上,中国团队也会排在前面。

第三,场景数据优势。中国制造业非常发达,可以把机器人快速落到产线上迭代;同时全国涌现出非常多的素材工厂,做大量数据采集,这些数据反过来反哺模型,让模型更快速迭代。

当然,无论是在中国还是美国做机器人或大模型,其实有相当一部分是华人。某种程度上来讲,中美之争可能就是华人内部的竞争。

Q:关于数据,真实数据和生成数据、实采数据之间的关系,怎么看这两类数据在训练的关系

李瑞:从视频数据、仿真数据到真实数据,这几种类型各有优势。现在的趋势是越来越多地往真实数据方向发展。

主要有几种:一是用机器人本体采集的遥操作数据(teleoperation),去年比较多,很多素材工厂以此为主;二是用UMI(Universal Manipulation Interface)采集,更轻便——人拿着设备就可以到不同的地方采集,不局限在实验室,可以边干活边采集。在工厂里可以几千、几万,甚至几十万人同时采集,量可以非常大;三是第一人称视角数据(EGO-centric data),英伟达等公司也证实了这类数据的有效性。

不同数据的质量和规模不一样。有些数据容易采但质量稍低,可以用来预训练(pre-train)一个基础模型,再用更精准的数据做fine-tuning(微调)。

但无论哪种数据,现在整个行业反映的普遍缺失模态就是触觉。只靠视觉数据是不行的,必须把触觉这个模态结合进去,机器人在跟真实世界交互时,才能知道不同物体用多大的力、插拔是否到位、衣服有没有扯坏、一瓶水是否拿稳……这些都需要触觉数据。尤其是插拔装配这一类"contact rich(接触密集型)"任务——这就是为什么富士康、立讯等企业还有几十万甚至上百万工人,因为很多操作需要非常丰富的触觉信息。

Q:数据规模上,现在整体处于什么阶段?机器人的"GPT时刻"到底是什么时候?

李瑞:国外有一些代表性成果,比如"Generalist AI"系列,第一代用了约27万小时的采集数据,第二代(G-Zero和G-One)用了约50万小时,用UMI采集。他们的模型在做新任务时,只需要很短时间的微调就可以上手,在某些任务上达到了90%以上的成功率。

但几十万小时够不够建立一个真正的具身智能基础模型?我觉得远远不够,大家还在探这个上限在哪里。

我们现在看的是:G-Zero这类算不算机器人的"GPT-1时刻"?如果算,那还有GPT-2、GPT-3、GPT-3.5……OpenAI从GPT-1到GPT-3.5中间又过了好几年。机器人操作的数据不像语言,互联网上没有现成的大量积累,所以达到类似语言数据量级的时间肯定要更长。但方向已经确定了,接下来就是怎么去scale up。

 | 发福利!添加下方明亮公司主编微信有惊喜!

估值叙事

从寒武纪走势看摩尔线程、沐曦股份袁记食品和老乡鸡阿里"千问"补课雷军的声量,小米的估值英矽智能AI制药泡泡玛特做家电理想汽车的估值重构

当季公司

霸王茶姬SKP联想泡泡玛特伯希和白犀牛智达DeepSeek阿里腾讯字节SharkNinja

#领先认知

新茶饮上市收官Paradigm谈早期投资字节AI医疗独角兽Abridge访谈龚虹嘉谈「杭州六小龙」开源人形机器人马克·安德森谈AI科技霸权九阳资本跷跷板阿里与拼多多AI殊途

#一手信息

ASML洛阳钼业锅圈安琪酵母蘑菇街活力银发访谈雷鸟创新熵简科技

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 李瑞 传感器 创始人 基础设施
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论