纬钛机器人李瑞：以视触觉传感器为核心底座，打造具身智能「手感」

作者：MD

出品：明亮公司

过去几年，无论是工业机器人还是人形机器人，视觉、模型和运动控制持续成为行业焦点。但在真实场景中，机器人要完成抓取、插拔、装配、旋拧、处理柔性物体等任务，真正决定成败的往往并不是"看到了什么"，而是"接触后如何调整动作、控制力度并稳定执行"。换句话说，机器人距离"像人一样干活"，还缺一双真正有"手感"的手。

成立于2024年的纬钛机器人，以"视触觉"传感器为核心底座，向上延展至夹爪、灵巧手、整机末端、手眼协同算法和多模态数据采集设备，试图为具身智能构建一套围绕"接触智能"的底层基础设施。

需要提及的是，纬钛机器人创始人、CEO李瑞是"视触觉"这一技术路线的重要开创者之一。据李瑞在2026天使投资大会上的演讲介绍，他在MIT攻读博士期间，与导师共同开创了机器人视触觉研究方向，并发明出全球首款分辨率可超越人类手指的视触觉传感器。此后十余年间，团队围绕该方向持续深耕，并推动这一原本偏学术的技术逐步走向产业化。

所谓"视触觉"，即"基于视觉的触觉传感"其基本逻辑是，在传感器内部放置模拟人类手指的弹性体，当弹性体接触物体发生形变时，由内置微型摄像头捕捉图像变化，再通过算法将其还原为力、纹理、滑动等触觉信息。

与电阻、电容、霍尔效应等传统阵列式触觉传感方案相比，视触觉的核心优势在于，它将触觉问题转化为图像采集与计算问题，从而获得远高于传统方案的分辨率，并具备对法向力和切向力的多维感知能力。

这一路线的意义不止于"灵敏"。在工业和服务机器人场景中，许多高价值任务都依赖切向力信息。例如，USB或连接器插拔需要判断是否对准孔位、是否插到底；抓取不同材质和形状的物体需要实时判断是否打滑；处理衣物、线缆和食品等柔性物体时，则需要更精细的接触反馈。传统系统中，不少所谓摩擦力或切向力数据往往依赖间接估算，而视触觉则有机会提供更原生的接触信息。对于具身智能而言，这意味着机器人控制系统第一次能够以更接近人类方式理解"接触"本身。

纬钛机器人的商业化思路并非只停留在单一传感器层面。根据公司介绍，其当前产品体系大致分为三层：最底层是不同规格的视触觉传感器；中间层是搭载视触觉的夹爪、灵巧手和末端执行器；再往上则是结合机械臂、视觉系统和手眼协同算法的场景解决方案，以及多模态、跨本体的数据采集设备。公司推出的GF225、GF220等产品可装配于夹爪，使传统夹爪具备类人的感知能力；GF515则面向五指灵巧手场景，帮助灵巧手从"有结构"走向"有手感"。

从应用角度看，纬钛机器人当前主要瞄准三类任务：一是自适应抓取，即面对不同大小、硬度、形状和表面特性的物体时，机器人可以自行调整力度和姿态；二是精准放置、插拔、装配、旋拧等高接触任务；三是柔性物体处理，如衣物、线缆和易碎食品等。

对资本市场而言，纬钛机器人更值得关注的或许不是单个产品，而是它所处的位置。

公司投资方恒松资本董事长娄刚指出，具身智能未来无论采用何种上层模型和终端形态，都绕不开手眼协同与接触反馈，而原生切向力数据可能是其中最关键的底层入口之一。从这个角度看，纬钛机器人所争夺的不仅是一个传感器市场，而可能是未来具身智能生态中的关键数据接口与能力标准。

这一点也解释了公司在成立后迅速获得资本关注的原因。根据公开信息，纬钛机器人成立于2024年，成立以来已连续完成多轮融资，投资机构包括小米战投、恒松资本、祥峰、雅瑞、上海天使会等知名产业和财务投资机构。

李瑞表示，新一轮融资正在顺利推进中，但具体融资金额、估值与轮次细节尚未正式对外披露。

在2026天使投资大会期间，「明亮公司」与李瑞进行了一番交流，以下为精编整理后的访谈内容：

李瑞（来源：受访人提供）

触觉传感器关键是能让机器人干活

Q：中国和全球范围内的具身智能或机器人，在进入规模化和商业化的过程中，主要瓶颈是什么？触觉传感器在解决哪些核心问题？

李瑞：我喜欢从第一性原理思考。机器人要真正服务于千行百业，需要具备的核心能力总结为"心灵手巧"。在手巧这部分，触觉传感器对人做很多操作是非常关键的。我们做90%以上的操作时，都需要手和眼的配合——触觉能感知物体的性质、大小、软硬、形状、重量，也能感知接触状态、法向力、切向力、滑动等信息。

如果只有视觉、没有触觉，你可以做一些demo，看着好像还行，但要稳定落地、达到99.999%的成功率，触觉是非常关键的闭环能力。所以我们做的东西不是可有可无的，而是未来机器人要实现像人一样操作能力的必须品。我们是具身智能生态里非常核心的一个卡位。

Q：从整个价值链来讲——大脑、小脑，还有具体的执行末端——大概的价值分布是什么？您怎么看公司的市场空间和增长空间？

李瑞：大脑（心灵）和手（手巧）是硬币的两面，缺一不可。我们做的手巧，十几年前就已经有了技术储备，但为什么到今天才开始落地？因为大模型来了，心灵这方面有了可能性，我们的手巧跟心灵搭配，才能让机器人更好地干活。

从市场空间来讲，一个通用机器人有两只胳膊、两只手，每只手就对应多个触觉传感器。假设有100万台机器人（其实100万台不算多），就对应1,000万个传感器、200万只手。这个规模是非常大的。特斯拉公开说现在最难的部分就是手，这也印证了这个方向的重要性。

Q：有一种说法是做具身本体必须做全栈。作为一个关键部件的创新企业，怎么看这一布局思路？

李瑞：大家会有不同的生态位——有的公司强调大脑，有的强调本体，有的强调手本身。我们做的是软硬件结合、手眼协同——不仅仅是传感器本身，我们还有手眼协同的软件算法，让传感器和手真正结合起来能够产生价值、能够干活。我们一直强调的是"干活"，而不是说简单的"我是一家传感器公司"。我们研发人员有相当一部分在做软件算法，让手眼协同、手眼脑结合，真正能做很多操作。

应用场景：先ToB再ToC

Q：规模化落地的场景优先级是什么？最优先的场景在哪里？

李瑞：先ToB，再ToC。ToC最难，真的进入千家万户，里面的难点非常多。ToB方面，工业场景、物流场景、商业场景等，相对可控，而且单价的价值量比较高，账比较好算，所以相对更容易先落地。

从我们客户的需求来讲，分为三类：第一类是工业物流等ToB场景；第二类是灵巧手公司，我们提供核心传感器以及配套的SDK和软件算法；第三类是带视触觉的数采设备。这三方面需求现在都在爆发。

Q：能举一个在工业场景里面的具体案例吗？

李瑞：我们有非常多头部制造业客户，很多还没有公开。可以说的一个例子是小米——他们已经公开了，在手机生产线的某些环节用到了我们的技术和产品。

总体来讲，我们对应的场景可以分为三大类：

第一大类，自适应抓取——什么东西都可以抓，就像小孩3岁以前就能抓各种食物、玩具，抓的种类可以特别多。物流分拣、上下料等都属于这一类。

第二大类，精准放置——不仅能抓起来，还能精准地放到另外一个零部件上，对应工业里的插拔装配。就像小孩会拼乐高了，可以把一个乐高块精准放到另一个乐高块上。

第三大类，柔性物体操作——衣服、线缆、食物等可变形物体。就像小孩会叠衣服、会做饭了。

具身智能赛道中国优势在于产业链、软件算法、场景数据

Q：中国和美国在整个具身智能或人形机器人产业链上，差异主要在哪里？中国相对美国的优势是什么？

李瑞：美国总体上比较偏前沿性的软件算法研究，偏"大脑"这一类。像Physical Intelligence（π）、Figure等，他们宣传时强调的是大脑有多智能，会开源一些模型。中国则相对偏在硬件基础上叠加软件算法的产品化路径。

中国的优势主要有三个：

第一，产业链优势。中国有非常丰富的上下游机器人产业链，可以快速迭代。从上春晚、翻跟头，到现在机器人跑步速度超过人类，这都得益于中国丰富的供应链，可以快速迭代。

第二，软件算法前沿性。中国在软件算法上也有非常多前沿研究，与美国的差距在缩小，在某些排行榜上，中国团队也会排在前面。

第三，场景数据优势。中国制造业非常发达，可以把机器人快速落到产线上迭代；同时全国涌现出非常多的素材工厂，做大量数据采集，这些数据反过来反哺模型，让模型更快速迭代。

当然，无论是在中国还是美国做机器人或大模型，其实有相当一部分是华人。某种程度上来讲，中美之争可能就是华人内部的竞争。

Q：关于数据，真实数据和生成数据、实采数据之间的关系，怎么看这两类数据在训练的关系？

李瑞：从视频数据、仿真数据到真实数据，这几种类型各有优势。现在的趋势是越来越多地往真实数据方向发展。

主要有几种：一是用机器人本体采集的遥操作数据（teleoperation），去年比较多，很多素材工厂以此为主；二是用UMI（Universal Manipulation Interface）采集，更轻便——人拿着设备就可以到不同的地方采集，不局限在实验室，可以边干活边采集。在工厂里可以几千、几万，甚至几十万人同时采集，量可以非常大；三是第一人称视角数据（EGO-centric data），英伟达等公司也证实了这类数据的有效性。

不同数据的质量和规模不一样。有些数据容易采但质量稍低，可以用来预训练（pre-train）一个基础模型，再用更精准的数据做fine-tuning（微调）。

但无论哪种数据，现在整个行业反映的普遍缺失模态就是触觉。只靠视觉数据是不行的，必须把触觉这个模态结合进去，机器人在跟真实世界交互时，才能知道不同物体用多大的力、插拔是否到位、衣服有没有扯坏、一瓶水是否拿稳……这些都需要触觉数据。尤其是插拔装配这一类"contact rich（接触密集型）"任务——这就是为什么富士康、立讯等企业还有几十万甚至上百万工人，因为很多操作需要非常丰富的触觉信息。

Q：数据规模上，现在整体处于什么阶段？机器人的"GPT时刻"到底是什么时候？

李瑞：国外有一些代表性成果，比如"Generalist AI"系列，第一代用了约27万小时的采集数据，第二代（G-Zero和G-One）用了约50万小时，用UMI采集。他们的模型在做新任务时，只需要很短时间的微调就可以上手，在某些任务上达到了90%以上的成功率。

但几十万小时够不够建立一个真正的具身智能基础模型？我觉得远远不够，大家还在探这个上限在哪里。

我们现在看的是：G-Zero这类算不算机器人的"GPT-1时刻"？如果算，那还有GPT-2、GPT-3、GPT-3.5……OpenAI从GPT-1到GPT-3.5中间又过了好几年。机器人操作的数据不像语言，互联网上没有现成的大量积累，所以达到类似语言数据量级的时间肯定要更长。但方向已经确定了，接下来就是怎么去scale up。

| 发福利！添加下方明亮公司主编微信有惊喜！

估值叙事

从寒武纪走势看摩尔线程、沐曦股份｜袁记食品和老乡鸡｜阿里"千问"补课｜雷军的声量，小米的估值｜英矽智能AI制药｜泡泡玛特做家电理想汽车的估值重构

当季公司

霸王茶姬｜SKP｜联想｜泡泡玛特｜伯希和｜白犀牛智达｜DeepSeek｜阿里｜腾讯｜字节｜SharkNinja

#领先认知

新茶饮上市收官｜Paradigm谈早期投资字节｜AI医疗独角兽Abridge访谈｜龚虹嘉谈「杭州六小龙」｜开源人形机器人｜马克·安德森谈AI科技霸权｜九阳资本跷跷板｜阿里与拼多多AI殊途

#一手信息

ASML｜洛阳钼业｜锅圈｜安琪酵母｜蘑菇街｜活力银发访谈｜雷鸟创新｜熵简科技

宙世代

一起剪

相关标签