4 月 10 日下午,商汤在上海举办 "2025 技术交流日 " 活动,推出 " 日日新 SenseNova V6"(以下简称 " 日日新 V6")大模型体系。
商汤董事长兼 CEO 徐立认为,大模型发展这么多年,其实已经用完互联网上大部分文本数据。也有观点预测,到 2028 年互联网上所有文本数据将被消耗完。
不过,在徐立看来,这并不意味着整个知识(体系)都被消耗完了。徐立认为,很多知识都蕴藏在图像、视频或者 3D 模态中。但到目前为止,还没有完全把这些知识真正用来提升原来的文本,甚至是智力的能力,因为模态的融合没有做到那么好。
徐立认为,从人类学习的路径来讲,即使是知识的含量一样,多模态的学习方式可能效率会更高。从小到大学习数学、几何、物理、化学实验,甚至学习交通规则、玩游戏的说明书等都是多模态的,从数据量来讲,多模态是补充人类智能的核心要素,而从学习方法上也是更有效的。
关于商汤 " 日日新 V6",徐立表示,一些核心的指标,在纯文本和多模态的单任务和复杂任务的推理之上,商汤都居于行业前列。
徐立称,最早大家在做大模型的时候,领先的有 OpenAI。但到今年,中国在很多情况下,能够同步发布出对标甚至超越美国同期发布的模型,这也是行业认知逐步刷新的一个必然结果。
值得注意的是,此次技术开放日,商汤也推出用于人形机器人领域的世界模型,并与傅利叶机器人达成合作。
对于机器人自主决策,傅利叶创始人顾捷表示,机器人现在类似于会走路的大模型。当机器人能够预测下一步动作,它就能产生大模型。但是,目前还不确定什么时候能够真正完成 VLA(视觉语言动作模型),即语言、视觉和动作的打通。目前的卡点在于大模型的思考能力是慢性的,而机器人是快速走动的。快系统与慢系统的连接,是未来研究的方向。
每日经济新闻
登录后才可以发布评论哦
打开小程序可以发布评论哦