AI 应用风向标(公众号:ZhidxcomAI)
作者|江宇
编辑|漠影
智东西 2 月 28 日报道,昨日,上海多模态 Agent 创企 VUI Labs(宇生月伴)宣布完成数千万元天使 + 轮融资。本轮由同创伟业领投,老股东靖亚资本、小苗朗程持续加注,心流资本 FlowCapital 担任长期财务顾问。
据企查查公开信息显示,其此前融资经历如下:
2025 年 8 月 18 日,VUI Labs 完成天使轮融资,融资金额为数千万元,投资方包括小苗朗程、靖亚资本、小苗基金和茵源资产。
2025 年 9 月 11 日,VUI Labs 完成又一轮天使轮融资,投资方为小苗朗程。
VUI Labs 半年累计获得近亿元投资,所募资金将用于核心模型迭代、产品和商业化落地、全球人才引进及 Voice Agent 平台建设,进一步夯实公司在 " 超低延迟 + 情感交互 + 多模态智能体(Agent)+ 端侧模型 " 上的综合壁垒。
VUI Labs 成立于 2025 年初,由教育部长江学者、上海交通大学计算机学院特聘教授、人工智能学院双聘教授、听觉认知与计算声学研究中心负责人钱彦旻创办。
其联合创始人兼 CEO 梅杰,毕业于浙江大学竺可桢学院创新与创业管理强化班。
VUI Labs(宇生月伴)创始人兼 CEO 梅杰(图源:企查查)
在技术路径上,VUI Labs 基于端到端语音模型的长期积累,自研多模态情感交互语音大模型 Luna 系列。
图源:VUI Labs 官网
VUI Labs 团队于 2019 年在全球首次提出端到端语音模型训练方法。与此同时,VUI Labs 覆盖全栈语音模型技术,在超低延时、情感语音交互、情感语音生成、多说话人理解等方面对标 Google、ElevenLabs、OpenAI、Hume AI、Sesame 等语音模型厂商。
其中,作为端到端情感语音交互模型,Luna-1 在 VoiceBench 测评中获得 79.05 分,属于行业第一梯队,语音对话延迟为 1.4 秒,达到行业领先水平。
图源:VUI Labs 宇生月伴
Luna-TTS-1 语音合成模型延迟低至 200 毫秒,自然度、可控性、稳定性方面稳居 TTS 行业第一梯队。
其依托由自主可控的高吞吐数据管线持续生产的高质量语音数据,通过深度场景化优化实现稳定可靠的输出效果。
在同声传译方向,VUI Labs 团队提出 SimulMEGA(Simultaneous Generation by Mixture-of-Experts Gating)无监督策略学习框架,将基于前缀的训练与混合专家精炼器结合,在不增加推理阶段额外开销的情况下学习读写决策。
基于该框架推出的 Luna-Live-Translation-1 为可端侧部署的同声传译模型,模型大小为 500M,延迟为 1.5 秒,支持数十种语言互译,目前已在某知名手机品牌欧洲版本中落地。
产品层面,VUI Labs 于 2026 年 1 月推出首个 C 端语音智能体产品 SaySo(sayso.ai)。该产品定位为智能语音助手,围绕语音 Agent 交互构建多步规划、工具调用、长时记忆与智能体编排等能力,实现从语音交互到任务执行的完整链路。


登录后才可以发布评论哦
打开小程序可以发布评论哦