上海语音Agent团队融资近亿，浙大校友创办

AI 应用风向标（公众号：ZhidxcomAI）

作者｜江宇

编辑｜漠影

智东西 2 月 28 日报道，昨日，上海多模态 Agent 创企 VUI Labs（宇生月伴）宣布完成数千万元天使 + 轮融资。本轮由同创伟业领投，老股东靖亚资本、小苗朗程持续加注，心流资本 FlowCapital 担任长期财务顾问。

据企查查公开信息显示，其此前融资经历如下：

2025 年 8 月 18 日，VUI Labs 完成天使轮融资，融资金额为数千万元，投资方包括小苗朗程、靖亚资本、小苗基金和茵源资产。

2025 年 9 月 11 日，VUI Labs 完成又一轮天使轮融资，投资方为小苗朗程。

VUI Labs 半年累计获得近亿元投资，所募资金将用于核心模型迭代、产品和商业化落地、全球人才引进及 Voice Agent 平台建设，进一步夯实公司在 " 超低延迟 + 情感交互 + 多模态智能体（Agent）+ 端侧模型 " 上的综合壁垒。

VUI Labs 成立于 2025 年初，由教育部长江学者、上海交通大学计算机学院特聘教授、人工智能学院双聘教授、听觉认知与计算声学研究中心负责人钱彦旻创办。

其联合创始人兼 CEO 梅杰，毕业于浙江大学竺可桢学院创新与创业管理强化班。

VUI Labs（宇生月伴）创始人兼 CEO 梅杰（图源：企查查）

在技术路径上，VUI Labs 基于端到端语音模型的长期积累，自研多模态情感交互语音大模型 Luna 系列。

图源：VUI Labs 官网

VUI Labs 团队于 2019 年在全球首次提出端到端语音模型训练方法。与此同时，VUI Labs 覆盖全栈语音模型技术，在超低延时、情感语音交互、情感语音生成、多说话人理解等方面对标 Google、ElevenLabs、OpenAI、Hume AI、Sesame 等语音模型厂商。

其中，作为端到端情感语音交互模型，Luna-1 在 VoiceBench 测评中获得 79.05 分，属于行业第一梯队，语音对话延迟为 1.4 秒，达到行业领先水平。

图源：VUI Labs 宇生月伴

Luna-TTS-1 语音合成模型延迟低至 200 毫秒，自然度、可控性、稳定性方面稳居 TTS 行业第一梯队。

其依托由自主可控的高吞吐数据管线持续生产的高质量语音数据，通过深度场景化优化实现稳定可靠的输出效果。

在同声传译方向，VUI Labs 团队提出 SimulMEGA（Simultaneous Generation by Mixture-of-Experts Gating）无监督策略学习框架，将基于前缀的训练与混合专家精炼器结合，在不增加推理阶段额外开销的情况下学习读写决策。

基于该框架推出的 Luna-Live-Translation-1 为可端侧部署的同声传译模型，模型大小为 500M，延迟为 1.5 秒，支持数十种语言互译，目前已在某知名手机品牌欧洲版本中落地。

产品层面，VUI Labs 于 2026 年 1 月推出首个 C 端语音智能体产品 SaySo（sayso.ai）。该产品定位为智能语音助手，围绕语音 Agent 交互构建多步规划、工具调用、长时记忆与智能体编排等能力，实现从语音交互到任务执行的完整链路。

宙世代