36氪 11-19
腾讯混元技术负责人刘威离职创业,又一巨头暂缓Sora的故事
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

文|周鑫雨

编辑|苏建勋

《智能涌现》从多名独立信源处获悉,原腾讯 AI Lab 计算机视觉中心负责人、混元大模型技术负责人之一刘威于近日离职。

此外,AI Lab 计算机视觉中心暂时由 AI Lab 副主任俞栋管理。

对上述信息,截至发稿前,腾讯官方暂无回应。

多名从业者对《智能涌现》表示,刘威已经在新加坡创业,瞄准的还是视频生成领域

原腾讯 AI Lab 计算机视觉中心负责人、混元大模型技术负责人刘威。图源:腾讯 AI 实验室微信公众号

在腾讯,具有 " 杰出科学家头衔 " 的刘威,最为人所知的身份是腾讯混元大模型的技术负责人之一。

此前,他曾任腾讯广告多媒体 AI 中心总监,带领团队基于混元大模型,研发了广告多媒体 AI 技术矩阵,提高了腾讯的广告转化效果和广告制作效率。

种种迹象表明,在验证落地场景和商业模式前,腾讯对视频生成的投入还十分谨慎。

一名从业者表示,图像、音频是目前腾讯多模态研究的重点:" 技术成熟,成本可控,而且比较容易找场景。" 比如,2024 年 11 月,微信公众号最新版本上线了 " 朗读音色 " 功能,用 AI 实现了音色克隆。

" 在腾讯,目前 CV 研究的主力在混元团队。但总体而言,腾讯对视频生成的人力和资源投入还不是很大。" 上述从业者表示。

另有相关人士表示,腾讯 AI Lab 计算机视觉中心所配备的人力向来很少,刘威创业后又带走了多名成员," 总体而言,AI Lab 对视频生成很佛 "。

有关是否大力投入视频生成模型,如今中国互联网公司已经分成了泾渭分明的两派:

大举投入派,以字节跳动和快手为代表。2024 年 6 月,快手发布了效果轰动一时的 " 可灵 AI";同年 9 月,不甘人后的字节一口气发了两款视频生成模型:Seaweed 和 PixelDance。

这些公司的特点在于,具有丰富的视频数据资源,以及能立刻与视频生成技术相结合业务场景。

而另一暂缓投入派,如百度,则对目前视频模型的商业回报,持有较为消极的态度。

此前《智能涌现》曾独家报道,在 2024 年 Q3 总监会上,百度董事长兼 CEO 李彦宏明确表示,Sora 这种视频生成的投入周期太长了,10 年、20 年都可能拿不到业务收益,那么无论多么火爆,百度都不去做。

而腾讯对视频生成模型的态度天平,也正在向保守和观望倾斜。在明确落地场景和商业化回报之前," 类 Sora" 的视频生成模型还不会成为腾讯挺进的领域。

欢迎交流!

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

腾讯 刘威 ai lab 计算机视觉
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论