字母榜 07-29
张一鸣的对手,多了一个又一个
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

字节的文生视频还没来。

进入 7 月,文生视频赛道动作不断:智谱 AI 推出 AI 生成视频模型智谱清言,用户可在 30 秒内免费生成 6 秒视频;快手可灵迎来全面开放测试,并正式上线会员体系,月费分为 66 元、266 元和 666 元三档。

据字母榜(ID:wujicaijing)不完全统计,仅国内,目前便有超 20 家公司推出了自研 AI 视频产品 / 模型。非凡产研数据显示,2024 年上半年,仅文生视频领域全球有 18 次融资活动,其中 12 起融资都集中在国内。

在今年 2 月份 Sora 震撼发布前后,前抖音 CEO 张楠几乎同期转岗剪映,并表示将推出一个 AI 生图和视频产品。但近半年过去,面对国内其他玩家在成为 Sora 的 " 国产平替 " 的竞赛中,字节在文生视频领域却推进缓慢。

更糟糕的是,新竞争对手还在不断赶来的路上,如今字节最新的对手是 MiniMax。

接近 MiniMax 的人士告诉字母榜,如今 MiniMax 正在内部开发视频大模型,可能会植入星野 AI 或海螺 AI 内,作为单个应用场景出现。

对此,MiniMax 商业化负责人魏伟回应称,现在包括 MiniMax 在内,各家大模型公司都在做文生视频的尝试,但对 MiniMax 来说,文生视频的技术仍在早期阶段。目前 MiniMax 对 AI 音频或 AI 视频的推出还没有明确计划。

作为国内 "AI 四小龙 " 之一,MiniMax 由闫俊杰创立,3 月,MiniMax 官宣了由阿里巴巴领投的 6 亿美元,投后估值达 25 亿美元,根据非凡产研数据,6 月,MiniMax 旗下星野 AI 的月活为 400 万人,海螺 AI 的月活为 200 万人。

不管是 MiniMax、还是智谱 AI,切入文生视频的 " 军备竞赛 ",背后都有着对流量的焦虑。

6 月 6 日,快手的文生视频大模型可灵发布,一口气把视频生成的时长提到了 2 分钟级。上线不到两月,申请内测可灵的用户已经超过了 70 万。而根据非凡产研数据,6 月,MiniMax 旗下海螺 AI 下降量为 176 万人,环比下降 19.95%。

尽管非凡产研 CEO 吴畏表示,整个 6 月,聊天类 AI 产品数据均有下滑,属于行业整体状况。但对于 MiniMax、智谱 AI 们而言,无论是开发自己的视频大模型,还是将文生视频作为单个功能场景插入原本的大模型内,都不失为一个引流的优选。

引流之外,对于坐拥短视频业务的字节而言,文生视频还将加强剪映等视频剪辑工具的能力,并有望带动平台内容供给的丰富度。

面对各路友商在文生视频领域的步步紧逼,字节不得不迎头跟上。

A

在文生视频领域效用不显的大厂,不只有字节一家。

宣布要 "All in AI" 的百度,年初推出的 AI 视频模型 UniVG 正在内测阶段,阿里达摩院推出了 AI 视频产品 " 寻光 "。

而根据晚点 LatePost 报道,2024 年一季度,字节 AI 研发团队将视频生成模型的优先级排在了前面,还挖来了原 Google 视频生成模型 VideoPoet 项目负责人蒋路。2024 年 1 月,字节推出一款 AI 视频生成工具—— MagicVideo-V2,支持从 4K 到 8K 的超高分辨率视频生成。随后 2 月,剪映推出名为 Dreamina 的 AI 绘画工具。3 个月后,剪映 Dreamina 正式更名为 " 即梦 ",上线 AI 作图和 AI 视频生成功能,生成时长为 3-12 秒。

腾讯不仅自己的 AI 实验室推出了视频生成模型 VideoCrafter2,同时腾讯混元团队还联合中山大学和香港科技大学共同研发了视频大模型 Follow-Your-Pose-v2,上传一张人物图片、提供一段动作视频,就能让图片人物模仿视频中的动作,视频可达 10 秒。

腾讯集团副总裁蒋杰更表示,腾讯混元已支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,且已拥有 16s 视频生成的能力。

继 Sora 激起文生视频讨论热潮,快手推出可灵,将文生视频从 60 秒拉长到 2-3 分钟,文生视频赛道也引发了 AI 创企们的争夺。

除了 MiniMax 和智谱 AI 之外,Morph AI 的 Morph Studio、爱诗科技的 PixVerse、MewXAI 的艺映 AI、右脑科技的 Vega AI,虽已经在 AI 视频领域占据一席之地,也在不断迭代产品。

但不是所有大模型企业都将研发 " 国产 Sora" 摆在了优先战略级。

长文本起家的月之暗面,在 OpenAI 推出文生视频模型 Sora 引发关注之际,完成了超 10 亿美元的新一轮融资。当同样由阿里领投的 MiniMax 已经传出正在研发视频大模型的消息时,月之暗面在长文本之外,仍未有新动作传出。

成立百川智能的搜狗前 CEO 王小川,更是在 3 月份一次采访中表示,百川不走 Sora 路径。他认为像 Sora 之类的文生视频模型既不靠近 AGI 理想,也不靠近现实场景,Sora 的高度、突破性、应用价值都低于 GPT。

B

大模型厂商争卷文生视频,显然是因为看好 AI 视频 " 钱景 "。

根据公开数据,早早在 APP 里支持 " 一键 AI 美颜 " 的美图,由连年亏损,到 2023 年总收入 27 亿元,同比增长 29.3%,经调整后归母净利润 3.7 亿元,同比增长 233.2%。而这一增长主要源于 AI 推动主营业务收入增长,如今美图用户每天处理数亿份图片和视频,其中约 83% 都用到了泛 AI 功能。

以美图 AI 口播视频工具开拍为例,面向 B 端用户,即抖音、小红书、B 站上的视频创作者。" 用(开拍)来拍口播可以设置字幕,滤镜美颜也会更自然,甚至美图还有专门的 APP Wink,恢复画质的功能也很好用。" 某小红书博主告诉字母榜,如今做自媒体,除了剪映之外,美图的开拍、Wink 已经成了她必用的剪辑工具。

前字节视觉技术负责人、爱诗科技创始人兼 CEO 王长虎亦表示,在过去的移动互联网时代,国民级产品一定包括抖音、TikTok、快手,视频相比语言更贴近用户,未来产品化和商业化的可能性更大。

对于尚在用投流换用户,仍处在亏损中的 AI 创企如 MiniMax 等大模型厂商们来说,文生视频已然成为极具诱惑力的商业化新场景。

更不用提,上线不到两月,申请内测可灵的用户已经超过了 70 万。在用文生视频 " 让特朗普说 rap"" 让李白跳抖肩舞 " 的互联网造梗狂欢里,AI 视频正在创造新的流量入口。

对于需要用日活和下载量证明自己的 AI 创企而言,社交平台的投流成本居高不下,研发视频大模型,将文生视频植入原本的 AI 工具内做流量入口,无疑会帮助正在亏损中的大模型初创公司,尽可能压缩成本。

此外,对于 MiniMax 们来说,想要承接由于 OpenAI 禁用 API 端口调用而寻找 " 下家 " 的 B 端用户,不论是用 AI 生成电商平台的门店物料,还是视觉创作、商业摄影、专业视频编辑、商业设计等其他领域,文生视频功能的载入,都能吸引一批 " 荷包更鼓 " 的 B 端用户。

但对于 " 不缺钱 " 的互联网大厂如字节等短视频平台," 卷 " 文生视频赛道,还有着关乎核心业务的重要考量。

在文生视频领域动作频频的剪映,既是视频创作的工具,也和抖音的内容生态息息相关。而面对快手可灵的 " 先发制人 ",美图开拍等 APP 的紧逼,对于持续引导视频创作者在创作完成后 " 一键发布到平台 " 的大厂来说,对创作入口的争夺,直接关联着背后内容生态的建构过程。

此外,无论是由抖音和博纳合作的 AI 科幻短剧《三星堆:未来启示录》,还是快手原创的 AI 奇幻短剧《山海奇镜之劈波斩浪》,对于巨头 APP 如抖音、快手而言,文生视频的 AI 技术也能够更大程度地丰富平台内容。

同时,头豹研究院数据显示,2021 年中国 AI 视频生成行业的市场规模为 800 万元,预计 2026 年,这一市场规模将达到 92.79 亿元。截至 2023 年底,该赛道已经出现了独角兽公司:Midjourney 估值 100 亿美元,Stability AI 估值 40 亿美元,Runway 估值 15 亿美元。而年初爆火出圈的 Pika,刚刚成立不到一年,已于 6 月 5 日,宣布完成 8000 万美元 B 轮融资,估值达到 4.7 亿美元。

根据非凡产研数据,2024 年上半年,仅文生视频领域全球有 18 次融资活动,其中 12 起融资都集中在国内,其中爱诗科技 A 轮融资达 1 亿元,生数科技 A 轮融资达数亿元,千万甚至亿级的融资数额,也展示了资本市场对文生视频的热切关注。

需要不断融资满足单月百万级别大模型运行费用的 AI 创企,想要把握投资人的心,也需要文生视频这个新故事。

C

但想用 AI 视频引流、做商业化,对资本市场讲出新故事,仍面临重重挑战。

2 月中旬,OpenAI 的文生视频模型 Sora 引发热议,可以生成长达 1 分钟的流畅视频,尽管 3 月 OpenAI CTO 已透露计划 " 今年晚些时候 " 正式推出 Sora,但迄今为止,Sora 仍未开放公测,仅向一些艺术家定向提供内测。

迟迟不进行公测的 Sora,或许指向的正是 AI 视频生成的质量问题。曾担任阿里巴巴智能设计实验室负责人,打造了 AI 设计平台 " 鲁班 " 的特看科技创始人吴春松(花名乐乘),也面向国内出海商家和海外本土企业推出了视频 AIGC 生成平台,他表示," 在产品面向 C 端用户的初期,用文生视频需要尝试 25 次,才能生成一次可用的视频,对于用户来说,抽卡概率太低。"

B 站某 UP 主则告诉字母榜,如今用国内几家文生视频大模型," 想要生成和文字描述准确的结果,很多情况下更看运气,尝试 10 次下来,调整后有 3-4 次能用,就已经是技术做得很不错的模型了。"

为了解决文生视频质量不稳定的问题,特看科技通过 " 文生图、图生视频 " 的技术迭代,让 AI 视频生成成功的概率从 1/25 提升到 1/10(生成 10 次成功 1 次)。但对于专业的视频创作者来说,想要真正地实现用 AI 生成可用度较高的商用视频,就不能只是社交平台上风靡的 " 复活老照片 " 这类简单易复制的操作,对于 AI 生成视频的分镜、剧情的准确性,甚至镜头效果的美观程度和一致性,都提出了更高的要求。

反观现在国内的视频大模型,即使是在时长和准确度上表现不错的可灵,也因为 " 平台用来训练模型的基础语料仍然不够,跳出擅长的美食和人像领域,视频生成的准确度就会下降。"

除了生成质量不稳定之外,文生视频的商业化路径也也并不容易走通。

除了坐拥美图秀秀这一稳定流量入口的美图,即便是国内的短视频超级 APP 抖音和快手,也尚未打造出破圈的商业化作品,更多依然是与影视制作团队的内部合作项目。

即便选择了出海,包括 5 月在海外用户量已经高达 176 万的爱诗科技 PixVerse、在海外音视频剪辑领域占据头部的字节 Capcut,商业化路径也并不明晰。在出海的 AI 视频工具内,只有 HeyGen 由于为企业定制营销数字人视频,在一年内实现了从 100 万美元到 3500 万美元的增长。

模糊不清的商业化路径,加上单月百万级别的研发成本,对于 AI 大模型厂商们来说,文生视频这场 " 大考 ",恐怕并不好过。

仍处在赔本赚吆喝阶段的文生视频赛道,某种程度上也给了张一鸣更多追赶的时间。

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

逗玩.AI

逗玩.AI

ZAKER旗下AI智能创作平台

相关标签

ai 融资 快手 ceo 抖音
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论