AI 视频模型正以意想不到的方式影响着世界各地每个人的生活,也包括一位远在大洋彼岸的 60 岁老奶奶。
Kimberly Fish 是一位儿童作家,和丈夫住在美国俄克拉荷马州的一个牧场里,有一个温馨的家庭,她已经 60 岁了,是几个孩子的奶奶。
而最近她又有了一个新身份—— AI 视频创作者。她使用视频模型创作的儿童动画在 YouTube 获得了很多人的喜爱,她的收入也增加了不少。
Kimberly Fish 使用的视频模型来自于一家中国 AI 公司生数科技旗下的产品 Vidu。由于视频模型技术的全球领先,目前 Vidu 是全球用户增速最快的视频模型产品,目前已覆盖 200 多个国家和地区,并正深刻改变着世界各个角落每个人的工作和生活。
60 岁奶奶的视频梦
Kimberly Fish 是一名颇有成就的儿童作家。她的小说在亚马逊上很畅销,获得过不少区域性奖项,她的书在 Kindle 上评分大多维持在 5 分(满分),多以 "comfort ( 舒适 ) " 命名,带给人满满的幸福感。
Kimberly Fish 的亚马逊主页
去年,她的编辑告诉她,人工智能正在彻底改变图书出版流程,可以帮她制作图书插画,也可以实现语音交互阅读的效果。
这引发了她的兴趣,Kimberly 一直希望将笔下童话变成视频。在某种意义上,她是一个非常全能的创作者,擅长写作,会写歌,对教育颇有研究,除了不会画画、做视频。专业视频制作的高昂成本和复杂技能,是横亘在她面前的一道门槛,她需要花很多时间学习适应,这并不像打开手机摄像头去拍摄那么简单。
她花了很大力气学习提示词工程,但她发现,不但生成时间很长,而且生成效果不可预期,制作的视频与 " 提示中写得完全不同,要么脸部会奇怪变形、融化,要么人或动物会在奇怪的地方从身体上长出多余的肢体 ",这让她很沮丧。市面上的视频生成工具生成任何一段素材,动辄都要面临小时级别的排队时间,实际推理环节的时间也很漫长。
此外她也没有足够的经费。传统的动画片制作一分钟视频上万元,S 级更是达到了 20 万元 / 分钟,即便朋友推荐的 Runway 每秒单价超过了 0.5 元,这对于她来说仍是一笔不小的支出。
直到她发现了 Vidu。
Vidu 满足了她的各种需求,它能在 10 秒内生成一个视频,几乎是 " 极速 "。这帮助 Kimberly 可以在 20 分钟内为儿童教育和娱乐视频创建 50 个场景,Vidu 的 " 参考生 " 功能让她所想即所得,支持她为家人制作动画。这个不懂视频制作的儿童作家,在这个冬天实现了自己的 " 视频自由 "。
事实上,生成速度一直是视频大模型的瓶颈。去年 7 月底,Vidu 全球上线 1.0 版本时,单片段的实测推理速度就跑进 30 秒内,实现了全球最快,今年发布的 Vidu 2.0 更是在生成速度上直接突破秒级。
" 有了 Vidu,我可以非常快速地完成动画和视频。它让我能够比以往更快地制作内容,而且它做得非常好。"
在传统图书出版行业,一张插画要用 3 个工作日完成,完成一万张插画需要 16 年时间,而借助多模态大模型,这个时间缩短到 2 周。
此外,Kimberly 认为 Vidu 帮她省去了雇佣动画师的成本。同时相比于其他视频生成工具,Vidu 进一步降低了制作成本。以 Vidu 2.0 的 720P 为例,其收费仅为行业平均的 43%。
720P 为例,目前市面上的视频模型,10 元钱平均只能生成 20 秒的视频,而 Vidu 2.0 能生成 38 秒的视频,接近行业平均水平的两倍。
Kimberly Fish 用 Vidu 制作的作品《If I Were A Cow》在 YouTube 上获得了很多点赞,她的频道已经为其贡献了三分之一的收入,很多粉丝在其频道下留言,询问如何制作内容。在 Kimberly 的启发下,有更多美国用户使用 Vidu 制作互动短剧、互动游戏等有趣的内容。
Kimberly Fish 利用 Vidu 创作的儿童动画短片《If I Were A Cow》
Kimberly Fish 的故事是 Vidu 在全球用户中掀起海啸的一个侧影。
Vidu 解决了困扰内容创作者的三个关键问题,生成速度,价格,一致性,创作者们欣喜地发现,不到百元成本,无需漫长的等待和排队就能搞定一支精美的短片。
自 2024 年 7 月底全球上线以来,Vidu 仅用了 20 天用户数就突破百万,上线 100 天用户数就突破千万,来自全球 200 个国家和地区的用户在 Vidu 平台上共计生产了上亿条视频。
一位美国年轻网友 Amir Kerr 想生成一个兔子低头手捧白球的视频,但其他 AI 都无法做到,因为它们需要像人一样的面孔,但他惊喜地发现,Vidu 2.0 成功做到了日本涌现了一批 " 新海诚 "
不仅是在美国,在有着深厚动漫历史和成熟产业的日本,也涌现出了一群专业或非专业的 AI 动漫创作者们。他们成长于高浓度的二次元日本市场,活跃于动漫圈,对使用 AI 视频模型非常积极,他们有一个共同的称呼—— " 新海诚们 "。
一位在 X 平台上很火的 35 万粉丝 AI 大 V 博主 @8co28 就是其中的一员。
他今年 30 岁,每天在推特上关注 AI 动态,是 Vidu 的第一批用户。
此前他也曾尝试用 Runway、pika、Luma 等其他产品平台,但最终成为了 Vidu 的死忠粉,因为 "Vidu 能制作出比其他平台更具魅力的视频 "。现在他每天都会使用 Vidu 来进行创作并将作品发布到 X、TikTok、YouTube、Instagram、Threads 等社交平台。
从最初的 Vidu 1.0 到现在的 Vidu 2.0,随着对 Vidu 功能越来越熟悉,他开始追求更高质量的艺术创作,也总结了一套 AI 视频制作流程。先用图生视频,再用参考生视频,最后是文生视频。"Vidu 的图生视频 " 更容易达到想要的画面,减少了创作失败偶然性。"
@8co28 用 Vidu 生成的 AI 动画
参考生是 @8co28 格外喜欢 Vidu 的一个功能。"Vidu 创作二次元动画片的参考生功能要比其他平台强得多,对大动作大动态的处理也非常出色。" 实际上参考生的功能的诞生就源于专业和非专业创作者们对于主体一致性上面的刚需,如果一个故事主体不固定,很难连贯性地讲述一个完整的故事,更别提商业化了。
从视频效果上讲,当前处在第一梯队的海内外视频生成工具都有独特偏好,Sora 喜欢添加大量运动镜头,擅长做出更准确更自然的色彩搭配,Runway 的动画生成经常带着一股老式 CGI 的感觉," 如同玩 2000 年的游戏动画 " 而 Vidu 在一致性全球领先,是用户心中的 " 以稳定性之王 "。
2024 年 Vidu 全球首发了参考生功能,而其去年 11 月全球独家发布的多主体一致性更是增强了对于多主体、场景的控制,让视频生成走向了规模化和可商业化。
用《鱿鱼游戏》场景作为参考图片制作的参考生视频,人物表情丰富,背景还原真实
一位日本 AI 创作者用一则颇具创意的场景测试了 Vidu 的多主体能力:一个女孩骑着巴哥犬去摧毁东京塔。创作者只是给了一张巴哥犬和女孩在书房打游戏的图,一段精彩的动画片段就生成了,女孩从书房打游戏瞬间切换到游戏场景中,坐着巴哥犬用密集的子弹摧毁东京塔的画面。生成的画面细节丰富,切换也颇有点蒙太奇的感觉,整体可以与 A 级动漫媲美。
" 断层优秀(ダントツ)" 这位日本 AI 创作者对于 Vidu 2.0 在动画制作方面如此评价。
实际上 Vidu 已经成为创作者们制作动漫视频的首选。很多日本网友称 Vidu 2.0 制作出的日漫短片效果,完全不输大作。
推特上有很多活跃的日本网友分享 Vidu 的创作案例。硅星人发现," 新海诚们 " 与 TikTok 日本用户的年龄层高度吻合,平均年龄在 34 岁。
AI 动画极大降低了创作者的门槛,也给了专业创作者更大的自由,当更多人成为了 " 新海城们 ",也进一步丰富了日本的动漫产业生态。
" alt="
" width="1720" height="530">
一位日本网友发帖表示,Vidu 对于动漫常见的雾气场景的表现非常优秀
不仅如此,视频模型在成本上的巨大优势正在重塑内容产业格局。
随着 1 月 15 日一部完全由 AI 生成的动画《八云与 SETSU 的怪谈事件薄》登陆关西电视频道,视频模型已经推动日本传统国艺动画业迎来剧变。巨大成本优势吸引批量动画公司积极涉足视频生成领域。
实际上即使是像宫崎骏这样知名的动漫导演,在早期时为了节约成本只能采用项目制的形式雇佣非正式员工,因为人力创作成本实在过高。
而现在有了 Vidu 这类视频模型,一个人或者几个人就可以完成整个动画制作的工作。
Discord 用户 Mori 用 Vidu 制作了一支水平极高的音乐 MV,整个制作环节都由他一人完成
爆款 AI 短剧《山海奇镜》预告片的创作者 " 闲人一坤 " 发现,以前做类似规模的动画项目,团队规模通常需要 40-50 人,现在,整个项目组不到 10 个人就能高效运转,人力需求直接降低到了原来的四分之一以下。成本上,传统的影视拍摄需要投入大量资金购买专业设备和软件,动辄几十万甚至上百万的投入。而使用 Vidu,整体的软件使用成本降到了一个完全不同的数量级,极大降低了创作的门槛和成本。
视频模型带来的降本增效或许也将给国内的动漫产业带来弯道超车的机会。
一位资深的动画导演曾私下表示,过去国产动漫受限于高昂的成本和有限的资源投入,整个国产动漫行业发展缓慢。不过他在视频模型中看到了新的机会,并第一波转型为 AI 导演。" 国产动漫或许可以借助视频模型快速崛起。因为当成本足够低时,能生成无限丰富的内容供给,旧的市场格局将被打破,AI 内容将占据重要的一席之地。" 其表示。目前他已经从 Vidu 创作的动画中获得了第一桶金。
Vidu 带来的降本增效不止在动画行业,广告制作、影视、游戏等内容生产环节,也会因最优质的视频生成工具带来新的产业变革。
目前广告商业片的传统制作流程,需要经过策划、拍摄、后期剪辑、配音等环节,拍摄周期 3-5 天,后期制作 5-15 天,一条 1 分钟广告片往往需要 1 个月才能交付。而 Vidu 2.0 的迭代,意味着 5 分钟时间就能生成 1 分钟时长的视频素材,这不仅省去了实拍环节,还节约了 90% 的后期制作工作。Vidu 渐渐成为创作者工作者不可或缺的创作助手。
赋能生产的 " 神器 "
在社交平台等看得到的地方,Vidu 在专业 / 非专业创作者群体中口口相传,而在更加垂直的 TOB 领域,Vidu 也获得了很多企业客户的青睐。
MaaS(Model as a Service ) 模型即服务,是现在非常流行的一种模型服务形式,核心业务是基于模型底座为用户提供 API(应用程序编程接口)或定制服务。
成立于 2015 年的克鲁网络 Evoke 是 Vidu 早期的企业级客户,这是一款面向海外用户的 AI 图生视频 APP,Vidu 能针对「拥抱、亲吻」特色模板需求和「图生视频」功能需求,提供 API 接口。
Evoke 内部数据显示,自从接入 Vidu 的 API 后,在「拥抱」「亲吻」等场景上,相较于同类视频生成平台,Vidu 在模型准确率提升了超 60%,在视频生成时间上从 270 秒缩短到 35 秒,时间相对下降了近九成。用户满意度也有显著提升,可以看到用户取消视频生成的概率降低了 10%。而这些用户体验帮助 Evoke 在海外获得了更多注册用户和付费用户。
对于 Evoke 应用来说,用户留存以及获得更多用户增长的关键,一是希望用户体验丝滑,二是需要准确理解用户意图,并快速生成视频,Vidu 极好地满足了这些点。Evoke 目前面向海外用户发行了 10 余款游戏、工具和 AI 类 APP,它一方面作为 Vidu 生态的一员扩充了 Vidu 的触角,帮 Vidu 接触到更多细分的场景,另一方面借助 Vidu 大模型的能力在海外市场实现用户规模和收入双重突破。
视频生成和语言模型两大赛道各有各的使命,视频生成赛道天花板高,产品迭代快,商业化是必然之结果,但竞争也残酷异常。而今 Vidu 依靠技术红利,打破了大多数 AI 视频生成产品功能单一的局面,作为国产视频大模型,凭借技术上的优势成为全球 AI 视频生成领域的引领者。
从日本十几岁的二次元女孩,到美国俄克拉荷马州年逾半百的奶奶,这款来自中国的视频生成工具,赢得了不同国家,不同年龄层不同需求用户的认可。Vidu 依靠模型的降本、提速、产品性能的升级迭代,让视频生成行业步入到普及阶段。或许在不久的将来,Vidu 将赋能每个人成为 AI 新时代的导演。
Vidu 体验地址:www.vidu.cn
登录后才可以发布评论哦
打开小程序可以发布评论哦