早在 2005 年的《极度恐慌》中,Monolith Productions 就通过引入 AI 的方法,让游戏中的敌人拥有了简单的思考能力,他们会通过简单的指令进行沟通、会通过玩家的行为判断威胁性,甚至会利用地图和手上的武器进行包抄等战术操作。
直到今天,极度恐慌里的人工智能系统依然是游戏界广泛学习的样本之一。
英伟达 ACE for Games 的出现,让 NPC 们能够按照设计师提前设定好的故事背景、设定以及人物性格,利用大语言模型实时生成与玩家的对话内容,让我们看到了为 NPC「注入灵魂」的一种可能性。
诸如英特尔、微星等公司,也都在开发着基于 AI 大模型的游戏辅助功能,力求让 AI 变成陪你我一起打游戏的「助手」。
不过这些操作,本质上都是在游戏里融入 AI 赋能以提升体验的做法。
但你有没有想过,有朝一日,不用游戏引擎,仅靠 AI 大模型就可以自动生成游戏了?
近日,初创公司 Decart AI 和芯片公司 Etched 宣布,在红杉资本 (Sequoia Capital) 和 Oren Zeev 等知名投资者的支持下,他们最近成功获得了 2100 万美元的融资,并打造了一款世界上首个实时、可玩、可交互的 AI 游戏—— Oasis。
(图源:Decart AI)
不同于我们以往介绍过的,在基于引擎打造的游戏中融入 AI 的做法,Oasis 被吹捧为第一个可玩的 AI 模拟「开放世界」,让玩家置身于一个完全基于大模型生成的世界中,可以移动、跳跃、拾取物品、打破砖块,并基于玩家的不同操作实时生成周边环境。
我们对于游戏的认知,或许真的要被 AI 彻底颠覆了?
想体验 Oasis 的话,方法其实还挺简单的。
目前 Decart AI 已经在网页上公开了一个完全可玩的三分钟 Demo,大家都可以通过访问 Oasis Al 的官方网站来玩游戏。
(图源:Decart AI,网址:https://oasis.decart.ai/)
对于国内用户而言,这个网页并不需要任何特殊手段连接,但是 Decart AI 表示该网页目前仅能在 Chrome 浏览器上面运行,这意味着大伙不可以在移动设备和其他浏览器(如 Safari 或 Firefox)上尝试该游戏。
为了让大家知道用不适配的浏览器打开会是什么样子,下面是一个示意图。
(图源:雷科技)
如果使用 Chorme 浏览器的话,那你会看到这样一个界面。
Oasis 默认给出了五张不同地图的基础图片,包括 Mountain Meadow、Desert Expanse、Rugged Coastline、Danse Forest 和 Village Outpost,甚至支持自己上传《我的世界》截图以生成独特的世界。
对了,还得排队来着。
还好实际排队的人不多,差不多等了小半分钟就轮到小雷的回合了,简单选个地图进入游戏,我的第一反应是——
这东西也太糊了吧!
当然,模糊是正常的。
根据官方介绍,在没有任何延迟的情况下,Oasis 在 H100 上运行时能以 360P 的分辨率实现每秒 20 帧的渲染,并实时生成视频交互内容。
对于我们这些动辄 2K/4K,120Hz/240Hz,这样的画面效果确实是有点不堪入目了。
不仅如此,即便是在公司的高速网络环境中,我在移动、转动视角时,依然能够感到明显的卡顿感,而且操作间的灵敏度忽高忽低,存在一种非常黏滞的操作感受。
(图源:雷科技)
但是,「it just work」。
这玩意居然能够真实运行起来这一点,本身就已经足够令人惊讶了。
在这个世界中闲逛,你甚至会发现 Oasis 居然基本掌握了《我的世界》 里较为复杂的游戏机制,例如建筑、空间位置、放置方块、昼夜照明、库存管理、对象理解等。
如果你能控制住自己的好奇心,不要转过头,那就能沿着默认的视野一直无限地走下去,甚至不会有太多破绽。
但是一旦你转头,你就会发现——
有什么不对劲,刚刚自己走过的绝对不是这条路。
不仅如此,当你准备重新上路的时候,你会发现前进的目标早已经不见了,甚至被替换成了一道不可名状、有点相似但又处处不同的诡异风景,周围的世界已经大不相同。
从某种意义上来说,就像是我置身于一个非欧几里得空间那样,一切物质的存在都不再遵循于常理中的透视法则。
挖掘方块?当然可以。
但是当你挖开方块之后,出现的不一定是方块下的地形,你正在挖掘的方块可能会被任意方块替换,它可能会变成栅栏、变成玻璃,或者是原样待在那里,但就是很难遇到遵循游戏规则的时候。
而且挖开方块,并不意味着你能捡起方块。
想要放置方块,最快的方法不是挖掘 - 拾取 - 放置,而且不断刷新你的角色背包,直到 Oasis 觉得你应该有一个方块,接着尽力把它拖到你的物品栏,还要注意别被随机替换成别的物品,这样才能开始搭建。
对了,即便开始搭建,也要确保你的视线不会离开方块,不然就会被 Oasis AI 刷新掉。
加上目前网页版的时间限制,这导致想在 Oasis 中搭建一个房子,变成了登天难事。
至于完成 Oasis 制定的挑战?
我在实际进行的五局游戏中,甚至都没能够发现一个除了玩家自己以外的生物,就更别提什么僵尸之类的了。
好的,体验部分就到这里,大家感兴趣的话可以自己去试试。
在经历过如此不同寻常的尝试后,我想很多人的心里都会有像我一样的疑问,这究竟是怎么实现的?
作为 Oasis 的技术支持,两家公司都发布了技术博客,其中Etched 提供算力,Decart AI 主要负责训练模型。
简单点说,Oasis Al 是种生成式 AI,它可以根据用户提供的输入生成图像或视频。
与根据用户提供的输入生成图像的 Midjourney/Dall-e,或者根据用户提供的输入生成视频的快手可灵类似,Oasis Al 会利用了经过大量《我的世界》游戏视频训练的数据,在我们游玩时实时创建对应的游戏帧。
和图像或视频生成应用不同的是,在经过训练后,Oasis 已经能够了解基础的游戏机制,例如用户面前存在台阶就需要跳过去、多个栅栏之间可以连接起来等,但是对距离和空间感的把握依然有待提高。
所以,从本质上来讲,这只是一个根据玩家交互实时演算的 AI 视频罢了。
无独有偶,今年 8 月,谷歌发布了世界上第一个完全由神经模型驱动的游戏引擎 GameNGen,可以在单个 TPU 上以超过 20 帧每秒的速度交互式模拟经典射击游戏《DOOM》。
效果的话,可以参考下面这张动图。
(图源:GameNGen)
当时就有人声称,从此不再需要游戏引擎,AI 大模型能基于扩散模型,为玩家生成实时可玩的游戏。
但是在我看来,这个未来距离我们还挺遥远。
原因其一嘛,在于资源的消耗。Oasis 背后消耗的计算资源难以估计,而最终实现的效果也仅仅是一款 360P/20FPS 的游戏,而 GameNGen 目前甚至没有可以实际游玩的 Demo 内容,对性能的要求是其中不可忽视的重要一环。
其二在于,目前 AI 其实并不能很好地掌握资源的概念。在 Oasis 的实际体验中,玩家的仓库内容和数量可以说是在持续、没有规律地变化着,这也符合我在日常大语言模型交互过程中难以让其定义常量和变量的情况。
(图源:Decart AI)
最重要的一点,在于这类 AI 制作游戏的原理。不管是《我的世界》还是《DOOM》,本质上都是在世界赛广为流传、享誉盛名的游戏杰作,这才让 AI 企业们得以获取大量的视频资源训练出对应的游戏模型。
那如果是一款新游戏呢?
只有概念、没有美术、没有设计、没有视频,没有了前任铺垫的基础,现在的 AI 制作游戏无异于空中楼阁。
Oasis 会是一个好的开始,还是另一个被大肆炒作的 AI 理念呢?或许只有时间能给我们答案。
登录后才可以发布评论哦
打开小程序可以发布评论哦