永无止境的游戏:人工智能将如何创造一个新的游戏类别

早期关于游戏中的世代人工智能革命的讨论主要集中在人工智能工具如何提高游戏创作者的效率——使游戏比以前更快、更大规模地构建。虽然这是真的,但我们相信,从长远来看,最大的机会是利用人工智能不仅改变我们创建游戏的方式,还改变游戏本身的性质。
我们对生成型人工智能有机会帮助创建新的人工智能第一类游戏并大幅扩展现有类型感到兴奋。人工智能长期以来一直在创造新的游戏形式方面发挥着作用——从Rogue的程序生成的地下城(1980年)到Half-Life的有限状态机(1998年),再到Left 4 Dead的人工智能游戏总监(2008年)。深度学习的最新进展使计算机能够根据用户提示和大数据集生成新内容,这进一步改变了游戏。

早期,我们看到的一些有趣的人工智能游戏领域包括生成代理、个性化、人工智能讲故事、动态世界和人工智能副驾驶。如果成功,这些系统可以结合起来创建新的人工智能游戏类别,这些游戏可以娱乐、吸引玩家并在很长一段时间内留住玩家。
生成代理
模拟类型于1989年由Maxis的《模拟城市》拉开帷幕,玩家在其中构建和管理一个虚拟城市。如今,最受欢迎的模拟游戏是模拟人生,全世界有7000多万玩家在日常生活中管理被称为“模拟人生”的虚拟人。设计师威尔·赖特曾将《模拟人生》描述为“互动娃娃屋”

生成型人工智能可以通过大型语言模型(LLM)提供的新兴社会行为使代理更加逼真,从而极大地推动模拟类型。
今年早些时候,斯坦福大学和谷歌的一个研究小组发表了一篇关于LLM如何应用于游戏中的代理的论文。在博士生朴俊星(Joon Sung Park)的领导下,研究团队用25个类似模拟人生的代理填充了一个像素艺术沙盒世界,这些代理的行为由ChatGPT和“一种扩展LLM的架构,可以使用自然语言存储代理体验的完整记录,将这些记忆…合成更高层次的反射,并动态检索它们以计划行为。”

结果是模拟游戏潜在未来的迷人预览。从只有一个用户指定的建议,即一位经纪人想举办情人节派对开始,经纪人们独立地发出派对邀请,建立新的友谊,约对方约会,并协调在两天后准时一起参加派对。
使这种行为成为可能的是,LLM是根据社交网络的数据进行训练的,因此在他们的模型中有人类如何在各种社交环境中相互交谈和行为的构建块。在模拟游戏这样的交互式数字环境中,这些反应可以被触发,创造出令人难以置信的逼真的突发行为。

从玩家的角度来看,最终结果是:更具沉浸感的游戏。玩模拟人生或殖民地模拟RimWorld的乐趣很大程度上来自于发生的意想不到的事情,以及经受住情绪的起伏。有了社交网络语料库提供的代理行为,我们可能会看到模拟游戏,它不仅反映了游戏设计者的想象力,还反映了人类社会的不可预测性。观看这些模拟游戏可以成为下一代杜鲁门秀,以一种在今天预先写好剧本的电视或电影中不可能实现的无休止娱乐。

利用我们对富有想象力的“玩偶之家”游戏的渴望,特工本身也可以是个性化的。玩家可以根据自己或虚构人物打造一个理想的特工。Ready Player Me允许用户通过自拍生成自己的3D化身,并将其导入超过9k个游戏/应用程序。人工智能角色平台character.AI、InWorld和Convai能够创建具有自己的背景故事、个性和行为控制的自定义NPC。想创建一个霍格沃茨模拟游戏,让你和哈利波特成为室友吗?现在你可以了。

随着他们的自然语言能力,我们与代理人互动的方式也得到了扩展。如今,开发人员可以使用Eleven Labs的文本到语音模型为他们的代理生成逼真的声音。Convai最近与NVIDIA合作进行了一个病毒式演示,玩家与AI拉面厨师NPC进行自然的语音对话,对话和匹配的面部表情实时生成。人工智能伴侣应用Replika已经允许用户通过语音、视频和AR/VR与伴侣交谈。接下来,人们可以想象一款模拟游戏,玩家在旅途中通过电话或视频聊天与经纪人保持联系,然后回到电脑后点击进入更具沉浸感的游戏。

请注意,在我们看到模拟人生的完全生成版本之前,还有许多挑战需要解决。LLM在其训练数据中存在固有的偏见,这可能反映在代理行为中。在云中为全天候直播服务游戏运行规模模拟的成本在财务上可能不可行——在2天内运行25个代理需要花费研究团队数千美元的计算成本。在设备上移动模型工作负载的努力是有希望的,但仍相对较早。我们可能还需要围绕与代理人的准社会关系制定新的规范。

然而,有一点是明确的——今天对生成代理的需求巨大。在我们最近的调查中,61%的游戏工作室计划试验人工智能NPC。我们的观点是,随着智能体进入我们的日常社交领域,人工智能伴侣将很快变得司空见惯。模拟游戏提供了一个数字沙盒,我们可以在这里以有趣和不可预测的方式与我们最喜欢的人工智能同伴互动。从长远来看,模拟游戏的性质可能会发生变化,以反映这些代理不仅仅是玩具,而是潜在的朋友、家人、同事、顾问,甚至恋人。

个性化
个性化游戏的最终目标是为每个玩家提供独特的游戏体验。例如,让我们从角色塑造开始——从最初的《龙与地下城》桌面游戏到Mihoyo的《源神冲击》,几乎所有角色扮演游戏(RPG)的支柱。大多数RPG允许玩家从预设选项中进行选择,以自定义外观、性别、职业等。但是,如果你可以超越预设,为每个玩家生成一个独特的角色并贯穿始终,该怎么办?将LLM与文本到图像的扩散模型(如Stable diffusion或Midtravel)相结合的个性化角色构建器可以实现这一点。

Spellbrush的Arrowmancer是一款RPG游戏,由该公司定制的基于GAN的动画模型提供动力。Arrowmancer中的玩家可以生成一整套独特的动漫角色,包括艺术和战斗能力。这种个性化也是其货币化系统的一部分——玩家将他们的人工智能创建的角色导入自定义的gacha横幅中,在那里他们可以寻找重复的角色来加强他们的团队。

个性化也可以扩展到游戏中的项目。例如,人工智能可以帮助生成只有完成特定任务的玩家才能使用的独特武器和盔甲。Azra Games建立了一个人工智能资产管道,可以快速概念化并生成一个庞大的游戏内物品和世界对象库,为更丰富多彩的游戏铺平道路。AAA级开发商动视暴雪(Activision Blizzard)创建了暴雪扩散(Blizzard Diffusion),这是图像生成器Stable Diffusion的一个即兴片段,有助于为角色和服装生成各种概念艺术。

游戏中的文本和对话也适合个性化。世界上的迹象可能反映出玩家获得了某种头衔或地位(“因谋杀而被通缉!”)。NPC可以被设置为LLM驱动的代理人,具有不同的个性,可以适应你的行为——例如,对话可以根据玩家过去与代理人的行为而改变。我们已经在AAA游戏中看到了这个概念的成功执行——Monolith的《魔多之影》有一个复仇系统,可以根据玩家的行为为反派动态创建有趣的背景故事。这些个性化元素使每次播放都独一无二。

游戏发行商育碧最近披露了一款由LLM提供支持的对话工具Ghostwriter。出版商的作者现在使用该工具生成背景聊天和吠叫(触发事件期间的对话片段)的初稿,帮助模拟玩家周围的生活世界。通过微调,像Ghostwriter这样的工具有可能用于个性化吠叫。

从玩家的角度来看,所有这些个性化的净影响是双重的:它增加了游戏的沉浸感和可重播性。《天际线》和《侠盗猎车手5》等沉浸式开放世界游戏的角色扮演MOD的持续流行表明了对个性化故事的潜在需求。即使在今天,《侠盗猎车手》在角色扮演服务器中的玩家数量也一直高于原版游戏。我们看到了一个未来,个性化系统是一个不可或缺的实时操作工具,可以在所有游戏中长期吸引和留住玩家。

AI叙事故事
当然,一个好的游戏不仅仅是角色和对话。另一个令人兴奋的机会是利用生成人工智能讲述更好、更个性化的故事。

游戏中个性化讲故事的鼻祖是《龙与地下城》,一个被称为地下城大师的人准备一个故事,并向一群朋友讲述,每个角色都扮演故事中的角色。由此产生的叙事部分是即兴剧场,部分是RPG,这意味着每一个游戏都是独一无二的。作为个性化故事讲述需求的一个信号,如今的D&D从未像现在这样受欢迎,数字和模拟产品的销售额创下历史新高。

如今,许多公司正在将LLM应用于D&D讲故事的模式。机会在于让玩家在无限耐心的人工智能故事讲述者的指导下,在他们喜爱的玩家制作或IP宇宙中度过他们想要的时间。Latitude的AI地牢于2019年推出,是一款开放式、基于文本的冒险游戏,AI扮演地牢主人。用户还对OpenAI的GPT-4版本进行了微调,以进行D&D游戏,并取得了有希望的结果。人工智能的文字冒险游戏是该应用程序最受欢迎的模式之一。

Hidden Door更进一步,在一组特定的源材料上训练其机器学习模型,例如《绿野仙踪》,允许玩家在既定的IP宇宙中冒险。通过这种方式,Hidden Door与IP所有者合作,实现了一种新的、互动的品牌延伸形式。粉丝们一看完一部电影或一本书,就可以通过一场类似D&D的定制活动,在他们最喜欢的世界里继续冒险。粉丝体验的需求也在激增——仅在5月份,两个最大的在线粉丝库Archiveofourown.org和Wattpad的网站访问量就分别超过3.54亿和1.46亿。

NovelAI开发了自己的LLM Clio,用于在沙盒模式下讲述故事,并帮助解决人类作家的写作障碍。对于最有眼光的作家来说,NovelAI允许用户根据自己的作品,甚至是像H.P.Lovecraft或Jules Verne这样的著名作家,对Clio进行微调。
值得注意的是,在人工智能故事制作完全就绪之前,还有许多障碍。开放式人工智能可以很容易地偏离轨道,这使得它很有趣,但对游戏设计来说很笨拙。今天,要打造一个优秀的人工智能故事讲述者,需要大量的人类规则设置来创建定义一个好故事的叙事弧线。记忆和连贯性很重要——讲故事的人需要记住故事早期发生的事情,并在事实和风格上保持一致性。对于许多作为黑匣子运行的闭源LLM来说,可解释性仍然是一个挑战,而游戏设计者需要理解为什么一个系统的行为方式会改善体验。

然而,当这些障碍正在克服时,人工智能作为人类故事讲述者的副驾驶员已经在这里了。如今,数以百万计的作家使用ChatGPT为自己的故事提供灵感。娱乐工作室Scriptic融合了DALL-E、ChatGPT、Midtravel、Eleven Labs和Runway,以及一组人工编辑,构建互动、选择自己的冒险节目,今天可在Netflix上观看。

动态世界建筑
虽然基于文本的故事很受欢迎,但许多游戏玩家也渴望看到他们的故事在视觉上栩栩如生。游戏中生成人工智能的最大机会之一可能是帮助创造玩家花费无数小时的生活世界。
虽然在今天是不可行的,但一个经常被提及的愿景是随着玩家在游戏中的进展实时生成关卡和内容。科幻小说《安德的游戏》中的心灵游戏就是这种游戏的典型例子。心智游戏是一种人工智能指导的游戏,它实时适应每个学生的兴趣,根据学生的行为和人工智能可以推断的任何其他心理信息来进化世界。

如今,最接近《心灵游戏》的可能是Valve的《左4死》系列——该系列利用人工智能总监来实现动态游戏节奏和难度。人工智能总监没有为敌人(僵尸)设置产卵点,而是根据每个玩家的状态、技能和位置将僵尸放置在不同的位置和数量,在每次游戏中创造独特的体验。导演还用动态的视觉效果和音乐来设定游戏的气氛(翻译过来就是:超级恐怖!)。Valve创始人Gabe Newell创造了这个系统“程序叙事”。EA广受好评的《死亡空间》重制版使用了人工智能导演系统的变体,以最大限度地增加恐怖。
虽然这在今天看来可能是科幻小说的领域,但有一天,随着生成模型的改进和对足够计算和数据的访问,我们可能会建立一个不仅能产生跳跃恐惧,还能产生世界本身的人工智能总监。

值得注意的是,游戏中机器生成关卡的概念并不新鲜。从《超级巨人的冥王》到暴雪的《暗黑破坏神》,再到莫让的《我的世界》,当今许多最受欢迎的游戏都使用程序生成技术——这是一种使用人类设计师运行的方程式和规则集随机创建关卡的技术,每次游戏都不同。已经建立了一个完整的软件库来帮助生成过程。Unity的SpeedTree帮助开发者生成虚拟树叶,你可能在《阿凡达》中的潘多拉森林或埃尔登环的风景中看到过这些树叶。
游戏可以将程序性资产生成器与用户界面中的LLM相结合。Townscaper游戏使用一个程序系统,只需要两个玩家输入(方块位置和颜色),就可以在飞行中将它们变成华丽的城镇景观。想象一下,Townscaper在用户界面中添加了LLM,通过自然语言提示,帮助玩家迭代获得更细微、更美丽的创作。

许多开发人员也对利用机器学习增强过程生成的潜力感到兴奋。有一天,设计师可以使用在风格相似的现有级别上训练的模型,迭代生成一个可行的级别初稿。今年早些时候,Shyam Sudhakaran带领哥本哈根大学的一个团队创建了MarioGPT,这是一种GPT2工具,可以使用在《超级马里奥1》和《超级马里奥2》原始关卡上训练的模型生成《超级马里奥》关卡。这方面的学术研究已经有一段时间了,包括2018年的一个项目,该项目旨在使用生成对抗网络(GANs)设计第一人称射击游戏DOOM的关卡。
与程序系统协同工作,生成模型可以显著加快资产创建。艺术家们已经在使用文本到图像的扩散模型来进行人工智能辅助的概念艺术和故事板。大型机特效负责人Jussi Kemppainen在这篇博客中描述了他是如何用

与程序系统协同工作,生成模型可以显著加快资产创建。艺术家们已经在使用文本到图像的扩散模型来进行人工智能辅助的概念艺术和故事板。大型机VFX负责人Jussi Kemppainen在本博客中描述了他如何在Midtravel和Adobe Firefly的帮助下为2.5D冒险游戏构建世界和角色。

3D生成也得到了大量的研究。Luma使用神经辐射场(NeRF)让消费者能够从iPhone上拍摄的2D图像中构建逼真的3D资产。Kaedim将人工智能和人在环质量控制相结合,创建了可供生产的3D网格,目前已有225多名游戏开发商使用。CSM最近发布了一个专有模型,可以从视频和图像中生成3D模型。

从长远来看,圣杯是使用人工智能模型进行实时世界构建。我们看到了一个潜在的未来,整个游戏不再渲染,而是在运行时使用神经网络生成。NVIDIA的DLSS技术已经可以使用消费级GPU动态生成新的更高分辨率游戏帧。总有一天,你可以点击Netflix电影上的“互动”,然后走进这个世界,看到每一个动态生成的场景,并为玩家提供独特的个性化设置。在未来,游戏和电影将变得难以区分。

值得注意的是,动态生成的世界本身不足以制作一款好游戏,《无人天空》的评论就证明了这一点,该片发射了超过1800万颗程序生成的行星。动态世界的前景在于它与其他游戏系统——个性化、生成代理等——的结合,以解锁新颖的故事讲述形式。毕竟,心灵游戏最引人注目的部分是它如何将自己塑造成安德,而不是世界本身。

每场比赛的AI复制品
虽然我们之前讨论了生成代理在模拟游戏中的使用,但还有另一个紧急用例,即人工智能充当游戏副驾驶——指导我们的游戏,在某些情况下甚至与我们并肩作战。

人工智能副驾驶对于让玩家进入复杂的游戏来说可能是非常宝贵的。例如,像Minecraft、Roblox或Rec Room这样的UGC沙盒是丰富的环境,如果玩家拥有合适的材料和技能,他们几乎可以在其中建造任何他们能想象的东西。但这是一个陡峭的学习曲线,对大多数玩家来说,要想知道如何开始并不容易。
人工智能副驾驶可以让任何玩家成为UGC游戏中的大师级构建者——根据文本提示或图像提供循序渐进的指令,并指导玩家克服错误。一个恰当的参考点是乐高宇宙中的大师建设者概念——很少有人能够在需要的时候看到他们能想象到的任何创造的蓝图。

微软已经在为《我的世界》开发人工智能复制品,该复制品使用DALL-E和Github复制品,使玩家能够通过自然语言提示将资产和逻辑注入《我的时代》会话。Roblox正在积极将生成性人工智能工具集成到Roblox平台中,其使命是让“每个用户都成为创造者”。人工智能副副本在联合创建方面的有效性已经在许多领域得到了证明,从使用Github Copilot编码到使用ChatGPT写作。

除了共同创作之外,受过人类游戏数据训练的LLM应该能够理解如何在各种游戏中表现。通过适当的整合,当球员的朋友不在时,经纪人可以作为合作伙伴,或者在国际足联或NBA 2k等面对面的比赛中占据球场的另一边。这样的经纪人总是可以上场,无论输赢都很亲切,从不挑剔。根据我们的个人游戏历史进行微调,该代理可能远远优于现有的机器人,完全按照我们自己的方式或以互补的方式进行游戏。

类似的项目已在受约束的环境中成功运行。流行的赛车游戏Forza开发了一个Drivatar系统,该系统使用机器学习为每个模拟驾驶行为的人类玩家构建一个人工智能驱动程序。Drivatars被上传到云端,当他们的人类伙伴离线时,他们可以被要求与其他玩家比赛,甚至可以获得胜利积分。谷歌DeepMind的AlphaStar根据“长达200年”的《星际争霸II》游戏数据集进行了训练,以创建能够在游戏中玩并击败人类电子竞技职业选手的代理。

人工智能副驾驶作为游戏机制,甚至可以创造全新的游戏模式。想象一下Fortnite,但每个玩家都有一根Master Builder魔杖,可以通过提示立即建造狙击塔或燃烧的巨石。在这种游戏模式下,胜利可能更多地取决于魔杖的作用(提示),而不是瞄准枪的能力。

游戏中完美的人工智能“伙伴”的梦想一直是许多流行游戏系列中令人难忘的一部分——看看《光环》宇宙中的Cortana、《最后的我们》中的Elle或《生化危机无限》中的Elizabeth。对于竞技游戏来说,对电脑机器人的打击永远不会过时——从《太空入侵者》中的油炸外星人到《星际争霸》中的竞争踩踏,最终变成了自己的游戏模式《合作指挥官》。

随着游戏发展成为下一代社交网络,我们预计人工智能副驾驶将作为教练和/或合作伙伴发挥越来越突出的社交作用。众所周知,添加社交功能可以增加游戏的粘性——有朋友的玩家可以获得高达5倍的留存率。我们看到了一个未来,每个游戏都有一个人工智能副驾驶——遵循“独自一人玩得好,与人工智能相处得好,和朋友相处得最好”的咒语

结论
我们还处于将生成人工智能应用于游戏的早期阶段,在这些想法投入生产之前,许多法律、道德和技术障碍都需要解决。今天,除非开发者能够证明用于训练模型的所有数据的所有权,否则人工智能生成资产游戏的合法所有权和版权保护在很大程度上尚不清楚。这使得现有知识产权特许经营权的所有者很难在其生产管道中使用第三方人工智能模型。
对于如何补偿培训数据背后的原创作家、艺术家和创作者,也存在重大担忧。挑战在于,如今大多数人工智能模型都是根据互联网上的公共数据进行训练的,其中大部分都是受版权保护的作品。在某些情况下,用户甚至可以使用生成模型来重现艺术家的确切风格。现在还为时过早,内容创作者的薪酬需要适当制定。

最后,当今大多数生成模型在云计算中以现代游戏运营所需的全天候全球规模运行,成本高昂。为了经济高效地扩展,应用程序开发人员可能需要找到将模型工作负载转移到最终用户设备的方法,但这需要时间。
然而,目前显而易见的是,开发者和玩家对游戏生成人工智能有着巨大的兴趣。虽然也有很多炒作,但我们对在这个领域看到的许多才华横溢的团队感到非常兴奋,他们加班加点地打造创新的产品和体验。

机会不仅在于让现有游戏更快、更便宜,还在于解锁一种以前不可能的人工智能游戏。我们不知道这些游戏会呈现什么样的形态,但我们知道游戏行业的历史一直是技术驱动新游戏形式的历史之一。潜在的奖励是巨大的——随着生成代理、个性化、人工智能讲故事、动态世界构建和人工智能副驾驶等系统的出现,我们可能即将看到第一批由人工智能第一开发者创建的NeverEnding游戏。