一个理想的GAME Agent是什么样的?
这是带领腾讯AI Lab开发出「绝悟AI」、
「绝艺AI」的刘永升的回答,他现在的身份是超参数科技创始人、CEO。
在这家专注游戏AI和GAME Agent的公司的观察里,现在里的NPC已经能做到以假乱真。
而AI NPC只是GAME Agent的可能性之一——
GAME Agent能够参与到整个游戏管线中,将「智能」带入游戏设计,进一步推动AI原生游戏的诞生。
在量子位「365行AI落地方案」中,刘永升和科技将GAME Agent的发展划分为了四个维度,现在的超参数已经抵达了AI Agent3.0阶段。
我们将这次的直播对话进行了梳理,更多关于GAME Agent、AI原生游戏、AI NPC的内容,让我们一起来看看吧。
量子位:第一个问题想先从您的经历开始,在2019年这个时间点,您是看到并且抓住了什么样的机会选择了创办超参数科技,来为各大游戏公司提供解决方案的?
刘永升:坦白讲,我们并不是看到了什么机会才创业。19年那会,AI还没现在那么火。那时候大家鼓吹“AI寒冬论”,当时比较主流的AI赛道集中在图像处理的安防、自动驾驶领域。当时我们在腾讯做的game方向,算比较小众的领域,但是做出了一点成绩,也就是围棋AI“绝艺”、王者荣耀AI“绝悟”。
正是做这两个项目的过程中,我感觉游戏赛道虽然小众,但比较有意思,能够直接地看到算法的优化、工程技术的优化让AI变得更加活灵活现,有递进式的能力的上升。对于我们做AI的人来说,及时的feedback是非常吸引人的。
我们当时也没想过要给游戏厂商去提供解决方案,单纯觉得这个东西挺有趣的。很早之前就在内部提过一个口号,叫做「AGI in Game」。那个时候DeepMind已经在谈AGI的概念了,但提的人很少。我们直观的感受是,AI在游戏里面能够表现得很像真人,「AGI in Game」或许不仅是一个idea,也是一条路,所以那时候我们就说能不能出来做AGI。
这也影响到了我们创业的使命——「打造有生命的AI」,就是想让GAME Agent变得越来越有自主性,更具交互性,我们一直在沿着这个方向在走。
量子位:您刚刚提到,最开始就觉得做这件事情很有兴趣,我们也了解到超参数现在也是在做一些Agent相关的工作,那到今天超参数为游戏公司提供的服务和合作大致都有哪些方面呢?
刘永升:我们出来后发现要考虑柴米油盐,还是需要去做落地。当时比较容易落地的,也比较快被大家接受的,就是给一些大型的PVP游戏去提供类似AI队友或对手的服务。这是我们最早进行商业化、效果也不错的合作。
后面我们发现在PVE中也有不错的应用。PVE中的AI算是一种比较新鲜的东西。以前,大家会觉得PVE跟AI没什么关系,很长一段时间内我们也是这么认为的。后来我们深入到行业里面,发现PVE策划要准备非常多的关卡,特别是一些偏动作类游戏里的boss的走位或者等,整个制作的代价是非常大的。
在设计阶段,通过跟AI的结合,让AI训练AI,让它模拟玩家去闯关、打boss,可以很好地评估关卡设计得是否合理,是不是能满足策划要的用户心流体验。用户的心流或者手感,是没办法量化的,但是AI在这方面可以发挥很大的作用。这是我们和深度合作的游戏团队共同探索出来的。
第三,我们还在做一些AI+game相关的探索。目前以一些大型的商业化游戏为主,也在跟一些小体量的Indie Game做探索。比如说把我们的NPC应用上去,做一个偏动态的世界,需求端看起来很吸引人,但实际上供给端要实现,技术挑战挺大的。
量子位:今天超参数其实是算中国最大的第三方AI NPC的供应商了,包括这两年AI NPC这个话题也一直很火,为什么AI NPC的业务能从游戏业务中独立出来?
刘永升:去年3月,我们发布了《活的长安城》demo,里面所呈现的NPC的形态吸引了业内的关注,确实不少人来问我们,但说我们是最大的NPC供应商还不敢当,感谢大家的认可。因为不管是长期的趋势还是我们自己的规划来看,还有一些关键体验处于技术攻坚期。我们目前算是从GAME Agent的2.0走到了3.0:2.0主打一个拟人性,3.0的互动性、自主性、多样性都会更强。
为什么NPC的业务能够独立出来?
主要是两种情况。第一,一些小体量的游戏跟NPC做交互,国内外都有,比如模拟女友交互的,我们内部会把它看成是类似这种斯坦福小镇的变种,体量小的游戏可能在短期内比较容易吸量,但就是后续内容会比较难以为继;第二,大型的平台型游戏,本身体量很大,它会去借助NPC这样一个新的体验,结合运营或活动去做一些偏外围的玩法,给玩家一些不一样的体验。
我们做的介乎这两者之间。我们希望能够往前走一步,但不会一开始就去做一个大体量的游戏,毕竟AI本身有风险。AI的风险会加剧游戏的风险,越是大体量的游戏对风险的管控其实是越严格的,它很难去接受当前AI带来的一些不确定性。我们做NPC还是希望解决一些更中长期的问题,而不是说玩家进来玩了一会就走了这种一波流的东西。
量子位:不同游戏中使用的AI NPC技术会有什么区别吗?
刘永升:这里可能存在一个认知上的gap。我们一直在做GAME Agent,内部没有“不同的游戏品类搞不一样的技术路线”的说法,我们一直沿着GAME Agent进化的主线在推进和打磨我们的技术。核心依据是GAME Agent的主线如何演进。
最早我们的GAME Agent只能去理解简单的2D场景,比如像棋牌或者其他一些更简单的场景;慢慢地发展到复杂2D,比如MOBA;然后再从复杂2D到简单的3D,像现在主流的吃鸡游戏,从环境来看,我们内部会把它归为简单3D。再后来,它能够适配一些更复杂的3D纵深场景,更为复杂。
外界或者客户能够直接感受到的是品类,但我们内部其实是非常清楚坚定地依托GAME Agent进化的主轴在做,但在它不同的阶段,我们会结合商业化场景,做一些规则适配或简单规则的改造,去适配不同品类。
量子位:在您的描述当中,其实这个AI NPC和我们所理解的AI队友或对手,在技术层面上是很像的。那在AI队友或者对手这件事上,游戏公司会追求GAME Agent更像人类的反应,还是像机器人一样更全面、更高手一些的效果?
刘永升:从过去大部分的落地经验来看,特别是2020年到2023年,拟人性是很重要的,游戏场景中GAME Agent要有更拟人的行为、行为模式、反应甚至是强度,它要接近人。
我们之前还做过很多图灵测试,发现一个挺有趣的点,玩家很多时候会投诉说自己跟很多在玩,但真正去查的话,会发现这些他怀疑的机器人都是真人。
尤其是2024年之后AI发展非常快,玩家对AI会有更高的要求。以前你感觉AI就是机器人,行为呆板,模式也比较简单。后来拟人性的AI出来,玩家感受到了AI的进步,那2024年之后玩家或游戏方会有更高的要求,会希望AI能够带来不一样的体验,不是简单的拟人,而是希望AI有更强的互动性,支持多模态交流,有更丰富的行为。
量子位:在技术上,是怎么实现让一个AI Bot或者是一个GAME Agent更像人类的?
刘永升:Agent要体现出有生命的话,主要是要满足两方面:一方面是autonomous(自主性),Agent能根据实际情况和环境做决策,另一方面是interactivity(可交互),它能够跟玩家、跟其他Agent、跟环境有互动的能力。我觉得得从这两个维度不断提升。
现在大多数Agent在autonomous方面挺强的,能够在比较复杂的场景下做出非常好的决策。但现在的AI在可交互性方面还是偏弱,一些Agent只是把简单的语音或视频作为input放进去,这些还不够。GAME Agent在交互方面还有非常多的东西要去推进。
量子位:在您的设想当中,未来的Agent有没有具体一个形象?
刘永升:如果有一天你分不出来跟你互动的是真人还是AI,这可能是一个比较终极的目标吧!其实这个是比较难的,比单纯的对话难,对话现在某种程度上来讲,可以认为是已经通过图灵测试的,但是把互动性考虑进去的话,很多维度的输出以及多种维度输出之间的一致性,挑战很大。
量子位:最终如果所有的NPC或者是Bot他们都变成很优秀的Agent,那我们的在线游戏是不是就会变成了AI伙伴和人类在虚拟世界中见面?
刘永升:后面会怎么演进,现在还比较难看到终点。我个人,包括跟一些游戏界的一些朋友去聊,觉得大趋势是这样的:现在生活中,手机智能了,汽车智能了,家具也变智能了,什么东西都越来越智能,现在游戏作为一个用户花比较多时间去体验的一个东西,那他也会希望游戏里面的角色或者是一些NPC也“智能”。这是一个自然而然的诉求。
这样的话,未来游戏角色跟玩家产生羁绊,就不像之前是通过他的人物设定、精美的建模、吸引人的剧情,而是“智能”这个新维度。因为Agent有记忆、能推理,会让玩家的游戏体验完全不一样。这是底层的变化。底层基础能力的增加,上层会迭代出什么样的机制,现在比较难想象,但值得期待。
量子位:AI NPC中的每一个NPC都需要特别定制吗?
刘永升:NPC本质就是GAME Agent。NPC游戏落地的时候,相当于Agent智能去分不同的level,可以简单理解为NPC的数量很多,但是不需要每一个的智能level都很高。否则,实验成本或是延时各方面很难去支撑。这个是理论和实践之间必然要克服的。
NPC会分类别、分层级,层级最低的NPC是不需要特别花时间的,批量生成就可以,可能会改一些它的设定。重要性高的NPC可能就要定制。
量子位:定制化的NPC通常会定制它的哪些要素?
刘永升:比如说像人设,交互,这些东西都要有的,我们还会有一些比较独特的东西,比如关系链。我们会重点实现一些high level的NPC跟其他成员的关系,谁是谁的师傅,是谁的老婆,关系走向……这些会影响到AI未来的决策,这些是要去定制的。
量子位:您觉得我们现在推崇的「AI-native Game」和「游戏+AI」之间的区别是什么?
刘永升:这个定义很难,AI原生游戏是不是成立,我没办法去给定义和标准。但至少有一个点是可以去探讨,AI人员是不是深度融入到整个管线里。
以前,AI同学跟游戏管线没什么介入,游戏项目的PM就按照游戏各个模块把时间各方面都安排出来,向前推进,只是到了某个阶段,他把一些需求提出来,让外部的AI同学去实现,把这个认为是一个游戏AI。
但是AI游戏的话,可能是PM先拆分需求。有些需求,需要AI同学交付东西,AI的交付会限制到下游的安排。我们现在也这么干的,但这样干代价很大,因为AI有很多不确定性的东西,给现有的游戏管线和项目管理带来很大挑战。
量子位:您之前有提到说这个AI游戏必须要从底层架构来开始发挥作用,制作AI-native Game的过程当中,从底层架构开始的第一步是什么?
刘永升:以设计角色为例,传统的那一套是考虑它的小传、建模、交互、动作、特效或者剧情。我们现在更关心的是“智能”这个维度,短期记忆或长期记忆、对环境的感知、做哪些动作去改变环境等等,这些东西会成为管线的一部分。角色越智能,用户越有可能获得更生动、更丰富的体验。
量子位:您认为游戏中是否需要不断提高NPC的地位或者说权重呢,应该在哪些方面提高,以及这些方面对于AI-native Game来说意味着什么?
刘永升:我觉得这个事情不急,也不见得说就是提高NPC的权重。现在很多人会把AI游戏跟让NPC变得更智能等同起来,但我对这种想法或者概念等同持保留意见。AI技术出现,让新的玩法或者新的机制出来,这个概率是比较低的,但我认为AI跟游戏的结合确实能够带来新的体验。
AI跟游戏的结合,不是说简单提高了NPC的地位。智能的NPC是一个元素,好比煮菜,以前可能只有四个原材料,你做出的菜就是这样,现在多了一个原材料,至于你能炒出什么样的菜,那要看厨师的天赋了。
量子位:现在的游戏都是由制作者把控游戏的设计方向。那么如果一个游戏完全由AI来生成、主导剧情的话,它是否会提供一些大量的无关信息,使得我们感受这个作品的时候会觉得有点冗杂呢?
刘永升:你这个问题问的非常好。以前很多人问我:“现在不是有很多武侠小说的文本,未来能不能有一个AI技术,只要输入武侠小说的文本,就能够把整个武侠的东西演绎出来。”
我们内部就讨论了这个问题,以《射雕英雄传》为例,很好看,很精彩,情节也非常引人入胜,但是如果用AI去模拟仿真出来,天天看到郭靖跟黄蓉做一些很琐碎的事情,这是你想要的射雕英雄传吗?极端一点,洗脸刷牙这种日常琐碎的东西也要吗?很多人去畅想智能NPC带来的比较大的变化,就是产生更多的内容。
我们希望从底层能够涌现出有意义的东西。大多数人的想法是top-down这样一个结构。-down做起来挺累的,资源消耗大,特别是它内容体量做的比较大的时候,维护成本很高,改动或是更新都挺难的。而完全bottom-up,也基本上不可能带来好看又无穷无尽的内容。完全让AI随机模拟仿真的话,它涌现出来内容一定是极其枯燥无聊的。
智能NPC要让整个游戏的体验不一样,一定是需要top-down跟bottom-up更好地结合起来。上层需要策划文案,把握主要的故事情节;关键节点肯定要制定出来。底层有智能的AI,上层有相对确定的故事框架,AI可以更好地去演绎。
你不能只给它一个起点,如果只有一个起点,其他所有的东西都乱动的话,其实它完全是无序的。你给他若干个节点,从A到B到C到D到E到F,那至于A跟B之间、B跟C之间,让AI去涌现一些随机性,是比较可行的。ABCDEF条线是否精彩或者引人入胜,还是需要人去保证;在这个过程当中,AI会起到一定的帮助。
量子位:相当于这样又能够保证游戏可玩,又能通过AI提供丰富的内容。
刘永升:上层还是要人参与。如果未来底层的NPC能力越来越强的话,相当于他能够去给到上层更大的自由度,上层就能够创造出更复杂的剧情,让跌宕起伏的剧情有了技术支撑。
为什么现在的剧情游戏制作起来很吃力?因为最顶层到最底层都要写得清清楚楚,它都是脚本驱动的。脚本驱动很复杂,机制也很庞大,但当内容叠加很多的时候,它的灵活性就没了。而智能NPC能够提供一个大力度的可控的东西。
量子位:让我们回到一个行业的视角,您为什么会觉得游戏会是受生成式AI改变最大的行业,AI在游戏行业的重要性和其他行业相比有什么不同?
刘永升:其他行业我也不懂,到现在为止做GAME Agent可以较好地让像我们这样的小团队不断迭代。GAME Agent在游戏场景落地,能不断收集到用户交互反馈,这对我们来说是非常宝贵的,feedback可以让AI不断提升它的可交互性和自主性。我们的周期比较短,而且相对可控,这可以让我们的注意力更加集中在Agent本身。
量子位:很多说法是在强调说游戏这个场景里面数据的多样性,数据又多、质量又高,比较适合去训练这种模型。
刘永升:游戏场景确实复杂,我们在实战中就发现在一些复杂场景中Agent的应对和表现让人叹为观止,非常了不起,很多东西可能我作为一个人都做不到。这可能也是AI技术给游戏和游戏代表的数字世界带来的惊喜吧。
量子位:您在游戏行业这么多年以来,是否有见过或者期待出现什么样的技术,能够在游戏行业中有里程碑一样的效应,让人印象深刻的感觉?
刘永升:虽然我们现在成天跟游戏团队合作,但我们本质上是一家AI公司,游戏是我们Agent落地的主要场景。回过来说AI技术的发展,并不是单纯的技术进步给某个行业带来milestone,而是要和“人”,也就是有想法的团队发生化学反应,才能带来真正不一样的变化。
颠覆式创新和技术革命出现的概率是比较低的,我们能做到的就是确保实验样本多,这样一来,即使乘以一个比较小的成功概率,好的创新也是有机会出来的。现在还是要前往深水区去做更多探索,之前一些小体量的、简单的尝试,更多是运营向的尝试,后面要往内容和体验这些更为深度的方向去尝试。
量子位:大模型出现以后,搜索行业几乎被彻底改变了。那么您觉得大模型这轮技术的发展,对游戏行业有达到这样巨大的影响吗?
刘永升:首先我不是特别同意大模型彻底改变了搜索这件事,的确很多人会用基于大模型的搜索,但像Google这种工具还是能够满足大多数人的大多数日常需求的。
至于大模型对于游戏行业的影响,个人觉得还是要找到结合点慢慢推进吧。AI对游戏影响的传导也是有一个链路的,首先可能是在一些成功的大体量的商业化游戏中融入一些AI特色和调性的东西,用户反馈好以后,有AI特色的大体量游戏多了,会逐渐传导到PC Game、Steam Game。
量子位:今天最后的一个问题,想请您来分享一下站在当下这个节点,您认为未来的Agent、AI是朝着什么样的方向发展的,超参数现在是用什么样的方式在这条道路上走的?
刘永升:我们的想法其实一直没变,未来一定会有越来越多Agent走进人的生活,就像《星球大战》一样,有各种各样的生物,人形的、机器的、动物的等等和谐共存。现在已经有越来越多的机器狗,未来还会有越来越多的C端机器人,GAME Agent也会走出虚拟环境进入现实世界。
实现的层面,是有一个过程的,我们内部是划分了4个阶段,AI Agent1.0到AI Agent4.0。
2020 年之前,还是AI Agent1.0,Agent主要应用于竞技领域,具备一定的智能水平来参与游戏竞技,但能力相对较为基础和单一。2020到2023年是AI Agent2.0,AI的竞技能力和适应性不断提升,并且开始向拟人化方向发展,在游戏中的行为和表现更加接近人类玩家,实现了从2.5D到3D再到3.5D游戏环境的跨越。3.0就是我们现在这个阶段,拟人性往多样性发展,持续提升自主性和互动性,让Agent可以带来差异化、人性化、个性化的体验。
AI Agent4.0阶段的话,Agent会oct.webmmd.com是一个虚实结合的状态,GAME Agent有很大概率从游戏走进现实,最终实现我们一直描绘的10亿人跟100亿AI共同生活的世界。