吃瓜的夜,来说说AI和游戏吧

今天稍早时候,我刷到了一段在 X上被疯狂转载,引发了无数网友的震惊与讨论的视频。
这段视频在风格保证贴近传统的3D渲染场景的同时,还呈现出了一定的交互性,伴随着大量的视觉效果,足以在大多数的观众眼中以假乱真。在短短20个小时的时间中,除了惊叹和启发,支持AI与反对AI的人你方唱罢我登场,在持续了很久之后主流意见趋于统一。
应该说X是一个很不错的社区(感谢Mastodon),在随后评价最高的Note中,一则评价非常专业。
notion image
这是一段由 AI 生成的视频,而不是一款第一人称或第三人称射击游戏。
即使将其视作“自选冒险(Choose Your Own Adventure)”类型的游戏,AI 视频中普遍存在的问题——例如叙事缺乏连贯性、设计风格不一致以及物理表现混乱——依然难以避免,并会对游戏体验造成极为负面的影响。
随Note直接附赠了一篇引用,总结下就是目前状态下,要实现“单一用户(如一个人)生成一部连贯、写实、具有好莱坞电影水准的长片”仍然不太可能。即便媒体上关于“AI 将颠覆电影业”的论调不少,但作者提醒这是受限于模型架构的“根本”问题,而非只是“还没做到”那样简单。作者还提及,也许未来需要全新方法(比如替代扩散模型的技术)才能突破这些瓶颈。
 
深夜吃瓜的我根本睡不着,看各方大佬的评论转帖看的不亦乐乎。
 
目前为止游戏行业和AI的交汇无非是AIGC和AI原生游戏,简单来说前者是用AI做游戏,后者是AI是游戏。AI的确能在特定工作上加速研发进度,但作为游戏本身很难为玩家提供一段完整且舒适的游戏体验。当然不能提供好的体验不一定不能赚钱,但好的商品不一定是好的游戏。
 
事实上AI能够把开发工作中50-60%的工作做好,但剩下的那一半,恰恰是决定一款游戏“是否有灵魂”的部分——系统的逻辑设计、美术的审美取向、叙事的情感温度,以及玩家体验的细节打磨。这些环节需要的是判断、想象力与对人性的理解,而非统计模型的堆叠。优质的策划、程序与美术在游戏开发中的作用,不但不可替代,反而在“AI普及化”的时代显得更为珍贵。
 
当产品开始成批涌现、市场被低成本生成内容淹没时,做得出来将不再稀有,稀有的是能够给予人们想要的体验技术的革新一定会造成供给的增加,产品数量的暴涨必然带来审美的疲劳,只有那些能在噪声中保持清晰表达、拥有设计思想与文化内核的作品,才能脱颖而出。AI 可以帮你造出千百个世界,但唯有人能决定这些世界为何存在、意味着什么。
 
游戏并不提供真实世界的体验,大多数时候是以10%真实的体验去让玩家脑补剩余90%的内容。筛选哪些是10%哪些是90%内的东西,并不是熟练的使用AI可以具备的技能,而是让 AI 服务于更真实的创作意图这一基于创作主旨的决策。多做一点可能是天量的成本,少做一点可能是玩家的口诛笔伐,真正的创造力,不在于控制 AI,而在于在 AI 的时代里,仍然保有人性与表达的锋芒,我想这才是我创立 Gnirut Studio 的本意。(反写的图灵寓意反图灵测试,谐音鸽你呀挺可爱的,直到后来才发现有一家公司可能跟我具备相同的创意叫灵图 = =)。
 
顺应时代潮流,现在所有人说的 AI 主要指代的是基于生成扩散神经网络的这么一种统计技术,并不是游戏中常用的决策行为树等传统AI算法。令人扼腕叹息的是,当学术名词被冠以商业噱头、工程概念被政治话语裹挟,原本属于技术探索的理性边界便开始模糊。AI 不再是一种工具或研究对象,而被包装成一种“革命”、一种“替代人类的浪潮”。这种论调听起来宏伟,却往往掩盖了事实——大多数所谓的“突破”,仍停留在算法性能与算力堆叠的层面;而那些真正决定体验与意义的东西,仍需人类去建构、去理解。
 
我用大佬Kiaran Ritchie的回复结束这篇文章:
notion image
我不是悲观论者,但我也清楚,有些事物即便看起来已经完成了 95%,也可能还要几十年才能真正实现。
游戏要正常运行,必须依赖严格的世界状态(world state)。游戏中的所有状态(例如物品、数值、角色属性等)都必须是完全确定性的(deterministic),并且在整个游戏过程中被精确地维护。哪怕游戏状态中只有一位(1 bit)发生随机偏差,都可能毁掉整个游玩体验。从这个意义上说,游戏在本质上并不是统计性的系统。而渲染与动画(也就是我们在这些 AI 视频里看到的内容)则是统计性的。一团烟雾、一片柔和的阴影,即便有无数种不同的变化,也都可以被视为“正确”的结果。
但——游戏状态不行。