前微软资深工程师 Dave Plummer 近期公开了一项新的人工智能训练项目,旨在攻克经典街机游戏《Robotron: 2084》。这位曾主导开发 Windows 任务管理器及 3D Pinball 的技术人员,正试图让 AI 在极度混乱的虚拟战场中生存。该项目于近日由 PC Gamer 报道,引发了技术社区对 AI 实时决策能力的广泛讨论与关注,成为焦点。
Plummer 此前已成功训练人工智能掌握了另一款经典游戏《Tempest》。但他认为《Robotron: 2084》的挑战性远超前者,几乎没有可预测的行为模式可供参考。这项新尝试被视为对现有 AI 架构的一次更高难度的压力测试,旨在探索智能在极端环境下的边界与能力,尽管他已处于退休状态。
这款发布于 1982 年的游戏要求玩家同时控制移动和射击两个方向,采用八向移动和射击机制。玩家需要在屏幕上躲避成百上千个敌人,同时保护幸存的人类平民不被消灭。任何一次接触都意味着立即死亡,迫使玩家进行毫秒级的生死抉择,容错率极低且需要极高的专注力,考验反应极限。
与 Plummer 之前的《Tempest》项目相比,《Robotron》缺乏明确的游戏机制护栏。Plummer 指出,前者更像教会机器人优雅的击剑,而后者则是教其在混乱暴乱中拳击求生。这种差异使得游戏成为检验实时系统决策能力的独特实验室,而非单纯的反应速度测试,难度系数显著增加,决策空间极大。
游戏设计师 Eugene Jarvis 在邮件中对该项目表达了看法。他认为游戏机制迫使人类做出愚蠢决定,例如为了躲避炮弹而撞上机器人。Jarvis 表示,这种设计武器化了玩家资源的有限性,增加了战术难度,使得完美通关几乎不可能,即便人类顶尖选手也难以避免牺牲,这凸显了资源管理的复杂性。
Plummer 认为掌握这款游戏需要战术、统计和不确定性下的分级处理。AI 不仅需要躲避攻击,还需要理解哪些目标值得躲避,哪些牺牲不可避免。这揭示了传统娱乐产品中蕴含的工程设计深度,远超普通玩家的认知,同时也反映了 30 年前的编程智慧,而非单纯的躲避。
该项目存在显著的讽刺意味,因为游戏背景正是人类对抗机器人暴动。Plummer 强调,这不仅仅是一件博物馆藏品,而是一个活生生的对手。当 AI 介入后,游戏开始以新的方式揭示其设计细节,不再被视为静态的娱乐产品,而是动态的对抗系统,引发对技术本质的思考。
开发者提供了一个实时训练仪表盘,展示了 AI 的实时表现和相关数据图表。这种可视化工具让观察者能够追踪 AI 的学习曲线和决策逻辑,查看其存活率和击杀数。该项目的视频展示也获得了技术爱好者的关注,成为观察 AI 进化的重要窗口,数据可视化增强了透明度。
分析认为,这款游戏是迄今为止最纯粹的实时决策压力测试之一。它展示了 30 或 40 年前的设计决策如何描述一个具有可测量行为的实时系统,涉及 CPU 周期和内存管理。这对理解人工智能在复杂环境中的表现具有重要参考价值,尤其是在资源受限的情况下,能为未来 AI 系统提供借鉴,意义深远。
目前该训练项目仍在进行中,具体的最终成绩尚未确定。技术社区正在密切关注 AI 能否真正掌握这款被认为几乎不可能通关的游戏。未来的进展可能会为实时决策 AI 的发展提供新的见解,并推动相关技术的演进,值得持续跟踪,期待其技术突破。