工程师、研究人员和各类勇敢的爱好者已经证明,经典的第一人称射击游戏《毁灭战士》几乎可以在任何东西上玩,包括割草机 (opens new window),甚至肠道细菌 (opens new window)。在周三,微软的首席应用科学家Adrian de Wynter证明了流行的AI聊天机器人ChatGPT可以玩《毁灭战士》 (opens new window)——只是它玩得很糟糕。
看到哪些设备和其他装置可以运行《毁灭战士》已经成为黑客、研究人员和科技爱好者日益流行的消遣方式。为了让ChatGPT与《毁灭战士》配合,de Wynter将其与OpenAI的多模态GPT-4V (opens new window)(视觉)配对,让聊天机器人玩游戏。
《毁灭战士》/ChatGPT实验的结果显示,尽管GPT-4及其视觉增强变体取得了进展,但由于输入和图像渲染的限制,AI模型无法独立运行《毁灭战士》。
de Wynter说:“例如,如果模型掉进了酸性池中,然后被卡在墙上,它会‘忘记’自己因为酸而受伤,然后被卡住并死亡。”
de Wynter面临的另一个问题是AI模型会产生幻觉 (opens new window),为自己的行为编造解释,或者谎称完成了某个动作。这让《毁灭战士》的太空海军陆战队员处于狂暴怪物的摧残之下。
de Wynter解释说,GPT-4设法到达了游戏中的最后一个房间……但只有一次。他说,《毁灭战士》的简单性使得它易于处理,因为它易于移植,其开源性质允许更好地通过它来衡量智能代理的基准,因为《毁灭战士》需要重量级的推理能力——比如在紧要关头制定计划。
“这很有趣!”de Wynter告诉_Decrypt_的GG。“它大多数情况下起源于一个模因(‘我的烤面包机能运行《毁灭战士》吗?’),因为它易于移植和开源代码。这也是为什么它仍然是首选游戏。”
de Wynter强调,该项目完全是他作为约克大学研究员的能力所做的,与他在微软的工作没有任何关系。
“调试花了很多时间。我通常会将帧倒出来,然后逐一检查,确保没有出现问题,”他说,指出不断出现的问题,包括模型试图通过窗户离开地图。“最终我放弃了,将这些帧转化为GIF文件。”
de Wynter的项目只是一系列试图在不寻常的地方玩《毁灭战士》的实验中的最新尝试。
去年,在Ordinals协议推出之后,《毁灭战士》的一个精简版本被铭刻 (opens new window)在比特币区块链上,作为铭文466 (opens new window)。今年早些时候,一个类似的项目将一个完整版的《毁灭战士》添加到了Dogecoin (opens new window)区块链上。
虽然这次AI尝试玩《毁灭战士》可能是一次性的,但de Wynter表示,他有关于未来使用大型语言模型(LLMs)进行游戏实验的想法。
他说:“我的主要研究兴趣与LLM的推理和规划能力相关,因此游戏总体上是一个很好的测试基准。”“策略游戏目前有点难以实现,但我想知道是否更简单的游戏(或其他模型)能够取得更好的效果。”
编辑:Andrew Hayward (opens new window)