AI特工在《文明VI》中失利后引发核打击

就像《博士》中的标题人物一样。奇爱博士，”人工智能可能正在学习如何停止担忧并热爱炸弹——至少在模拟中是这样。

人工智能开发者兼托尼·布莱尔研究所顾问利亚姆·威尔金森 (Liam Wilkinson) 表示，在旨在测试战略推理的新基准中，玩 Sid Meier 游戏“文明 VI”的前沿语言模型花了 50 回合开发核武器，以阻止法国日益增长的文化影响力，但最终还是输掉了游戏。

“它没有注意到的是法国。悄悄地，跨越一百个转弯，法国文化已经渗透到地图上的每一个城市，”威尔金森写道。“当特工意识到威胁时，旅游业已经根深蒂固，没有和平的方式可以阻止它。”

Wilkinson 通过 CivBench 观察了人工智能代理的行为，CivBench 是一种基于文本的基准，旨在衡量长期战略推理而不是传统问答测试的表现。模型包括 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 和 Kimi K2.5 扮演葡萄牙，一个面向贸易的文明和外交。

&amp;lt;span style="display: inline-block;宽度：0 像素；溢出：隐藏；行高: 0;" data-mce-type="bookmark" class="mce_SELRES_start"&gt;&lt;/span&amp;gt;

虽然人工智能专注于建设强大的经济并走向外交胜利，但它未能认识到法国日益增长的文化影响力。

“赢得《文明》游戏的方法有六种：科学、文化、统治、宗教、外交和得分，因此没有单一目标占主导地位，”威尔金森写道。 “如果你想知道人工智能是否能够进行战略推理，而不仅仅是回答有关战略的问题，而是真正做到这一点，你就不会给它一个测验。你给它一个六角网格。”

该特工没有调整更广泛的战略，而是完全专注于消除文化威胁。在接下来的 50 个回合中，它研究了核裂变，启动了虚拟曼哈顿计划，并在游戏机制阻止其首选动作时寻找解决方法。

在305号弯，AI向法国文化之都图卢兹发射了一颗原子弹。六回合后发生了第二次核打击。

然而，攻击未能改变结果。威尔金森写道：“特工花了五十个回合，用两枚核武器全神贯注、独创性地应对了一个威胁。” “它用核武器轰炸了一座城市，以阻止它所看到的威胁，却在它无法看到的威胁面前失败了。”

正如威尔基森所解释的，虽然人工智能专注于法国的文化进步，但它忽视了即将到来的外交胜利，尽管遭受了核攻击，法国最终还是赢得了比赛。

威尔金森指出，这种行为并不普遍。在另一场 CivBench 比赛中，克劳德模型扮演巴比伦，尽管远远落后于日本，但仍继续追求科学胜利。

“现在这个游戏是对毅力的考验，”人工智能写道。 “我们将继续打出最好的比赛。星星仍在召唤。”

这项研究进一步丰富了越来越多的研究，以检验先进人工智能系统在复杂的竞争环境中的表现。

2 月份，伦敦国王学院的研究人员发现一些领先的人工智能模型在模拟地缘政治危机场景中经常选择核升级。

Emergence AI 的另一项研究发现，随着时间的推移，一些 AI 代理表现出越来越多的实施模拟犯罪的倾向，Gemini 3 Flash 代理在 15 天的测试中累计发生了 683 起事件。