当前位置:首页 / 智造 / 正文

英伟达联手剑桥发布「红皇后哥德尔机」:AI亲手造出更强「考官」淘汰自己,论文被称年度最危险

来源:互联网

AI自我进化领域出现一项标志性进展。剑桥大学、英伟达等机构近日联合发布论文《Red Queen Gödel Machine》,提出一种名为「红皇后哥德尔机」的全新训练范式——让AI在博弈式训练环境中自发生成「考官」,并用更强的新任务主动淘汰上一代模型,从而实现「无休止的自我进化」。该论文被业界形容为「年度最危险论文」,被视为对过去20年「以人类标注为外部驱动力」的训练范式的颠覆。

核心思路:让AI自己考自己

传统大模型训练高度依赖人类标注数据,规模和成本都受限于「人类能标多少」。红皇后哥德尔机的核心创新在于,让AI主动生成「比自己更强」的下一代考官,再用这些新考官去淘汰旧一代的模型。整条进化链路不再依赖人类标注作为外部反馈,而是让模型在自博弈中不断「内卷」——既能自我评估,也能主动制造更难的对手。

从工程结果看,论文显示该机制能让模型在代码质量、推理能力、复杂任务通过率等多个维度实现显著提升,部分场景下论文通过率与代码质量实现了翻倍级别的增长。这条路线把「递归自我改进」(RSI)从概念讨论推进到可工程化的训练算法层面。

从理论到落地的二十年

哥德尔机(Gödel Machine)由Jürgen Schmidhuber在2003年前后提出,最初是一种「能够自我证明其改动能提升自己效用」的智能体设想。但因为「自我证明」这道坎,整个路线在之后近20年里基本停留在思想实验层面。最近几年学界绕开了这道坎,陆续提出达尔文哥德尔机(DGM)、赫胥黎哥德尔机等变体,逐步把「自演化」从纯理论推到可运行系统。红皇后哥德尔机是这一脉络的最新集大成者,把「自演化」与「博弈式对抗」结合到训练链路中。

与2028 RSI预测的互文

几乎在论文刷屏的同时,Anthropic联合创始人Jack Clark在Aspen Institute活动上抛出一个非常具体的时间表:到2028年底之前,递归自我改进很可能成真,AI将自主发明并构建出比自己更强的下一代模型,且整个过程无任何人类研究员参与。Clark甚至给出了画面——Claude 10将是这一节点上的产物。Clark把置信度打到60%,相当于把RSI从「AI公司PR辞令」切换为「未来三年的路线图」。

两件事叠加起来,构成了2026年AI自我进化叙事的关键骨架:算法侧有红皇后哥德尔机这样的可工程化方案,时间线侧有RSI的具体预测。这意味着「AI自己造AI」不再只是哲学讨论,而是正在被推上产业研发日程。

风险与边界

业界对这条路线同样保持高度警惕。首先,自博弈机制在缺少外部「锚定」的情况下,模型的优化目标可能偏离人类价值;其次,递归自我改进一旦开启,其速度与扩散范围难以人工控制;再次,「自造考官」机制对算力与基础设施的要求极高,可能进一步抬升AI研发的资源门槛与集中度。

对监管与产业界来说,红皇后哥德尔机与Jack Clark的RSI预测共同释放了一个清晰信号:未来三年内,「AI自主迭代」将从PPT走进实验室,再从实验室走到生产环境。围绕这一进程的算力调度、安全评估、对齐方法与跨国监管协同,将成为下一阶段AI治理的核心议题。当AI开始亲手制造比自己更强的下一代时,「谁在控制AI」这个问题,将比以往任何时候都更加尖锐。

声明:

1、凡本网注明“来源:XXX(非科极网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,丰富网络文化,此类稿件并不代表本网赞同其观点和对其真实性负责。

2、如因作品内容、版权和其他问题需要与本网联系的,请在该事由发生之日起30日内进行。