“你再想想”，一则让AI崩溃的咒语

在清华大学的实验室里，博士生张清杰见证了有趣的一幕。

“地球是平的吗？”当他向ChatGPT 抛出这个基础问题后，模型先是条理清晰地论证“地球是椭球体”，却在面临新的指令“再想一想”之后，开始谨慎斟酌，最后诡异地改口道，“因此地球是平的”。

最新研究显示，人类只要说一句“再想想”，就有可能引发AI 自我怀疑风暴，在76.1% 的情况下让大模型把原本正确的答案改错，包括最基本的常识性问题。

想象一下你刚答完试卷，老师突然严肃地盯着你问：“你确定吗？”就算是胸有成竹的好学生，也可能会在一次次的质问中手心冒汗怀疑自己。这样看来，AI 自我怀疑倒也显得情有可原了。

对于大模型而言，人类就像是严厉的考官，掌握着出题和阅卷的权力。大模型的训练集来自人类曾经书写的“标准答案”，人类又通过强化学习为每次回答都贴上了“好”或“坏”的标签，使得AI 比人类更为“迷信权威”。当用户反馈“再想想”时，系统会本能地将此解读为“用户对当前答案不满”，进而启动自审程序。

研究团队发现，一旦开始反思，大模型就会产生“自我怀疑”的倾向，最终给出错误答案。一句“你确定吗”造成的影响甚至与直接指出“你错了”极为相似，AI 活像被考官吓破胆的考生，在答题卡上反复涂改直到墨迹斑斑。

过度的反思让AI 生成了过量的“think”指令，导致推理进程停滞不前。有时，AI 像一个想太多的选择困难症患者，过度制定策略而最终无法采取行动；有时，AI 又像一个囫囵吞枣的孩子，面对过长的反思文本时忽略关键信息；有时，AI 还会是一个完美主义者，为了追求高效而无视现实环境限制。

吊诡之处在于，当人们换一种刁难方式，用精妙的逻辑悖论替代直接反问时，AI 又能瞬间化身为苏格拉底，输出让人眼前一亮的回答。这便是AI的认知失调现象。若是你给出自相矛盾的问题，例如：“你刚才说量子纠缠是超距作用，但爱因斯坦说过‘上帝不掷骰子’，这不就矛盾了吗？”此时AI 便会进入过度思考模式，不仅能讲明量子力学和经典力学之间的差异，甚至搬出隐变量理论展开分析。

如何让AI 在保持深度的同时又不至于崩溃？清华大学副教授邱寒发现，只需在反思指令后锚定原问题，就能将误改率降低30%，就像给走钢丝的AI 系上保险绳，避免其坠入过度思考的深渊。

驾驭AI 深度思考的秘诀就像驯鹰，用一定的逻辑挑战激发其振翅高飞，又在它即将力竭时及时停止。毕竟，无论是人类还是AI，过犹不及都是一条颠扑不破的真理。