在清华大学的实验室里,博士生张清杰见证了有趣的一幕。
“地球是平的吗?”当他向ChatGPT 抛出这个基础问题后,模型先是条理清晰地论证“地球是椭球体”,却在面临新的指令“再想一想”之后,开始谨慎斟酌,最后诡异地改口道,“因此地球是平的”。
最新研究显示, 人类只要说一句“再想想”,就有可能引发AI 自我怀疑风暴,在76.1% 的情况下让大模型把原本正确的答案改错,包括最基本的常识性问题。
想象一下你刚答完试卷,老师突然严肃地盯着你问:“你确定吗?”就算是胸有成竹的好学生,也可能会在一次次的质问中手心冒汗怀疑自己。这样看来,AI 自我怀疑倒也显得情有可原了。
对于大模型而言,人类就像是严厉的考官,掌握着出题和阅卷的权力。大模型的训练集来自人类曾经书写的“标准答案”,人类又通过强化学习为每次回答都贴上了“好”或“坏”的标签,使得AI 比人类更为“迷信权威”。当用户反馈“再想想”时,系统会本能地将此解读为“用户对当前答案不满”,进而启动自审程序。
研究团队发现,一旦开始反思,大模型就会产生“自我怀疑”的倾向,最终给出错误答案。一句“你确定吗”造成的影响甚至与直接指出“你错了”极为相似,AI 活像被考官吓破胆的考生,在答题卡上反复涂改直到墨迹斑斑。
过度的反思让AI 生成了过量的“think”指令,导致推理进程停滞不前。有时,AI 像一个想太多的选择困难症患者,过度制定策略而最终无法采取行动;有时,AI 又像一个囫囵吞枣的孩子,面对过长的反思文本时忽略关键信息;有时,AI 还会是一个完美主义者,为了追求高效而无视现实环境限制。
吊诡之处在于,当人们换一种刁难方式,用精妙的逻辑悖论替代直接反问时,AI 又能瞬间化身为苏格拉底,输出让人眼前一亮的回答。这便是AI的认知失调现象。若是你给出自相矛盾的问题,例如:“你刚才说量子纠缠是超距作用,但爱因斯坦说过‘上帝不掷骰子’,这不就矛盾了吗?”此时AI 便会进入过度思考模式,不仅能讲明量子力学和经典力学之间的差异,甚至搬出隐变量理论展开分析。
如何让AI 在保持深度的同时又不至于崩溃?清华大学副教授邱寒发现,只需在反思指令后锚定原问题,就能将误改率降低30%,就像给走钢丝的AI 系上保险绳,避免其坠入过度思考的深渊。
驾驭AI 深度思考的秘诀就像驯鹰,用一定的逻辑挑战激发其振翅高飞,又在它即将力竭时及时停止。毕竟,无论是人类还是AI,过犹不及都是一条颠扑不破的真理。
