关于AI幻觉，你需要知道这些事

7月的一天，有粉丝声称，DeepSeek 因为违规关联艺人王一博与另一名涉腐人员而公开道歉，并发表了和AI 对话的截图。在截图的对话里，AI态度端正地道歉辟谣，它说将永久撤回这一条表述并赔偿。

目前暂无证据表明艺人王一博卷入了涉腐案件，但除此之外，还有一个小问题，DeepSeek 公司其实没道过歉，毕竟那只是AI 生成的对话。

但当你去问各家AI 这件事，它们又异口同声地告诉你：是的，DeepSeek 确实道歉了（包括DeepSeek 自己）。

原因在于，这则道歉的假消息传播太广，多家媒体转发，AI 在这些虚假信息的基础上，认定此事属实。

AI 为什么睁着眼睛说瞎话？欢迎来到AI 的另一面——幻觉。什么是AI 幻觉？最直观的理解，就是它说的那些胡话。你问，拿破仑是不是很矮？它说，是的。

大语言模型本质上是在做极其复杂的“填空题”，基于上文预测下一个最可能的词。它们并不真正“理解”内容，只是在模仿人类的语言模式。

AI 幻觉问题的根源在于现代AI 系统的工作机制。这些系统通过分析海量文本数据，记住了单词、短语和概念之间的关联。模型并不是真的在思考，而是根据“什么词经常跟什么词一起出现”来生成回答。

但是统计关联并不等同于因果关系。当我们问AI“拿破仑是不是很矮”时，它给出的答案来自它在训练数据中学到的关于“拿破仑”“身高矮”的统计关联，而不是对历史事实的直接访问。

2023 至2025 年，全球科技公司已经投资了128 亿美元用于解决AI 幻觉问题。这的确起到了效果，AI 幻觉程度一直在降低，各个AI 产品平均幻觉率从2021 年的38.9% 降至2025 年的8.2%。坏消息是，幻觉依然不可避免。

如何才能系统地检测出那些说胡话的AI 呢？人类为此绞尽脑汁。比如，剑桥大学的博士生马纳库尔就提出了一个解决方案，如果AI 真的掌握某个知识，那么多次询问同一个问题，它应该给出一致的答案；如果它在编造信息，不同版本的回答就会相互矛盾。这也被称为SelfCheckGPT 方法，让AI 生成多个版本的回答，然后检查它们之间的一致性。

除了SelfCheckGPT，目前应用得最多的，是RAG（检索增强生成）技术，它帮助AI在回答问题之前从可信来源提取真实数据。它平均可将AI幻觉减少71%，是目前最有效的AI 精准响应方法。

研究人员发现，询问AI“你现在出现幻觉了吗”，随后的回答中AI 幻觉出现率会降低17%，不过这个方法用7 次左右就会失效。

或许，就像人类也会记错事、产生错觉一样，AI 幻觉不可避免。我们永远等不来一个完美无缺的AI，但可以建立自己的验证机制。