7月的一天,有粉丝声称,DeepSeek 因为违规关联艺人王一博与另一名涉腐人员而公开道歉,并发表了和AI 对话的截图。在截图的对话里,AI态度端正地道歉辟谣,它说将永久撤回这一条表述并赔偿。
目前暂无证据表明艺人王一博卷入了涉腐案件,但除此之外, 还有一个小问题,DeepSeek 公司其实没道过歉,毕竟那只是AI 生成的对话。
但当你去问各家AI 这件事,它们又异口同声地告诉你:是的,DeepSeek 确实道歉了(包括DeepSeek 自己)。
原因在于,这则道歉的假消息传播太广,多家媒体转发,AI 在这些虚假信息的基础上,认定此事属实。
AI 为什么睁着眼睛说瞎话?欢迎来到AI 的另一面——幻觉。什么是AI 幻觉?最直观的理解,就是它说的那些胡话。你问,拿破仑是不是很矮?它说,是的。
大语言模型本质上是在做极其复杂的“填空题”,基于上文预测下一个最可能的词。它们并不真正“理解”内容,只是在模仿人类的语言模式。
AI 幻觉问题的根源在于现代AI 系统的工作机制。这些系统通过分析海量文本数据,记住了单词、短语和概念之间的关联。模型并不是真的在思考,而是根据“什么词经常跟什么词一起出现”来生成回答。
但是统计关联并不等同于因果关系。当我们问AI“拿破仑是不是很矮”时,它给出的答案来自它在训练数据中学到的关于“拿破仑”“身高矮”的统计关联,而不是对历史事实的直接访问。
2023 至2025 年, 全球科技公司已经投资了128 亿美元用于解决AI 幻觉问题。这的确起到了效果,AI 幻觉程度一直在降低,各个AI 产品平均幻觉率从2021 年的38.9% 降至2025 年的8.2%。坏消息是,幻觉依然不可避免。
如何才能系统地检测出那些说胡话的AI 呢?人类为此绞尽脑汁。比如,剑桥大学的博士生马纳库尔就提出了一个解决方案,如果AI 真的掌握某个知识,那么多次询问同一个问题,它应该给出一致的答案;如果它在编造信息,不同版本的回答就会相互矛盾。这也被称为SelfCheckGPT 方法,让AI 生成多个版本的回答,然后检查它们之间的一致性。
除了SelfCheckGPT,目前应用得最多的,是RAG(检索增强生成)技术,它帮助AI在回答问题之前从可信来源提取真实数据。它平均可将AI幻觉减少71%,是目前最有效的AI 精准响应方法。
研究人员发现, 询问AI“你现在出现幻觉了吗”,随后的回答中AI 幻觉出现率会降低17%,不过这个方法用7 次左右就会失效。
或许,就像人类也会记错事、产生错觉一样,AI 幻觉不可避免。我们永远等不来一个完美无缺的AI,但可以建立自己的验证机制。
