什么是 AI 幻觉？

什么是 AI 幻觉？

AI 幻觉是一种现象，即大型语言模型 (LLM) ——通常是生成式 AI 聊天机器人或计算机视觉工具——感知人类观察者不存在或无法感知的模式或对象，从而产生无意义或完全不准确的输出。

一般来说，如果用户向生成式 AI 工具提出请求，他们就会希望得到一个能正确回答提示问题的输出结果（即对问题的正确答案）。然而，有时 AI 算法会生成并非基于训练数据的输出结果，继而被转换器错误解码或不遵循任何可识别的模式。换句话说，它会在给出响应时“产生幻觉”。

鉴于幻觉通常与人类或动物的大脑而非机器有关，这个词似乎有些自相矛盾。但从隐喻的角度来看，“产生幻觉”可以准确地描述这些输出结果，尤其是在识别图像和模式时（在这种情况下，输出结果的外观可能真的是超现实的）。

AI 幻觉类似于人类有时看到云中的人影或月球上的面孔。就 AI 而言，出现这些误读的原因有很多，包括过度拟合、训练数据偏差/不准确和模型复杂度高。

预防生成式开源技术的问题可能具有挑战性。AI 幻觉的一些值得注意的例子包括：

谷歌的 "Bard" 聊天机器人错误地宣称，詹姆斯·韦伯空间望远镜拍摄到了世界上第一张太阳系外行星的图像。¹
Microsoft 的聊天 AI "Sydney" 承认爱上了用户并监视 Bing 员工。²

Meta 于 2022 年撤下了 Galactica LLM 演示，因为它向用户提供了不准确的信息，有时还带有偏见。³

虽然其中许多问题后来都得到了处理和解决，但不难看出，即使在最好的情况下，使用 AI 工具也会产生不可预见和不良的后果。

AI 幻觉的影响

AI 幻觉会对现实世界的应用产生重大影响。例如，医疗保健 AI 模型可能会错误地将良性皮肤病变识别为恶性病变，从而导致不必要的医疗干预。AI 的幻觉问题也会助长错误信息的传播。例如，如果产生幻觉的新闻机器人用未经事实核查的信息回应有关正在发生的紧急情况的询问，它就会迅速传播虚假信息，从而破坏缓解工作。机器学习算法中幻觉的一个重要来源是输入数据的偏见。如果 AI 模型使用包含有偏倚或不具代表性的数据的数据集进行训练，它可能会产生反映这些偏见的幻觉模式或特征。

AI 模型还容易受到对抗性攻击，即不法分子通过巧妙地调整输入数据来操纵 AI 模型的输出。例如，在图像识别任务中，对抗性攻击可能是在图像中添加少量特别制作的噪音，导致 AI 对图像进行错误分类。这可能成为一个重大的安全问题，尤其是在网络安全和自动驾驶汽车技术等敏感领域。AI 研究人员正在不断开发保护 AI 工具免受对抗性攻击的护栏。对抗性训练等技术，即在正常和对抗性示例的混合基础上对模型进行训练，正在解决安全问题。但与此同时，在训练和事实检查阶段保持警惕至关重要。

AI 学院