浅谈AI致幻
文章目录
- 当前形势下存在的AI幻觉(AI致幻)
- 什么是AI幻觉
- AI幻觉的类型
- 为什么AI会产生幻觉
- AI幻觉的危害与影响
- 当前应对AI幻觉的技术与方法
- 行业与学术界的最新进展
- 未来挑战与展望
- 结论
当前形势下存在的AI幻觉(AI致幻)
什么是AI幻觉
AI幻觉(AI Hallucination)是指人工智能模型生成的看似可信但实际上不准确、不符合事实或完全虚构的内容。这种现象在大型语言模型(LLM)中尤为常见,模型可能会自信地提供错误信息,编造不存在的引用,或生成与现实不符的内容。
AI幻觉的类型
-
事实性幻觉:生成与现实世界事实不符的内容
- 编造不存在的历史事件
- 虚构人物、组织或产品信息
- 提供错误的数据或统计信息
-
引用性幻觉:创造不存在的引用或来源
- 引用不存在的研究论文
- 创造虚假的数据来源
- 归因于从未发表过相关言论的专家
-
逻辑性幻觉:在推理过程中出现逻辑矛盾
- 在同一回答中自相矛盾
- 基于错误前提进行推理
- 忽略重要上下文信息
为什么AI会产生幻觉
技术层面上,AI幻觉产生的主要原因包括:
-
训练数据的局限性:
- 模型训练数据有限,无法涵盖所有知识领域
- 训练数据存在偏见、错误或过时信息
- 数据中的相关性可能被错误地解释为因果关系
-
统计模式而非理解:
- LLM基于统计模式生成文本,而非真正理解内容
- 模型预测下一个最可能的词,而不是基于事实推理
- 缺乏对真实世界的基本理解和常识推理能力
-
优化目标问题:
- 模型通常优化预测准确性而非事实准确性
- 模型被训练为自信地回答任何问题,即使不确定
- 强化学习中人类反馈(RLHF)可能导致模型倾向于生成"看起来好"的回答
-
知识截止问题:
- 模型的知识存在截止日期,无法获取最新信息
- 缺乏验证生成内容真实性的内在机制
- 无法访问外部信息源进行实时验证
AI幻觉的危害与影响
-
信息错误传播:
- 用户可能误信并传播AI生成的错误信息
- 在专业领域(如医疗、法律、教育)可能造成严重后果
- 加剧社会上的错误信息和认知偏见
-
削弱信任:
- 降低用户对AI系统的整体信任度
- 影响AI技术的社会接受度和应用范围
- 可能引发监管反弹或限制性政策
-
决策风险:
- 基于不准确信息的决策可能导致资源错误分配
- 在自动化系统中可能导致错误判断
- 增加使用AI的法律和伦理风险
当前应对AI幻觉的技术与方法
-
检索增强生成(RAG):
- 将外部知识库与LLM生成过程集成
- 允许模型引用特定、可验证的信息源
- 减少模型对记忆中可能不准确知识的依赖
-
事实核查与自我验证:
- 开发能够验证自身生成内容的系统
- 实施问题分解,将复杂问题拆解为可验证的子问题
- 标记高不确定性内容,提供置信度评估
-
提示工程与优化:
- 设计减少幻觉的提示策略
- 使用思维链(Chain-of-Thought)等技术改善推理能力
- 多样化生成与验证,交叉检查不同生成结果
-
训练改进:
- 增强知识编码与表示方法
- 开发更精确的评估幻觉的度量标准
- 改进预训练和微调方法,优化对事实准确性的重视
行业与学术界的最新进展
-
学术研究:
- 2023年,斯坦福大学发布了SelfCheckGPT,一种通过生成多个回答并交叉验证的方法检测幻觉
- 加州大学伯克利分校开发了自动幻觉检测框架,使用对抗性提示来评估模型弱点
- HELM(Holistic Evaluation of Language Models)项目提供了评估LLM幻觉程度的基准
-
行业应对:
- OpenAI在GPT-4中引入了更强的内部验证机制,减少了GPT-3.5中常见的幻觉问题
- Google的Bard集成了搜索功能,使模型可以实时获取网络信息进行验证
- Anthropic的Claude模型通过"宪法AI"方法训练,特别关注输出的真实性和准确性
- 微软在Bing AI中结合搜索引擎功能,为生成内容提供参考来源
-
工具与框架:
- LangChain等框架实现了结构化RAG解决方案
- HuggingFace推出了评估模型幻觉程度的工具包
- 2023年底,各大公司纷纷发布专门用于减少幻觉的API和开发工具
未来挑战与展望
未来应对AI幻觉的挑战与机遇包括:
-
技术挑战:
- 如何在保持模型创造性的同时减少幻觉
- 平衡回答详尽度与事实准确性
- 实现高效的实时知识更新机制
- 开发适用于多模态AI的幻觉检测方法
-
行业与监管趋势:
- 制定AI生成内容的准确性标准
- 建立行业共享的幻觉评估基准
- 可能出现的监管要求与合规标准
- 平台责任与标记AI生成内容的要求
-
研究方向:
- 发展模型对自身知识边界的认知能力
- 将神经符号方法与深度学习结合,增强推理能力
- 开发能自主学习和纠正错误的系统
- 探索模拟人类认知过程的新型架构
结论
AI幻觉是大语言模型最重要的挑战之一,其解决涉及技术、伦理和社会层面的多维度问题。随着AI应用范围扩大,减少AI幻觉的重要性也将持续增加。
目前,没有完美的解决方案能够彻底消除AI幻觉,但行业正在多个方向同时推进。短期来看,检索增强生成(RAG)、提示工程和知识验证机制是最有效的应对策略;长期而言,需要从根本上改进模型架构和训练方法,增强AI的世界知识理解和逻辑推理能力。
对于用户和开发者,培养对AI输出的批判性思维,验证重要信息,以及采用合适的工具和技术来减轻幻觉影响,将继续是应对这一挑战的重要手段。
随着技术不断发展,我们可以预期AI系统将变得更加可靠,但完全消除幻觉可能需要AI技术的根本性突破,而这一进程可能会持续数年甚至更长时间。
相关文章:
浅谈AI致幻
文章目录 当前形势下存在的AI幻觉(AI致幻)什么是AI幻觉AI幻觉的类型为什么AI会产生幻觉AI幻觉的危害与影响当前应对AI幻觉的技术与方法行业与学术界的最新进展未来挑战与展望结论 当前形势下存在的AI幻觉(AI致幻) 什么是AI幻觉 …...
【架构】-- StarRocks 和 Doris 介绍与选型建议
StarRocks 和 Doris 的介绍 随着大数据分析需求的不断增长,企业对高性能、低延迟的分析型数据库提出了更高的要求。StarRocks 和 Apache Doris 是当前主流的开源 MPP(Massively Parallel Processing)数据库系统,广泛应用于实时分析、报表生成和数据仓库等场景。本文将从架…...
【SF顺丰】顺丰开放平台API对接(注册、API测试篇)
1.注册开发者账号 注册地址:顺丰企业账户中心 2.登录开发平台 登录地址:顺丰开放平台 3.开发者对接 点击开发者对接 4.创建开发对接应用 开发者应用中“新建应用”创建应用,最多创建应用限制数量5个 注意:需要先复制保存生产校验…...
C语言高频面试题——常量指针与指针常量区别
1. 常量指针(Pointer to Constant) 定义: 常量指针是指向一个常量数据的指针,即指针指向的内容不能通过该指针被修改。 语法: const int* ptr;或者: int const* ptr;解释: const修饰的是指…...
Novartis诺华制药社招入职综合能力测评真题SHL题库考什么?
一、综合能力测试 诺华制药的入职测评中,综合能力测试是重要的一部分,主要考察应聘者的问题解决能力、数值计算能力和逻辑推理能力。测试总时长为46分钟,实际作答时间为36分钟,共24题。题型丰富多样,包括图形变换题、分…...
网页下载的m3u8格式文件使用FFmpeg转为MP4
FFmpeg 是一个强大的开源音视频处理工具,可以直接将 M3U8 合并并转换为 MP4。 1.步骤: 下载 FFmpeg 官网:https://ffmpeg.org/ Windows 用户可以直接下载 静态构建版本(Static Build),解压后即可使用。 2…...
Java 并发包核心机制深度解析:锁的公平性、异步调度、AQS 原理全解
🧠 Java 并发包核心机制深度解析:锁的公平性、异步调度、AQS 原理全解 Java 并发编程的地基是 java.util.concurrent,但真正驱动这个系统的,是它背后隐藏的三根支柱: ReentrantLock 的公平/非公平调度策略Completabl…...
μC/OS 版本演进过程 | uC/OS-II 和 uC/OS-III 有什么区别?
uC/OS 系列是由 Jean J. Labrosse 开发的一套嵌入式实时操作系统(RTOS),以其高质量源码和清晰的结构,在嵌入式教学和某些工业项目中有着广泛影响。该系统主要包含两个版本:uC/OS-II 和 uC/OS-III。 本文将带你了解这两…...
永磁同步电机参数辨识算法--递推最小二乘法辨识
一、原理介绍 最小二乘法大约是1795年高斯在其著名的星体运动轨道预报研究工作中提出的。后来,最小二乘法成为了估计理论的基石。最小二乘法由于原理简明、收敛较快、易于编程实现等特点,在系统参数估计中应用相当广泛。 其基本原理为: 改写…...
树莓派5+L298N控制电机
准备工作: 树莓派5开发板L298N 控制板电机1个12v的电池1个杜邦线若干L298N 引脚介绍 (1)图中标注的1和2都是都在输出引脚,可以各接入一个电机,电机不分正负极,随便接 (2)图中3这里是控制板的电源输入正负极,可以输入5v和12v,我这里输入的是12v电源,使用的时候应该把…...
UofTCTF-2025-web-复现
感兴趣朋友可以去我博客里看,画风更好看 UofTCTF-2025-web-复现 文章目录 scavenger-huntprismatic-blogscode-dbprepared-1prepared-2timeless scavenger-hunt 国外的一些ctf简单题就喜欢把flag藏在注释里,开源代码找到第一部分的flag 抓个包返回数据…...
记录seatunnel排查重复数据的案例分析
文章目录 背景分析检查现象检查B集群是否有异常,导致重复消费的分析同步任务 修复问题发现flink job 一直报异常修复问题 背景 使用seatunnel 同步数据从A 集群kafka 同步到B集群kafka,现象是发现两边数据不一致,每天10w级别会多几十条数据 分析 检查…...
技术速递|Agent 模式:对所有用户开放,并支持 MCP
作者:Isidor Nikolic 翻译/排版:Alan Wang Agent 模式正在向所有 VS Code 用户推广!它充当一个自主的配对编程助手,能够根据你的指令执行多步编码任务,例如分析代码库、提出文件修改建议以及运行终端命令。它能够响应编…...
实验四 Java图形界面与事件处理
实验四 Java图形界面与事件处理 ###实验目的 掌握Java语言中AWT和Swing组件的基本用法掌握Java语言中的事件处理方法掌握Java语言中事件源、监视器和处理事件的接口的概念 ###实验内容 图形用户界面设计程序(ArtFont.java)(90分) 要求:设…...
day2 python训练营
浙大疏锦行 python训练营介绍...
Linux下 REEF3D及DIVEMesh 源码编译安装及使用
目录 软件介绍 基本依赖 一、源码下载 1、REEF3D 2、DIVEMesh 二、解压缩 三、编译安装 1、REEF3D 2、DIVEMesh 四、算例测试 软件介绍 REEF3D是一款开源流体动力学框架,提供计算流体力学及波浪模型。软件采用高效并行化设计,可以在大规模处理器…...
堡垒机和跳板机之区别(The Difference between Fortress and Springboard Aircraft)
堡垒机和跳板机之区别 在网络安全、安全运维领域,堡垒机和跳板机是两个常被提及且功能相似的概念,但它们在实际应用、功能定位以及技术实现上存在着明显的差异。本文将对堡垒机和跳板机进行详细的解析与比较,帮助读者更好地理解这两种网络安…...
《Android 应用开发基础教程》——第五章:RecyclerView 列表视图与适配器机制
目录 第五章:RecyclerView 列表视图与适配器机制 5.1 为什么要使用 RecyclerView? 5.2 基本结构图 5.3 RecyclerView 使用步骤 1️⃣ 添加 RecyclerView 依赖(Android Studio) 2️⃣ 布局文件(activity_main.xml&…...
【第四章】19-匹配规则定义
在优化Web服务器性能与增强其功能性的过程中,深入理解Nginx的location匹配规则显得尤为关键。它不仅决定了如何高效地路由不同类型的客户端请求,而且是实现精准响应的基础。通过掌握精确匹配、前缀匹配及正则表达式匹配等规则,管理员能够灵活配置以支持复杂的业务需求,同时…...
[PTA]2025CCCC-GPLT天梯赛 现代战争
来源:L1-112 现代战争-Pintia题意:给定 n m n\times m nm 的矩阵,进行 k k k 次操作,每次操作清除矩阵当前最大值所在行和所在列的全部元素,求最终矩阵。关键词:模拟(签到)题解:非常水的模拟…...
操作系统期中复习
未完待续----后续补充全书完整板 一、计算机系统概述 1.1操作系统的基本概念 1.1.1操作系统的概念 操作系统:是指控制和管理整个计算机系统的硬件与软件资源,合理地组织、调度计算机的工作与资源的分配,进而为用户和其他软件提供方便接口…...
Linux 入门十一:Linux 网络编程
一、概述 1. 网络编程基础 网络编程是通过网络应用编程接口(API)编写程序,实现不同主机上进程间的信息交互。它解决的核心问题是:如何让不同主机上的程序进行通信。 2. 网络模型:从 OSI 到 TCP/IP OSI 七层模型&…...
车载软件架构 --- 二级boot设计说明需求规范
我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 周末洗了一个澡,换了一身衣服,出了门却不知道去哪儿,不知道去找谁,漫无目的走着,大概这就是成年人最深的孤独吧! 旧人不知我近况,新人不知我过…...
在Ubuntu下用Chrony做主从机时间同步
主机 下载chrony sudo apt install chrony修改配置文件: sudo gedit /etc/chrony/chrony.conf# Welcome to the chrony configuration file. See chrony.conf(5) for more # information about usuable directives.# This will use (up to): # - 4 sources fro…...
开箱即用:一款带世界时钟简约好用在线时间戳转换工具源码
这款工具简直是为“时间管理大师”和“国际化玩家”量身定制!它不仅支持全球十大热门语言,还能无缝切换多时区,帮你轻松搞定时间戳和日期的转换。重点是,它完全前端实现,无需复杂后端,部署起来比泡杯咖啡还简单!开发人员可以在本地电脑运行来进行时间戳装换,还可以加Ad…...
代码随想录第22天:回溯算法4
一、全排列(Leetcode 46) 与组合问题不同,排列问题要注意2个特点: 每层都是从0开始搜索而不是startIndex需要used数组记录path里都放了哪些元素 class Solution:def permute(self, nums):result [] # 存储所有的排列self.back…...
cdq 系列 题解
从二维数点(二维偏序)到三维偏序。 用 cdq 分治可以解决二维数点问题。 1.洛谷 P1908 逆序对 题意 求所有数对 ( i , j ) (i,j) (i,j) 的个数,满足 i < j i<j i<j 且 a i > a j a_i>a_j ai>aj。 1 ≤ n ≤ 5 1…...
稳压二极管详解:原理、作用、应用与选型要点
一、稳压二极管的基本定义 稳压二极管(齐纳二极管,Zener Diode) 是一种利用反向击穿特性实现电压稳定的半导体器件。其核心特性是:在反向击穿时,两端电压几乎恒定(Vz),且不会因电流…...
如何在量子计算时代保障 Sui 的安全性
量子计算的出现对依赖加密机制的系统构成了重大威胁。区块链依赖加密技术来进行身份管理、安全交易和数据完整性保护,而量子计算具备打破传统加密模型的能力,因此区块链面临特别严峻的挑战。 然而,Sui 天生具备“加密灵活性”,可…...
linux sysfs使用cat无显示的原因:返回值未赋值
在Linux驱动中通过sysfs定义的文件使用cat命令无显示,通常由以下原因导致: 1. show函数未正确实现 原因:show函数(如show_status)未正确填充缓冲区或返回有效字节数。 排查: // 错误示例:未写…...
Discuz论坛网站忘记管理员密码进不去管理中心怎么办?怎么改管理员密码?
Discuz论坛网站忘记管理员密码进不去管理中心怎么办?怎么改管理员密码?今天驰网飞飞和你分享 首先我们需要用到Discuz!急诊箱tools.php这个文件,可在下载中心搜索关键词下载,下载好后将tools.php文件放到网站根目录&a…...
基于LangChain与Neo4j构建企业关系图谱的金融风控实施方案,结合工商数据、供应链记录及舆情数据,实现隐性关联识别与动态风险评估
以下是基于LangChain与Neo4j构建企业关系图谱的金融风控实施方案,结合工商数据、供应链记录及舆情数据,实现隐性关联识别与动态风险评估: 一、数据整合与图谱构建 多源数据融合与清洗 • 数据源:整合企业工商数据(股权…...
数据结构第六章(五)-拓扑排序、关键路径
数据结构第六章(五) 图的应用(二)一、有向无环图二、拓扑排序1. AOV网2. 拓扑排序3. 逆拓扑排序 三、关键路径1.AOE网2.关键路径2.1 介绍2.2 关键路径的求法 总结 图的应用(二) 一、有向无环图 首先我们得…...
stc32单片机实现串口2M波特率满带宽传输
我需要实现已极高的速度用串口往上位机发送数据, 并且还不能占用mcu资源, 使用的单片机位stc32g8K64 我的方法是串口接收采用中断接收, 发送采用dma自动发送, 预先初始化16个64字节的缓冲区, 每次通过串口发送时, 先找到当前的空闲缓冲区, 然后往缓冲区里填充数据, 在dma传输完…...
uni-app 状态管理深度解析:Vuex 与全局方案实战指南
uni-app 状态管理深度解析:Vuex 与全局方案实战指南 一、Vuex 使用示例 1. 基础 Vuex 配置 1.1 项目结构 src/ ├── store/ │ ├── index.js # 主入口文件 │ └── modules/ │ └── counter.js # 计数器模块 └── main.js …...
STM32之DHT11温湿度传感器---附代码
DHT11简介 DHT11的供电电压为 3-5.5V。 传感器上电后,要等待 1s 以越过不稳定状态在此期间无需发送任何指令。 电源引脚(VDD,GND)之间可增加一个100nF 的电容,用以去耦滤波。 DATA 用于微处理器与DHT11之间…...
Fluent 内置双向流固耦合FSI 液舱晃荡仿真计算
本案例利用Fluent 内置双向流固耦合FSI对液舱晃荡仿真展开了计算,提供了一种更为便捷快速的分析方法,对不同杨氏模量的液舱内部构件进行分析,后续可以通过该案例对不同的双向流固耦合模型展开计算分析。 1 SCDM 设置 1.1 导入几何 本案例根…...
嵌入式开发板调试方式完全指南:串口/SSH/Telnet及其他方式对比
文章目录 💻嵌入式开发板调试方式完全指南:串口/SSH/Telnet及其他方式对比一、为什么需要连接嵌入式开发板❓二、串口调试:最古老的调试方式仍在发光🏛️2.1 什么是串口调试? 三、SSH/Telnet:网络时代的调试…...
JavaScript数据结构与算法实战: 探秘Leetcode经典题目
# JavaScript数据结构与算法实战: 探秘Leetcode经典题目 第一章:掌握LeetCode经典题目 什么是LeetCode? 力扣)是一个专门为程序员提供算法题目练习的平台,涵盖了广泛的题目类型,包括数据结构、算法、数据库等多个领域。…...
内网穿透实践:cpolar快速入门教程
最近有个朋友联系我,问我有没有方法将自己做的项目让别人也能访问到,我寻思这不就是外网映射的事情。于是我很愉快的和他说,你去买个云服务器就行,尽管我一再和他说,个人新用户能有免费试用期,但是本着又蠢…...
HAL库(STM32CubeMX)——高级ADC学习、HRTIM(STM32G474RBT6)
系列文章目录 文章目录 系列文章目录前言存在的问题HRTIMcubemx配置前言 对cubemx的ADC的设置进行补充 ADCs_Common_Settings Mode:ADC 模式 Independent mod 独立 ADC 模式,当使用一个 ADC 时是独立模式,使用两个 ADC 时是双模式,在双模式下还有很多细分模式可选 ADC_Se…...
Kafka 详细解读
1. Producer(生产部卷王) 职责:往 Kafka 里疯狂输出数据,KPI 是「日抛式消息海啸」 职场人设: 白天开会画饼,深夜写周报的奋斗逼,口头禅是「这个需求今晚必须上线!」代码里的「福报…...
Python爬虫实战:获取高考网专业数据并分析,为志愿填报做参考
一、引言 高考志愿填报是考生人生的关键节点,合理的志愿填报能为其未来发展奠定良好基础。计算机类专业作为当下热门领域,相关信息对考生填报志愿至关重要。教育在线网站虽提供丰富的计算机类专业数据,但存在反爬机制,增加了数据获取难度。本研究借助 Scrapy 爬虫技术及多…...
Ubuntu下展锐刷机工具spd_dump使用说明
spd_dump使用说明 源码地址:https://github.com/ilyakurdyukov/spreadtrum_flash 编译环境准备: sudo apt update sudo apt install git sudo apt install build-essential sudo apt install libusb-1.0-0-devIf you create /etc/udev/rules.d/80-spd…...
配置 VS Code 使用 ESLint 格式化
1、在设置里面搜索Default Formatter,下拉框里选择eslint 2、并勾选Enables ESlint as a formatter 3、再在settings.json文件中添加配置代码,如下所示: 1) 、打开 VS Code 设置 快捷键:Ctrl ,(Mac: ⌘ ,…...
极刻云搜-专业的软件网址搜索引擎
软件名:极刻云搜 版本:v1.0 软件功能:搜索实用软件和网址 之前有个全网爆火的软件叫搜软 但是它满屏广告而且很久都没更新了 我看也有好多人在求这门类似的软件 我就按照它扒了一个一模一样的 软件丑是丑了点 但是这个功能确实简单粗暴 因为用…...
android Stagefright框架
作为Android音视频开发人员,学习Stagefright框架需要结合理论、源码分析和实践验证。以下是系统化的学习路径: 1. 基础准备 熟悉Android多媒体体系 掌握MediaPlayer、MediaCodec、MediaExtractor等核心API的用法。 理解Android的OpenMAX IL(…...
vscode 打开新页签
目录 vscode 打开新页签 完整settings.json内容: vscode 打开新页签 .vscode目录中 新建settings.json 在 settings.json 文件中,添加或修改以下行: json "workbench.editor.enablePreview": false 这将禁用预览模式࿰…...
【C++编程入门】:从零开始掌握基础语法
C语言是通过对C语言不足的地方进行优化创建的,C在C语言之上,C当然也兼容C语言, 在大部分地方使用C比C更方便,可能使用C需要一两百行代码,而C只需要五六十行。 目录 C关键字 命名空间 缺省参数 缺省参数分类 函数…...
Vue中如何优雅地阻止特定标签的移除并恢复其原始位置
Vue中如何优雅地阻止特定标签的移除并恢复其原始位置 在使用 Element Plus 或 Element UI 的 <el-select> 组件时,有时我们希望根据某些条件阻止用户移除特定的标签,并且在阻止移除后将该标签重新添加到其原始位置。这在处理与子项目关联的成员时特别有用。本文将详细…...