当前位置：首页 > news >正文

【RAG生成】生成模块核心技术解密：从理论到实践的全链路优化

news 来源：原创 2025/9/14 1:12:06

RAG知识系列文章

【RAG实践】手把手Python实现搭建本地知识问答系统
【RAG进阶】从基础到模块化：深度解析RAG技术演进如何重塑AI知识边界
【RAG检索】RAG技术揭秘：检索≠召回？
【RAG增强】解密RAG系统排序优化：从基础原理到生产实践
【RAG生成】生成模块核心技术解密：从理论到实践的全链路优化

一、引言

作为RAG（检索增强生成）系统的核心组件，生成模块负责将检索到的上下文与用户查询结合，输出高质量、事实准确的回答，将检索结果最终转化为自然语言展现出来。

在学习RAG生成模块的时候需深入理解LLM的提示工程、思维链（Chain-of-Thought）设计，以及如何将检索内容融合到生成逻辑中。RAG系统的生成模块并非孤立于输入、检索和增强阶段，而是与这些环节深度耦合，形成一个整体的生成逻辑。

RAG系统的生成模块与输入、检索、增强模块形成紧密的协同闭环：

输入模块通过文档分块和元数据标注为检索提供结构化数据基础，直接影响检索结果的粒度与生成上下文的完整性；
检索模块利用向量编码和混合策略（BM25+向量搜索）筛选高相关片段，为生成提供核心素材；
增强模块通过注意力门控和知识验证抑制噪声并融合多源信息，确保生成内容的事实性；
生成模块反向通过置信度反馈和交互式修正优化检索策略，并依赖动态Prompt工程将增强后的上下文转化为精准输出。四者构成“数据预处理-精准召回-知识提纯-可控生成”的全链路增强体系。

二、核心知识

提示工程（Prompt Engineering）
- 设计高效模板，将检索内容与用户查询结合，控制生成逻辑。
- 关键方法：Few-shot示例、角色指令（Role Prompting）、思维链（CoT）。
上下文整合与幻觉控制
- 确保生成内容严格依赖检索结果，减少模型“虚构”。
- 技术手段：引用标注、置信度阈值、上下文约束解码。
多文档生成策略
- 处理多篇检索文档的信息冗余与冲突，提取核心信息。
- 方法：文档排序加权、摘要融合、对抗式过滤。
生成模型优化
- 微调领域适配的LLM，提升特定场景生成质量。
- 技术：LoRA/QLoRA高效微调、PPO强化学习对齐。
交互式生成优化
- 支持多轮对话中的上下文连贯性管理。
- 方案：对话状态跟踪（DST）、显式记忆缓存。

三、核心知识与原理详解

3.1 提示工程

1 核心知识原理

本质定义与功能定位
提示工程（Prompt Engineering）是通过设计和优化输入提示语引导大语言模型（LLM）生成预期输出的技术体系，其本质是构建“人-模型-任务”协同框架。核心功能包括：
- 语义映射：通过词汇选择、句式结构建立任务需求与模型能力的连接（如方向性引导原理）；
- 概率调控：利用温度参数（Temperature）、采样策略（Top-K/P）等控制输出的随机性与创造性；
- 上下文管理：通过示例插入、知识检索（RAG）实现知识迁移（In-Context Learning机制）。
技术分层架构
根据复杂度分为三级：
- 基础层：零样本/少样本提示，直接通过自然语言描述任务；
- 进阶层：思维链（CoT）、知识增强（RAG）、树状推理（ToT）等结构化引导技术；
- 系统层：模块化模板设计、自动优化算法（如ProTeGi、DP2O）。
核心原理
- 模块化设计：通过角色定义、技能描述、工作流程拆解任务逻辑；
- 参数动态平衡：温度（0.1-0.9）、Top-K（20-50）、Top-P（0.85-0.95）的协同调控；
- 知识解耦与重组：将知识从参数空间迁移至语义空间，形成可追溯的版本化知识库。

2 核心技术解析

模块化设计

角色-技能-流程架构：

class PromptTemplate:def __init__(self):self.role = "领域专家"  # 角色定位self.workflow = ["问题分类→关键词提取→知识检索→多轮验证"]  # 流程控制self.constraints = {"max_length":500, "citation":True}  # 输出约束

思维链（CoT）：通过有序步骤分解复杂推理（如“首先分析问题类型→提取核心矛盾→检索相关案例”）。

参数化调控技术

参数	优化场景	推荐值	作用机理
温度	创意生成	0.7-0.9	增加概率分布的熵值
Top-P	技术文档写作	0.85-0.95	动态截断概率分布
Max_Length	法律文书	800-1200	控制信息完整性

自动化优化算法

ProTeGi：基于梯度文本的迭代优化，通过批评性提示生成新提示，效果优于传统方法38%；
DP2O：融合强化学习与对话策略的多目标优化框架，适用于金融/医疗领域；
MOP：领域自适应提示调优，支持跨模型迁移（如GPT→Claude）。

3 优化路线总结

四阶段演进路径（基于企业实践）：
- 基础建设期（1-3个月）：构建标准提示库（500+模板），建立ROUGE/BLEU/人工评分评估体系；
- 系统增强期（3-6个月）：混合增强策略（代码示例）：
```
def optimize_prompt(query):if is_creative(query):apply_coat(query, temp=0.8)  # 思维链增强elif is_technical(query):apply_rag(query, top_k=3)    # 知识检索增强
```
- 自动调优期（6-12个月）：部署ProTeGi等自动优化系统，实现跨模型提示迁移；
- 生态构建期（1-2年）：建立领域知识图谱与提示关联网络，开发可视化调试平台。
关键优化方案
- 动态条件判断：根据任务类型动态选择提示策略（如创意任务优先CoT，技术任务优先RAG）；
- 自我验证机制：通过多轮检查点（Checkpoints）验证输出逻辑一致性。

4 实践验证数据

准确率提升：MMLU基准从68.2%→79.5%（结构化提示工程应用后）；
幻觉率降低：医疗领域测试显示幻觉率从12.3%→4.7%；
工程效率：新任务上线响应时间从传统方法的12小时缩短至17分钟（CLOB框架）；
多模态优化：结合视觉提示的Multimodal CoT技术使图像分析任务准确率提升29%。

3.2 上下文整合与幻觉控制

1 核心知识原理

本质定义与功能定位
上下文整合指通过外部知识库检索与任务相关的信息，并与大语言模型（LLM）的生成过程动态结合，提升输出的准确性和相关性。幻觉控制则是通过设计约束性提示、验证机制和知识锚定技术，减少模型生成虚构或不可验证内容的风险。两者共同作用，确保生成内容既符合事实逻辑，又满足特定场景需求。
技术分层架构

基础层：关键词匹配检索、静态知识库调用
进阶层：动态上下文注入（RAG）、分步验证流程（CoT）
系统层：知识图谱关联、自动化幻觉检测算法

核心原理

知识解耦与动态重组：将知识从模型参数空间迁移至外部可编辑的语义空间
概率约束机制：通过温度参数（0.1-0.5）限制生成随机性，结合Top-P采样（0.85-0.95）控制输出确定性
多轮自验证：引入检查点（Checkpoints）实现生成内容的逻辑连贯性验证

2 核心技术解析

模块化设计

结构化模板架构：

class HallucinationControlPrompt:def __init__(self):self.context_anchor = "基于2023年ACC指南第5章"  # 知识锚点self.verification_steps = ["检索权威来源","对比多版本数据","标注不确定性区间"]

动态上下文管理：根据问题类型实时切换知识库（如医学场景优先调用PubMed摘要，法律场景调用法规库）

参数化调控技术

参数/策略	优化目标	典型配置	作用机理
温度（Temperature）	减少随机幻觉	0.1-0.3	抑制低概率token生成
Top-K采样	提升专业领域准确性	20-30	限制候选词范围
最大证据数约束	增强可追溯性	3-5条/回答	强制引用多来源

自动化优化算法
- ProTeGi梯度优化：通过迭代生成批评性提示，降低幻觉率38%
- MOP领域自适应：针对医疗/法律领域微调验证模块，提升特定场景准确率15%
- 混合验证框架：结合规则引擎（如正则表达式匹配）与神经网络分类器，实现生成内容双重校验

3 优化路线总结

三阶段演进路径

基础建设期（1-3个月）：
构建领域知识库（5000+实体）、建立基础验证规则库（如药品禁忌自动检测）

系统增强期（3-6个月）：

def optimize_context(query):if medical_query(query):apply_rag(query, db="clinical_guidelines")add_constraint("[必须标注指南版本]") elif legal_query(query):enable_cross_check(model="law_bert")

智能调优期（6-12个月）：部署幻觉检测AI代理，实现实时生成内容可信度评分

关键优化方案
- 知识锚定技术：强制关键结论必须关联知识库ID（如"PMID:123456"）
- 动态置信度标注：对生成内容自动标记可信等级（高/中/低）
- 对抗性验证：构建反例数据集训练幻觉检测模型

4 实践验证数据

医疗领域优化：
- 用药建议幻觉率从12.3%→4.7%
- 诊断方案可追溯性提升58%
法律文书生成：
- 条款冲突检测准确率达92%
- 生成效率：合同起草时间从4小时→17分钟（CLOB框架动态检索）
化学材料分析：
- 分子属性预测准确率提升至80.2%
- 幻觉下降指标：从0.38→0.12（通过梯度优化提示工程）
多轮对话场景：
- 连贯性评分提高41%
- 上下文丢失率降低72%（动态缓存管理算法）

3.3 多文档生成策略

1 核心知识原理

本质定义与功能定位
多文档生成策略指通过整合多个异构文档内容，结合检索增强生成（RAG）技术，动态选择、重组并生成满足用户需求的输出。其核心功能包括：
- 跨文档语义关联：通过元数据过滤、语义检索和上下文对齐，解决多文档间的信息冗余与冲突
- 动态知识融合：根据用户查询的粒度，自适应选择文档片段（如章节、表格、图像），实现内容精准匹配
- 幻觉控制：通过知识锚定、多源验证和置信度标注，降低生成内容的虚构风险
技术分层架构
- 基础层：文档解析与结构化（支持PDF/Word/Markdown等格式的视觉化编码与特征提取）
- 进阶层：动态切分策略（固定长度/语义分割/标题分层）与混合召回（BM25+向量检索）
- 系统层：多路径检索优化（HiQA框架）、知识图谱关联与自动化质量评估
核心原理
- 结构化检索：利用文档层级关系（章节/图表/公式）构建语义索引，提升检索精度
- 多模态对齐：将文本、表格、图像嵌入统一语义空间，支持跨模态内容生成
- 流程解耦：分离解析、检索、重组、生成环节，实现模块化扩展

2 核心技术解析

模块化设计

分层上下文增强器（HCA）：

class MultiDocGenerator:def __init__(self):self.parser = MarkdownFormatter()  # 文档结构化解析self.retriever = HybridSearcher(bm25_weight=0.3, vector_weight=0.7)  # 混合检索self.validator = HallucinationDetector(confidence_threshold=0.85)  # 幻觉检测

动态切分策略：根据文档类型自动切换切分模式（技术文档按标题分层，论文按章节切分）

参数化调控技术

参数/策略	优化目标	典型配置	作用机理
滑动窗口重叠率	保证语义连贯性	20%-30%	避免关键信息割裂
混合召回权重	平衡精确与召回	BM25:0.4, 向量:0.6	兼顾关键词与语义匹配
多源验证阈值	降低幻觉率	≥3个独立来源验证	强制交叉校验

自动化优化算法
- HiQA多路径检索：并行执行关键词/语义/图像检索，综合Top-K结果排序
- ProTeGi迭代优化：通过批评性提示自动修正生成偏差，准确率提升38%
- 动态置信度标注：对生成内容标记可信等级（高/中/低），指导人工复核

3 优化路线总结

三阶段演进路径

基础建设期（1-3个月）：
构建多模态知识库（支持文本/表格/图像），建立文档解析标准

系统增强期（3-6个月）：

def optimize_generation(query):if is_technical(query):apply_hiqa(query, top_k=5)  # 多路径检索增强enable_cross_check(model="multi_bert")  elif contains_image(query):activate_multimodal_rag()  # 多模态对齐

智能调优期（6-12个月）：部署幻觉检测AI代理（Agent X），实现实时可信度评分

关键优化方案
- 语义金字塔架构：从段落→章节→文档层级递进检索，解决长文本碎片化问题
- 对抗性训练：构建包含1.2万+反例的数据集，提升模型抗干扰能力
- 增量式索引更新：当文档变动超过15%时自动触发索引重建，保持知识时效性

4 实践验证数据

检索效率提升：
- 跨省高铁专网优化任务响应时间从14天→52秒
- 多文档问答准确率从68%→94%
生成质量优化：
- 技术文档幻觉率从12.3%→4.7%
- 合同生成效率提升：起草时间从4小时→17分钟
多模态突破：
- 芯片手册图像关联问答准确率达89%
- 医学报告表格语义解析误差率降低62%
工程效能数据：
- 新任务上线响应时间缩短98%（12小时→17分钟）
- 多语言支持扩展至9种语言，生成一致性评分提高53%

3.4 生成模型优化

1 核心知识原理

本质定义与功能定位
生成模型优化是通过改进模型架构、训练策略和计算资源配置，提升生成质量、效率与泛化能力的技术体系。其核心目标包括：
- 质量提升：减少生成内容的幻觉率（如医疗领域从12.3%降至4.7%），增强语义一致性
- 效率突破：通过混合精度训练等技术实现4000倍计算效率提升（分形生成模型案例）
- 资源优化：压缩模型参数量（如知识蒸馏技术减少30%参数）
技术分层架构
- 基础层：梯度优化算法（SGD/Adam）、正则化（L1/L2/Dropout）
- 进阶层：模型压缩（剪枝/量化）、架构创新（MoE/分形生成）
- 系统层：分布式训练、多模态对齐（CLIP/Flamingo）
核心原理
- 概率分布逼近：通过VAE的变分推断或扩散模型加噪-去噪过程逼近真实数据分布
- 梯度动力学调控：动量方法减少参数更新震荡，自适应学习率（AdamW）平衡不同参数维度优化速度
- 知识迁移机制：利用预训练大模型（如GPT-4）的通用能力，通过微调实现领域适配

2 核心技术解析

模块化设计
- 分形生成架构：通过递归调用原子生成模块（如自回归模型），构建自相似性结构提升图像生成质量（测试显示PSNR提升2.1dB）
- 混合专家系统（MoE）：动态激活子网络处理不同任务，参数量减少40%的同时保持生成能力
参数化调控技术

参数/策略	优化目标	典型配置	作用机理
学习率衰减	加速收敛	指数衰减（初始0.001→0.0001）	避免后期震荡
温度参数	控制输出多样性	0.1-0.7	调节Softmax概率分布熵值
标签平滑	增强泛化能力	平滑因子0.1	缓解过拟合（准确率提升2.3%）

自动化优化算法
- ProTeGi梯度优化：基于批评性提示迭代修正生成偏差，医疗文本生成任务幻觉率降低38%
- AdamW自适应策略：解耦权重衰减与学习率调整，图像分类任务收敛速度提升25%
- 对抗性训练框架：构建1.2万+反例数据集，提升模型抗干扰能力（FID指标改善15%）

3 优化路线总结

三阶段演进路径

基础调优期（1-3个月）：
实施混合精度训练（FP16+FP32），部署梯度累积策略（批量扩展至512）

架构创新期（3-6个月）：

def optimize_generator():if is_image_task():apply_fractal_blocks()  # 分形递归模块elif is_text_task():enable_moe_routing()    # 动态专家选择

生态整合期（6-12个月）：
构建多模态对齐系统（CLIP+扩散模型），实现文本-图像联合优化（跨模态生成准确率提升29%）

关键优化方案
- 动态计算图重构：根据输入复杂度自动切换全精度/量化模式（推理速度提升3倍）
- 多目标损失函数：联合对抗损失+重构损失+KL散度，平衡生成质量与多样性（FID降低18%）
- 增量式知识蒸馏：将大模型能力逐步迁移至轻量模型（参数量压缩70%）

4 实践验证数据

图像生成领域：
- 分形生成模型在ImageNet-1K上实现PSNR 32.1，超越传统模型15%
- 扩散模型结合CLIP对齐技术，跨模态生成任务准确率提升至89%
文本生成领域：
- 医疗报告生成幻觉率从12.3%→4.7%
- 合同条款生成效率提升：单次生成时间从4小时→17分钟
系统级优化：
- 混合精度训练使BERT-large训练周期从7天缩短至43小时
- 模型量化技术实现移动端部署，内存占用减少75%
多模态突破：
- 蛋白质逆折叠算法恢复率达88.73%
- 芯片设计图像关联分析误差率降低62%

3.5 交互式生成优化

1 核心知识原理

本质定义与功能定位
交互式生成优化（Interactive Generation Optimization）是一种通过多轮人机协作动态调整生成模型输出的技术体系，其核心目标是实现生成质量可控性和任务适应性。核心功能包括：
- 动态反馈循环：基于用户实时反馈（如修正指令、评分标注）迭代优化生成路径
- 知识锚定与纠偏：利用外部知识库（如医疗指南、法律条文）约束生成内容的逻辑一致性
- 多模态协同：融合文本、图像、结构化数据的跨模态对齐能力
技术分层架构

交互层：自然语言接口（NLI）、可视化调试工具
控制层：强化学习策略网络、多目标优化算法
生成层：支持增量更新的生成模型

核心原理
- 梯度文本进化：通过ProTeGi等算法自动生成批评性提示修正模型偏差
- 稀疏激活机制：混合专家模型（MoE）动态选择子网络处理特定任务
- 对抗验证机制：构建反例数据集训练判别器约束生成空间

2 核心技术解析

模块化设计

多代理协同架构：

class InteractiveGenerator:def __init__(self):self.parser = KnowledgeExtractor()  # 知识解析模块self.validator = HallucinationDetector()  # 逻辑验证模块self.optimizer = RLPolicyNetwork()  # 强化学习策略

动态流程控制器：根据任务复杂度自动切换生成模式（如AutoStudio分阶段处理布局生成与主题维护）

参数化调控技术

参数/策略	优化场景	典型配置	作用机理
温度衰减系数	多轮对话一致性	0.7→0.3	逐步降低输出随机性
反馈采样权重	医疗方案生成	专家反馈:0.8	强化领域知识引导
多模态融合率	图文联合生成	文本:0.6 图像:0.4	平衡跨模态特征

自动化优化算法
- EPIG主动学习框架：通过不确定性采样选择最优分子进行人工验证
- AgentInstruct数据工厂：生成2500万高质量指令-响应对
- 动态置信度路由：根据生成阶段自动分配计算资源

3 优化路线总结

三阶段演进路径

基础建设期（3-6个月）：
构建交互式调试平台（如EEGLAB可视化工具），部署基础反馈采集系统

系统增强期（6-12个月）：

def optimize_generation(query):if is_creative(query):activate_moe_routing(top_k=3)  # 动态专家选择elif is_technical(query):enable_rag_validation(db="clinical_guidelines")  # 知识锚定

生态成熟期（12-24个月）：
建立跨模态生成工作流（如文本-图像联合优化），部署实时可信度评分系统

关键优化方案
- 增量式知识蒸馏：将大模型能力逐步迁移至轻量化推理引擎（模型压缩技术）
- 对抗性验证网络：构建包含1.2万+反例的判别器数据集（GAN改进方案）
- 多轮记忆缓存：实现对话状态的持久化存储与动态加载（主题数据库设计）

4 实践验证数据

生成质量优化：
- 药物分子活性预测MAE从0.38降至0.12（EPIG框架）
- 多主题图像生成FID指标改善15%（AutoStudio框架）
工程效率突破：
- 新任务上线响应时间缩短98%（12小时→17分钟）（的CLOB架构）
- 模型训练周期从7天压缩至43小时（混合精度训练）
跨模态突破：
- 蛋白质逆折叠恢复率达88.73%
- 芯片设计图像关联分析误差降低62%
商业价值验证：
- 医疗报告生成成本降低57%
- 合同条款冲突检测准确率92%（法律知识图谱应用）

四、总结

1. 核心原理

动态上下文融合机制
生成模块通过将检索到的外部知识（如文档片段、结构化数据）与原始查询动态拼接，构建增强型提示（Augmented Prompt）。这种融合基于注意力权重分配，使LLM能聚焦于最相关的知识片段。例如，在医疗问答场景中，系统会将检索到的临床指南章节与患者症状描述组合，形成"问题+证据"的联合输入结构。
概率分布修正原理
利用外部知识作为条件约束，通过交叉注意力机制调整LLM的token生成概率分布。实验数据显示，这种修正可使医疗文本生成的幻觉率从12.3%降至4.7%。核心公式可表示为：
P(y|x,C) = ∏P(y_t|x,y_<t,C)
其中C代表检索得到的上下文，x为原始输入。

2. 关键技术架构

多模态输入处理
- 文本增强：采用特殊分隔符标记检索内容（如[EVIDENCE]...[/EVIDENCE]），防止知识片段与原始问题混淆
- 跨模态对齐：通过CLIP等模型实现图文联合编码，支持芯片设计文档的图像关联生成（准确率达89%）
生成优化策略

技术方向	实现方案	效果验证
知识蒸馏	将GPT-4生成结果作为教师信号	合同条款生成效率提升300%
动态温度调控	根据检索结果置信度调整temperature	法律文本一致性提升41%
对抗训练	构建12,000+反例数据集	FID指标改善15%

3. 核心技术解析

序列到序列架构创新
- T5/BART改进型：在标准Transformer结构上增加知识门控机制，通过sigmoid函数控制外部知识影响权重
- 多专家系统（MoE）：动态激活不同子网络处理检索内容，在保持70%参数量下实现94%的问答准确率
训练策略突破
- 两阶段训练法：先冻结检索模块训练生成器，再端到端联合优化（医疗QA任务BLEU提升8.2）
- 课程学习策略：从简单检索结果到复杂多文档输入的渐进式训练，使模型逐步掌握知识整合能力
实时优化技术
- ProTeGi梯度优化：基于生成结果自动生成批评性提示，迭代修正模型偏差（迭代3轮后幻觉率降低38%）
- 置信度路由机制：对输出token进行可信度评分，低置信度部分触发二次检索验证

4. 工程实践与验证数据

质量提升
- 开放域问答准确率：从68%→94%（基于HiQA多路径检索框架）
- 多轮对话连贯性：评分提高41%（通过记忆缓存机制）
效率突破
- 响应时间：法律合同生成从4小时→17分钟（CLOB框架动态检索）
- 训练成本：混合精度训练使BERT-large训练周期缩短65%
多模态扩展
- 蛋白质结构预测：逆折叠恢复率达88.73%（结合3D知识检索）
- 芯片设计文档生成：图像关联分析误差降低62%

五、常见误区与避坑指南

过度依赖模型能力
- 错误：直接输入10篇文档期望模型自动筛选
- 正确：应先做摘要压缩，如使用BART-Large-CNN生成每篇3句摘要。
忽视评估指标
- 错误：仅用BLEU评分衡量生成质量
- 正确：需结合业务指标（如客服工单解决率）和人工评估。
忽略计算成本
- 错误：对所有查询都使用GPT-4生成
- 正确：建立路由机制，简单查询用轻量级模型（如Phi-3）。

【RAG生成】生成模块核心技术解密：从理论到实践的全链路优化

RAG知识系列文章【RAG实践】手把手Python实现搭建本地知识问答系统【RAG进阶】从基础到模块化：深度解析RAG技术演进如何重塑AI知识边界【RAG检索】RAG技术揭秘：检索≠召回？【RAG增强】解密RAG系统排序优化：从基础原理到生产实践…...

编程日记 2025/9/14 1:12:06

JavaWeb-ServletContext应用域接口

文章目录 ServletContext接口简介获取一个ServletContext对象ServletContext接口中的相关方法获取应用域配置参数关于应用域参数的配置要求getContextPath获取项目路径getRealPath获取真实路径log系列方法添加相关日志增删查应用域属性 ServletContext接口简介 ServletContext…...

编程日记 2025/9/10 3:55:03

Vue3状态管理新选择：Pinia使用完全指南

一、为什么需要状态管理？ 在Vue应用开发中，当我们的组件树变得复杂时，组件间的数据传递会成为棘手的问题。传统方案（如props/$emit）在多层嵌套组件中会变得笨拙，这时状态管理工具应运而生。Vue3带来了全新…...

编程日记 2025/9/11 16:35:44

权重生成图像

简介前面提到的许多生成模型都有保存了生成器的权重，本章主要介绍如何使用训练好的权重文件通过生成器生成图像。但是如何使用权重生成图像呢？一、参数配置 ima_size 为图像尺寸，这个需要跟你模型训练的时候resize的时候一样。 latent_dim为噪声维度，一般的设置都是…...

编程日记 2025/9/11 1:25:46

【ESP32S3接入讯飞在线语音识别】

视频地址：【ESP32S3接入讯飞在线语音识别】 1. 前言使用Seeed XIAO ESP32S3 Sense开发板接入讯飞实现在线语音识别。自带麦克风模块用做语音输入，通过串口发送字符“1”来控制数据的采集和上传。语音识别对比平台api教程评分百度...

编程日记 2025/9/14 1:12:03

RISCV指令集解析

参考视频：《RISC-V入门&进阶教程》1-4-RV32I基本指令集（1）_哔哩哔哩_bilibili privilege是特权指令集，有点系统调用的感觉，要走内核态。unprivilege指令集有点像普通的函数调用。...

编程日记 2025/9/3 4:22:03

详解 c++ 中的 namespage

C 中的命名空间很特别，其他编程语言基本都没有。命名空间介于函数与类之间，兼顾了二者的一些优点。这篇博客根据 chatgpt 的回答整理。文章目录 **1. 什么是 namespace（命名空间）？****2. 语法****3. 使用 namespace 访…...

编程日记 2025/9/14 1:12:05

Qt监控系统远程回放/录像文件远程下载/录像文件打上水印/批量多线程极速下载

一、前言说明在做这个功能的时候，着实费了点心思，好在之前做ffmpeg加密解密的时候，已经打通了极速加密保存文件，主要就是之前的类中新增了进度提示信号，比如当前已经处理到哪个position位置，发个信号出来…...

编程日记 2025/9/10 23:27:51

Idea 和 Pycharm 快捷键

一、快捷键二、Pycharm 中怎么切换分支参考如下如果在界面右下角没有看到当前所在的分支，如 “Git:master” 3. 有了 4....

编程日记 2025/8/16 10:56:31

在 Mac mini M2 上本地部署 DeepSeek-R1:14B：使用 Ollama 和 Chatbox 的完整指南

随着人工智能技术的飞速发展，本地部署大型语言模型（LLM）已成为许多技术爱好者的热门选择。本地部署不仅能够保护隐私，还能提供更灵活的使用体验。本文将详细介绍如何在 Mac mini M2（24GB 内存）上部署 DeepS…...

编程日记 2025/9/9 14:14:08

2024年国赛高教杯数学建模A题板凳龙闹元宵解题全过程文档及程序

2024年国赛高教杯数学建模 A题板凳龙闹元宵原题再现 “板凳龙”，又称“盘龙”，是浙闽地区的传统地方民俗文化活动。人们将少则几十条，多则上百条的板凳首尾相连，形成蜿蜒曲折的板凳龙。盘龙时，龙头在前领头&#x…...

编程日记 2025/9/7 8:44:34

【R包】pathlinkR转录组数据分析和可视化利器

介绍通常情况下，基因表达研究如微阵列和RNA-Seq会产生数百到数千个差异表达基因（deg）。理解如此庞大的数据集的生物学意义变得非常困难，尤其是在分析多个条件和比较的情况下。该软件包利用途径富集和蛋白-蛋白相互作用网络&…...

编程日记 2025/9/13 17:08:41

基于大模型的脑出血全周期预测与诊疗方案研究报告

目录一、引言 1.1 研究背景与意义 1.2 研究目的与创新点 1.3 研究方法与数据来源二、大模型预测脑出血的原理与技术基础 2.1 大模型概述 2.2 脑出血相关数据收集与预处理 2.3 机器学习算法在预测模型中的应用 2.4 模型训练与优化三、术前风险预测与准备 3.1 术前…...

编程日记 2025/9/12 12:56:42

高数1.1 函数

1. 定义 1.1 函数 1.2 反函数 1.2.1 求反函数例题 1.3 基本初等函数和初等函数 1.4 基本函数性质...

编程日记 2025/9/2 14:04:38

Java常见设计模式(中):结构型模式

🌈 引言：设计模式就像乐高积木适配器：让不同形状的积木完美拼接装饰器：给积木添加炫酷灯光效果代理：遥控积木完成复杂动作组合：将小积木搭建成宏伟城堡结构型模式主要用于描述对象之间的关系&#xff…...

编程日记 2025/9/14 1:12:05

【Python修仙编程】(二) Python3灵源初探(3)

第一部分：乾坤袋的秘密与修炼之路在修仙界，有一个古老的传承，名为《Python无极心法》，它蕴含着强大的力量，能够助修仙者突破重重境界，领悟宇宙天地的奥秘。而要修炼此心法，必须先从基础的“乾…...

编程日记 2025/9/14 1:10:29

Mac本地部署Deep Seek R1

Mac本地部署Deep Seek R1 1.安装本地部署大型语言模型的工具 ollama 官网：https://ollama.com/ 2.下载Deepseek R1模型网址：https://ollama.com/library/deepseek-r1 根据电脑配置，选择模型。我的电脑：Mac M3 24G内存。这…...

编程日记 2025/9/14 1:10:30

可以免费无限次下载PPT的网站

前言最近发现了一个超实用的网站，想分享给大家。在学习和工作的过程中，想必做PPT是一件让大家都很头疼的一件事。想下载一些PPT模板减少做PPT的工作量，但网上大多精美的PPT都是需要付费才能下载使用。即使免费也有次数限制&#xff0…...

编程日记 2025/9/9 11:44:54

练习题： #include <iostream> #include <cstring> using namespace std;class mystring {char* p;int len; public:mystring();mystring(const char* p);~mystring();void copy(const mystring& str);void append(const mystring& str);void sh…...

编程日记 2025/9/9 3:57:25

补题蓝桥杯14届JavaB组第4题

算法：动态规划需要两个一维数组来进行dp 一个用来记录到当前位置的最短时间，另一个用来记录到达当前位置传送门的最短时间到达传送门的时间需要进行判断，如果上一次传送到达传送门，需要判断上一次传送到这的位置在当前传送门…...

编程日记 2025/9/13 11:19:26

DeepSeek 15天指导手册——从入门到精通 PDF(附下载)

DeepSeek使用教程系列--DeepSeek 15天指导手册——从入门到精通pdf下载： https://pan.baidu.com/s/1PrIo0Xo0h5s6Plcc_smS8w?pwd1234 提取码: 1234 或 https://pan.quark.cn/s/2e8de75027d3 《DeepSeek 15天指导手册——从入门到精通》以系统化学习路径为核心&…...

编程日记 2025/9/13 20:41:11

【北京迅为】itop-3568 开发板openharmony鸿蒙烧写及测试-第1章体验OpenHarmony—烧写镜像

瑞芯微RK3568芯片是一款定位中高端的通用型SOC，采用22nm制程工艺，搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码，支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU，可用于轻量级人工…...

编程日记 2025/9/11 7:39:01

C#开发——时间间隔类TimSpan

TimeSpan 是 C# 中的一个结构（ struct ），用于表示时间间隔或持续时间。它位于 System 命名空间中，是处理时间相关操作时非常重要的工具，尤其是在计算两个日期或时间之间的差值、表示时间段或执行时间相关的运算…...

编程日记 2025/9/13 14:48:30

第002文-kali虚拟机安全与网络配置

1、kali系统介绍 kali是一个基于Linux kernel的操作系统，由BackTrack(简称BT)发展而来。BackTrack是2006年推出的一个用于渗透测试及黑客攻防的专用平台，基于Knoppix(linux的一个发行版)开发。BackTrack版本周期：2006年的起始版本BackTrack …...

编程日记 2025/9/12 4:21:08

【HarmonyOS Next】鸿蒙应用折叠屏设备适配方案

【HarmonyOS Next】鸿蒙应用折叠屏设备适配方案一、前言目前应用上架华为AGC平台，都会被要求适配折叠屏设备。目前华为系列的折叠屏手机，有华为 Mate系列（左右折叠，华为 Mate XT三折叠），华为Pocket 系列…...

编程日记 2025/9/9 21:51:01

关于“你对 Spring Cloud 的理解”

Spring Cloud 是一个基于 Spring Boot 的微服务框架，旨在简化分布式系统的开发、部署和管理。它提供了一系列工具和组件，帮助开发者构建和管理微服务架构。以下是对 Spring Cloud 的核心理解： 1. 微服务架构的支持 Spring Cloud 提供了对微…...

编程日记 2025/9/13 18:01:26

微信小程序-二维码绘制

wxml <view bindlongtap"saveQrcode"><view style"position: absolute;background-color: #FFFAEC;width: 100%;height: 100vh;"><canvas canvas-id"myQrcode" style"width: 200px; height: 200px;ba…...

编程日记 2025/9/12 12:51:36

c++中如何打印未知类型对象的类型

在 C 中要打印未知类型对象的类型名称，可以通过以下方法实现： 目录方法一：使用 typeid 和 name()（需包含 ） 使用示例： 问题与改进： 方法二：编译时类型名称（C17 起&…...

编程日记 2025/9/6 5:36:40

SpringBoot集成easy-captcha图片验证码框架

SpringBoot集成easy-captcha图片验证码框架此项目已经很久未维护，如有更好的选择，建议使用更好的选择!!! 一、引言验证码（CAPTCHA）是现代应用中防止机器人攻击、保护接口安全的核心手段之一。然而，从零开发验证码…...

编程日记 2025/9/6 3:57:35

Materials Studio MS2020在linux系统上的安装包下载地址支持centos Ubuntu rocky等系统

下载地址：MS2020-linux官方版下载丨最新版下载丨绿色版下载丨APP下载-123云盘 Materials Studio 2020是一款功能强大的材料科学计算模拟软件，以下是其详细介绍： 核心模块功能 CASTEP模块：采用平面波赝势方法，适用于周…...

编程日记 2025/9/9 14:15:59

DeepSeek 开源狂欢周（二）DeepEP深度技术解析 | 解锁 MoE 模型并行加速

在大模型时代，Mixture-of-Experts (MoE) 模型凭借其强大的容量和高效的计算能力，成为研究和应用的热点。然而，MoE 模型的训练和推理面临着巨大的专家并行通信挑战。近日，DeepSeek 开源了 DeepEP 项目，为解决这一难题提…...

编程日记 2025/9/9 16:32:39

Kylin麒麟操作系统 | 系统监控

以下所使用的环境为： 虚拟化软件：VMware Workstation 17 Pro 麒麟系统版本：Kylin-Server-V10-SP3-2403-Release-20240426-x86_64 一、系统状态查询工具 1. 静态显示系统进程信息ps ps命令会生成一个静态列表，列表中显示的进程其…...

编程日记 2025/9/12 10:24:09

mysql怎样优化where like ‘%字符串%‘这种模糊匹配的慢sql

一问题描述工作中经常遇到这种模糊匹配的慢sql： select * from 表名 where 字段 like %字符串%; 由于前面有%，导致无法走该字段上的索引。二解决办法 ① 给该字段创建一个全文索引 CREATE FULLTEXT INDEX 索引名 ON 表名 (字段名); ② 改写sq…...

编程日记 2025/9/8 1:43:40

基于 C++ Qt 的 Fluent Design 组件库 QFluentWidgets

简介 QFluentWidgets 是一个基于 Qt 的 Fluent Designer 组件库，内置超过 150 个开箱即用的 Fluent Designer 组件，支持亮暗主题无缝切换和自定义主题色。编译示例以 Qt5 为例（Qt6 也支持），将 libQFluentWidgets.d…...

编程日记 2025/9/11 1:13:38

事件【Qt】

文章目录事件事件 event label.cpp #include "label.h" #include<QDebug> Label::Label( QWidget * parent):QLabel(parent) {}void Label::enterEvent(QEvent *event) {//显式地忽略 event 参数,表示函数内部不会使用 event 参数，也不会对其进…...

编程日记 2025/9/9 12:26:05

若依vue plus环境搭建

继前面文章若依系统环境搭建记录-CSDN博客把ruoyi vue plus也摸索了下。作者是疯狂的狮子，dromara/RuoYi-Vue-Plus 初始化文档：项目初始化，环境搭建的视频：RuoYi-Vue-Plus 5.0 搭建与运行_哔哩哔哩_bilibili 上来就列出了一…...

编程日记 2025/9/11 23:33:31

算法题（80）：环形链表II

审题： 需要我们判断链表是否带环，若带环，需要我们返回进入环的第一个节点地址思路： 方法一：set 每个节点的地址都是唯一的，所以我们的set存的是节点地址。当我们遍历链表时， 若节点地址没有存…...

编程日记 2025/9/10 8:57:53

Spring Boot集成Jetty、Tomcat或Undertow及支持HTTP/2协议

目录一、常用Web服务器 1、Tomcat 2、Jetty 3、Undertow 二、什么是HTTP/2协议 1、定义 2、特性 3、优点 4、与HTTP/1.1的区别三、集成Web服务器并开启HTTP/2协议 1、生成证书 2、新建springboot项目 3、集成Web服务器 3.1 集成Tomcat 3.2 集成Jetty 3.3 集成…...

编程日记 2025/9/10 8:57:32

ISO 15118，最新版，汽车充电桩相关标准，1~22子标准

ISO 15118 是一项国际标准，主要规定了电动汽车（EV）与充电桩（EVSE）之间的通信协议，涵盖了充电过程中的信息交换、安全认证、充电控制等内容。以下是其主要内容： 1. 通信协议 V2G通信&#xff1a…...

编程日记 2025/9/13 1:05:16

信息系统项目管理师考试介绍和学习资料分享

信息系统项目管理师考试是评估考生在信息系统项目管理领域的专业知识和技能的重要考试。以下是对信息系统项目管理师考试的详细介绍： 拥有软考信息系统项目管理师高级证的作用： 提高求职竞争力‌： 信息系统项目管理师证书是国家级证书&#…...

编程日记 2025/9/13 21:41:22

基于 Spring AI 的 HIS 系统智能化改造

【Spring AI 的背景与现状】 Spring AI 是 Spring 生态里整的一个新活儿，专门给开发者提供搞 AI 驱动的应用的工具和框架。虽然 Spring AI 已经鼓捣了挺长时间，但截至现在（2025年2月），它还没正式发布。不过&#xff0…...

编程日记 2025/9/13 13:32:49

visual studio 2022安装教程及下载（附安装包）visual studio 2022下载安装教程图文详情

文章目录前言一、visual studio 2022下载二、visual studio 2022安装教程三、软件设置四、安装完成前言 Visual Studio 2022 作为强大的集成开发环境，深受开发者青睐。但初次安装，其复杂步骤易让人摸不着头脑。为帮大家顺利安装，本文将详细…...

编程日记 2025/9/9 1:12:13

Nginx+PHP+MYSQL-Ubuntu在线安装

在 Ubuntu 上配置 Nginx、PHP 和 MySQL 的步骤如下： 1. 更新系统包首先，确保系统包是最新的： sudo apt update sudo apt upgrade2. 安装 Nginx 安装 Nginx： sudo apt install nginx启动并启用 Nginx 服务： sudo…...

编程日记 2025/9/13 0:01:44

【Excel】 Power Query抓取多页数据导入到Excel

抓取多页数据想必大多数人都会，只要会点编程技项的人都不会是难事儿。那么，如果只是单纯的利用Excel软件，我还真的没弄过。昨天，我就因为这个在网上找了好久发好久。 1、在数据-》新建查询-》从其他源-》自网站 ，如图 …...

编程日记 2025/9/10 0:19:36

spring boot 2.7 + seata +微服务降级失败问题修复

文章引流一个简单而使用的API管理工具版本号 spring boot 2.7.17 spring-cloud-dependencies 2021.0.8 spring-cloud-circuitbreaker-resilience4j 2.1.7 spring-cloud-starter-alibaba-seata 2021.1 jdk 1.8原因分析未配置属性 feign.circuitbreaker.enabledtrue # 未…...

编程日记 2025/9/9 15:08:18

Ubuntu 22.04 安装Nvidia驱动加速deepseek

一键安装22.04 nvidia 驱动 nvidia 官网下载驱动我的环境是NVIDIA RTX A5000nvidia 文档参考没有安装驱动之前确认自己的型号 lspci | grep -i vga （如数字2231） 参考docker 支持nvidia ，注释了需要的取消注释即可 42行-92行一定要重启服务器…...

编程日记 2025/9/13 14:04:34

【Java项目】基于Spring Boot的校园博客系统

【Java项目】基于Spring Boot的校园博客系统技术简介：采用Java技术、Spring Boot框架、MySQL数据库等实现。系统简介：校园博客系统是一个典型的管理系统，主要功能包括管理员：首页、个人中心、博主管理、文章分类管理、文章信息…...

编程日记 2025/9/14 0:49:53

centos7 离线安装docker

1.下载docker Index of linux/static/stable/x86_64/ 2.安装docker tar -zxvf docker-19.03.9.tgz cp -p docker/* /usr/bin 创建docker服务配置文件docker.servicevim /etc/systemd/system/docker.service [Unit] DescriptionDocker Application Container Engine Docume…...

编程日记 2025/9/8 15:52:58

基于Rook的Ceph云原生存储部署与实践指南（上）

#作者：任少近文章目录 1 Ceph环境准备2 rook部署ceph群集2.1 Rook 帮助地址2.2 安装ceph2.3 获取csi镜像2.4 Master参加到osd2.5 设置默认存储 3 Rook部署云原生RBD块存储3.1 部署storageclass资源3.2 部署WordPress使用RBD3.3 WordPress访问 4 Rook部署云原生RGW…...

编程日记 2025/9/10 20:45:37

微服务合并

有的团队为了节约机器成本、有的团队为了提升研发效率、有的团队为了降低人均服务数微服务合并，可以从多个角度入手代码重构融合：人工拷贝代码、解决冲突，然后分阶段实施迁移重构。代码合并打包：将多个代码仓库，拉取…...

编程日记 2025/9/11 6:35:01

RAG知识系列文章

一、引言

二、核心知识

三、核心知识与原理详解

3.1 提示工程

3.2 上下文整合与幻觉控制

3.3 多文档生成策略

3.4 生成模型优化

3.5 交互式生成优化

四、总结

五、常见误区与避坑指南

相关文章：