当前位置: 首页 > news >正文

RAG - 五大文档切分策略深度解析

文章目录

  • 切分策略
    • 1. 固定大小分割(Fixed-Size Chunking)
    • 2. 滑动窗口分割(Sliding Window Chunking)
    • 3. 自然语言单元分割(Sentence/Paragraph Segmentation)
    • 4. 语义感知分割(Semantic-Aware Segmentation)
    • 5. 结构化分割(Hierarchical/Structural Segmentation)
  • 应用场景举例
    • 一、固定大小切分:舆情监控的基石策略
    • 二、语义切分:医疗知识库的救星
    • 三、结构感知切分:法律合同解析的黄金标准
    • 四、LLM智能切分:科研论文处理的新范式
    • 五、混合策略:电商场景的终极解决方案
    • 企业级选型指南
    • 演进路线建议
  • 选择策略的建议

在这里插入图片描述

在RAG(检索增强生成)系统中,文本切分策略对检索效果和生成质量至关重要。我们来看下RAG五大核心切分策略及其特点


切分策略

1. 固定大小分割(Fixed-Size Chunking)

  • 方法:将文本按预设的固定长度(如字符数、词数或Token数)均匀分割。

  • 优点:实现简单,计算效率高,适合处理大批量文本。

  • 缺点:可能截断语义完整的句子或段落,导致上下文丢失。

  • 应用场景:通用文档处理,对速度要求高于语义完整性的场景。


2. 滑动窗口分割(Sliding Window Chunking)

  • 方法:允许相邻块之间部分重叠(如后一块包含前一块末尾的若干句子),减少信息断裂。
  • 优点:缓解上下文不连贯问题,提升检索相关性。
  • 缺点:增加计算和存储开销,可能引入冗余信息。
  • 应用场景:长文本处理(如科研论文、技术文档),需保留连续上下文的场景。

3. 自然语言单元分割(Sentence/Paragraph Segmentation)

  • 方法:基于自然语言结构(如句子、段落或章节)切分文本,依赖标点符号或换行符。
  • 优点:保持语义完整性,符合人类阅读习惯。
  • 缺点:对格式不规范或结构松散的文本效果较差。
  • 应用场景:结构清晰的文本(如新闻文章、书籍章节)。

4. 语义感知分割(Semantic-Aware Segmentation)

  • 方法:利用嵌入模型(如BERT、Sentence-BERT)计算句子相似度,在语义变化处切分。
  • 优点:动态识别语义边界,适应复杂文本。
  • 缺点:计算成本高,依赖模型性能。
  • 应用场景:多主题混合或领域专业性强的内容(如法律合同、医学报告)。

5. 结构化分割(Hierarchical/Structural Segmentation)

  • 方法:依据文档结构(如标题、列表、表格)切分,结合元数据(如Markdown标题层级)。
  • 优点:保留逻辑结构,增强检索的精准性。
  • 缺点:依赖文档格式标准化,需预处理解析工具。
  • 应用场景:格式规范的文档(如API文档、技术手册)。

应用场景举例


一、固定大小切分:舆情监控的基石策略

技术实现:以512个token为基本单元,设置15%重叠区域的滑动窗口
典型案例

  • 今日头条舆情系统采用动态分块算法,对突发新闻进行实时处理。通过设置"紧急事件防护栏",当检测到关键词(如"地震"、“疫情”)时自动切换至256token细粒度切分,使灾害预警响应速度提升60%
  • Stack Overflow论坛分析平台采用Markdown代码块保护机制,确保python\nprint("Hello")\n等代码片段不被截断,技术问答匹配准确率提升至89%

优化技巧

  1. 使用SentencePiece分词器预判token边界
  2. 对数学公式等特殊内容启用LaTeX语法感知
  3. 通过正则表达式自动修复被截断的医学术语(如"冠状动脉[被截断]“→"冠状动脉粥样硬化”)

二、语义切分:医疗知识库的救星

技术实现:基于Sentence-BERT计算相邻段落相似度,阈值设为0.25
突破性案例

  • 平安好医生AI问诊系统在解析《内科学手册》时,通过动态合并相关段落,完整保留"临床表现→实验室检查→鉴别诊断"的医学逻辑链。测试显示,在胸痛鉴别诊断场景中,生成建议的临床符合率从58%提升至94%
  • 中国法律智能库采用语义分块+法律实体识别,在处理《民法典》第1260条时,精准保持"不可抗力"条款的完整性,相关案例检索F1值达91.2%

算法创新

def semantic_split(text):chunks = []buffer = []for para in text.split("\n"):if buffer and cosine_sim(embed(buffer[-1]), embed(para)) < 0.25:chunks.append("\n".join(buffer))buffer = [para]else:buffer.append(para)return chunks

三、结构感知切分:法律合同解析的黄金标准

技术实现:基于XPath解析PDF目录树,结合递归切分
标杆案例

  • 金杜律师事务所的"合同审查AI"系统,在解析并购协议时:
    1. 按"鉴于条款→交割条件→赔偿条款"划分章节
    2. 对超过2000字的"陈述与保证"条款进行二次切分
      使关键条款召回率从67%飙升至98%,人工复核时间减少73%
  • 广联达BIM设计文档处理平台,通过识别"建筑→结构→机电"专业标签,实现技术规范精准检索,图纸修改建议采纳率提升41%

四、LLM智能切分:科研论文处理的新范式

技术实现:使用GPT-4生成分块指令,成本降低方案:

请将以下论文按【研究背景、方法创新、实验结果、局限讨论】四部分切分,用XML标签包裹。若某部分超过500字,添加<subchunk>子块。

创新应用

  • 中国知网推出的"ResearchDigest"系统,在解析Nature论文时:
    1. 自动提取Figure 3对应的实验描述
    2. 将"方法"部分拆分为"材料制备→表征测试→模拟计算"
      使跨论文综述生成效率提升3倍,被国家自然科学基金委采用
  • 药明康德药物研发平台,通过切分"化合物结构→活性数据→毒性分析",使分子相似性检索准确率突破92%

五、混合策略:电商场景的终极解决方案

技术架构

  1. 粗切分:按1000字符分割商品描述
  2. 精处理:Qwen-72B提取"材质成分→适用场景→保养说明"
  3. 知识融合:Neo4j链接商品参数与用户评论

阿里云实战数据

  • 家电类目检索响应时间从2.1s降至0.7s
  • "羽绒服含绒量"等关键属性召回率达96%
  • 通过关联"用户问:洗衣机噪音大"与"评论:脱水时震动明显",生成建议采纳率提升65%

企业级选型指南

典型组合方案

  1. 金融研报解析:结构切分(章节)→LLM切分(财报表格)→语义合并
  2. 社交舆情分析:固定切分(实时流)→语义聚类(话题演化)
  3. 设备手册处理:OCR分栏→结构切分(故障代码)→Q&A对提取

演进路线建议

  1. 初创验证期:采用固定切分+重叠窗口,快速验证核心场景(1-2周)
  2. 垂直深耕期:引入语义切分+领域词典,提升专业场景准确率(如法律术语库)
  3. 平台化阶段:构建多路召回架构,支持结构/语义/LLM切分的动态路由

哈啰出行实践启示:在智能客服升级中,通过混合策略使骑行保险条款解析准确率从40%提升至83%,关键在於建立分块质量评估体系:

  • 人工标注500组问答对作为测试集
  • 定义【信息完整性】【边界合理性】等评估维度
  • 采用SWARMS优化分块参数组合

选择策略的建议

文档类型推荐策略典型场景
非结构化文本语义切分 + 滑动窗口社交媒体分析
专业领域文档结构感知 + 递归切分法律条款检索
多模态内容LLM切分 + 模式特定分块研报图表解析
实时性要求高固定切分 + 动态防护栏舆情监控系统
  • 平衡效率与质量:固定大小或滑动窗口适合快速处理,语义分割适合高精度需求。
  • 结合混合策略:例如先按结构分大块,再对每块进行语义分割。
  • 动态调整:根据下游任务反馈优化切分参数(如块大小、重叠比例)。

文档切分是RAG系统的"地基工程",需要根据数据特征、业务场景、计算预算进行动态调整。建议企业建立分块策略矩阵,持续通过A/B测试优化方案,真正释放大模型的知识处理潜能。通过灵活应用这些策略,可显著提升RAG系统的检索效果和生成内容的准确性。

在这里插入图片描述

相关文章:

RAG - 五大文档切分策略深度解析

文章目录 切分策略1. 固定大小分割&#xff08;Fixed-Size Chunking&#xff09;2. 滑动窗口分割&#xff08;Sliding Window Chunking&#xff09;3. 自然语言单元分割&#xff08;Sentence/Paragraph Segmentation&#xff09;4. 语义感知分割&#xff08;Semantic-Aware Seg…...

软件测试之接口测试

&#x1f345; 点击文末小卡片 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 接口测试定义 接口是前后端沟通的桥梁&#xff0c;是数据传输的通道&#xff0c;包括外部接口、内部接口。内部接口又包括:上层服务与下层服务接口&#xff…...

synchronized锁与lock锁的区别

引言 在学习多线程时&#xff0c;当时为了解决线程并发问题&#xff0c;曾有两种锁&#xff0c;一种是synchronized同步块&#xff0c;同步方法&#xff0c;一种就是Lock锁&#xff0c;那么这两种锁之间有什么区别&#xff1f;谁更好用呢&#xff1f; synchronized 同步方法…...

Open HarmonyOS 5.0 分布式软总线子系统 (DSoftBus) 详细设计与运行分析报告

1. HarmonyOS 5.0 与分布式软总线 (DSoftBus) 概述 1.1 HarmonyOS 5.0 架构概览 HarmonyOS 5.0&#xff0c;又称鸿蒙星河版&#xff0c;标志着操作系统架构的重大演进&#xff0c;其核心在于转向自研的微内核系统 1。此版本摒弃了先前版本中兼容安卓的双框架模式&#xff0c;全…...

蓝桥杯备考:多米诺骨牌

这道题要求上下方格子和之差要最小&#xff0c;其实就是算每个上下格子的差求和的最小值 这道题其实是动态规划01背包问题 我们直接按步骤做吧 step1:定义状态表示f[i][j]表示从1到i个编号的差值里选出刚好j个数的最小操作次数 step2:推导状态转移方程 如图这就是我们的状态…...

C++:allocator类(动态数组续)

1.为什么需要 allocator&#xff1f; 在 C 中&#xff0c;动态内存管理通常通过 new 和 delete 完成&#xff1a; int* p new int; // 分配内存 构造对象 delete p; // 析构对象 释放内存 但 new 和 delete 有两个问题&#xff1a; 耦合性&#xff1a;将内…...

Go语言手动内存对齐的四大场景与实践指南

Go语言手动内存对齐的四大场景与实践指南 引言&#xff1a;Go的内存对齐机制 Go语言通过编译器自动处理内存对齐问题&#xff0c;开发者通常无需关心底层细节。然而&#xff0c;在特定场景下&#xff0c;手动干预内存对齐是避免程序崩溃或数据错乱的必要操作。本文将深入探讨G…...

libva基础

Libva&#xff08;Lib Video Acceleration&#xff09;是一个开源的库&#xff0c;实现了 **VA-API**&#xff08;Video Acceleration API&#xff09;&#xff0c;旨在为视频处理提供跨平台的硬件加速支持。 1、核心功能与作用 硬件加速抽象层&#xff1a;Libva 作为中间层&…...

如何在 AI 搜索引擎(GEO)霸屏曝光,快速提升知名度?

虽然大多数人仍然使用 Google 来寻找答案&#xff0c;但正在发生快速转变。ChatGPT、Copilot、Perplexity 和 DeepSeek 等 LLM 已成为主流。这主要是因为每个都有自己的免费和公共版本&#xff0c;并且总是有重大的质量改进。 许多人每天都使用这些工具来提问和搜索互联网&…...

Java入门知识总结——章节(二)

ps&#xff1a;本章主要讲数组、二维数组、变量 一、数组 数组是一个数据容器&#xff0c;可用来存储一批同类型的数据 &#x1f511;&#xff1a;注意 类也可以是一个类的数组 public class Main {public static class Student {String name;int age; // 移除 unsignedint…...

Python 序列构成的数组(元组不仅仅是不可变的列表)

元组不仅仅是不可变的列表 有些 Python 入门教程把元组称为“不可变列表”&#xff0c;然而这并没有完全概括 元组的特点。除了用作不可变的列表&#xff0c;它还可以用于没有字段名的记 录。鉴于后者常常被忽略&#xff0c;我们先来看看元组作为记录的功用。 元组和记录 元…...

OJ题:移动零

双指针法 c 语言实现 void moveZeroes(int* nums, int numsSize) {int dest,cur; //创建临时指针和目标指针destcur0;//出初始化while(cur<numsSize)//遍历{if(nums[cur]!0){swap(&nums[cur],&nums[dest]);cur;dest;}else{cur;}}} 思路是建立两个指针&#xff0…...

wait函数等待多个子进程

父进程等待多个子进程时可以使用 wait() 函数&#xff0c;但有一些要点需要注意&#xff0c;下面为你详细介绍相关内容。 可以使用 wait() 函数等待多个子进程的原理 wait() 函数会让调用它的父进程暂停执行&#xff0c;直到它的某个子进程结束&#xff0c;然后返回结束子进程…...

数据湖的数据存储与管理策略:构建高效的数据管理框架

数据湖的数据存储与管理策略:构建高效的数据管理框架 在大数据时代,数据湖作为存储和管理海量数据的关键技术,已经成为众多企业数字化转型的重要组成部分。数据湖的核心优势在于其能够支持结构化、半结构化和非结构化数据的存储,然而,随着数据量的增加和复杂度的提升,如…...

Linux进程管理之进程的概念、进程列表和详细的查看、进程各状态的含义

进程的概念 进程是程序执行的实例&#xff0c;在Linux中&#xff0c;每个进程都有一个唯一的PID&#xff08;进程ID&#xff09;。 查看当前系统中有哪些进程 在Linux系统中&#xff0c;查看当前运行的进程可以使用几个常用命令&#xff1a; ps - 显示当前进程的快照。常用选…...

3万字长文详解Android AIDL 接口设计

目录 第一章:AIDL 概述 1.1 什么是 AIDL?定义与核心作用 1.2 AIDL 的典型使用场景 第二章:AIDL 语法规则 2.1 支持的数据类型:从基础到高级 2.2 接口声明:写好通信的 “剧本” 2.3 方向标记:数据流向的 “交通灯” 第三章:AIDL 文件编写 3.1 创建 AIDL 文件:从…...

HFSS 使用入门

资源 下载资源&#xff1a; https://download.csdn.net/download/wangjun_huster/90547193 下载破解&#xff1a; https://download.csdn.net/download/wangjun_huster/90547551 安装 https://www.bilibili.com/list/ml3403866295?oid925751664&bvidBV1CT4y1u7LB 入门…...

精心整理-2024最新网络安全-信息安全全套资料(学习路线、教程笔记、工具软件、面试文档).zip

2024最新网络安全-信息安全全套资料&#xff08;学习路线、教程笔记、工具软件、面试文档&#xff09;&#xff0c;视频教程文档资料共55GB。 一、网络安全-信息安全学习路线 0、网络安全-信息安全思维导图.jpg 1、网络安全大师课 V2024.pdf 2、网络安全行业白皮书.pdf 3、网络…...

RAG基建之PDF解析的“流水线”魔法之旅

将PDF文件和扫描图像等非结构化文档转换为结构化或半结构化格式是人工智能的关键部分。然而,由于PDF的复杂性和PDF解析任务的复杂性,这一过程显得神秘莫测。 在RAG(Retrieval-Augmented Generation)基建之PDF解析的“魔法”与“陷阱”中,我们介绍了PDF解析的主要任务,对现…...

leetcode刷题日记——跳跃游戏

[ 题目描述 ]&#xff1a; [ 思路 ]&#xff1a; 题目要求在给出的每次可移动最大步数中选择一个移动步数&#xff0c;如果有一种选择能达到终点就返回true&#xff0c;如果没有一种选择能够达到终点就返回false因为每次给出的最大步数不同&#xff0c;步数越大&#xff0c;…...

Scala 数组

Scala 数组 引言 Scala 作为一门多范式编程语言&#xff0c;融合了面向对象和函数式编程的特点。数组是编程语言中非常基础和常见的数据结构&#xff0c;在 Scala 中也不例外。本文将详细介绍 Scala 中的数组&#xff0c;包括其定义、操作以及在实际开发中的应用。 Scala 数…...

基于华为设备技术的端口类型详解

以下是基于华为设备技术网页的端口类型详解&#xff08;截至2025年3月&#xff09;&#xff1a; 一、Access端口 定义&#xff1a;仅允许单个VLAN通过&#xff0c;用于连接终端设备&#xff08;如PC、打印机&#xff09; 处理流程&#xff1a; ​接收帧&#xff1a;未带标签…...

使用 Go 和 Gin 实现高可用负载均衡代理服务器

前言 在现代分布式系统中,负载均衡是保障服务高可用性和性能的核心技术。本文将基于 Go 语言和 Gin 框架实现一个支持动态路由、健康检查、会话保持等特性的企业级负载均衡代理服务器,并提供完整的压力测试方案和优化建议。 通过本方案实现的负载均衡代理具备以下优势: 单…...

零基础驯服GitHub Pages

各位互联网流浪汉、赛博吉普赛人、以及不小心点进来的产品经理们&#xff01;今天我们要用程序员的方式搞点大事情——不写代码、不买服务器、不氪金&#xff0c;免费拥有一个能吹牛的个人网站&#xff01;准备好你的键盘和表情包收藏夹&#xff0c;我们的奇幻漂流开始了&#…...

OpenBMC:BmcWeb 生效路由5 优化trie

OpenBMC:BmcWeb 生效路由4 将路由添加到Trie中-CSDN博客 在url被添加到trie中后,validate的最后一步是优化trie void validate() {for (std::unique_ptr<BaseRule>& rule : allRules){if (rule){std::unique_ptr<BaseRule> upgraded = rule->upgrade();if…...

买卖股票的最佳时机(121)

121. 买卖股票的最佳时机 - 力扣&#xff08;LeetCode&#xff09; 解法&#xff1a; class Solution { public:int maxProfit(vector<int>& prices) {int cur_min prices[0];int max_profit 0;for (int i 1; i < prices.size(); i) {if (prices[i] > cur…...

强大的AI网站推荐(第四集)—— Gamma

网站&#xff1a;Gamma 号称&#xff1a;展示创意的新媒介 博主评价&#xff1a;快速展示创意&#xff0c;重点是展示&#xff0c;在几秒钟内快速生成幻灯片、网站、文档等内容 推荐指数&#xff1a;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f;&#x1f31f;&#x…...

Business Trip and Business Travel

Business Trip and Business Travel References Background I would like to introduce the background. Dave is going on a business trip, but he’s very busy, so he needs Leo’s help to buy the plane ticket. Panda is an agent of China Eastern /ˈiːstərn/ Airl…...

为pip设置国内镜像源

pip设置国内镜像源 在Python中使用pip安装软件包时&#xff0c;通常我们会遇到网络问题&#xff0c;尤其是在中国大陆地区。为了解决这个问题我们可以使用一些国内提供的镜像源。下面以清华大学的镜像源为例进行使用说明。 方法一&#xff1a;临时使用 在命令行中&#xff0…...

MySQL查询成本计算

对于如上SQL&#xff0c;只是因为查询字段不同&#xff0c;最终执行时选择的索引就不同&#xff0c;那么MySQL是如何决定选择使用哪个索引呢&#xff1f; 答案是MySQL会进行成本计算&#xff0c;对于各个场景查询进行成本预估&#xff0c;最终选择最优。 我们可以使用trace工具…...

使用 rsync 进行服务器文件同步与优化

使用 Rsync 工具在两台 Linux 服务器之间同步文件 Rsync 是一种高效的文件同步工具&#xff0c;它可以在本地或远程服务器之间同步文件和目录。Rsync 通过仅传输文件的变化部分来减少数据传输量&#xff0c;因此特别适合用于定期备份或同步大量数据。本文将详细介绍如何将 A 服…...

java面向对象从入门到入土

面向对象进阶 (写程序的套路) 面向:拿,找 对象:能干活的东西 面向对象编程:拿东西过来做对应的事情 (写程序的套路) 面向:拿,找 对象:能干活的东西 面向对象编程:拿东西过来做对应的事情 重点学习:学习已有对象并使用,学习如何自己设计对象并使用 设计对…...

Redis设计与实现-哨兵

哨兵模式 1、启动并初始化sentinel1.1 初始化服务器1.2 使用Sentinel代码1.3 初始化sentinel状态1.4 初始化sentinel状态的master属性1.5 创建连向主服务器的网络连接 2、获取主服务器信息3、获取从服务器的信息4、向主从服务器发送信息5、接受主从服务器的频道信息6、检测主观…...

vscode 打开工程 看不到文件目录

vscode 打开工程 看不到文件目录 View->Explorer 快捷键&#xff1a;CtrlShiftE...

[c++项目]基于微服务的聊天室服务端测试

项目概述 本测试报告针对基于C实现的微服务架构聊天室服务端进行全面测试。系统主要包含以下微服务&#xff1a; 用户认证服务&#xff08;Auth Service&#xff09;消息处理服务&#xff08;Message Service&#xff09;在线状态服务&#xff08;Presence Service&#xff0…...

Java面试黄金宝典16

1. 各种排序算法的时间复杂度和空间复杂度 冒泡排序 定义&#xff1a; 冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列&#xff0c;一次比较两个元素&#xff0c;如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换&#xff0c;…...

pytorch中dataloader自定义数据集

前言 在深度学习中我们需要使用自己的数据集做训练&#xff0c;因此需要将自定义的数据和标签加载到pytorch里面的dataloader里&#xff0c;也就是自实现一个dataloader。 数据集处理 以花卉识别项目为例&#xff0c;我们分别做出图片的训练集和测试集&#xff0c;训练集的标…...

LabVIEW 燃气轮机气路故障诊断

在船用燃气轮机气路故障诊断领域&#xff0c;LabVIEW 软件以其独特的功能和优势&#xff0c;成为构建高效、精准诊断系统的关键技术支撑。它全面覆盖硬件在环仿真平台的各个环节&#xff0c;从硬件连接、数据交互到系统功能实现&#xff0c;都发挥着不可替代的作用&#xff0c;…...

[项目]基于FreeRTOS的STM32四轴飞行器: 十六.激光测距定高功能

基于FreeRTOS的STM32四轴飞行器: 十六.激光测距定高功能 一.芯片介绍二.配置CubeMX三.激光测距芯片驱动编写四.定高PID的计算五.定高PID作用到电机上 一.芯片介绍 激光测高芯片在飞控板下侧&#xff1a; 原理图如下&#xff1a; 型号为&#xff1a;VL53LX1&#xff0c;为国产…...

HTML跑酷

先看效果 再上代码 <!DOCTYPE html> <html> <head><title>火柴人跑酷</title><style>body {margin: 0;overflow: hidden;background: #87CEEB;}#gameCanvas {background: linear-gradient(to bottom, #87CEEB 0%, #87CEEB 50%, #228B22 …...

C++Primer学习(14.1 基本概念)

当运算符作用于类类型的运算对象时&#xff0c;可以通过运算符重载重新定义该运算符的含义。明智地使用运算符重载能令我们的程序更易于编写和阅读。举个例子&#xff0c;因为在Sales_item类中定义了输入、输出和加法运算符&#xff0c;所以可以通过下述形式输出两个Sales_item…...

【Goalng】第九弹-----文件操作、JSON处理

&#x1f381;个人主页&#xff1a;星云爱编程 &#x1f50d;所属专栏&#xff1a;【Go】 &#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐文章 长风破浪会有时&#xff0c;直挂云帆济沧海 目录 1.文件操作 1.1文件介绍 1.2.文件流 1.3.打开和关闭文件 1…...

锐评|希捷NVMe闪存+磁盘混合存储阵列

近日&#xff0c;希捷在英伟达GTC 2025会议上展示了NVMe混合闪存/磁盘阵列技术。这个混合存储阵列确实在当前AI数据存储困境中撕开了一道新口子&#xff0c;但远称不上完美&#xff0c;优缺点都极为鲜明。 从优点来看&#xff0c;希捷切中了大多数企业的痛点。AI领域数据量呈爆…...

如何缩短研发周期,降低研发成本?全星APQP软件为您提供解决方案

如何缩短研发周期&#xff0c;降低研发成本&#xff1f;全星APQP软件为您提供解决方案 一、 系统概述 全星研发管理APQP软件系统是一款专为产品研发和质量管控打造的智能化平台&#xff0c;旨在帮助企业高效推进APQP&#xff08;先期产品质量策划&#xff09;流程&#xff0c…...

Centos7安装cat美化工具lolcat

Centos7安装cat美化工具lolcat Centos7安装lolcat使用ruby安装lolcat配置cat系统别名 结果验证 Centos7安装lolcat lolcat &#xff1a;一个在Linux 终端中输出彩虹特效的命令行工具 使用ruby安装lolcat # 安装ruby和zip yum install -y ruby# 查看ruby版本 ruby --version# …...

bluecode-20240913_1_数据解码

时间限制&#xff1a;C/C 1000MS&#xff0c;其他语言 2000MS 内存限制&#xff1a;C/C 256MB&#xff0c;其他语言 512MB 难度&#xff1a;困难 数据解码 指定有一段经过编码的二进制数据&#xff0c;数据由0个或多个"编码单元"组成。"编码单元"的编码方式…...

【 <二> 丹方改良:Spring 时代的 JavaWeb】之 Spring Boot 中的缓存技术:使用 Redis 提升性能

<前文回顾> 点击此处查看 合集 https://blog.csdn.net/foyodesigner/category_12907601.html?fromshareblogcolumn&sharetypeblogcolumn&sharerId12907601&sharereferPC&sharesourceFoyoDesigner&sharefromfrom_link <今日更新> 一、开篇整…...

典范硬币系统(Canonical Coin System)→ 贪心算法

【典范硬币系统】 ● 典范硬币系统&#xff08;Canonical Coin System&#xff09;是指使用贪心算法总能得到最少硬币数量解‌的货币面值组合‌。 ● 给定一个硬币系统 &#xff0c;若使其为典范硬币系统&#xff0c;则要求其各相邻面值比例 &#xff0c;及各开区间 内各金额…...

hbuilderx打包iOS上传苹果商店的最简流程

无需Mac电脑&#xff0c;无需安装xcode和transporter&#xff0c;其实使用hbuilderx开发的ios软件&#xff0c;也可以上架到苹果的app store商店的。 只需要有苹果开发者中心的苹果开发者账号就行了。 假如你还在了解上架阶段&#xff0c;还没打包&#xff0c;也还没有创建任…...

DeepSeek详解:探索下一代语言模型

文章目录 前言一、什么是DeepSeek二、DeepSeek核心技术2.1 Transformer架构2.1.1 自注意力机制 (Self-Attention Mechanism)(a) 核心思想(b) 计算过程(c) 代码实现 2.1.2 多头注意力 (Multi-Head Attention)(a) 核心思想(b) 工作原理(c) 数学描述(d) 代码实现 2.1.3 位置编码 (…...