利用python从零实现Byte Pair Encoding(BPE)
喜欢可以到我的主页订阅专栏哟(^U^)ノ~YO
第一章:自然语言处理与分词技术基础
1.1 自然语言处理的核心挑战
自然语言处理(Natural Language Processing, NLP)作为人工智能领域的重要分支,其核心目标是实现计算机对人类语言的理解与生成。在深度学习技术快速发展的今天,NLP面临着三大基础性挑战:
- 语言的非结构化特性:自然语言具有复杂的语法结构、多变的语义表达和丰富的上下文依赖关系
- 数据稀疏性问题:语言元素的组合可能性呈指数级增长,导致传统n-gram方法面临维度灾难
- 跨语言通用性需求:现代NLP系统需要处理多种语言的混合场景和低资源语言处理
这些挑战在分词技术领域体现得尤为明显。以中文为例,传统的基于词典的分词方法需要维护庞大的词库,而英语等西方语言虽然存在天然空格分隔,但面对未登录词(OOV)时同样束手无策。
1.2 传统分词方法的局限性
传统分词技术主要分为三大类:
1.2.1 基于规则的方法
# 示例:简单的正向最大匹配算法
def forward_max_match(sentence, word_dict, max_len=5):result = []while sentence:for i in range(min(max_len, len(sentence)), 0, -1):if sentence[:i] in word_dict:result.append(sentence[:i])sentence = sentence[i:]breakelse:result.append(sentence[0])sentence = sentence[1:]return result
这种方法需要预先构建完整的词典,无法处理新词和网络用语,维护成本高且泛化能力差。
1.2.2 基于统计的方法
隐马尔可夫模型(HMM)和条件随机场(CRF)等概率图模型通过统计相邻字符的共现概率进行分词。虽然在一定程度上缓解了未登录词问题,但仍然受限于局部特征提取能力。
1.2.3 混合方法
结合规则与统计方法的混合系统虽然提升了准确率,但系统复杂度呈指数增长,难以适应现代大规模语料处理需求。
1.3 子词分解的革命性突破
2015年提出的子词分解(Subword Tokenization)技术彻底改变了传统分词范式,其核心思想是将词汇分解为更小的语义单元。这种方法的优势体现在:
- 解决未登录词问题:通过组合子词单元可以表示任意新词
- 平衡词表大小与语义粒度:典型词表规模控制在10k-50k之间
- 跨语言共享能力:相同字符在不同语言中可以复用
图1展示了传统分词与子词分解的对比:
(此处应插入对比示意图,由于当前环境限制,描述图片内容:左侧为传统分词将"unhappiness"分为完整单词,右侧BPE分解为"un", “happiness”)
1.4 Byte Pair Encoding的历史沿革
BPE算法最初由Philip Gage于1994年提出用于文本压缩,其核心思想是通过迭代合并最高频的字节对来构建压缩字典。2016年,Sennrich等人将这一算法创新性地应用于神经机器翻译的分词任务,实现了以下改进:
- 将基础单元从字节扩展为Unicode字符
- 引入词频统计与合并优先级队列
- 添加特殊标记处理数字、标点等符号
表1展示了BPE在NLP领域的关键发展节点:
年份 | 里程碑事件 | 贡献者 |
---|---|---|
1994 | 原始BPE压缩算法 | Philip Gage |
2016 | 首次应用于神经机器翻译 | Sennrich et al. |
2018 | 改进版BPE用于BERT预训练 | Google Research |
2020 | 动态BPE适配多语言场景 | Facebook AI |
1.5 现代分词系统的典型架构
一个完整的子词分词系统包含以下核心组件:
各模块的功能说明:
- 预处理模块:处理大小写、标准化、特殊符号
- 分词模型:BPE/WordPiece/Unigram等算法实现
- 编码字典:存储子词到索引的映射关系
- 下游接口:提供与神经网络模型的对接能力
1.6 本章小结
本章系统阐述了自然语言处理中的分词技术演进,重点分析了传统方法的局限性及子词分解技术的突破性优势。通过对比分析,我们明确了BPE算法在现代NLP系统中的核心地位。后续章节将深入讲解BPE的算法原理、实现细节及优化策略。
第二章:Byte Pair Encoding算法原理详解
2.1 BPE算法整体架构
Byte Pair Encoding(BPE)是一种基于数据压缩理论的分词算法,其核心思想是通过迭代合并最高频的字符对来构建子词词表。图2-1展示了BPE算法的完整处理流程:
[原始语料] → [预处理] → [词频统计] → [初始化字符表] → [迭代合并]↓ ↗ ↖[编码字典] ← [终止条件判断] ← [更新词表]
该架构包含三个核心阶段:
- 预处理阶段:将原始文本转换为适合统计的格式
- 词表构建阶段:通过迭代合并生成子词单元
- 编码应用阶段:使用训练好的词表处理新文本
2.2 核心算法原理剖析
BPE算法的数学基础可以表述为:
给定文本语料 D D D,初始字符集合 V 0 V_0 V0,目标词表大小 K K K,算法执行以下操作:
While ∣ V i ∣ < K : ( a , b ) = arg max ( x , y ) ∑ w ∈ D count i ( x y ∣ w ) V i + 1 = V i ∪ { a b } ∖ { a , b } Update merge operations \begin{aligned} & \text{While } |V_i| < K: \\ & \quad (a, b) = \underset{(x,y)}{\arg\max} \sum_{w \in D} \text{count}_i(xy|w) \\ & \quad V_{i+1} = V_i \cup \{ab\} \setminus \{a, b\} \\ & \quad \text{Update merge operations} \end{aligned} While ∣Vi∣<K:(a,b)=(x,y)argmaxw∈D∑counti(xy∣w)Vi+1=Vi∪{ab}∖{a,b}Update merge operations
其中 count i ( x y ∣ w ) \text{count}_i(xy|w) counti(xy∣w)表示在第 i i i次迭代时字符对 ( x , y ) (x,y) (x,y)在单词 w w w中的出现次数。
2.3 合并操作执行过程
合并操作是BPE算法的核心步骤,我们通过具体示例演示其工作原理:
示例语料:
corpus = ["low", "lower", "newest", "widest"
]
初始字符统计:
l o w (count=1)
l o w e r (count=1)
n e w e s t (count=1)
w i d e s t (count=1)
第一次合并:
最高频字符对为e s
(出现2次)
合并后新词表包含es
单元
更新后的单词表示:
low, low e r, newest → n e w es t, widest → w i d es t
第二次合并:
最高频字符对变为es t
(出现2次)
合并生成新单元est
最终词表包含原始字符和合并后的es
, est
等子词
图2-2展示了该合并过程的可视化表示(此处应插入合并过程示意图,图示应包含初始字符、合并步骤箭头、最终子词)
2.4 算法伪代码实现
def train_bpe(corpus, vocab_size):# 初始化基础词表vocab = Counter()for word in corpus:vocab[' '.join(list(word)) + ' </w>'] += 1# 计算初始字符对频率pairs = get_pairs(vocab)# 迭代合并过程while len(vocab) < vocab_size:if not pairs:breakbest_pair = max(pairs, key=lambda x: pairs[x])vocab = merge_vocab(best_pair, vocab)pairs = update_pairs(best_pair, pairs)return vocabdef get_pairs(vocab):pairs = defaultdict(int)for word, freq in vocab.items():symbols = word.split()for i in range(len(symbols)-1):pairs[symbols[i], symbols[i+1]] += freqreturn pairsdef merge_vocab(pair, vocab):new_vocab = defaultdict(int)bigram = re.compile(r'(?<!\S)' + re.escape(' '.join(pair)) + r'(?!\S)')for word in vocab:new_word = bigram.sub(''.join(pair), word)new_vocab[new_word] += vocab[word]return new_vocab
2.5 关键参数解析
2.5.1 词表大小控制
- 动态终止条件:当达到预设词表大小或无法继续合并时停止
- 经验值范围:英语通常30k-50k,中文10k-30k
- 计算公式: K = α × N K = \alpha \times \sqrt{N} K=α×N(N为语料总字符数,α≈5)
2.5.2 特殊符号处理
class BPETokenizer:def __init__(self):self.special_tokens = {'<unk>': 0,'<pad>': 1,'</w>': 2
相关文章:
利用python从零实现Byte Pair Encoding(BPE)
喜欢可以到我的主页订阅专栏哟(^U^)ノ~YO 第一章:自然语言处理与分词技术基础 1.1 自然语言处理的核心挑战 自然语言处理(Natural Language Processing, NLP)作为人工智能领域的重要分支,其核心目标是实现计算机对人类语言的理解与生成。在深度学习技术快速发展的今…...
Redis的分布式锁
Redis的分布式锁 一.分布式锁的简介二.分布式锁的实现1.基本实现2.引入过期时间3.引入校验ID4.引入Lua5.引入看门狗(watch dog)6.引入RedLock算法 一.分布式锁的简介 在一个分布式的系统中, 会涉及到多个节点访问一个公共资源的情况,此时就需要通过锁的…...
SpringBoot分布式项目中实现智能邮件提醒系统
一、应用场景与需求分析 在电商、OA、客服等系统中,邮件提醒是用户触达的重要方式。本文针对以下典型需求进行方案设计: 多类型支持:订单超时、服务到期、待办通知等场景动态内容:支持纯文本/HTML/模板引擎内容格式智能重发:24小时未处理自动升级提醒级别高可用性:分布式…...
LSTM-SVM长短期记忆神经网络结合支持向量机组合模型多特征分类预测/故障诊断,适合新手小白研究学习(Matlab完整源码和数据)
LSTM-SVM长短期记忆神经网络结合支持向量机组合模型多特征分类预测/故障诊断,适合新手小白研究学习(Matlab完整源码和数据) 目录 LSTM-SVM长短期记忆神经网络结合支持向量机组合模型多特征分类预测/故障诊断,适合新手小白研究学习…...
【图像处理基石】什么是抗锯齿(Anti-Aliasing)?
1. 抗锯齿的定义与作用 抗锯齿(Anti-Aliasing, AA)是一种用于消除数字图像中因采样不足导致的边缘锯齿现象的技术。锯齿(Jaggies)通常出现在高分辨率信号以低分辨率呈现时,例如3D图形渲染或图像缩放过程中。抗锯齿通过…...
C++曲线数据统一:如何高效插值并处理多条曲线的x值
在数据处理和科学计算中,我们经常会遇到需要对多条曲线进行统一x值处理的情况。例如,在实验数据记录中,不同传感器可能以不同的采样率记录数据,导致曲线的x值不一致。为了后续的分析和可视化,我们需要将这些曲线的x值统…...
训练模型的方式的两种方式:图像描述(Image Captioning)和对比学习(Contrastive Learning)原理及区别
图像描述(Image Captioning)和对比学习(Contrastive Learning)都是深度学习中用于训练模型的方式,但它们的目标、原理和实现方法都有很大不同。让我们分别看看它们的原理和区别。 1. 图像描述(Image Capti…...
数据结构:哈希表 | C++中的set与map
上回说到,红黑树是提升了动态数据集中频繁插入或删除操作的性能。而哈希表(Hash Table),则是解决了传统数组或链表查找数据必须要遍历的缺点。 哈希表 哈希表的特点就是能够让数据通过哈希函数存到表中,哈希函数能够将数据处理为表中位置的索…...
【unity游戏开发——Animator动画】Animator动画状态机复用——重写动画控制器 Animator Override Controller
注意:考虑到UGUI的内容比较多,我将UGUI的内容分开,并全部整合放在【unity游戏开发——Animator动画】专栏里,感兴趣的小伙伴可以前往逐一查看学习。 文章目录 一、状态机复用是什么?二、实战专栏推荐完结 一、状态机复…...
第九届 蓝桥杯 嵌入式 省赛
一、分析 1. LCD 显示 显示 存储位置、定时时间和当前状态存储位置:5个,来存储定时时间当前状态 定时器停止,Standby设置时间,Setting定时器运行,Runing定时器暂停,Pause 伪代码 LCD 显示 # 显示存储位…...
电流互感器的两相星形接线的建模与仿真
微♥“电击小子程高兴的MATLAB小屋”获取巨额优惠 1.模型简介 本仿真模型基于MATLAB/Simulink(版本MATLAB 2016Rb)软件。建议采用matlab2016 Rb及以上版本打开。(若需要其他版本可联系代为转换) 2.仿真模型 3.仿真结果 3.1一次…...
【征程 6】工具链 VP 示例中 Cmakelists 解读
1. 引言 在文章【征程 6】VP 简介与单算子实操中,介绍了 VP 是什么,并以单算子 rotate 为例,介绍了 VP API 使用方法。在【征程 6】工具链 VP 示例中日志打印解读 中介绍了 VP 单算子示例中用到的日志打印的头文件应该怎么写。接下来和大家一…...
制作像素风《饥荒》类游戏的整体蓝图和流程
游戏的制作过程和核心要素拆解成以下几个主要部分: 1. 核心概念与玩法设计 (蓝图构思) 游戏类型: 确定是纯粹的生存、带有冒险元素,还是有其他侧重?(比如更强的战斗、建造或剧情)核心循环: 玩家主要做什么࿱…...
Day22 -php开发01--留言板+知识点(超全局变量 文件包含 数据库操作 第三方插件)
环境要求:php7.0.9 小皮 navicat phpstorm24.1 知识点:会写(留言板 留言板后台) 超全局变量 三方插件的使用 文件包含 1、开启小皮并利用navicat新建一个数据库 注意:本地的服务mysql关闭后 才可打开小皮。属…...
履带小车+六轴机械臂(1)
基于单片机的可移动抓取机械手 采用的是一个履带底盘和六轴机械臂做的 已经实现的功能有:PS2手柄控制六个轴的舵机转动和控制两个直流减速电机的转动,以此来达到控制移动和抓取的目地,以及用手机APP连接蓝牙模块HC-05也能达到六个轴的舵机转…...
AI:深度学习之循环神经网络(RNN)
🔄 从零入门循环神经网络(RNN):原理详解+代码实战+未来展望 🚀 摘要:在人工智能蓬勃发展的当下,循环神经网络(Recurrent Neural Network, RNN)是处理序列数据的“记忆大师”🧠,正发挥着举足轻重的作用。从自然语言处理中的文本生成、机器翻译,到语音识别、时间…...
03-libVLC的视频播放器:控制(播放/暂停/停止/拖动条/声音)
libvlc_media_player_get_state(m_pMediaPlayer) 功能:获取当前媒体播放器的状态,返回值为libvlc_state_t枚举类型。常见状态值:libvlc_Playing:正在播放libvlc_Paused:已暂停libvlc_Stopped:已停止libvlc_Ended:播放结束libvlc_Error:发生错误注意事项:状态检测是异步…...
Python_仓库使用货拉拉物流运费计算1
仓库地址为广州 物料表里有各SKU的尺寸,长宽高 货拉拉收费明细表 根据订单的SKU的数量、尺寸、重量,去寻找最合适的货拉拉车型,并计算它所需的路费 import pandas as pd# 读取数据 df_111 pd.read_excel(订单明细表.xlsx) df_material …...
CATIA高效工作指南——常规配置篇(一)
一、CATIA无窗口启动优化 原理与实现 通过修改环境变量或启动参数,可禁用启动界面以提升加载速度。添加环境变量CATNOSTARTDOCUMENT1可跳过初始画面 进阶应用: 结合脚本实现静默启动:创建批处理文件(.bat)包含start …...
【AI提示词】金融信息抽取工程师工作流程
提示说明 专注于从金融行业的文本中提取关键信息,确保准确性和规范性。具备良好的文本处理能力和数据整理经验,能够处理复杂的信息结构。 提示词 # Role:金融信息抽取工程师## Background: 用户希望从金融行业的文本中严格提取…...
8、HTTPD服务--http协议介绍
目录 一、http协议 二、web服务 1、类型 2、cookie、session 三、HTTP协议特性 1、http/0.9 2、http/1.0 3、http/1.1 4、http/2 四、HTTP状态码、请求方法 1、状态码 2、请求方法 一、http协议 应用层协议作用 在客户端、web服务器传递数据 Hyper Text Transfer …...
React useEffect
在发送请求后执行代码 useEffect(副作用函数,依赖项数组) import { useEffect, useState } from "react";const URL http://geek.itheima.net/v1_0/channels function App() {// 创建状态数据const [list,setList] useState([])const [count,setCount] …...
部署Fish-Speech实现声音克隆及文本转语音
FishSpeech 是由Fish Audio团队开发的一款开源文本转语音(TTS)模型,支持多语言的语音合成和识别。它采用先进的深度学习技术,能够生成自然流畅的语音,并提供高质量的语音转文字功能。FishSpeech 支持声音克隆ÿ…...
Qt之OpenGL中的shader layout
layout一共有两种绑定方法。一种是把设定好的值绑定到shader中、另一种是shader中的layout绑定到代码中。 第一种方法(注意:要在link之前绑定同时要把shader代码中的layout设置删掉) void sunOpengl::initializeGL() {this->initializeO…...
【问题记录】记录2个安装Centos/Anolis系统卡死在安装包阶段的问题?(硬盘分区?换设备)
背景 问题就不详细记录了,本文记录的是Centos/Anolis安装中卡主的问题。这个问题遇到过几十次了,尝试过各种方法。最近一个偶然因素找到了原因。然后翻看历史上出现这个问题的照片居然是相同的地方卡死。。。 有点意思。特此记录,希望未来遇…...
用纯Qt实现GB28181协议/实时视频/云台控制/预置位/录像回放和下载/事件订阅/语音对讲
一、前言 在技术的长河中探索,有些目标一旦确立,便如同璀璨星辰,指引着我们不断前行。早在2014年,我心中就种下了用纯Qt实现GB28181协议的种子,如今回首,一晃十年已逝,好在整体框架和逻辑终于打…...
论文阅读笔记——Multi-Token Attention
MTA 论文 在 Transformer 中计算注意力权重时,仅依赖单个 Q 和 K 的相似度,无法有效捕捉多标记组合信息。(对于 A、B 两个词,单标记注意力需要分别计算两个词的注意力分数,再通过后处理定位共同出现的位置或通过多层隐…...
【VitePress】新增md文件后自动更新侧边栏导航
目录 说在前面先看效果代码结构详细说明侧边栏格式utils监听文件变化使用pm2管理监听进程 说在前面 操作系统:windows11node版本:v18.19.0npm版本:10.2.3vitepress版本:1.6.3完整代码:github 先看效果 模板用的就是官…...
redis大key排查指南
文章目录 一、什么是 Redis 大 Key?二、为什么要排查大 Key?三、如何排查 Redis 大 Key?1、使用 Redis 自带的命令 bigkeys2、使用 SCAN MEMORY USAGE Redis 基本数据数据类型String(字符串)Hash(哈希&…...
Rasa总体目录架构介绍
详细讲解一下每个主要文件/目录的作用,以及之后如何一步步使用它们来训练和运行你的聊天机器人。 📁 Rasa 项目结构说明(初始化后生成的主要文件) . ├── actions/ │ └── actions.py # 自定义 action 的地方&…...
Python functools模块:函数式编程工具的探索之旅
Python functools模块:函数式编程工具的探索之旅 起源 那是天空线科技公司的一个阴雨绵绵的周二,我首次遇到了一个彻底改变我编程方式的问题。我们团队接到任务,需要优化一个日益复杂且难以维护的关键数据处理流水线。当时的代码库就像一张蜘蛛网,充斥着嵌套函数、重复计…...
吴恩达深度学习复盘(14)迁移学习|项目基本周期
迁移学习 迁移学习是一种机器学习技术,它允许我们将从一个任务中学习到的知识应用到另一个相关的任务中。其核心思想在于,很多情况下,从头开始训练一个模型需要大量的数据和计算资源,而迁移学习能够复用在已有数据上训练好的模型…...
[福游宝——AI智能旅游信息查询平台]全栈AI项目-阶段一:Vite前端开荒
简言 本项目旨在构建一个以AI智能体为核心的福建省旅游信息查询系统,聚焦景点推荐、路线规划、交通天气查询等功能,为游客提供智能化、便捷化的旅游信息服务。项目采用前后端分离架构,前端基于Vite TypeScript Vue3技术栈,搭配…...
SpringCloud-OpenFeign
前言 1.存在问题 远程调用可以像Autowired一样吗 服务之间的通信⽅式,通常有两种:RPC和HTTP. 在SpringCloud中,默认是使⽤HTTP来进⾏微服务的通信,最常⽤的实现形式有两种: RestTemplate OpenFeign RPC(RemoteProcedureCall)远程过程调⽤&…...
程序化广告行业(79/89):技术革新与行业发展脉络梳理
程序化广告行业(79/89):技术革新与行业发展脉络梳理 大家好!一直以来,我都热衷于在技术领域不断探索,也深知知识共享对于进步的重要性。写这篇博客,就是希望能和大家一起深入研究程序化广告行业…...
[算法题:快排(一)]颜色分类
1->题目链接 算法题:颜色分类 2->题目解析 数字0表示红色,数字1表示白色,数字2表示蓝色. 这到题说白了就是让我们进行排序,数组中只会有 0 1 2 三种数字 3->算法原理 类⽐数组分两块的算法思想,这⾥是将数组分成三块,那么我们可以再添加⼀个…...
论文精度:YOLOMG:基于视觉的无人机间检测算法——外观与像素级运动融合详解
论文地址:https://arxiv.org/pdf/2503.07115 1. 论文概述 论文标题:YOLOMG: Vision-based Drone-to-Drone Detection with Appearance and Pixel-Level Motion Fusion 作者:Hanqing Guo, Xiuxiu Lin, Shiyu Zhao 发表:未明确会议/期刊(推测为预印本或待发表) 核心贡献:…...
Redis:线程模型
单线程模型 Redis 自诞生以来,一直以高性能著称。很多人好奇,Redis 为什么早期采用单线程模型,它真的比多线程还快吗? 其实,Redis 的“快”并不在于并发线程,而在于其整体架构设计极致简单高效,…...
C++进阶——C++11_{ }初始化_lambda_包装器
目录 1、{ }初始化 1.1 C98的{ } 1.2 C11的{ } 1.3 C11中的std::initializer_list 总结一下: 2、lambda 2.1 lambda的语法 2.2 捕捉列表 2.3 lambda的应用 2.4 lambda的原理 3、包装器 3.1 function 3.2 bind 1、{ }初始化 1.1 C98的{ } C98中一般数组…...
十大PDF解析工具在不同文档类别中的比较研究
PDF解析对于包括文档分类、信息提取和检索在内的多种自然语言处理任务至关重要,尤其是RAG的背景下。尽管存在各种PDF解析工具,但它们在不同文档类型中的有效性仍缺乏充分研究,尤其是超出学术文档范畴。通过使用DocLayNet数据集,比…...
【LeetCode Solutions】LeetCode 160 ~ 165 题解
CONTENTS LeetCode 160. 相交链表(简单)LeetCode 162. 寻找峰值(中等)LeetCode 164. 最大间距(中等)LeetCode 165. 比较版本号(中等) LeetCode 160. 相交链表(简单&#…...
关于 Spring Boot 微服务解决方案的对比,并以 Spring Cloud Alibaba 为例,详细说明其核心组件的使用方式、配置及代码示例
以下是关于 Spring Boot 微服务解决方案的对比,并以 Spring Cloud Alibaba 为例,详细说明其核心组件的使用方式、配置及代码示例: 关于 Spring Cloud Alibaba 致力于提供微服务开发的一站式解决方案! https://sca.aliyun.com/?spm7145af80…...
3.1多状态专题:LeetCode面试题17.16 按摩师
动态规划解决按摩师预约问题——以LeetCode面试题17.16为例 1.题目链接 LeetCode面试题17.16 按摩师 2.题目描述 一个有名的按摩师收到一系列的预约请求,每个预约都可以选择接受或不接受。但相邻的预约不能同时接受。给定一个包含各预约时长的数组 nums…...
Netty基础入门(一)
1.EventLoopGroup 1、概念 EventLoopGroup 是一组 EventLoop,Channel 一般会调用 EventLoopGroup 的 register 方法来绑定其中一个 EventLoop,后续这个 Channel 上的 io 事件都由此 EventLoop 来处理(保证了 io 事件处理时的线程安全&#x…...
Transformer模型的自注意机制原理、作用、优缺点,通俗易懂
Transformer模型中的自注意力机制(Self - attention Mechanism)可以通俗地理解为一种让模型自动关注文本中不同部分之间关系的方法。 工作原理 假设你有一句话“我正在吃苹果”,自注意力机制会让模型去分析每个词和其他词之间的关联程度。比…...
设计模式-结构型模式-代理模式
概述 代理模式: Proxy Pattern : 是一种结构型设计模式. 它允许你提供一个替代对象来代表真实对象,以此控制对真实对象的访问。 通过代理对象,可以在不改变目标对象的前提下,扩展其功能或控制对其的访问。 简单理解 : 代理模式就是…...
大模型开发:源码分析 Qwen 2.5-VL 视频抽帧模块(附加FFmpeg 性能对比测试)
目录 qwen 视频理解能力 messages 构建 demo qwen 抽帧代码分析 验证两个实际 case 官网介绍图 性能对比:ffmpeg 抽帧、decord 库抽帧 介绍 联系 对比 测试结果 测试明细 ffmpeg 100 qps 测试(CPU) decord 100 qps 测试&#x…...
单调栈 —— 1.基本概念与核心算法
1. 基本概念 1.1 知识预备 在理解单调栈之前,我们需要先掌握两个基础概念:栈(Stack) 和 单调性(Monotonicity)。 什么是栈(Stack) 栈是一种**后进先出(LIFO, Last-In…...
Ollama部署大模型 (完整版本、网速慢处理、聊天界面)
切记!切记!切记! Ollama软件下载的模型一般都是别人微调好的,且模型文件与HuggingFace等平台不一样,使用为主,没有官方API可以对模型微调(教程都是cpp这类的,没必要这么麻烦去操作&a…...
CMake中add_custom_command用法详解
add_custom_command 是 CMake 中用于在构建过程中添加自定义命令的工具。它通常用于生成文件或在构建特定目标前后执行操作。其行为和执行时机取决于具体使用场景。 主要用法 add_custom_command 有两种典型用法: 1. 生成文件(Generating Files&#x…...