当前位置：首页 > news >正文

《AI大模型应知应会100篇》第46篇：大模型推理优化技术：量化、剪枝与蒸馏

news 来源：原创 2025/7/14 18:35:33

第46篇：大模型推理优化技术：量化、剪枝与蒸馏

📌 目标读者：人工智能初中级入门者
🧠 核心内容：量化、剪枝、蒸馏三大核心技术详解 + 实战代码演示 + 案例部署全流程
💻 实战平台：PyTorch、HuggingFace Transformers、bitsandbytes、GPTQ、ONNX Runtime 等
🎯 目标效果：掌握将大模型从13B压缩至移动设备运行的优化技能

在这里插入图片描述

📝 摘要

随着AI大模型（如LLaMA、ChatGLM、Qwen等）的广泛应用，如何在有限资源下实现高性能推理成为关键挑战。本文将系统讲解大模型推理优化的核心技术：

量化（Quantization）
剪枝（Pruning）
知识蒸馏（Knowledge Distillation）

并结合实战案例，展示如何在实际场景中应用这些技术，显著提升推理速度、降低显存占用，同时保持模型精度。

🔍 核心概念与知识点

一、量化技术工程实践

1. 精度比较：FP32/FP16/INT8/INT4

类型	存储大小	精度	性能优势	典型应用场景
FP32	32bit	高	低	训练阶段
FP16	16bit	中	中	GPU推理加速
INT8	8bit	中低	高	移动端、边缘设备
INT4	4bit	低	极高	超轻量模型部署

2. 量化流程：PTQ vs QAT

PTQ (Post-Training Quantization)：训练后直接量化
QAT (Quantization-Aware Training)：训练时模拟量化误差

✅ 实战：使用 `bitsandbytes` 对 LLaMA 进行 8-bit 量化推理

pip install bitsandbytes
pip install transformers accelerate

from transformers import AutoTokenizer, AutoModelForCausalLMmodel_name = "huggyllama/llama-7b"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name, load_in_8bit=True)input_text = "What is the capital of France?"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=50)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

📌 输出示例：

What is the capital of France?
The capital of France is Paris.

⚠️ 注意：8-bit 量化会牺牲部分精度，但可节省高达 40% 的显存。

3. GPTQ/AWQ 高级量化方法

GPTQ（Greedy Perturbation-based Quantization）：逐层量化，支持4-bit推理。
AWQ（Activation-aware Weight Quantization）：根据激活值分布调整权重量化策略。

✅ 实战：使用 GPTQ 加载 4-bit llama-13b 模型

git clone https://github.com/qwopqwop200/GPTQ-for-LLaMa.git
cd GPTQ-for-LLaMa
pip install -r requirements.txt
python setup_cuda.py build_ext --inplace

加载模型：

import torch
from gptq import GPTQModelmodel_path = "./models/llama-13b-4bit/"
gptq_model = GPTQModel.load(model_path, device="cuda:0")input_ids = tokenizer("Tell me a joke", return_tensors="pt").input_ids.to("cuda")
output = gptq_model.generate(input_ids, max_length=100)
print(tokenizer.decode(output[0]))

二、模型剪枝与优化

1. 结构化剪枝：注意力头与层级剪枝

以 BERT 为例，我们可以对多头注意力机制中的某些“不重要”头进行移除。

from torch.nn.utils import prune# 假设我们有一个BERT模型
from transformers import BertModel
model = BertModel.from_pretrained("bert-base-uncased")# 对第0层的query线性层进行结构化剪枝
layer = model.encoder.layer[0].attention.self.query
prune.ln_structured(layer, name='weight', amount=0.3, n=2, dim=0)  # 剪掉30%的通道

2. 非结构化剪枝：权重稀疏化

# 对整个模型进行非结构化剪枝
for name, module in model.named_modules():if isinstance(module, torch.nn.Linear):prune.random_unstructured(module, name='weight', amount=0.5)  # 剪掉50%权重

3. 重训练恢复性能

剪枝后通常需要进行微调来恢复性能：

from transformers import Trainer, TrainingArgumentstraining_args = TrainingArguments(output_dir="./results",per_device_train_batch_size=16,num_train_epochs=3,logging_dir='./logs',
)trainer = Trainer(model=model,args=training_args,train_dataset=train_dataset,
)trainer.train()

三、知识蒸馏实战

1. 教师-学生架构搭建

使用 HuggingFace Transformers 快速构建蒸馏任务：

from transformers import DistilBertForSequenceClassification, BertForSequenceClassificationteacher_model = BertForSequenceClassification.from_pretrained("bert-base-uncased")
student_model = DistilBertForSequenceClassification.from_pretrained("distilbert-base-uncased")

2. 蒸馏损失函数设计

常用损失函数组合：

KL散度：用于logits对齐
MSE：用于中间特征对齐

import torch.nn.functional as Fdef distill_loss(student_logits, teacher_logits, temperature=2.0):return F.kl_div(F.log_softmax(student_logits / temperature, dim=-1),F.softmax(teacher_logits / temperature, dim=-1),reduction='batchmean') * (temperature ** 2)

3. 特征对齐与渐进式蒸馏

使用 HuggingFace 提供的 TrainerCallback 来实现中间层输出对齐。

class DistillationCallback(TrainerCallback):def on_step_begin(self, args, state, control, **kwargs):student_model.train()with torch.no_grad():teacher_outputs = teacher_model(kwargs['inputs'])student_outputs = student_model(kwargs['inputs'])loss = distill_loss(student_outputs.logits, teacher_outputs.logits)loss.backward()

四、综合优化策略

1. 模型合并（Model Merging）

使用 SLERP（Spherical Linear Interpolation）融合多个模型：

def slerp(a, b, t):a_norm = a / torch.norm(a)b_norm = b / torch.norm(b)omega = torch.acos(torch.dot(a_norm.view(-1), b_norm.view(-1)))sin_omega = torch.sin(omega)return (torch.sin((1.0 - t) * omega) / sin_omega) * a + (torch.sin(t * omega) / sin_omega) * bmerged_weights = {}
for key in model_a.state_dict():merged_weights[key] = slerp(model_a.state_dict()[key], model_b.state_dict()[key], t=0.5)

2. KV缓存优化

在Transformer推理中，KV缓存占大量内存。可通过以下方式优化：

复用已生成序列的Key/Value缓存
使用PagedAttention（如vLLM）

3. 推理引擎对比

引擎	支持语言	支持模型	优势
TensorRT	C++/Python	ONNX模型	NVIDIA GPU极致优化
ONNX Runtime	Python/C++	ONNX模型	支持CPU/GPU混合推理
TVM	Python/C++	多种模型	支持跨平台编译与优化

🧪 案例与实例

案例1：将 LLaMA-13B 优化到手机端运行

✅ 目标：将原始 LLaMA-13B 在移动端运行
✅ 步骤：

使用 GPTQ 将模型压缩为 4-bit
使用 ONNX Runtime 导出模型
在 Android 上部署 ONNX 模型（使用 PyTorch Mobile 或 TFLite）

# 导出为 ONNX 格式
dummy_input = tokenizer("Hello world", return_tensors="pt")
torch.onnx.export(model, dummy_input.input_ids, "llama-13b.onnx")

案例2：优化前后性能对比

模型版本	显存占用	推理延迟(ms)	准确率下降
FP32	26GB	120	0%
INT8	13GB	70	<1%
INT4 (GPTQ)	6.5GB	50	~2%

🛠 实战操作指南

工具推荐与安装说明

技术	工具	安装命令
量化	bitsandbytes	`pip install bitsandbytes`
GPTQ	GPTQ-for-LLaMa	`git clone && pip install -e .`
ONNX导出	torch.onnx	`pip install torch`
蒸馏	HuggingFace Transformers	`pip install transformers`

🧭 总结与扩展思考

1. 模型优化与能力权衡框架

维度	量化	剪枝	蒸馏
显存占用	★★★★☆	★★★☆☆	★★★★☆
精度保留	★★★☆☆	★★☆☆☆	★★★★☆
实施难度	★☆☆☆☆	★★★☆☆	★★★★☆
通用性	★★★★☆	★★☆☆☆	★★★★☆

2. 优化技术与硬件演进协同

CUDA加速：TensorRT 可针对NVIDIA GPU做深度优化
ARM指令集优化：Neon 指令提升移动端推理效率
TPU支持：JAX + TPU 适合大规模蒸馏训练

3. 下一代推理优化展望

动态量化（Dynamic Quantization）：按输入自适应选择精度
神经架构搜索（NAS）+ 剪枝联合优化
稀疏张量计算库（如NVIDIA CUTLASS）

📚 参考资料

HuggingFace Transformers Docs
bitsandbytes GitHub
GPTQ-for-LLaMa GitHub
DistilBERT Paper
SLERP for Model Merging

📢 欢迎订阅《AI大模型应知应会100篇》专栏系列文章，持续更新，带你从零构建大模型认知体系！

《AI大模型应知应会100篇》第46篇：大模型推理优化技术：量化、剪枝与蒸馏

第46篇：大模型推理优化技术：量化、剪枝与蒸馏 📌 目标读者：人工智能初中级入门者 🧠 核心内容：量化、剪枝、蒸馏三大核心技术详解实战代码演示案例部署全流程 💻 实战平台：PyTor…...

编程日记 2025/7/14 18:35:33

C++/SDL 进阶游戏开发 —— 双人塔防（代号：村庄保卫战 20）

🎁个人主页：工藤新一 🔍系列专栏：C面向对象（类和对象篇） 🌟心中的天空之城，终会照亮我前方的路 🎉欢迎大家点赞👍评论📝收藏⭐文章文章目录三…...

编程日记 2025/6/29 8:20:18

【Python生成器与迭代器】核心原理与实战应用

目录前言技术背景与价值当前技术痛点解决方案概述目标读者说明一、技术原理剖析核心概念图解核心作用讲解关键技术模块说明技术选型对比二、实战演示环境配置要求核心代码实现案例1：自定义迭代器类案例2：生成器函数案例3：生成器表达式运行结果验证三、性能对比测试方法论量…...

编程日记 2025/6/29 5:20:13

2025年最新嵌入式开发STM32单片机详细教程（更新中）

ARM 处理器架构 ARM 处理器从 1984 ARM-1 发展到 2004 ARM-11 之后，放弃数字命名，用 cortex 来命令处理器产品。 Cortex-A系列主打高性能手机，平板，智能电视等 Cortex-R系列主打实时汽车，工业控…...

编程日记 2025/6/29 5:19:14

NeatChat 人工智能模型对话web客户端前言此项目是nextchat分支，相比原者更加简洁流畅。部署 docker部署 name: next-chat services:chatgpt-next-web:ports:- 8080:3000environment:- OPENAI_API_KEYsk-xx543Ef3d- BASE_URLhttps://api.ai.com- GOOGLE_API_K…...

编程日记 2025/7/7 23:33:22

学习黑客分析案例

▶️ Day 2 任务 – 「怪物图鉴」实战选一条最新安全事件（国内外均可，建议 1 年内） 例：CVE-2024-21887 Ivanti VPN RCE 用下列表格框架，3 句话归纳它的“派系”“CIA 受击点”“一句话原理”： 攻击流派…...

编程日记 2025/7/15 12:39:02

sonar-scanner在扫描JAVA项目时为什么需要感知.class文件

1 概述 SonarQube是一个静态代码分析工具，主要用于检查源代码的质量，包括代码重复、潜在漏洞、代码风格问题等。而SonarScanner是SonarQube的客户端工具，负责将代码进行形态分析，并将结果发送到SonarQube服务器。所以&#xff0c…...

编程日记 2025/7/7 23:31:52

AtCoder Beginner Contest 404（ABCDE）

A - Not Found 翻译： 给您一个字符串S，长度在1 到25 之间，由小写英文字母组成。输出S 中没有出现的一个小写英文字母。如果有多个这样的字母，可以输出其中任何一个。思路： 数组记录存在于 s 中的字母。&#xff08…...

编程日记 2025/6/29 5:12:37

【言语理解】中心理解题目之结构分析

front:中心理解题目之抓住关键信息 3.1 五种常见对策表达方式 3.1.1 祈使或建议给对策应该（应） 需要（要） eg：……。对此，媒体要做好自我规约。……。 eg：……。然而，两地仅简单承接…...

编程日记 2025/6/29 8:13:10

DeepSeek-Prover-V2-671B：AI在数学定理证明领域的重大突破

文章目录什么是DeepSeek-Prover-V2-671B？核心技术亮点1. **超大规模参数与高效推理**2. **超长上下文窗口**3. **强化学习与合成数据** 主要应用场景1. **教育领域**2. **科学研究**3. **工程设计**4. **金融分析** 开源与商业化性能表现总结 2025年4月30日&#x…...

编程日记 2025/6/30 16:35:10

React18组件通信与插槽

1、为DOM组件设置Props 在react中jsx中的标签属性被称为Props DOM组件的类属性，为了防止与js中的class属性冲突改成了className DOM组件的style属性 import image from "./logo.svg"; function App() {const imgStyleObj {width: 200,height: 200,};re…...

编程日记 2025/6/29 5:12:34

第15章对API的身份验证和授权

第15章对API的身份验证和授权在构建RESTful API时，确保只有经过身份验证和授权的用户才能访问特定资源是至关重要的。身份验证是确认用户身份的过程，而授权则是决定用户是否有权访问特定资源的过程。在本章中，我们将详细探讨如何在ASP.NET Core Web API中实现身份验证和授…...

编程日记 2025/6/29 7:49:33

【项目归档】数据抓取+GenAI+数据分析

年后这两个月频繁组织架构变动，所以博客很久没更新。现在暂时算是尘埃落定，趁这段时间整理一下。入职九个月，自己参与的项目有4个，负责前后端开发，测试，devops（全栈/doge）&#xff…...

编程日记 2025/6/29 7:40:30

如何优化MySQL主从复制的性能？

优化MySQL主从复制的性能需要从硬件、配置、架构设计和运维策略等多方面入手。以下是详细的优化方案： 一、减少主库写入压力 1. ‌主库优化‌ 二进制日志（binlog）优化‌： 使用 binlog_formatROW 以获得更高效的复制和更少的数…...

编程日记 2025/7/9 17:45:08

asp.net客户管理系统批量客户信息上传系统客户跟单系统crm

# crm-150708 客户管理系统批量客户信息上传系统客户跟单系统 # 开发背景本软件是给郑州某企业管理咨询公司开发的客户管理系统软件 # 功能 1、导入客户数据到系统 2、批量将不同的客户分配给不同的业务员跟进 3、可以对客户数据根据紧急程度标记不同的颜色&#xff0c…...

编程日记 2025/6/29 5:23:17

PCIe | TLP | 报头 / 包格式 / 地址转换 / 配置空间 / 寄存器 / 配置类型

注：本文为 “PCIe - TLP” 相关文章合辑。英文引文，机翻未校。中文引文，未整理去重。图片清晰度受引文原图所限。略作重排，如有内容异常，请看原文。 PCIe - TLP Header, Packet Formats, Address Translation, Co…...

编程日记 2025/6/29 5:12:40

ip和域名

好的，我来依次回答你的问题： 域名和 IP 地址是什么关系？ IP 地址 (Internet Protocol Address)：可以想象成互联网上每台设备（比如服务器、电脑、手机）的门牌号码。它是一串数字（例如 IPv4 地址 …...

编程日记 2025/6/29 6:37:41

《解锁GCC版本升级：开启编程新世界大门》

《解锁GCC版本升级：开启编程新世界大门》一、引言：GCC 版本升级的魔法钥匙在编程的广阔天地里，GCC（GNU Compiler Collection）宛如一座灯塔，为无数开发者照亮前行的道路。它是一款开源且功能强大的编译器集合，支持 C、C++、Objective - C、Fortran、Ada 等多种编程语言…...

编程日记 2025/6/29 5:41:54

前端跨域问题怎么在后端解决

目录简单的解决方法： 添加配置类： 为什么会跨域 1. 什么是源 2. URL结构 3. 同源不同源举🌰 同源例子不同源例子 4. 浏览器为什么需要同源策略 5. 常规前端请求跨域简单的解决方法： 添加配置类： packag…...

编程日记 2025/6/29 7:55:24

生成式 AI 的工作原理

在科技浪潮汹涌澎湃的当下，生成式 AI 宛如一颗璀璨的新星，照亮了我们探索未知的征程。它不再仅仅是科幻电影中的幻想，而是已经悄然融入我们生活的方方面面，从智能客服的贴心应答，到艺术创作的天马行空，生成式 AI 正以一种前所未有的姿态重塑着世界。然而，你是否曾好奇，…...

编程日记 2025/6/29 5:28:43

DeepSeek辅助学术写作之修订与校稿以及发表与推广相关提示词分享祝你顺利毕业~

目录 1.修订与校对 2.发表与推广大家好这里是AIWritePaper官方账号，官网👉AIWritePaper~ 宝子们可以使用小编精选的“ChatGPT研究论文提示词”集合来创建研究论文。利用ChatGPT的智能回应生成详尽有效的内容，这样可以加快研究论文的策划、…...

编程日记 2025/7/8 23:15:19

叠层阻抗线框

1.阻抗介绍特性阻抗：又称“特征阻抗”，它不是直流电阻，属于长线传输中的概念。在高频范围内，信号传输过程中，信号沿到达的地方，信号线和参考平面（电源或地平面）间由于电场的建立&am…...

编程日记 2025/6/29 7:17:48

大数据：驱动技术创新与产业转型的引擎

📝个人主页🌹：慌ZHANG-CSDN博客 🌹🌹期待您的关注 🌹🌹 在全球数字化转型的浪潮中，大数据已经成为推动各行各业革新的核心力量。随着信息技术的迅猛发展，数据的收集、存储、处理和分析能力不断提升，大数据不仅改变了企业的运营模式，更引领了技术创新和产业结构…...

编程日记 2025/6/29 5:55:05

C++继承基础总结

引言在编写多个类时，类之间可能会存在多个相同的成员变量，导致代码冗余度过高，C继承的出现，使得我们可以在已有类的基础上构建新类，从而实现代码复用与结构扩展。一、继承的基本概念继承是指子类（派生…...

编程日记 2025/6/29 6:19:47

2025年斯诺克世锦赛——“75三杰”在1/4决赛作为对手的概率

“在最近的斯诺克世锦赛中，中国两名球员成功挺进前8强。此外，前8强也出现令人感慨的一幕：75三杰全部进入到了八强，这也是历史第5次，50岁正是打拼的年纪！传奇之旅继续！”——摘自50岁正是打拼的年…...

编程日记 2025/6/29 5:43:00

Python绘制地球的重力地图

文章目录 Boule重力地图从ensaio下载重力数据Boule boule中定义了多种参考椭球，可用于表示地球、火星等星体的重力分布。可通过pip安装 pip install bouleboule中已经定义的椭球如下椭球GRS80WGS84MARSMERCURYMOONVENUSVESTA星体地球地球火星水星月球金星灶神星这些椭球可直…...

编程日记 2025/6/29 7:50:06

多端定制系统开发：打造高效全平台覆盖的APP解决方案

在移动互联网时代，用户需求日益多样化，企业若想触达更广泛的受众，仅靠单一平台的应用已远远不够。无论是iOS、Android、Web端，还是智能手表、车载设备等新兴终端，多端适配已成为企业数字化转型的刚需。多端定制系统开发…...

编程日记 2025/6/29 7:19:42

WGDI-分析WGD及祖先核型演化的集成工具-文献精读126

WGDI: A user-friendly toolkit for evolutionary analyses of whole-genome duplications and ancestral karyotypes WGDI：一款面向全基因组重复事件与祖先核型演化分析的易用工具集摘要在地球上大多数主要生物类群中，人们已检测到全基因组复制&…...

编程日记 2025/6/29 5:12:41

旋转矩阵公式理解

这里给出其中一种理解方法： 设原始直角坐标系下的坐标为(x,y)，我们可以将它分解为两个向量(x,0)和(0,y)。接下来将两个向量分别顺时针旋转θ度，二者就会分别变成：(xcosθ,xsinθ)和(-ysinθ,ycosθ)。也就是说，二者…...

编程日记 2025/6/29 5:12:44

网络Tips20-002

1..某主机接口的IP地址为192.16.7.131/26.则该IP地址所在网络的广播地址是：192 16.7.191 广播地址是指在特定网络上发送广播消息的地址。它用于向网络上的所有设备发送信息。方法1：广播地址掩码取反和网络地址的或运算方法2：广播地址将网…...

编程日记 2025/6/29 8:22:04

firewall docker 冲突问题解决（亲测有效）

# 关闭iptables，使用firewall systemctl disable iptables # 禁用服务 systemctl stop iptables # 关闭服务 systemctl status iptables # 查看服务状态 systemctl enable firewalld # 设置防火墙开机自启动 systemctl start firewalld # 开启服务 systemctl s…...

编程日记 2025/6/29 5:12:43

SwiftUI-MLX本地大模型开发（二）

介绍在 SwiftUI-MLX本地大模型开发一文中，我们已经详细讲了如何利用 MLX 进行本地大模型的开发。但是通过案例可以发现 2 个问题： MLX 内置的大模型数量有限。每次大模型都需要从 HuggingFace 下载。如何解决这 2 个问题，方案是&#xff1a…...

编程日记 2025/6/28 20:04:45

基于「骑手外卖系统」串联7大设计原则

你说得对！这些设计原则听起来都很抽象、很“玄”，如果不是实际开发过系统，很难理解“到底为什么要这样设计”。那我现在就用一个你能想象得很清楚的真实例子，帮你把这7个设计原则一一落地到具体情境里，你会一眼明白。…...

编程日记 2025/6/29 9:00:58

泰迪杯特等奖案例学习资料：基于时空图卷积网络的城市排水系统水位精准重建与异常检测

（第十四届泰迪杯数据挖掘挑战赛A题特等奖案例解析）一、案例背景与核心挑战 1.1 应用场景与行业痛点城市排水系统（Urban Drainage Network, UDN）是城市基础设施的重要组成部分，其运行效率直接影响防洪排涝能力和水环境质量。然而，实际运维中面临以下难题：监测数据稀…...

编程日记 2025/6/29 9:00:57

嵌入式Linux应用项目----智能网关

一、网关概述： Linux网关的作用在于，通过蓝牙、LoRa、串口、CAN等接口，与哪些无法连接网络的设备建立联系，将它们的数据转发至服务器。这过程中，网关充当了数据的桥梁，将下级设备所产生的数据发送至服务器。…...

编程日记 2025/6/29 9:00:59

C++ 中的继承

目录前言一、继承的概念及定义二、基类和派生类对象赋值转换三、继承中的作用域四、派生类的默认成员函数五、继承与友元六、继承与静态成员七、复杂的菱形继承及菱形虚拟继承 （一）单继承与多继承 （二）菱形继承 …...

编程日记 2025/6/29 9:00:28

【中间件】brpc_基础_用户态线程上下文

文章目录 context介绍1 简单介绍2 主要功能2.1 上下文结构定义2.2 上下文切换实现2.3 协程栈管理2.4 平台兼容性处理2.5 性能优化 3 关键代码逻辑示例3.1 上下文初始化 (bthread_make_fcontext)3.2 上下文切换 (bthread_jump_fcontext) 4 与 BRPC 其他模块的协作5 性能与稳定性…...

编程日记 2025/6/29 9:00:24

蟋蟀的叫声,大自然的温度计

夏夜草丛中，蟋蟀的鸣叫声此起彼伏。有趣的是，它们的叫声频率竟然与气温有关！根据图片中的公式： 气温 ( X 8 ) 5 9 \text{气温} \frac{(X 8) \times 5}{9} 气温9(X8)5 只需记录蟋蟀在 15 秒内的鸣叫次数（ X X X…...

编程日记 2025/6/29 9:00:46

文献总结：TPAMI端到端自动驾驶综述——End-to-End Autonomous Driving: Challenges and Frontiers

端到端自动驾驶综述 1. 文章基本信息2. 背景介绍3. 端到端自动驾驶主要使用方法3. 1 模仿学习3.2 强化学习 4. 测试基准4.1 真实世界评估4.2 在线/闭环仿真测试4.3 离线/开环测试评价 5. 端到端自动驾驶面临的挑战5.1 多模态输入5.2 对视觉表征的依赖5.3 基于模型的强化学习的世…...

编程日记 2025/6/29 9:01:44

二极管反向恢复的定义和原理

二极管的反向恢复定义二极管的反向恢复是指二极管从正向导通状态切换到反向阻断状态时，电流从正向变为负向并最终回到零所需的时间。具体过程如下： 正向导通：当二极管正向偏置时，电流可以顺利通过，此时二极管处于导…...

编程日记 2025/6/29 9:01:15

# 基于词袋模型（BoW）的猫狗图像分类实践

基于词袋模型（BoW）的猫狗图像分类实践在计算机视觉领域，图像分类是一项基础且重要的任务。本文将介绍如何使用词袋模型（Bag of Words, BoW）结合支持向量机（SVM）实现猫狗图像分类。通过详细的代…...

编程日记 2025/6/29 9:00:39

Vscode+git笔记

1.U是untracked m是modify modified修改了的。 2.check out 查看观察 3 status changed 暂存区 4.fetch v 取来拿来 5.orangion 起源代表远程分支 git checkout就是可以理解为进入的意思。...

编程日记 2025/6/29 6:08:42

生成式 AI 的未来

在人类文明的长河中，技术革命始终是推动社会跃迁的核心引擎。从蒸汽机解放双手，到电力点亮黑夜，再到互联网编织全球神经网络，每一次技术浪潮都在重塑人类的生产方式与认知边界。而今天，生成式人工智能（Generative AI）正以一种前所未有的姿态登上历史舞台——它不再局限于…...

编程日记 2025/6/29 6:20:13

进程间通信（IPC）

进程间通信（IPC）是操作系统中非常重要且基础的概念，涉及到不同进程之间如何交换数据和同步操作。下面我会一个一个地详细讲解这几种常见的IPC方式：管道（包含匿名管道和有名管道）、消息队列、共享内存、信号量、Socket通信，内容尽量用通俗易懂的语言，并结合具体原理、优…...

编程日记 2025/6/29 7:14:42

C语言奇幻指南：宏、头文件与变量的秘密世界

🌟 C语言奇幻指南：宏、头文件与变量的秘密世界 🌟 一、写一个“比小”宏：三目运算符的魔法目标：定义一个宏，返回两个参数中较小的值。代码： #define MIN(a, b) ((a) < (b) ? (a) : (b))…...

编程日记 2025/6/29 7:57:34

【开源免费】二维码批量识别-未来之窗——C#-仙盟创梦IDE

二维码批量识别工具，借助先进图像识别技术，能快速准确读取大量二维码信息。适用于物流与供应链管理，如库存盘点和货物追踪；可用于资产管理，像固定资产盘点与设备巡检；还能助力数据收集与市场调研&#xff0…...

编程日记 2025/6/29 6:26:59

n8n工作流自动化平台的实操：解决中文乱码

解决问题： 通过ftp读取中文内容的文件，会存在乱码，如下图： 解决方案 1.详见《安装 iconv-lite》 2.在code节点，写如下代码： const iconv require(iconv-lite);const items $input.all(); items.forEa…...

编程日记 2025/6/29 5:22:50

MCP 探索：MCP 集成的相关网站 Smithery、PulseMCP 等

简简单单 Online zuozuo ：本心、输入输出、结果文章目录 MCP 探索：MCP 集成的相关网站 Smithery、PulseMCP 等前言一、MCP 集成基础二、利用热门资源平台集成三、集成常见 MCP 服务四、管理集成的 MCP 能力五、集成示例借鉴六、数据交互与安全管理MCP 探索：MCP 集成的相关网…...

编程日记 2025/6/29 6:28:37

linux的时间轮

时间轮：高效管理海量定时任务的利器 1. 引言：为什么需要时间轮？ 在许多应用场景中，我们都需要管理大量的定时任务，例如： 网络连接的超时检测。分布式系统中的心跳检测。缓存条目的过期淘汰。需要延迟执行…...

编程日记 2025/6/29 7:57:51

《操作系统真象还原》第十二章（2）——进一步完善内核

文章目录前言可变参数的原理实现系统调用write更新syscall.h更新syscall.c更新syscall-init.c 实现printf编写stdio.h编写stdio.c 第一次测试main.cmakefile结果截图完善printf修改main.c 结语前言上部分链接：《操作系统真象还原》第十二章（1&#…...

编程日记 2025/6/29 6:11:37