大模型本地部署硬件资源学习(包含模型微调所需资源)
大模型本地部署硬件配置学习
- 前言
- 1.大模型应用需求分析扩展框架
- 2.华为昇腾算力
- 3.显卡信息汇总对比表
- 4.大模型微调显卡资源指南(Qwen系列与DeepSeek蒸馏模型)
- 一、Qwen系列模型微调显存需求
- 二、DeepSeek-R1蒸馏模型微调显存需求
- 三、显存优化策略与硬件选型建议
- 四、典型场景配置示例
前言
本博客将全面探讨构建系统的需求分析框架到深入解析华为昇腾算力的支持能力,再到提供详尽的显卡信息对比和大模型微调所需的显存资源指南。特别针对Qwen系列与DeepSeek蒸馏模型,将详细介绍其微调显存需求、优化策略及硬件选型建议。
1.大模型应用需求分析扩展框架
从行业落地、技术实现、资源匹配、场景适配等多维度展开需求分析,结合大模型技术特性与业务痛点,形成系统性评估体系。
行业需求分析:聚焦降本增效与创新驱动
行业 | 核心痛点 | 需求及解决方案 | 目标 |
---|---|---|---|
通信行业 | - 人工拼装方案效率低、质量不稳定 - 客户需求变更频繁 | - RAG检索增强生成 - 业务参数固化 - 标准化章节模板 实现方案自动化生成与动态调整 | 效率提升 |
金融行业 | - 数据分散、合规要求高 - 分析时效性强 | - 构建行业知识库(监管规则、历史案例) - 结合多模态数据分析生成合规报告 | 质量优化 |
医疗行业 | - 影像数据量大 - 医生经验依赖度高 | - 视觉大模型结合病理文本数据 - 实现病灶标注与诊断建议生成 | 创新赋能 |
制造业 | - 设备数据孤岛 - 故障响应滞后 | - 时序数据分析模型+知识图谱 - 生成维修指南与备件调度方案 | 效率提升/质量优化 |
目标:
- 效率提升(自动化):通过自动化工具和技术减少人力投入,提高工作效率。
- 质量优化(标准化):通过制定和应用标准流程或模板,确保输出的一致性和高质量。
- 创新赋能(智能化):利用先进的技术手段如AI,为行业带来新的可能性和服务能力。
资源需求分析:分级匹配投入规模
根据业务目标划分资源投入层级,避免资源浪费:
场景分级 | 参数量范围 | 硬件配置 | 典型应用 |
---|---|---|---|
轻量级(实验) | 1.5B-7B | 单卡RTX 3060+32GB内存 | 内部知识问答、文本校对 |
企业级(生产) | 14B-70B | 多卡RTX 4090/A5000+128GB内存 | 自动化报告生成、智能客服 |
科研级(创新) | 100B+ | 昇腾910B集群/A100 SuperPOD | AGI研究、多模态生成 |
资源匹配原则:
- 显存瓶颈:模型参数量×2 ≈ 最小显存需求(例:7B模型需14GB显存,实际需16GB以上冗余);
- 成本控制:企业级场景优先采用量化技术(4-bit)与模型剪枝,显存占用降低50%。
用户场景需求分析:从通用到垂直
通用场景(L0级模型):
- 需求:多轮对话、跨领域知识问答;
- 案例:ChatGPT式交互,需长上下文支持(16K+ tokens)与意图识别 。
行业场景(L1级模型):
- 需求:领域术语理解、规则约束(如法律条文);
- 案例:通信行业售前方案生成需固化报价模板、对接设备库 。
垂直场景(L2级模型):
- 需求:高精度任务执行(如医疗影像分割);
- 案例:制造业质检模型需融合视觉大模型与缺陷数据库 。
主流显卡性能分析**
显卡型号 | 显存容量 | FP16算力(TFLOPS) | 适用场景 | 性价比推荐 |
---|---|---|---|---|
RTX 3060 | 12GB | 25.9 | 7B模型推理/微调 | 入门级 |
RTX 3090 | 24GB | 71.0 | 14B-32B模型训练 | 中高端 |
RTX 4090 | 24GB | 130.0 | 70B模型推理/多卡并行 | 旗舰级 |
A100 40GB | 40GB | 312.0 | 科研级大模型分布式训练 | 企业级 |
AMD RX 7900XTX | 24GB | 122.0 | 光栅化任务(性价比高) | 替代方案 |
2.华为昇腾算力
华为昇腾系列是专为AI计算设计的芯片组,分为 训练卡 和 推理卡 两类,适配不同算力需求场景:
- 昇腾910B(训练卡)
- 算力:FP16算力376 TFLOPS,INT8算力512 TOPS,支持大规模分布式训练。
- 架构:基于达芬奇3D Cube架构,集成HCCS高速互联接口(带宽392GB/s),支持多卡集群扩展。
- 应用:100B+参数大模型训练、多模态学习(如医疗影像与文本联合建模)。
- 昇腾310(推理卡)
- 算力:FP16算力8 TFLOPS,INT8算力16 TOPS,功耗仅8W,适合边缘端部署。
- 特性:支持16路超高清视频解码(H.264/H.265),适用于安防监控、工业质检等实时分析场景。
- Atlas 300I系列(推理加速卡)
- 型号:Atlas 300I Pro(24GB显存)和Atlas 300I Duo(96GB显存)。
- 场景:7B-70B参数模型的低延迟推理,兼容华为CANN框架和MindSpore生态。
Atlas智能计算硬件矩阵
昇腾芯片通过 Atlas产品家族 实现多形态部署,覆盖端边云全场景:
- 边缘设备
- Atlas 500智能小站:集成昇腾310芯片,支持-40°C至70°C宽温运行,用于油气巡检、电力监测等严苛环境。
- Atlas 800边缘服务器:搭载4-8张昇腾310卡,提供边缘侧AI推理集群能力,支持智慧城市交通调度。
- 云端服务器与集群
- Atlas 900 PoD:单集群支持4096颗昇腾910B,算力达256 PFLOPS(FP16),用于国家级AI计算中心建设。
- Atlas 300T Pro训练服务器:单机配置8张昇腾910B,支持千亿参数模型微调,适配金融、运营商行业需求。
命名规则:
- I后缀为推理卡,V为视频解析卡,T为训练卡;
- Pro/Duo代表增强版或多卡协同设计。
指标 | 昇腾910B(训练) | NVIDIA A100(训练) | Atlas 300I Duo(推理) | NVIDIA T4(推理) |
---|---|---|---|---|
FP16算力 (TFLOPS) | 376 | 312 | 140 | 65 |
显存容量 | 64GB HBM | 40GB HBM2e | 96GB GDDR6 | 16GB GDDR6 |
显存带宽 | 392GB/s | 1.55TB/s | 800GB/s | 320GB/s |
功耗 | 350W | 400W | 250W | 70W |
生态兼容性 | MindSpore/CANN | CUDA/TensorRT | 华为云AI框架 | CUDA/TensorRT |
昇腾核心优势:
- 能效比:昇腾910B在FP16算力上超越A100,功耗降低12.5%,适合数据中心绿色化需求。
- 国产化适配:与鲲鹏CPU、欧拉OS深度集成,支持信创场景的本地化部署。
- 长序列处理:Atlas 300V Pro的视频解析能力在医疗影像、工业质检中表现突出。
- 达芬奇架构 :3D Cube矩阵运算单元提升AI计算密度,相比传统GPU能效比提升50%。
- 软硬协同生态 :CANN(Compute Architecture for Neural Networks):异构计算架构,实现昇腾芯片与TensorFlow/PyTorch框架无缝对接。
- MindSpore:支持自动并行与混合精度训练,降低大模型开发门槛。
- 国产化适配 :与鲲鹏CPU、欧拉OS深度集成,满足政府、国防等领域的安全可控需求。
3.显卡信息汇总对比表
以下为华为昇腾、英伟达(消费级/数据中心)、以及混合型号的全面对比,覆盖性能参数、应用场景及技术特性。此表为参考,并不能完全保证数据准确无误。
制造商 | 型号 | 架构 | 显存容量 | 显存类型 | 显存带宽 | FP16算力 (TFLOPS) | INT8算力 (TOPS) | 功耗 (W) | 应用场景 | 关键特性 |
---|---|---|---|---|---|---|---|---|---|---|
华为 | 昇腾910B | 达芬奇架构 | 64GB | HBM | 392GB/s | 376 | 512 | 350 | 大模型训练/多模态 | 高能效比,国产化适配 |
华为 | 昇腾310 | 达芬奇架构 | 8GB | LPDDR4 | 64GB/s | 8 | 16 | 8 | 边缘推理/视频分析 | 低功耗,支持16路视频解码 |
华为 | Atlas 300I Duo | 达芬奇架构 | 96GB | GDDR6 | 800GB/s | 140 | 280 | 250 | 大模型推理 | 多任务并行,高显存容量 |
华为 | Atlas 300I Pro | 达芬奇架构 | 24GB | GDDR6 | 512GB/s | 130 | 260 | 200 | 企业级推理 | 兼容MindSpore生态 |
英伟达 | H100 | Hopper | 80GB | HBM3 | 3.35TB/s | 312 | 2000 | 700 | 千亿参数模型训练 | 第四代Tensor Core,NVLink高速互联 |
英伟达 | B100 | Blackwell | 192GB | HBM3e | 5TB/s | 400+(预估) | 1600+(预估) | 1000+ | 多模态/AGI研究 | 3nm工艺,3D堆叠技术 |
英伟达 | A100 | Ampere | 40GB | HBM2e | 1.55TB/s | 156 | 624 | 400 | 中等模型训练/HPC | 支持MIG技术,高性价比 |
英伟达 | L20 | Ada Lovelace | 48GB | HBM3 | 1.9TB/s | 90 | 360 | 275 | 云端推理/多模态 | 高显存带宽,支持光追与DLSS |
英伟达 | A30 | Ampere | 24GB | HBM2 | 933GB/s | 20.6(FP16) | 330 | 165 | 企业级训练/推理 | MIG多实例分割,低功耗 |
英伟达 | RTX 4090 | Ada Lovelace | 24GB | GDDR6X | 1TB/s | 130 | 520 | 450 | 4K光追游戏/AI推理 | 消费级旗舰,支持DLSS 3.0 |
英伟达 | RTX 5090 | Blackwell | 32GB | GDDR7 | 2TB/s | 200+(预估) | 800+(预估) | 600+ | 下一代光追/大模型推理 | 3nm制程,DLSS 4.0支持 |
英伟达 | RTX 4070 Super | Ada Lovelace | 12GB | GDDR6X | 504GB/s | 80(FP16) | 320 | 220 | 2K游戏/轻量AI任务 | 高性价比,AV1编码支持 |
4.大模型微调显卡资源指南(Qwen系列与DeepSeek蒸馏模型)
一、Qwen系列模型微调显存需求
模型规模 | 微调方式 | FP16显存需求 | INT8显存需求 | INT4显存需求 | 推荐显卡配置 | 适用场景 |
---|---|---|---|---|---|---|
Qwen2-1.5B | 全参微调 | 8-10GB | 4-5GB | 2-3GB | RTX 3060/昇腾310(8GB) | 轻量级对话/边缘推理 |
LoRA微调 | 5-6GB | 3-4GB | 1.5-2GB | RTX 4070 Super(12GB) | 本地多任务适配 | |
Qwen2-7B | 全参微调 | 24GB+ | 12-14GB | 6-8GB | RTX 4090(24GB) | 企业级垂直领域优化 |
LoRA微调 | 16-18GB | 8-10GB | 4-6GB | 双RTX 4090(NVLink) | 高并发推理/多任务并行 | |
Qwen2-14B | 全参微调 | 32GB+ | 16-18GB | 8-10GB | A100 80GB(单卡) | 长文本生成/复杂逻辑推理 |
LoRA+QLoRA | 12-14GB | 6-8GB | 3-4GB | RTX 4090(24GB) | 低成本快速迭代 | |
Qwen2-72B | 全参微调 | 300GB+ | 150-180GB | 80-100GB | 4×H100 80GB(NVLink集群) | 千亿参数科研级训练 |
分布式微调 | 单卡80GB+ | 单卡40-50GB | 单卡20-25GB | 8×A100 80GB(RDMA互联) | 多模态联合训练 |
关键数据来源:
- Qwen1.5-7B/14B模型需24GB+显存,INT8量化显存降低50%。
- 72B模型需多卡集群,显存总量需覆盖参数+梯度+优化器状态。
二、DeepSeek-R1蒸馏模型微调显存需求
模型规模 | 微调方式 | FP16显存需求 | INT8显存需求 | INT4显存需求 | 推荐显卡配置 | 适用场景 |
---|---|---|---|---|---|---|
DeepSeek-R1-1.5B | 全参微调 | 4-5GB | 2-3GB | 1-1.5GB | 昇腾310(8GB) | 嵌入式设备/实时视频分析 |
LoRA微调 | 2.5-3GB | 1.2-1.8GB | 0.6-1GB | Jetson AGX Orin(32GB) | 边缘端多模态推理 | |
DeepSeek-R1-7B | 全参微调 | 12-14GB | 6-8GB | 3-4GB | RTX 4070 Super(12GB) | 轻量级代码生成/合同审核 |
QLoRA微调 | 5-6GB | 2.5-3GB | 1.2-1.5GB | RTX 3060(8GB) | 中小企业本地部署 | |
DeepSeek-R1-14B | 全参微调 | 24GB+ | 12-14GB | 6-8GB | RTX 4090(24GB) | 长文本摘要/法律文书生成 |
分布式微调 | 单卡16GB+ | 单卡8-10GB | 单卡4-6GB | 2×A30(24GB HBM2) | 医疗影像与文本联合训练 | |
DeepSeek-R1-70B | 全参微调 | 80GB+ | 40-50GB | 20-25GB | 4×H100 80GB(3.2TB/s带宽) | 金融预测/超大规模知识图谱 |
异构分布式 | 单卡24GB+ | 单卡12-15GB | 单卡6-8GB | 混合NVIDIA/昇腾集群 | 跨平台多任务推理 |
关键数据来源:
- DeepSeek-R1-14B量化后显存降低至6-8GB,支持单卡推理。
- 70B模型需多卡并行,HBM3e显存带宽需≥5TB/s。
三、显存优化策略与硬件选型建议
-
量化技术选择:
- INT8:适用于显存紧张场景,Qwen2-7B量化后显存降至12GB。
- INT4+QLoRA:DeepSeek-R1-7B仅需1.2GB显存,适合边缘设备。
-
分布式训练配置:
- Qwen2-72B:需4×H100集群,显存带宽≥3.2TB/s以避免通信瓶颈。
- DeepSeek-R1-70B:推荐阿里云GN7实例(A100集群),按需扩展算力。
-
性价比方案:
- 中小模型:RTX 4090(24GB)单卡覆盖Qwen2-14B和DeepSeek-R1-14B的LoRA微调。
- 企业级部署:华为昇腾910B(64GB HBM)适配国产化需求,支持Qwen全系列。
四、典型场景配置示例
场景 | 模型与配置 | 硬件方案 | 性能指标 |
---|---|---|---|
医疗报告生成 | DeepSeek-R1-14B + LoRA(FP16) | 双RTX 4090(48GB显存) + 128GB DDR5 | 吞吐量120样本/秒,延迟<0.5秒 |
金融风险预测 | Qwen2-72B + 分布式全参微调(INT8) | 8×H100 80GB + InfiniBand网络 | 训练速度1.2小时/epoch,精度99.2% |
工业质检边缘推理 | DeepSeek-R1-1.5B + QLoRA(INT4) | 昇腾310集群(4节点) + 32GB内存 | 支持16路视频流,功耗<50W |
- 显存计算工具:使用公式
显存 ≈ 参数量 × 精度字节数 × 3
快速估算(如Qwen2-7B FP16:7B×2×3=42GB → 实际优化后24GB。 - 监控工具:SwanLab或NVIDIA DCGM实时追踪显存与算力利用率。
- 云服务对比:阿里云GN6i(T4 16GB)时租成本低于自建机房的30%。
相关文章:
大模型本地部署硬件资源学习(包含模型微调所需资源)
大模型本地部署硬件配置学习 前言1.大模型应用需求分析扩展框架2.华为昇腾算力3.显卡信息汇总对比表4.大模型微调显卡资源指南(Qwen系列与DeepSeek蒸馏模型)一、Qwen系列模型微调显存需求二、DeepSeek-R1蒸馏模型微调显存需求三、显存优化策略与硬件选型…...
【DeepSeek系列】05 DeepSeek核心算法改进点总结
文章目录 一、DeepSeek概要二、4个重要改进点2.1 多头潜在注意力2.2 混合专家模型MoE2.3 多Token预测3.4 GRPO强化学习策略 三、2个重要思考3.1 大规模强化学习3.2 蒸馏方法:小模型也可以很强大 一、DeepSeek概要 2024年~2025年初,DeepSeek …...
Java基础常见的面试题(易错!!)
面试题一:为什么 Java 不支持多继承 Java 不支持多继承主要是为避免 “菱形继承问题”(又称 “钻石问题”),即一个子类从多个父类继承到同名方法或属性时,编译器无法确定该调用哪个父类的成员。同时,多继承…...
山东大学软件学院nosql实验四
实验题目: 使用Java做简单数据插入 实验内容 用API方式,做数据插入。 使用Java语言实现数据插入界面,为实验一建立的学生、教师、课程表插入数据,可以在前端界面中录入数据之后保存,也可以导入Excel中的数据。 实…...
Linux | man 手册使用详解
注:本文为 “Linux man 手册” 相关文章合辑。 略作重排。 man 手册常用命令 1. 查看和搜索手册页 查看特定软件包的手册页,并使用 grep 命令过滤出包含特定关键字的行: man <package> | grep <keyword>在整个系统的手册页中…...
初阶数据结构(C语言实现)——1数据结构前言
1. 什么是数据结构 数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在一种或多种特定关系的数据元素的集合。 2.什么是算法? 算法(Algorithm):就是定义良好的计算过程,他取一个或一组的值为输入,并产生出一…...
Windows - 通过ssh打开带有图形界面的程序 - 一种通过计划任务的曲折实现方式
Windows(奇思妙想) - 通过ssh打开带有图形界面的程序 - 一种通过计划任务的曲折实现方式 前言 Windows启用OpenSSH客户端后就可以通过SSH的方式访问Windows了。但是通过SSH启动的程序: 无法显示图形界面会随着SSH进程的结束而结束 于是想到了一种通过执行“计划…...
基于 SpringBoot 的 “电影交流平台小程序” 系统的设计与实现
大家好,今天要和大家聊的是一款基于 SpringBoot 的 “电影交流平台小程序” 系统的设计与实现。项目源码以及部署相关事宜请联系我,文末附上联系方式。 项目简介 基于 SpringBoot 的 “电影交流平台小程序” 系统设计与实现的主要使用者分为 管理员 和…...
工具方法 - 合规性矩阵
Compliance matrix (合规性矩阵)是产品需求管理中的一个重要工具,它是用来识别、跟踪、监控和组织所有客户和利益相关方需求是否被满足的工具。具体来说,Compliance matrix需要用一行一行的证据来证明被设计的产品针对每个需求的实…...
2.2 STM32F103C8T6最小系统板的四种有关固件的开发方式
2.2.1 四种有关固件的开发方式 四种有关于固件的开发方式从时间线由远及近分别是:寄存器开发、标准外设驱动库开发、硬件抽象层库开发、底层库开发。 四种开发方式各有优缺点,可以参考ST官方的测试与说明。 1.寄存器开发 寄存器编程对于从51等等芯片过渡…...
go 环境准备
配置路径: GOROOT:D:\GoGOPATH:go的工作目录 D:\workspacego 验证版本:go version 配置第三方仓库: GO111MODULE:开启mod模式GOPROXY:go语言三方库地址GOSUMDB:go语言软件包的M…...
VMware安装Centos 9虚拟机+设置共享文件夹+远程登录
一、安装背景 工作需要安装一台CentOS-Stream-9的机器环境,所以一开始的安装准备工作有: vmware版本:VMware Workstation 16 镜像版本:CentOS-Stream-9-latest-x86_64-dvd1.iso (kernel-5.14.0) …...
高中数学基础-平面向量
文章目录 1、平面向量2、复数 高中数学-平面向量、复数 1、平面向量 向量:具有大小和方向的量称为向量;物理学中向量也称矢量,只有大小没有方向的量称为标量;向量的大小称为模,大小为1的是单位向量,长度为0…...
v4l2子系统学习(三)编写虚拟摄像头驱动
文章目录 1、声明2、前言3、虚拟摄像头驱动编写3.1、编写硬件相关代码3.2、程序示例 1、声明 本文是在学习韦东山《驱动大全》V4L2子系统时,为梳理知识点和自己回看而记录,全部内容高度复制粘贴。 韦老师的《驱动大全》:商品详情 其对应的…...
堆排序(详解)c++
堆排序 (可以⽤ ppt 演⽰流程) 堆排序(Heap Sort)是指利⽤堆这种数据结构所设计的⼀种排序算法。本质上是优化了选择排序算法,选择排序的思想是在堆排序元素中拿出最大值或最小值,然后把这个位置的值放在它该放的位置上就可以了&a…...
API测试工具:Swagger vs Postman 2025最新全面对比
随着微服务架构的普及和云原生应用的激增,高效的 API 开发、测试和文档管理工具变得越来越重要。在众多 API 工具中,Swagger 和 Postman 各自以不同的方式解决着 API 开发生命周期中的关键问题,本文将从多个维度深入对比这两款工具࿰…...
算法-图-数据结构(邻接矩阵)-BFS广度优先遍历
邻接矩阵广度优先遍历(BFS)是一种用于遍历或搜索图的算法,以下是具体介绍: 1. 基本概念 图是一种非线性的数据结构,由顶点和边组成,可分为无向图、有向图、加权图、无权图等。邻接矩阵是表示图的一种数…...
List的模拟实现(2)
前言 上一节我们讲解了list的基本功能,那么本节我们就结合底层代码来分析list是怎么实现的,那么废话不多说,我们正式进入今天的学习:) List的底层结构 我们先来看一下list的底层基本结构: 这里比较奇怪的…...
【C++设计模式】观察者模式(1/2):从基础到优化实现
1. 引言 在 C 软件与设计系列课程中,观察者模式是一个重要的设计模式。本系列课程旨在深入探讨该模式的实现与优化。在之前的课程里,我们已对观察者模式有了初步认识,本次将在前两次课程的基础上,进一步深入研究,着重…...
可狱可囚的爬虫系列课程 13:Requests使用代理IP
一、什么是代理 IP 代理 IP(Proxy IP)是一个充当“中间人”的服务器IP地址,用于代替用户设备(如电脑、手机等)直接与目标网站或服务通信。用户通过代理IP访问互联网时,目标网站看到的是代理服务器的IP地址&…...
冒险岛079 V8 整合版源码搭建教程+IDEA启动
今天教大家来部署下一款超级怀旧游戏冒险岛,冒险岛源码是开源的,但是开源的代码会有各种,本人进行了加工整合,并且用idea进行了启动测试,经过修改后没有任何问题。 启动截图 后端控制台 前端游戏界面 声明 冒险岛源码…...
Web刷题之PolarDN(中等)
1.到底给不给flag呢 代码审计 一道典型的php变量覆盖漏洞 相关知识 什么是变量覆盖漏洞 自定义的参数值替换原有变量值的情况称为变量覆盖漏洞 经常导致变量覆盖漏洞场景有:$$使用不当,extract()函数使用不当,parse_str()函数使用不当&…...
[250224] Yaak 2.0:Git集成、WebSocket支持、OAuth认证等 | Zstandard v1.5.7 发布
目录 Yaak 2.0 发布:Git 集成、WebSocket 支持、OAuth 认证等众多功能!Zstandard v1.5.7 发布:性能提升,稳定性增强 Yaak 2.0 发布:Git 集成、WebSocket 支持、OAuth 认证等众多功能! Yaak,一款…...
插入排序:一种简单而直观的排序算法
大家好!今天我们来聊聊一个简单却非常经典的排序算法——插入排序(Insertion Sort)。在所有的排序算法中,插入排序是最直观的一个。 一、插入排序的基本思想 插入排序的核心思想是:将一个待排序的元素,插…...
vue2响应式数据原理
1. 核心原理 Vue 2 的响应式系统基于 Object.defineProperty,通过 依赖收集 和 派发更新 来实现数据的响应式 依赖收集:在读取数据时,记录哪些函数(或组件)依赖了该数据。派发更新:在修改数据时ÿ…...
对免认证服务提供apikey验证
一些服务不带认证,凡是可以访问到服务端口,都可以正常使用该服务,方便是方便,但是不够安全。 比如ollama默认安装后就是这样。现在据说网上扫一下端口11434,免apikey的ollama服务一大堆。。。 那我们怎样将本机安装的o…...
算法——Trie 树
Trie 树(前缀树或字典树)是一种高效处理字符串集合的树形数据结构,核心思想是通过共享公共前缀来优化存储和查询。以下是 Trie 树的详细介绍: 1. Trie 树的基本概念 结构特点: 每个节点表示一个字符。从根节点到某一节…...
python中的JSON数据格式
文章目录 什么是json主要功能Python数据和Json数据的相互转化 什么是json JSON是一种轻量级的数据交互格式。可以按照JSON指定的格式去组织和封装数据。JSON本质上是一个带有特定格式的字符串。 主要功能 json就是一种在各个编程语言中流通的数据格式,负责不同编…...
服务器能否拒绝非浏览器发起的HTTP请求?
互联网各领域资料分享专区(不定期更新): Sheet 前言 服务器可以采取多种方法来拒绝非浏览器发起的HTTP请求,但需要明确的是:HTTP协议本身并不限制客户端类型,任何符合协议规范的请求都会被处理。因此,拒绝非浏览器请求需依赖额外策略。 正文 一、基于请求头过滤 1、Us…...
深度学习之图像分类(二)
前言 文章主要是通过实战项目——食品分类来理解分类项目的整体流程。除此之外,还需要对半监督学习,迁移学习,数据增广,Adam和AdamW进行了解。 数据增广 图片增广(Image Data Augmentation)是深度学习中一种…...
数据库高安全—openGauss安全整体架构安全认证
openGauss作为新一代自治安全数据库,提供了丰富的数据库基础安全能力,并逐步完善各类高阶安全能力。这些安全能力涵盖了访问登录认证、用户权限管理、审计与追溯及数据安全隐私保护等。本章节将围绕openGauss安全机制进行源码解读,以帮助数据…...
利用开源小智AI制作桌宠机器狗
本文主要介绍如何利用开源小智AI制作桌宠机器狗 1 源码下载 首先下载小智源码,下载地址, 下载源码后,使用vsCode打开,需要在vscode上安装esp-idf,安装方式请自己解决 2 源码修改 2.1添加机器狗控制代码 在目录main/iot/things下添加dog.cc文件,内容如下; #include…...
uniapp在app下使用mqtt协议!!!支持vue3
什么?打包空白?分享一下我的解决方法! 第一步 找大师算过了,装4.1版本运气好! 所以根目录执行命令… npm install mqtt4.1.0第二步 自己封装一个mqtt文件方便后期开坛做法! // utils/mqtt.js import mqt…...
Orange 开源项目 - 集成阿里云大模型
1 阿里云的大模型服务平台百炼 阿里云的大模型服务平台百炼是一站式的大模型开发及应用构建平台。不论是开发者还是业务人员,都能深入参与大模型应用的设计和构建。您可以通过简单的界面操作,在5分钟内开发出一款大模型应用,或在几小时内训练…...
DSP芯片C6678的SRIO及其中断跳转的配置
C6678SRIO读写测试门铃中断跳转测试 SRIO简述代码前言SRIO配置原始代码1.使能电源2.初始化SRIO回环修改 3.SRIO测试 Doorbell门铃中断1.初始化中断函数2.中断向量表建立3.中断向量表的链接 本博客基于创龙“678ZH产品线”的SRIO代码,部分参考于网友们的博客…...
MongoDB#常用脚本
批量插入数据脚本 const oneDayAgo new Date(Date.now() - 1 * 24 * 60 * 60 * 1000);const documents []; for (let i 1; i < 100; i) {documents.push({id: i, // 递增的 idcreateTime: oneDayAgo, // 1天前的日期data: Sample data ${i} // 其他字段(可选…...
MySQL 主从集群同步延迟问题分析与解决方案
MySQL 主从复制(Replication)是构建高可用架构的核心技术,但在实际应用中,主从同步延迟(Replication Lag)是常见且棘手的问题。延迟会导致从库数据不一致、读请求返回旧数据,甚至引发业务逻辑错…...
论文笔记(七十二)Reward Centering(五)
Reward Centering(五) 文章概括摘要附录B 理论细节C 实验细节D 相关方法的联系 文章概括 引用: article{naik2024reward,title{Reward Centering},author{Naik, Abhishek and Wan, Yi and Tomar, Manan and Sutton, Richard S},journal{arX…...
FFmpeg 是什么?为什么?怎么用?
摘要:本文介绍了 FFmpeg,一个功能强大的开源多媒体处理工具,广泛应用于视频和音频文件的处理。FFmpeg 支持多种多媒体格式,能够实现视频编码/解码、格式转换、裁剪、合并、音频提取、流媒体处理等功能。本文详细阐述了 FFmpeg 的主…...
雷池WAF动态防护技术实测
作者; Hacker / 0xh4ck3r 介绍 长亭雷池(SafeLine)是由北京长亭科技有限公司耗时近10年研发并推出的Web应用防火墙(WAF),其核心检测能力由智能语义分析算法驱动。雷池旨在为用户提供高质量的Web攻击防护、…...
BUU40 [CSCCTF 2019 Qual]FlaskLight1【SSTI】
模板: {{.__class__.__base__.__subclasses__()[80].__init__.__globals__[__builtins__].eval("__import__(os).popen(type flag.txt).read()")}} 是个空字符串,.__class__代表这个空字符串的类是什么(这里是单引号双引号都行&a…...
【每日八股】Redis篇(二):数据结构
Redis 数据类型? 主要有 STRING、LIST、ZSET、SET 和 HASH。 STRING String 类型底层的数据结构实现主要是 SDS(简单动态字符串),其主要应用场景包括: 缓存对象:可以用 STRING 缓存整个对象的 JSON&…...
VScode+stfp插件,实现文件远程同步保存【2025实操有效】
目录 1 痛点2 准备工作3 操作步骤3.1 第一步,下载STFP插件3.2 第二步,修改配置文件3.3 第三步,测试是否成功 4 后记 1 痛点 我一直用vscode远程连接服务器,传代码文件等到服务器上面,突然有一次服务器那边尽心维修&am…...
115 道 MySQL 面试题,从简单到深入!
1. 什么是数据库事务? 数据库事务是一个作为单个逻辑工作单元执行的一系列操作。事务具有ACID属性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性…...
不同安装路径重复R包清理
df <- as.data.frame(installed.packages()) table(duplicated(df$Package)) ids <- df$Package[duplicated(df$Package)] df2 <- subset(df, df$Package %in% ids)...
Grouped-Query Attention(GQA)详解: Pytorch实现
Grouped-Query Attention(GQA)详解 Grouped-Query Attention(GQA) 是 Multi-Query Attention(MQA) 的改进版,它通过在 多个查询头(Query Heads)之间共享 Key 和 Value&am…...
选择排序:简单高效的选择
大家好,今天我们来聊聊选择排序(Selection Sort)算法。这是一个非常简单的排序算法,适合用来学习排序的基本思路和操作。选择排序在许多排序算法中以其直观和易于实现的特点著称,虽然它的效率不如其他高效算法…...
(教程)PDF 字体技术入门
PDF字体技术 许多人觉得PDF字体令人困惑的主要原因在于PDF文件可以使用多种不同的字体技术。PDF文件规范已经存在16年,在此期间,出现了多种不同的字体技术(既有技术方面的原因,也有商业方面的原因)。因此,…...
LabVIEW中CFURL.llb 工具库说明
CFURL.llb 是 LabVIEW 2019 安装目录下 C:\Program Files (x86)\National Instruments\LabVIEW 2019\vi.lib\Platform\ 路径下的工具库,主要用于处理 LabVIEW 与 URL 相关的操作,涵盖 URL 解析、HTTP 请求发送、数据传输等功能模块,帮助开发者…...
BGP配置华为——路径优选验证
实验拓扑 实验要求 实现通过修改AS-Path属性来影响路径选择实现通过修改Local_Preference属性来影响路径选择实现通过修改MED属性来影响路径选择实现通过修改preferred-value属性来影响路径选择 实验配置与效果 1.改名与IP配置 2.as300配置OSPF R3已经学到R2和R4的路由 3.…...