当前位置: 首页 > news >正文

三、【LLaMA-Factory实战】模型微调进阶:从LoRA到MoE的技术突破与工程实践

一、引言

在大模型微调领域,选择合适的训练策略直接决定了效率与效果的平衡。LLaMA-Factory深度整合了参数高效微调(PEFT)、全量微调、混合专家模型(MoE)等12种训练策略,支持从消费级GPU到多卡集群的全场景训练。本文结合结构图、核心代码和生产级配置,带您掌握大模型微调的核心技术。

二、模型微调核心技术架构图

模型微调技术体系
参数高效微调PEFT
全量微调
前沿技术集成
LoRA
QLoRA
IA-Adapter
显存优化
分布式训练
APOLLO内存优化
MoE训练
稀疏微调

三、参数高效微调(PEFT):小显存撬动大模型

1. LoRA实战:低秩矩阵分解技术

核心原理

在Transformer层中插入低秩适配器,仅训练新增的低秩矩阵(秩值通常为32-128),冻结原始权重。显存占用降低90%+,支持7B-32B模型在单卡24GB GPU训练。

配置示例(YAML)
# config/lora_llama3_7b.yaml
model:name_or_path: llama-3-7b-instructfinetuning_type: loralora_config:rank: 64                # 低秩矩阵秩值target_modules:         # 目标层(不同模型需调整)- q_proj- v_projlora_alpha: 128         # 缩放因子dropout: 0.05           # 正则化
代码实现(Python)
from llamafactory.trainer import LoraTrainertrainer = LoraTrainer(model_name="llama-3-7b-instruct",dataset="alpaca_zh",lora_rank=64,target_modules=["q_proj", "v_proj"],learning_rate=3e-4
)
trainer.train()
可视化调参(Web UI)
  1. 在「LoRA Configuration」面板滑动调整Rank值(推荐64-128)
  2. 自动生成目标层列表(支持LLaMA/Qwen/Mistral等模型的适配层)

2. QLoRA优化:4-bit量化+LoRA

技术优势
  • 对预训练模型进行4-bit量化(显存占用降低75%)
  • 保持LoRA的高效微调能力,精度损失可控制在5%以内
训练命令
# 单卡4090训练7B模型(显存占用<16GB)
llamafactory-cli train \--config config/qlora_7b.yaml \--quantization_bit 4 \--bf16 True \--per_device_train_batch_size 4
关键配置
# config/qlora_7b.yaml
model:name_or_path: qwen2/Qwen2.5-7B-Instructfinetuning_type: qloraquantization_bit: 4        # 量化精度(支持4/8位)load_in_4bit: True         # 启用4-bit加载

四、全量微调解密:释放模型极限性能

1. 显存优化技术

① 梯度检查点(Gradient Checkpointing)
  • 牺牲部分计算速度,节省50%显存
  • 配置示例:
    # 全量微调配置
    train:gradient_checkpointing: true  # 启用梯度检查点fp16: true                     # 混合精度训练
    
② 动态形状优化
# 启动动态形状(减少冗余显存分配)
export TORCHDYNAMO_DYNAMIC_SHAPES=1
llamafactory-cli train config/full_finetune.yaml

2. 分布式训练(DeepSpeed+FSDP)

8卡A100训练70B模型配置
# deepspeed_config.json
{"fp16": { "enabled": true },"zero_optimization": {"stage": 3,                # ZeRO-3参数分片"offload_optimizer": { "device": "cpu" },"offload_param": { "device": "cpu" }},"gradient_accumulation_steps": 2,"scheduler": { "type": "CosineAnnealingLR" }
}
启动命令
# 8卡分布式训练
deepspeed --num_gpus=8 --deepspeed_config deepspeed_config.json \llamafactory-cli train config/llama3_70b_full.yaml

五、前沿技术集成:突破性能边界

1. APOLLO内存优化

技术亮点
  • 混合精度优化器(支持FP16/FP32参数混合)
  • 动态内存分配,训练速度提升30%+
代码实现
from llamafactory.optim import ApolloOptimizeroptimizer = ApolloOptimizer(model.parameters(),lr=1e-4,betas=(0.9, 0.999),weight_decay=0.01
)
trainer = FullTrainer(model, optimizer=optimizer)

2. MoE模型训练

核心参数
# config/moe_llama3_32b.yaml
model:name_or_path: llama-3-32b-moefinetuning_type: moemoe_config:num_experts: 8            # 专家数量top_k: 2                  # 每次激活的专家数aux_loss_coeff: 0.1       # 辅助损失系数
训练监控
# 实时查看专家激活率
llamafactory-cli monitor \--log_dir logs/moe_train \--plot_expert_usage True

六、实战对比:不同策略的适用场景

策略显存需求可训练模型规模训练速度推荐场景
LoRA24GB单卡7B-32B中小模型快速迭代
QLoRA16GB单卡7B-70B(量化)较快资源受限环境下的微调
全量微调8卡A10070B+追求极致性能的场景
MoE训练16卡A100100B+ MoE模型多任务泛化与复杂推理

七、生产级微调案例:金融领域70B模型优化

1. 技术方案

  • 策略:QLoRA(4-bit量化+LoRA)
  • 硬件:4卡RTX 4090(24GB显存)
  • 数据:10万条财报分析数据(Alpaca格式)

2. 关键配置

# config/finance_70b_qlora.yaml
model:name_or_path: mistral/Mistral-70B-Instructfinetuning_type: qloralora_target: allquantization_bit: 4
data:dataset: financial_reportsmax_length: 2048
train:num_epochs: 5learning_rate: 2e-4gradient_accumulation_steps: 4  # 显存不足时增大此值

3. 效果验证

  • 显存占用:单卡18GB(全量微调需80GB+)
  • 训练耗时:48小时(全量微调需7天+)
  • 任务准确率:提升15%(对比纯LoRA)

八、总结

LLaMA-Factory的模型微调技术体系覆盖了从高效轻量到极致性能的全场景需求:

  1. PEFT系列:LoRA/QLoRA适合快速迭代和资源受限场景
  2. 全量微调:搭配DeepSpeed实现大模型深度优化
  3. 前沿技术:MoE/APOLLO为复杂任务提供技术突破

实践建议

  1. 从LoRA开始调试,确认数据质量后逐步尝试QLoRA/全量微调
  2. 使用Web UI生成基础配置,再通过命令行添加高级参数(如MoE配置)
  3. 利用llamafactory-cli profile工具分析显存/计算瓶颈

通过合理选择微调策略,开发者能在不同硬件条件下释放大模型的最大潜力。后续教程将深入模型部署与监控,敬请关注!

相关文章:

三、【LLaMA-Factory实战】模型微调进阶:从LoRA到MoE的技术突破与工程实践

一、引言 在大模型微调领域&#xff0c;选择合适的训练策略直接决定了效率与效果的平衡。LLaMA-Factory深度整合了参数高效微调&#xff08;PEFT&#xff09;、全量微调、混合专家模型&#xff08;MoE&#xff09;等12种训练策略&#xff0c;支持从消费级GPU到多卡集群的全场景…...

Photo-SLAM论文理解、环境搭建、代码理解与实测效果

前言&#xff1a;第一个解耦式Photo-SLAM&#xff0c;亮点和效果。 参考&#xff1a;https://zhuanlan.zhihu.com/p/715311759 全网最细PhotoSLAM的conda环境配置教程&#xff0c;拒绝环境污染&#xff01;&#xff01;-CSDN博客 1. 环境搭建 硬件&#xff1a;RTX 4090D wi…...

解决pycharm检测不到已经装好的conda的pytorch环境

问题 1.找装anaconda的位置&#xff08;我装到了py-anacon下&#xff09; 2.找到下图中的conda.bat 3.pycharm社区版右下角&#xff0c;添加新解释器 4.选conda环境&#xff0c;选择2.中conda.bat的位置&#xff0c;加载环境&#xff0c;使用现有环境&#xff0c;可以看到有选…...

【计算机视觉】3d人脸重建:3DDFA_V2:实时高精度3D人脸重建与密集对齐技术指南

3d人脸重建&#xff1a;3DDFA_V2&#xff1a;实时高精度3D人脸重建与密集对齐技术指南 一、项目概述与技术背景1.1 3DDFA_V2核心价值1.2 技术演进路线1.3 核心技术指标 二、环境配置与模型部署2.1 硬件要求2.2 软件安装基础环境搭建关键组件安装 2.3 模型下载 三、核心算法原理…...

谈判模拟器 - Gemini 2.5 商业优化版

核心目标&#xff1a; 基于深厚的理论知识、丰富的实战经验和前沿的技术洞察&#xff0c;结合麦肯锡领先的谈判策略框架&#xff0c;为用户提供全面、深入、可操作的商业谈判策略指导和建议&#xff0c;助力其在复杂商业环境中达成最优谈判结果&#xff0c;并实现商业价值最大化…...

深度学习系统学习系列【4】之反向传播(BP)四个基本公式推导

文章目录 补充知识&#xff1a;∇ 和 ⊙ 运算符详解∇ (nabla) 运算符⊙ (圆圈点) 运算符 反向传播基本公式计算图和基本定义BP1&#xff1a;输出层误差推导BP1公式的重要性实际例子BP2第 l l l层误差推导BP3 &#xff1a;损失函数关于偏置(b)偏导的推导BP4&#xff1a; 损失函…...

算法每日一题 | 入门-顺序结构-上学迟到

上学迟到 题目描述 学校和 yyy 的家之间的距离为 s 米&#xff0c;而 yyy 以 v 米每分钟的速度匀速走向学校。 在上学的路上&#xff0c;yyy 还要额外花费 10 分钟的时间进行垃圾分类。 学校要求必须在上午 8:00 到达&#xff0c;请计算在不迟到的前提下&#xff0c;yyy 最…...

开源库测试

yolov10 https://github.com/THU-MIG/yolov10 conda create -n yolov10 python3.9 conda activate yolov10 pip install -r requirements.txt pip install -e .报错 找不到对应版本 Could not find a version that satisfies the requirement gradio4.31.5 (from versions:…...

因为gromacs必须安装cuda(系统自带的NVIDIA驱动不行),这里介绍下如何安装cuda

1. 安装步骤 查看是否安装了cuda # 法1 cat /usr/local/cuda/version.txt # 法2 nvcc --version 若没有安装&#xff0c;则查看是否有N卡驱动&#xff0c;若无N卡驱动&#xff0c;则到软件与更新 -> 附加驱动中安装驱动 查看N卡驱动支持的cuda版本 nvidia-smi 如下…...

ABC 404

1.C 题&#xff1a; 1.思路&#xff1a; NM&每个点读数为2&#xff0c;但图中有可能出现多环&#xff0c;需要判断所有点是否都在同一连通块上&#xff0c;有俩种解法&#xff1a;搜索&#xff0c;循环 2.代码&#xff08;循环做法&#xff09; #include<bits/stdc.h&g…...

机器学习朴素贝叶斯算法

1.朴素贝叶斯算法 1.1基本概念 其分类原理是利用贝叶斯公式根据某特征的先验概率计算出其后验概率&#xff0c;然后选择具有最大后验概率作为该特征所属的类。之所以称之为“朴素”&#xff0c;是因为贝叶斯分类只做最原始、最简单的假设&#xff1a;所有的特征之间是相对独立…...

Linux:深入理解数据链路层

实际上一台主机中&#xff0c;报文并没有通过网络层直接发送出去&#xff0c;而是交给了自己的下一层协议——数据链路层&#xff01;&#xff01; 一、理解数据链路层 网络层交付给链路层之前&#xff0c;会先做决策再行动&#xff08;会先查一下路由表&#xff0c;看看目标网…...

健康养生:从生活点滴启航

养生并非遥不可及的高深学问&#xff0c;只需把握生活中的细微之处&#xff0c;就能为健康保驾护航。 清晨睁眼&#xff0c;先在床上做简单的搓脸动作&#xff0c;从下巴到额头轻柔按摩&#xff0c;促进面部血液循环&#xff0c;唤醒肌肤活力。随后空腹喝一杯温水&#xff0c;可…...

【向量数据库】用披萨点餐解释向量数据库:一个美味的技术类比

文章目录 前言场景设定&#xff1a;披萨特征向量化顾客到来&#xff1a;生成查询向量相似度计算实战1. 欧氏距离计算&#xff08;值越小越相似&#xff09;2. 余弦相似度计算&#xff08;值越大越相似&#xff09; 关键发现&#xff1a;度量选择影响结果现实启示结语 前言 想象…...

CloudCompare 中 ccDrawableObject

CloudCompare 中 ccDrawableObject 类的主要内容与使用 1. ccDrawableObject 概述 在 CloudCompare 中&#xff0c;ccDrawableObject 是一个基类&#xff0c;主要用于管理 3D 可绘制对象 的显示属性&#xff0c;如颜色、可见性、LOD&#xff08;层次细节&#xff09;、光照等…...

【Linux】进程控制

&#x1f31f;&#x1f31f;作者主页&#xff1a;ephemerals__ &#x1f31f;&#x1f31f;所属专栏&#xff1a;Linux 目录 前言 一、什么是进程控制 二、进程创建 三、进程终止&#xff08;进程退出&#xff09; 退出码 main函数返回 _exit() exit() 测试 四、进…...

设计模式-基础概念学习总结(继承、多态、虚方法、方法重写)

概念使用例子的方式介绍&#xff08;继承&#xff0c;多态&#xff0c;虚方法&#xff0c;方法重写&#xff09;&#xff0c;实现代码python 1. 继承&#xff08;Inheritance&#xff09; 概念&#xff1a;子类继承父类的属性和方法&#xff0c;可以直接复用父类的代码&#…...

分析rand()和srand()函数的功能

rand()和srand()函数原型&#xff1a; int rand(void) 返回一个范围在 0 到 RAND_MAX 之间的伪随机数。 void srand(unsigned int seed)用来给rand() 设置随机数发生器&#xff0c;随机数发生器输出不同的数值&#xff0c;rand() 就会生成不同的随机数 1)、在“D:\Keil_v5\AR…...

架构师如何构建个人IP:职业规划与业务战略的双重提升

在数字化时代&#xff0c;软件架构师的角色已从单纯的技术专家转变为兼具技术领导力和业务影响力的复合型人才。如何构建个人IP&#xff0c;提升行业影响力&#xff0c;成为架构师职业发展的关键课题。本文从个人认知、业务战略、架构决策、产品思维四个维度&#xff0c;探讨架…...

CSS知识总结

一、CSS核心概念解析 1.1 选择器体系&#xff08;重点&#xff09; 基础选择器&#xff1a; /* ID选择器 */ #header { background: #333; }/* 类选择器 */ .btn-primary { color: white; }/* 属性选择器 */ input[type"text"] { border: 1px solid #ccc; } 组合…...

CRS 16 slot 设备硬件架构

目录 1. 核心组件 1.1 线路卡与物理接口模块 1.2 交换结构与容量 1.3 控制与管理 1.4 风扇与散热 1.5 电源与告警 2. 插槽编号与机箱布局 2.1 前侧&#xff08;PLIM 面&#xff09; 2.2 后侧&#xff08;MSC 面&#xff09; 2.3 插槽配对 1. 核心组件 1.1 线路卡与物…...

人工智能浪潮中Python的核心作用与重要地位

在人工智能&#xff08;Artificial Intelligence&#xff0c;AI&#xff09;蓬勃发展的时代&#xff0c;Python已然成为推动这一技术进步的关键编程语言。从复杂的机器学习算法实现&#xff0c;到前沿的深度学习模型构建&#xff0c;再到智能系统的部署&#xff0c;Python无处不…...

【了解】数字孪生网络(Digital Twin Network,DTN)

目录 一、为什么&#xff1f;二、是什么&#xff1f;三、什么架构&#xff1f;四、如何应用&#xff1f;参考 一、为什么&#xff1f; 一方面&#xff0c;网络负载不断增加,&#xff0c;网络规模持续扩大带来的网络复杂性&#xff0c;使得网络的运行和维护变得越来越复杂。另一…...

[C语言]第一章-初识

目录 一.引言 二.MinGW 下载与安装 1.什么是 MinGW 2.下载 MinGW 3.安装 MinGW 4.配置 MinGW 环境变量 三.VS Code 下载与安装 1.什么是 VS Code 2.下载 VS Code 3.安装 VS Code 4.汉化 5.安装扩展插件 C/C 截图 四.编写并运行 Hello World 程序 代码解释 运行…...

如何用git将项目上传到github

步骤 1.创建仓库 2.记下仓库的url 3.在本地初始化仓库 路径要在项目下 cd /path/to/your/vue-project git init 4.创建touch .gitignore文件 在项目根目录下创建 .gitignore 文件&#xff0c;用于指定 Git 忽略哪些文件或文件夹 5.添加和提交项目文件 将文件提交到版本控…...

C++入门(上)--《Hello C++ World!》(1)(C/C++)

文章目录 前言命名空间域命名空间的用法 C的输入和输出缺省参数函数重载auto关键字(C11)范围for 前言 C不是C# C兼容大部分C的东西&#xff0c;但不是完全(98%的样子&#xff0c;除非遇到了不兼容的&#xff0c;那就记一下&#xff0c;不然就认为自己在C里面写的那些可以写到C里…...

架构思维:构建高并发读服务_基于流量回放实现读服务的自动化测试回归方案

文章目录 引言一、升级读服务架构&#xff0c;为什么需要自动化测试&#xff1f;二、自动化回归测试系统&#xff1a;整体架构概览三、日志收集1. 拦截方式2. 存储与优化策略3. 架构进化 四、数据回放技术实现关键能力 五、差异对比对比方式灵活配置 六、三种回放模式详解1. 离…...

代码随想录第33天:动态规划6(完全背包基础)

一、完全平方数&#xff08;Leetcode 279&#xff09; 本题与“零钱兑换”基本一致。 1.确定dp数组以及下标的含义 dp[j]&#xff1a;和为j的完全平方数的最少数量为dp[j] 2.确定递推公式 dp[j] 可以由dp[j - i * i]推出&#xff0c; dp[j - i * i] 1 便可以凑成dp[j]。 …...

Android控件View、ImageView、WebView用法

一 控件清单 View、ImageView、WebView 二 控件UI代码 <?xml version="1.0" encoding="utf-8"?> <androidx.coordinatorlayout.widget.CoordinatorLayoutxmlns:android="http://schemas.android.com/apk/res/android"xmlns:app=&qu…...

关于浏览器页面自动化操作

Selenium 是一个用于自动化浏览器操作的强大框架&#xff0c;广泛应用于Web应用程序的测试自动化。它主要由以下几个核心组件组成&#xff1a; Selenium WebDriver&#xff1a; WebDriver 是 Selenium 的核心组件&#xff0c;它提供了一组API&#xff0c;允许开发者编写程序来…...

P5739 计算阶乘详解

此题目&#xff0c;对于会递归的很简单很简单&#xff0c;但作者是野人不会&#xff0c;只能是边刷边学&#xff0c;且题解比较有意思&#xff0c;所有我这次的重心不是题目&#xff0c;而是题解里面创作者展示的不一样的东西&#xff0c;先看题目 题目要求不用for循环&#xf…...

把Android设备变成“国标摄像头”:GB28181移动终端实战接入指南

把Android设备变成“国标摄像头”&#xff1a;GB28181移动终端实战接入指南 ——执法记录仪、巡检终端、布控球&#xff0c;如何通过大牛直播SDK直接挂到GB28181平台&#xff1f; 在过去&#xff0c;GB28181 通常用于固定摄像头、NVR等“设备端”。但在政务、安防、应急等行业…...

机器学习项目流程极简入门:从数据到部署的完整指南

前言 本文将通过一个简单案例&#xff08;根据水果外观特征判断是否为橘子&#xff09;&#xff0c;逐步拆解机器学习项目的完整流程&#xff0c;帮助读者掌握从数据收集到模型部署的全流程方法论。 通常&#xff0c;一个完整的机器学习项目可以分为以下几个步骤&#xff1a; …...

PrivKV: Key-Value Data Collection with Local Differential Privacy论文阅读

文献阅读课需要制作ppt但是感觉选的这篇论文都是公式&#xff0c;决定做点动画直观展示一下。还没有完成会继续更新这个笔记 manim动画代码 需要下载ffmpeg下载latex https://docs.manim.org.cn/getting_started/installation.html ffmpeg下载教程 texlive官网 但是其实不需要…...

RViz(机器人可视化工具)的配置文件(moveitcpp)

1. Panels&#xff08;面板设置&#xff09; 面板是RViz界面中的各个功能区域&#xff0c;用于显示和操作不同的数据。 Displays&#xff08;显示面板&#xff09; Class: rviz_common/Displays 指定面板的类型&#xff0c;这里是显示面板。 Help Height: 78 帮助区域的高度…...

kotlin 01flow-StateFlow 完整教程

一 Android StateFlow 完整教程&#xff1a;从入门到实战 StateFlow 是 Kotlin 协程库中用于状态管理的响应式流&#xff0c;特别适合在 Android 应用开发中管理 UI 状态。本教程将带全面了解 StateFlow 的使用方法。 1. StateFlow 基础概念 1.1 什么是 StateFlow? StateF…...

OpenGl实战笔记(1)基于qt5.15.2+mingw64+opengl绘制三角形

一、实现效果 二、实现原理 &#xff08;1&#xff09;各函数作用与原理 initialize() 作用&#xff1a; 初始化 OpenGL 函数&#xff08;initializeOpenGLFunctions()&#xff09; 设置背景清除颜色为 rgba(0.2, 0.3, 0.4, 1.0)。 原理&#xff1a; initializeOpenGLFunctio…...

S100平台调试RS485/RS232

提供一个C语言的测试程序Demo #include <stdio.h> #include <stdlib.h> #include <string.h> #include <unistd.h>...

蓝桥杯 19. 植树

植树 题目描述 小明和朋友们一起去郊外植树&#xff0c;他们带了一些在实验室中精心研究出的小树苗。 一共有 n 个人&#xff0c;每个人挑选了一个适合植树的位置&#xff0c;一共 n 个位置。每人准备在自己的位置种下一棵树苗。 但他们遇到一个问题&#xff1a;有的树苗比…...

Spring Boot 中 @Bean 注解详解:从入门到实践

在 Spring Boot 开发中&#xff0c;Bean注解是一个非常重要且常用的注解&#xff0c;它能够帮助开发者轻松地将 Java 对象纳入 Spring 容器的管理之下&#xff0c;实现对象的依赖注入和生命周期管理。对于新手来说&#xff0c;理解并掌握Bean注解&#xff0c;是深入学习 Spring…...

git项目迁移,包括所有的提交记录和分支 gitlab迁移到gitblit

之前git都是全新项目上传&#xff0c;没有迁移过&#xff0c;因为迁移的话要考虑已有项目上的分支都要迁移过去&#xff0c;提交记录能迁移就好&#xff1b;分支如果按照全新项目上传的方式需要新git手动创建好老git已有分支&#xff0c;在手动一个一个克隆老项目分支代码依次提…...

前端面试每日三题 - Day 25

这是我为准备前端/全栈开发工程师面试整理的第25天每日三题练习&#xff0c;涵盖了&#xff1a; CSS中如何实现一个保持宽高比的自适应正方形元素Angular的变更检测&#xff08;Change Detection&#xff09;机制项目实战 - 设计一个微前端架构的前端应用。 ✅ 题目1&#xff…...

基于windows安装MySQL8.0.40

基于windows安装MySQL8.0.40 基于windows 安装 MySQL8.0.40&#xff0c;解压文件到D:\mysql-8.0.40-winx64 在D:\mysql-8.0.40-winx64目录下创建my.ini文件&#xff0c;并更新一下内容 [client] #客户端设置&#xff0c;即客户端默认的连接参数 # 设置mysql客户端连接服务…...

基于机器学习算法预测二手车市场数据清洗与分析平台(源码+定制+讲解) 基于Python的数据挖掘与可视化 二手车数据处理与分析系统开发 (机器学习算法预测)

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…...

【神经网络与深度学习】普通自编码器和变分自编码器的区别

引言 自编码器&#xff08;Autoencoder&#xff0c;AE&#xff09;和变分自编码器&#xff08;Variational Autoencoder&#xff0c;VAE&#xff09;是深度学习中广泛应用的两类神经网络结构&#xff0c;主要用于数据的压缩、重构和生成。然而&#xff0c;二者在模型设计、训练…...

【现代深度学习技术】现代循环神经网络07:序列到序列学习(seq2seq)

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ ⌋ ⌋ 深度学习 (DL, Deep Learning) 特指基于深层神经网络模型和方法的机器学习。它是在统计机器学习、人工神经网络等算法模型基础上&#xff0c;结合当代大数据和大算力的发展而发展出来的。深度学习最重…...

【Linux我做主】进度条小程序深度解析

Linux下C语言进度条程序深度解析 进度条小程序GitHub地址 前言前置知识回车换行&#xff08;CR/LF&#xff09;的深度解析历史渊源与技术规范在进度条/倒计时中的应用 缓冲区机制的全面剖析缓冲区引入缓冲类型对比进度条开发中的关键控制 进度条实现以小见大——倒计时倒计时最…...

Vue项目安全实践指南:从输入验证到状态管理的全方位防护

一、项目背景 在Vue2项目开发过程中&#xff0c;我们遇到了一些需要优化的安全实践问题。本文将分享我们在项目中的一些安全优化经验&#xff0c;希望能帮助到其他开发者。 主要优化点&#xff1a; 输入输出安全处理请求安全防护数据存储安全路由访问控制文件上传处理表单数…...

Pinocchio导入URDF关节为continuous的问题及详细解释

视频讲解&#xff1a; Pinocchio导入URDF关节为continuous的问题及详细解释 仓库地址&#xff1a;GitHub - LitchiCheng/mujoco-learning 问题背景&#xff1a;打算测试将之前的panda的urdf换成so-arm100的urdf&#xff0c;发现pinocchio的代码不能用&#xff0c;很奇怪&#…...

《Python星球日记》第30天:Flask数据库集成

名人说&#xff1a;路漫漫其修远兮&#xff0c;吾将上下而求索。—— 屈原《离骚》 创作者&#xff1a;Code_流苏(CSDN)&#xff08;一个喜欢古诗词和编程的Coder&#x1f60a;&#xff09; 专栏&#xff1a;《Python星球日记》&#xff0c;限时特价订阅中ing 目录 一、数据库…...