当前位置：首页 > news >正文

【个人开发】deepspeed+Llama-factory 本地数据多卡Lora微调

news 来源：原创 2025/9/21 18:42:01

文章目录

1.背景
2.微调方式
- 2.1 关键环境版本信息
- 2.2 步骤
- 2.2.1 下载llama-factory
- - 2.2.2 准备数据集
  - 2.2.3 微调模式
  - 2.2.3.1 zero-3微调
  - 2.2.3.2 zero-2微调
  - 2.2.3.3 单卡Lora微调
- 2.3 踩坑经验
- - 2.3.1 问题一：ValueError: Undefined dataset xxxx in dataset_info.json.
  - 2.3.2 问题二： ValueError: Target modules {'c_attn'} not found in the base model. Please check the target modules and try again.
  - 2.3.3 问题三： RuntimeError: The size of tensor a (1060864) must match the size of tensor b (315392) at non-singleton dimension 0。
  - 2.3.4 问题四：训练效率问题
- 2.4 实验
- - 2.4.1 实验1：多GPU微调-zero2
  - 2.4.2 实验2：多GPU微调-zero3
  - 2.4.3 实验3：Lora单卡微调
3 合并大模型并启动
- 3.1 方法一：Llama-factory合并，并使用ollama调用大模型
- 3.2 方法二：Llama-factory合并，并使用vllm启动模型服务

1.背景

上一篇文件写到，macbook微调Lora，该微调方式，同样适用于GPU，只不过在train.py脚本中，针对device，调整为cuda即可。

但如果数据量过大的话，单卡微调会存在瓶颈，因此考虑多GPU进行微调。网上找了一圈，多卡微调的常用方式采用deepspeed+Llama-factory。

本文主要记录该方式的微调情况，仅为个人学习记录

2.微调方式

2.1 关键环境版本信息

模块	版本
python	3.10
CUDA	12.6
torch	2.5.1
peft	0.12.0
transformers	4.46.2
accelerate	1.1.1
trl	0.9.6
deepspeed	0.15.4

2.2 步骤

2.2.1 下载llama-factory

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

2.2.2 准备数据集

数据集采用网上流传的《甄嬛传》，数据集结构如下，数据集命名【huanhuan.json】

[{"instruction": "小姐，别的秀女都在求中选，唯有咱们小姐想被撂牌子，菩萨一定记得真真儿的——","input": "","output": "嘘——都说许愿说破是不灵的。"},...
]

其次，还得准备数据集信息【dataset_info.json】,因为是本地微调，所以微调时现访问dataset_info，再指定到具体的数据集中。

{"identity": {"file_name": "test_data.json"}
}

注意文本的数据集的格式必须为，json，不然会报错。

2.2.3 微调模式

2.2.3.1 zero-3微调

本次微调采用zero-3的方式，因此在LLaMa-Factory目录下，新增配置文件【ds_config_zero3.json】。

相关配置可参考【./LLaMA-Factory/examples/deepspeed/文件夹下的样例】

在这里插入图片描述

配置如下【ds_config_zero3.json】

{"fp16": {"enabled": "auto","loss_scale": 0,"loss_scale_window": 1000,"initial_scale_power": 16,"hysteresis": 2,"min_loss_scale": 1},"bf16": {"enabled": "auto"},"optimizer": {"type": "AdamW","params": {"lr": "auto","betas": "auto","eps": "auto","weight_decay": "auto"}},"scheduler": {"type": "WarmupLR","params": {"warmup_min_lr": "auto","warmup_max_lr": "auto","warmup_num_steps": "auto"}},"zero_optimization": {"stage": 3,"offload_optimizer": {"device": "none","pin_memory": true},"offload_param": {"device": "none","pin_memory": true},"overlap_comm": true,"contiguous_gradients": true,"sub_group_size": 1e9,"reduce_bucket_size": "auto","stage3_prefetch_bucket_size": "auto","stage3_param_persistence_threshold": "auto","stage3_max_live_parameters": 1e9,"stage3_max_reuse_distance": 1e9,"stage3_gather_16bit_weights_on_model_save": true},"gradient_accumulation_steps": "auto","gradient_clipping": "auto","steps_per_print": 100,"train_batch_size": "auto","train_micro_batch_size_per_gpu": "auto","wall_clock_breakdown": false
}

微调脚本

# run_train_bash.sh 
#!/bin/bash
# 记录开始时间
START=$(date +%s.%N)
CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 accelerate launch  src/train.py \--deepspeed ds_config_zero3.json \--stage sft \--do_train True \--model_name_or_path /root/ai_project/fine-tuning-by-lora/models/model/qwen/Qwen2___5-7B-Instruct \--finetuning_type lora \--template qwen \--dataset_dir /root/ai_project/fine-tuning-by-lora/dataset/ \--dataset identity \--cutoff_len 1024 \--num_train_epochs 5 \--max_samples 100000 \--per_device_train_batch_size 4 \--gradient_accumulation_steps 4 \--lr_scheduler_type cosine \--learning_rate 5e-04 \--lr_scheduler_type cosine \--max_grad_norm 1.0 \--logging_steps 5 \--save_steps 100 \--neftune_noise_alpha 0 \--lora_rank 8 \--lora_dropout 0.1 \--lora_alpha 32 \--lora_target q_proj,v_proj,k_proj,gate_proj,up_proj,o_proj,down_proj \--output_dir ./output/qwen_7b_ds/train_2025_02_13 \--bf16 True \--plot_loss True# 记录结束时间
END=$(date +%s.%N)
# 计算运行时间
DUR=$(echo "$END - $START" | bc)
# 输出运行时间
printf "Execution time: %.6f seconds\n" $DUR

说明一下上述一些关键参数：

参数	版本
–deepspeed	指定deepspeed加速微调方式
–model_name_or_path	微调模型路径
–finetuning_type	微调方式，这里用lora微调
–template	训练和推理时构造 prompt 的模板，不同大语言模型的模板不一样，这里用的是qwen
–dataset_dir	本地的数据集路径
–dataset	指定dataset_info.json中哪个数据集
–lora_target	应用 LoRA 方法的模块名称。
–output_dir	模型输出路径。

模型微调参数可以参考：Llama-Factory参数介绍

其他参数，其实就是常规使用peft进行lora微调的常见参数，以及常见的微调参数，可以对照如下。

lora_config = LoraConfig(task_type=TaskType.CAUSAL_LM,target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],inference_mode=False,r=8,lora_alpha=32,lora_dropout=0.1
)

2.2.3.2 zero-2微调

zero-2下述的配置中，调度器使用了AdamW，学习率在训练时候可以逐步下降。

配置如下【ds_config_zero2.json】

{"fp16": {"enabled": "auto","loss_scale": 0,"loss_scale_window": 1000,"initial_scale_power": 16,"hysteresis": 2,"min_loss_scale": 1},"bf16": {"enabled": "auto"},"optimizer": {"type": "AdamW","params": {"lr": "auto","betas": "auto","eps": "auto","weight_decay": "auto"}},"zero_optimization": {"stage": 2,"offload_optimizer": {"device": "cpu","pin_memory": true}},"gradient_accumulation_steps": 4,"gradient_clipping": "auto","steps_per_print": 100,"train_batch_size": "auto","train_micro_batch_size_per_gpu": "auto","wall_clock_breakdown": false
}

2.2.3.3 单卡Lora微调

具体使用可以参考上一篇文章：【个人开发】macbook m1 Lora微调qwen大模型
也可以参考github项目：fine-tuning-by-Lora

微调代码如下。


torch_dtype = torch.halflora_config = LoraConfig(task_type=TaskType.CAUSAL_LM,target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],inference_mode=False,r=8,lora_alpha=32,lora_dropout=0.1
)def train():# 加载模型model_dir = snapshot_download(model_id=model_id, cache_dir=f"{models_dir}/model", revision='master')if model_path != model_dir:raise Exception(f"model_path:{model_path} != model_dir:{model_dir}")model = AutoModelForCausalLM.from_pretrained(model_path,device_map=device, torch_dtype=torch_dtype)model.enable_input_require_grads()  # 开启梯度检查点时，要执行该方法# 加载数据df = pd.read_json(dataset_file)ds = Dataset.from_pandas(df)print(ds[:3])# 处理数据tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False, trust_remote_code=True)tokenizer.pad_token = tokenizer.eos_tokendef process_func(item):MAX_LENGTH = 384  # Llama分词器会将一个中文字切分为多个token，因此需要放开一些最大长度，保证数据的完整性input_ids, attention_mask, labels = [], [], []instruction = tokenizer(f"<|start_header_id|>user<|end_header_id|>\n\n{item['instruction'] + item['input']}<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n",add_special_tokens=False)  # add_special_tokens 不在开头加 special_tokensresponse = tokenizer(f"{item['output']}<|eot_id|>", add_special_tokens=False)input_ids = instruction["input_ids"] + response["input_ids"] + [tokenizer.pad_token_id]attention_mask = instruction["attention_mask"] + response["attention_mask"] + [1]  # 因为eos token咱们也是要关注的所以 补充为1labels = [-100] * len(instruction["input_ids"]) + response["input_ids"] + [tokenizer.pad_token_id]if len(input_ids) > MAX_LENGTH:  # 做一个截断input_ids = input_ids[:MAX_LENGTH]attention_mask = attention_mask[:MAX_LENGTH]labels = labels[:MAX_LENGTH]return {"input_ids": input_ids,"attention_mask": attention_mask,"labels": labels}tokenized_id = ds.map(process_func, remove_columns=ds.column_names)tokenizer.decode(list(filter(lambda x: x != -100, tokenized_id[1]["labels"])))# 加载lora权重model = get_peft_model(model, lora_config)# 训练模型training_args = TrainingArguments(output_dir=checkpoint_dir,per_device_train_batch_size=4,gradient_accumulation_steps=4,logging_steps=5,num_train_epochs=30,save_steps=100,learning_rate=5e-04,save_on_each_node=True,gradient_checkpointing=True,)trainer = Trainer(model=model,args=training_args,train_dataset=tokenized_id,data_collator=DataCollatorForSeq2Seq(tokenizer=tokenizer, padding=True),)trainer.train()# 保存模型trainer.model.save_pretrained(lora_dir)tokenizer.save_pretrained(lora_dir)

2.3 踩坑经验

2.3.1 问题一：ValueError: Undefined dataset xxxx in dataset_info.json.

如果你脚本的启动参数，–dataset identity。而dataset_info.json中的数据信息，没有“identity”这个key，则会出现这个报错，只要确保你dataset_info.json中存在该key即可。

2.3.2 问题二： ValueError: Target modules {‘c_attn’} not found in the base model. Please check the target modules and try again.

如果你脚本的启动参数，–lora_target参数设为常见的c_attn参数，则会报此错。处理方式还是调整参数，使用Lora微调时的常见参数，q_proj,v_proj,k_proj,gate_proj,up_proj,o_proj,down_proj。注意格式，如果格式不对，还是会报错。

2.3.3 问题三： RuntimeError: The size of tensor a (1060864) must match the size of tensor b (315392) at non-singleton dimension 0。

这种tensor的问题，很可能是模型冲突的问题，比如调到一半，然后重新提调，指到相同的路径。重新指定output路径即可。

2.3.4 问题四：训练效率问题

在GPU充分的情况下，使用zero_2的训练效率，很明显比zero_3的训练效率更快！

2.4 实验

本次测试使用多GPU微调，测试多GPU微调跟单GPU微调的性能对比。

使用2,030条数据，epoch = 30 ，batch size = 4，Gradient Accumulation steps = 4

实验组	实验类别	步数	耗时	最终loss
实验1	zero2微调	480	09:59	0.4757
实验2	zero3微调	480	1:49:11	0.0746
实验3	单卡lora微调	3810	1:07:57	0.0009

2.4.1 实验1：多GPU微调-zero2

使用2,030条数据，8卡微调，微调参数如下,总共480步，耗时09:59。

[INFO|trainer.py:2369] 2025-02-17 12:53:54,461 >> ***** Running training *****
[INFO|trainer.py:2370] 2025-02-17 12:53:54,461 >>   Num examples = 2,030
[INFO|trainer.py:2371] 2025-02-17 12:53:54,461 >>   Num Epochs = 30
[INFO|trainer.py:2372] 2025-02-17 12:53:54,461 >>   Instantaneous batch size per device = 4
[INFO|trainer.py:2375] 2025-02-17 12:53:54,461 >>   Total train batch size (w. parallel, distributed & accumulation) = 128
[INFO|trainer.py:2376] 2025-02-17 12:53:54,461 >>   Gradient Accumulation steps = 4
[INFO|trainer.py:2377] 2025-02-17 12:53:54,461 >>   Total optimization steps = 480
[INFO|trainer.py:2378] 2025-02-17 12:53:54,465 >>   Number of trainable parameters = 20,185,088***** train metrics *****epoch                    =        30.0total_flos               = 234733999GFtrain_loss               =      1.6736train_runtime            =  0:09:59.38train_samples_per_second =     101.605train_steps_per_second   =       0.801
Figure saved at: ./output/qwen_7b_ft/zero2/training_loss.png

GPU使用情况如下：
在这里插入图片描述
损失下降情况：

2.4.2 实验2：多GPU微调-zero3

使用2,030条数据，8卡微调，微调参数如下,总共480步，耗时1:49:11。

[INFO|trainer.py:2369] 2025-02-17 13:07:48,438 >> ***** Running training *****
[INFO|trainer.py:2370] 2025-02-17 13:07:48,438 >>   Num examples = 2,030
[INFO|trainer.py:2371] 2025-02-17 13:07:48,438 >>   Num Epochs = 30
[INFO|trainer.py:2372] 2025-02-17 13:07:48,438 >>   Instantaneous batch size per device = 4
[INFO|trainer.py:2375] 2025-02-17 13:07:48,438 >>   Total train batch size (w. parallel, distributed & accumulation) = 128
[INFO|trainer.py:2376] 2025-02-17 13:07:48,438 >>   Gradient Accumulation steps = 4
[INFO|trainer.py:2377] 2025-02-17 13:07:48,438 >>   Total optimization steps = 480
[INFO|trainer.py:2378] 2025-02-17 13:07:48,442 >>   Number of trainable parameters = 20,185,088...***** train metrics *****epoch                    =       30.0total_flos               =   257671GFtrain_loss               =     0.3719train_runtime            = 1:49:11.88train_samples_per_second =      9.295train_steps_per_second   =      0.073
Figure saved at: ./output/qwen_7b_ft/zero3/training_loss.png
[WARNING|2025-02-17 14:57:11] llamafactory.extras.ploting:162 >> No metric eval_loss to plot.
[WARNING|2025-02-17 14:57:11] llamafactory.extras.ploting:162 >> No metric eval_accuracy to plot.
[INFO|modelcard.py:449] 2025-02-17 14:57:11,629 >> Dropping the following result as it does not have all the necessary fields:

GPU使用情况如下：

在这里插入图片描述
损失下降情况：

2.4.3 实验3：Lora单卡微调

单卡微调，总共需要3810步。
在这里插入图片描述

3 合并大模型并启动

3.1 方法一：Llama-factory合并，并使用ollama调用大模型

模型合并

利用Llama-factory的框架，配置llama3_lora_sft_qwen.yaml 文件，进行模型合并。

# llama3_lora_sft_qwen.yaml
### model
model_name_or_path: /root/ai_project/fine-tuning-by-lora/models/model/qwen/Qwen2___5-7B-Instruct
adapter_name_or_path: /root/ai_project/LLaMA-Factory/output/qwen_7b_ds/zero2/
template: qwen
trust_remote_code: true### export
export_dir: output/llama3_lora_sft_qwen
export_size: 5
export_device: gpu
export_legacy_format: false

llamafactory-cli export llama3_lora_sft_qwen.yaml

模型打包

合并完成后，会有直接生成Modelfile文件，可以直接打包到ollama中。

在这里插入图片描述

# ollama modelfile auto-generated by llamafactory
FROM .TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ range .Messages }}{{ if eq .Role "user" }}<|im_start|>user
{{ .Content }}<|im_end|>
<|im_start|>assistant
{{ else if eq .Role "assistant" }}{{ .Content }}<|im_end|>
{{ end }}{{ end }}"""SYSTEM """You are a helpful assistant."""PARAMETER stop "<|im_end|>"
PARAMETER num_ctx 4096

模型启动
ollama启动

ollama create llama3_lora_sft_qwen -f Modelfile

参考文章：大模型开发和微调工具Llama-Factory–＞LoRA合并

3.2 方法二：Llama-factory合并，并使用vllm启动模型服务

模型的合并同方法一，之后使用vllm命令启动。

vllm命令启动模型服务

# 内置了vllm的qwen的template。
CUDA_VISIBLE_DEVICES=1,2,3,4 python3 -m vllm.entrypoints.openai.api_server \--model "/root/ai_project/LLaMA-Factory/output/merge/" \--port 6006 \--tensor-parallel-size 4 \--served-model-name Qwen2.5-7B-sft \--max-model-len 8192 \--dtype half \--host 0.0.0.0

模型服务接口调用

import requestsdef chat_with_vllm(prompt, port=6006):url = f"http://localhost:{port}/v1/chat/completions"headers = {"Content-Type": "application/json"}data = {"model": "Qwen2.5-7B-sft",  # 模型名称或路径"messages": [{"role": "user", "content": prompt}],"max_tokens": 512,"temperature": 0.7}response = requests.post(url, headers=headers, json=data)if response.status_code == 200:result = response.json()generated_text = result["choices"][0]["message"]["content"]print(generated_text.strip())else:print("Error:", response.status_code, response.text)# 示例调用
chat_with_vllm("你是谁？", port=6006)

服务日志：
在这里插入图片描述
说明：日志中可以看到template。

调用结果：
在这里插入图片描述

【个人开发】deepspeed+Llama-factory 本地数据多卡Lora微调

文章目录 1.背景2.微调方式2.1 关键环境版本信息2.2 步骤2.2.1 下载llama-factory2.2.2 准备数据集2.2.3 微调模式2.2.3.1 zero-3微调2.2.3.2 zero-2微调2.2.3.3 单卡Lora微调 2.3 踩坑经验2.3.1 问题一：ValueError: Undefined dataset xxxx in dataset_info.json.2…...

编程日记 2025/9/21 18:42:01

后端生成二维码，前端请求接口生成二维码并展示，且多个参数后边的参数没有正常传输问题处理

一、后端代码 1、controller GetMapping("/generateQRCode/{url}")ApiOperation(value "生成url链接二维码",notes "生成url链接二维码")public JsonResult<NewsQRCodeVo> generateQRCode(PathVariable String url,HttpServletRespons…...

编程日记 2025/9/13 9:02:36

NBT群落物种级丰度鉴定新方法sylph

文章目录简介为什么选择Sylph？Sylph的工作原理 Install使用解析成gtdb格式sylph 能做什么？sylph 不能做什么？ANI定义如何使用 sylph-utils 生成包含分类信息的配置文件耗时：66个样本耗时1h 转成easymicroplot可用数据简介 Sylp…...

编程日记 2025/9/21 18:39:19

长视频生成、尝试性检索、任务推理 | Big Model Weekly 第56期

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！ 01 COMAL:AConvergent Meta-Algorithm for Aligning LLMs with General Preferences 许多对齐方法，包括基于人类反馈的强化学习（RLHF），依赖于布拉德利-特里&#…...

编程日记 2025/9/20 22:53:02

使用右侧值现象来处理一个word导入登记表的需求

需求也简单，导word文件用户登记表，有各部门的十几个版本（为什么这么多？不知道）。这里说下谈下我的一些代码做法： 需求分析： 如果能解决java字段和各项填的值怎么配对的问题，那么就…...

编程日记 2025/9/21 16:07:35

FRRouting配置与OSPF介绍，配置，命令，bfd算法：

文章目录 1、frrouting的配置：2、ospf2.1、检测和维护邻居关系2.2、ospfDR和BDR2.3、odpf邻居表2.4、ospf常用命令2.5、bfd配置 1、frrouting的配置： sudo service zebra start sudo service ospfd start telnet localhost 2604 en configure termina…...

编程日记 2025/9/21 18:39:27

基于ThinkPHP 5~8兼容的推荐算法类实现，

在现代推荐系统中，随着用户量和物品量的增长，传统的推荐算法可能会面临性能瓶颈。本文将介绍如何基于 ThinkPHP 实现一个高性能的推荐系统，结合显性反馈（如兴趣选择）、隐性反馈（如观看时长、评论、点赞、搜…...

编程日记 2025/9/15 10:54:43

使用Python爬虫实时监控行业新闻案例

目录背景环境准备请求网页数据解析网页数据定时任务综合代码使用代理IP提升稳定性运行截图与完整代码总结在互联网时代，新闻的实时性和时效性变得尤为重要。很多行业、技术、商业等领域的新闻都可以为公司或者个人发展提供有价值的信息。如果你有一项需求是要实时…...

编程日记 2025/9/21 18:39:18

kong身份认证插件详解之Basic Auth插件

1.3、Basic Authentication 支持基于用户名和密码的基本认证，通常用于简单的身份验证场景。 1.3.1、环境准备 1.3.1.1、创建一个服务，basic-auth-service curl -i -s -X POST http://localhost:8001/services \--data namebasic-auth-service \--dat…...

编程日记 2025/9/11 19:04:20

Copilot基于企业PPT模板生成演示文稿

关于copilot创建PPT，咱们写过较多文章了： Copilot for PowerPoint通过文件创建PPT Copilot如何将word文稿一键转为PPT Copilot一键将PDF转为PPT，治好了我的精神内耗测评Copilot和ChatGPT-4o从PDF创建PPT功能 Copilot for PPT全新功能&a…...

编程日记 2025/9/21 1:28:05

用React实现一个登录界面

使用React来创建一个简单的登录表单。以下是一个基本的React登录界面示例： 1. 设置React项目如果你还没有一个React项目，你可以使用Create React App来创建一个。按照之前的步骤安装Create React App，然后创建一个新项目。 2. 创建登录组…...

编程日记 2025/9/13 11:47:16

前端布局的方式有哪些

前端布局的方式有哪些在前端开发里，布局就像是装修房子，把不同的东西合理地摆放在合适的位置，让整个空间既美观又实用。下面给你介绍几种常见的前端布局方式： 1. 普通流布局（标准文档流布局） 这就像是按…...

编程日记 2025/9/21 18:39:15

seata集成nacos

#nacos集成nacos并配置mysql数据源 1. 所需依赖 <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-seata</artifactId></dependency> 2. 打开seata目录&#xff…...

编程日记 2025/9/21 18:40:46

第29篇基于ARM A9处理器用C语言实现中断＜五＞

Q：怎样设计基于ARM A9处理器的C语言程序使用定时器中断实现实时时钟？ A：在上一期的程序中添加A9 Private Timer作为第三个中断源，配置该定时器使其每隔0.01秒产生一次中断。使用该定时器使全局变量time的值递增，并将…...

编程日记 2025/9/18 15:21:29

deepseek多列数据对比，联想到excel的高级筛选功能

目录 1 业务背景 2 deepseek提示词输入 3 联想分析 4 EXCEL高级搜索 1 业务背景系统上线的时候经常会遇到一个问题，系统导入的数据和线下的EXCEL数据是否一致，如果不一致，如何快速找到差异值，原来脑海第一反应就是使用公…...

编程日记 2025/9/13 9:01:35

C 程序多线程拆分文件

C 程序多线程拆分文件在C语言中，实现多线程来拆分文件通常需要借助多线程库，比如 POSIX 线程库（pthread）或者 Windows 的线程库（CreateThread 或类似的函数）。下面我将分别展示在 Linux 和 Windows 环境下…...

编程日记 2025/9/13 9:01:33

mysql 使用 CONCAT、GROUP_CONCAT 嵌套查询出 json 格式数据

tb_factory表由 factory_code 和 factory_name 字段，查询出如下所示效果： {"factory_0001": "工厂1","factory_0002": "工厂2",... } select sql： SELECT CONCAT( "{",GROUP_CONCAT( C…...

编程日记 2025/9/13 9:01:31

Leetcode 2466. Count Ways To Build Good Strings

Problem Given the integers zero, one, low, and high, we can construct a string by starting with an empty string, and then at each step perform either of the following: Append the character ‘0’ zero times.Append the character ‘1’ one times. This can …...

编程日记 2025/9/21 1:10:24

分布式 IO 模块：食品罐装产线自动化与高效运行的推手

在当今竞争激烈的罐装视频生产行业，如何实现产线的自动化与连续性高效运行，成为了众多企业追求的核心目标。明达技术推出的MR30分布式 IO 模块作为一种先进的工业控制技术，正逐渐崭露头角，为食品罐装产线带来了前所未有的变革。痛…...

编程日记 2025/9/15 14:29:10

rustdesk编译修改名字

最近，我用Rust重写了一个2W行C代码的linux内核模块。在此记录一点经验。我此前没写过内核模块，认识比较疏浅，有错误欢迎指正。为什么要重写？ 这个模块2W行代码量看起来不多，却在线上时常故障，永远改不完。…...

编程日记 2025/9/20 22:48:34

MySQL 窗口函数：功能、使用场景与性能优化

MySQL 8.0 引入了一个强大的新特性——**窗口函数（Window Functions）**。它为数据分析和复杂查询提供了极大的便利，但同时也可能带来性能问题。本文将带你快速了解窗口函数的功能、使用场景以及如何优化性能。 --- ## **什么是窗口函数&#…...

编程日记 2025/9/15 4:17:10

数据权限校验实践

数据权限控制实践最近在实习中为公司项目完成一个文件数据权限校验代码的转换重构，写这篇博客来记录前后两种权限校验的实现方案与相关概念原实现方案：RBAC-基于角色的访问控制 RBAC（Role-Based Access Control） RBAC 是一种常…...

编程日记 2025/9/21 7:24:09

spring boot对接clerk 实现用户信息获取

在现代Web应用中，用户身份验证和管理是一个关键的功能。Clerk是一个提供身份验证和用户管理的服务，可以帮助开发者快速集成这些功能。在本文中，我们将介绍如何使用Spring Boot对接Clerk，以实现用户信息的获取。 1.介绍 Clerk提供…...

编程日记 2025/9/18 10:50:10

公网远程家里局域网电脑过程详细记录，包含设置路由器。

由于从校内迁居小区，校内需要远程控制访问小区内个人电脑，于是早些时间刚好自己是电信宽带，可以申请公网ipv4不需要花钱，所以就打电话直接申请即可，申请成功后访问光猫设备管理界面192.168.1.1，输入用户名密码登录超管（密码是网上查下就有了）设置了光猫为桥接模式，然后…...

编程日记 2025/9/20 13:03:58

自制简单的图片查看器（）

图片格式：支持常见的图片格式（JPG、PNG、BMP、GIF）。 import os import tkinter as tk from tkinter import filedialog, messagebox from PIL import Image, ImageTkclass ImageViewer:def __init__(self, root):self.root rootself.root.…...

编程日记 2025/9/19 17:54:13

25/2/17 ＜嵌入式笔记＞桌宠代码解析

这个寒假跟着做了一个开源的桌宠，我们来解析下代码，加深理解。代码中有开源作者的名字。可以去B站搜着跟着做。首先看下main代码 #include "stm32f10x.h" // Device header #include "Delay.h" #include &quo…...

编程日记 2025/9/21 15:05:06

Kafka偏移量管理全攻略：从基础概念到高级操作实战

#作者：猎人文章目录前言：概念剖析kafka的两种位移消费位移消息的位移位移的提交自动提交手动提交 1、使用--to-earliest重置消费组消费指定topic进度2、使用--to-offset重置消费offset3、使用--to-datetime策略指定时间重置offset4、使用--to-current…...

编程日记 2025/9/20 16:18:22

python中使用日期和时间差：datetime模块

datetime模块的表示时间的有 datetime.datetime #时间包含年月日时分秒毫秒 datetime.date #时间只包含年月日 datetime.time #只包含时分秒获取当前时间 import datetime now datetime.datetime.now() print(now)得到 atetime中的年月日时分秒可以分别取出来 import da…...

编程日记 2025/9/19 15:11:07

申论对策建议类【2022江苏B卷第一题“如何开展网络直播”】

材料： 近年来，公安交管部门通过网络直播，将执法过程和执法细节以视频形式呈现在公众面前，吸引“围观”、组织点评，让执法过程变成一堂生动的法治公开课。 “各位网友，大家好！这里是‘全国交通…...

编程日记 2025/9/13 11:46:59

Blazor-父子组件传递任意参数

在我们从父组件传参数给子组件时，可以通过子组件定义的[Parameter]特性的公开属性进行传值，但是当我们需要传递多个值的时候，就需要通过[Parameter]特性定义多个属性，有没有更简便的方式？ 我们可以使用定义 IDictionar…...

编程日记 2025/9/16 8:16:01

Python的那些事第二十三篇：Express（Node.js）与 Python：一场跨语言的浪漫邂逅

摘要在当今的编程世界里，Node.js 和 Python 像是两个性格迥异的超级英雄，一个以速度和灵活性著称，另一个则以强大和优雅闻名。本文将探讨如何通过 Express 框架将 Node.js 和 Python 结合起来，打造出一个高效、有趣的 Web 应用。我们将通过一系列幽默风趣的实例和表格，展…...

编程日记 2025/9/19 18:09:03

win11安装wsl报错：无法解析服务器的名称或地址（启用wsl2）

1. 启用wsl报错如下 # 查看可安装的 wsl --install wsl --list --online此原因是因为没有开启DNS的原因，所以需要我们手动开启DNS。 2. 按照如下配置即可 Google的DNS（8.8.8.8和8.8.4.4) 全国通用DNS地址 (114.114.114.114) 3. 运行以下命令来重启 WSL…...

编程日记 2025/9/20 3:15:12

【设计模式】【结构型模式】桥接模式（Bridge）

👋hi，我不是一名外包公司的员工，也不会偷吃茶水间的零食，我的梦想是能写高端CRUD 🔥 2025本人正在沉淀中… 博客更新速度 👍 欢迎点赞、收藏、关注，跟上我的更新节奏 🎵 当你的天空突…...

编程日记 2025/9/13 11:46:52

1997-2019年各省进出口总额数据

1997-2019年各省进出口总额数据 1、时间：1997-2020年 2、来源：国家统计局、各省年鉴 3、指标：进出口总额 4、范围：31省 5、指标解释：进出口总额‌是指以货币表示的一定时期内一国实际进出口商品的总金额&#xff…...

编程日记 2025/9/21 16:00:12

AI前端开发效率革命：拥抱AI，开启前端开发新纪元

前端开发行业竞争日益激烈，项目交付周期不断缩短，对开发效率的要求也越来越高。在这种高压环境下，开发者们常常面临着巨大的压力。而近年来，人工智能技术的飞速发展，特别是AI写代码工具的出现，为前端开发带…...

编程日记 2025/9/13 11:46:48

Rust编程语言入门教程（一）安装Rust

目录引言一、为什么要用 Rust？二、与其他语言比较三、Rust 特别擅长的领域四、Rust 与 Firefox五、Rust 的用户和案例六、Rust 的优缺点七、安装 Rust1、访问官网下载 Rust2、下载完成，执行exe文件八、Rust 安装验证九、开发工具结束语引言在当今快…...

编程日记 2025/9/15 22:04:08

Kubernetes控制平面组件：Kubernetes如何使用etcd

云原生学习路线导航页（持续更新中） kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计（一）Kubernetes架构原则和对象设计（二）Kubernetes架构原则和对象设计（三）Kubernetes控…...

编程日记 2025/9/19 8:49:48

2025年-G4-Lc78--121. 买卖股票的最佳时机--（java版）

1.题目描述 2.思路思路1: 做两轮排序，第一轮排序找到最小的那个数，然后再判断最小的那个数之后还有其他数吗，如果有在进行排序，选出最大的那个数，然后值相减。问题要点： （1）你需要…...

编程日记 2025/9/20 8:01:45

LabVIEW 中的 3dgraph.llb 库

3dgraph.llb 库位于 C:\Program Files (x86)\National Instruments\LabVIEW 2019\vi.lib\Platform 目录下，是 LabVIEW 系统中用于 3D 图形相关操作的重要库。它为 LabVIEW 用户提供了丰富的功能，能在应用程序中创建、显示和交互各种 3D 图形，…...

编程日记 2025/9/18 1:49:33

通过VSCode直接连接使用 GPT的编程助手

GPT的编程助手在VSC上可以直接使用选择相应的版本都可以正常使用。每个月可以使用40条，超过限制要付费。如下图对应的4o和claude3.5等模型都可以使用。VSC直接连接即可。配置步骤如下： 安装VSCODE 直接，官网下载就行 https://code.vis…...

编程日记 2025/9/21 14:24:20

[LeetCode力扣hot100]-C++常用数据结构

0.Vector 1.Set-常用滑动窗口 set<char> ans;//根据类型定义，像vector ans.count()//检查某个元素是否在set里，1在0不在 ans.insert();//插入元素 ans.erase()//删除某个指定元素 2.栈 3.树树是一种特殊的数据结构，力扣二叉树相…...

编程日记 2025/9/21 0:19:35

2-安装YIUI

YIUI框架：GitHub - LiShengYang-yiyi/YIUI: Unity3D UGUI Framework, 基于UI数据事件绑定为核心数据驱动的UGUI框架, ETUI框架, ET框架官方推荐UI框架 ET框架：egametang/ET: Unity3D Client And C# Server Framework (github.com) 1 - 安装YIUI框架&a…...

编程日记 2025/9/21 1:31:39

16-使用QtChart创建动态图表：入门指南

QtChart是Qt框架中的一个强大模块，用于创建各种类型的图表，如折线图、柱状图、饼图等。它提供了丰富的API和灵活的配置选项，使得开发者能够轻松地将数据可视化集成到应用程序中。本文将介绍如何使用QtChart创建一个简单的动态折线图&#xff…...

编程日记 2025/9/13 11:46:35

蓝耘智算携手DeepSeek，共创AI未来

🌟 各位看官号，我是egoist2023！ 🌍 种一棵树最好是十年前，其次是现在！ 🚀 今天来学习如何通过蓝耘智算使用DeepSeek R1模型 👍 如果觉得这篇文章有帮助，欢迎您一键三连&a…...

编程日记 2025/9/12 12:02:05

具身智能在智能巡检机器人中的应用——以开关柜带电操作机器人为例

随着机器人技术和人工智能的迅速发展，具身智能在各行业的应用日益广泛，尤其是在电力行业中的智能巡检领域。传统的电力巡检和维护工作通常需要人工操作，存在着高温、高压、强电磁场等危险环境，且效率较低。开关柜带电操作机器人作…...

编程日记 2025/9/20 17:37:31

【第4章：循环神经网络（RNN）与长短时记忆网络（LSTM）— 4.6 RNN与LSTM的变体与发展趋势】

引言：时间序列的魔法钥匙在时间的长河中，信息如同涓涓细流，绵延不绝。而如何在这无尽的数据流中捕捉、理解和预测，正是循环神经网络（RNN）及其变体长短时记忆网络（LSTM）所擅长的。今天，我们就来一场深度探索，揭开RNN与LSTM的神秘面纱，看看它们如何在时间序列的海洋…...

编程日记 2025/9/15 3:45:14

【R语言】回归分析与判别分析

一、线性回归分析 1、lm()函数 lm()函数是用于拟合线性模型（Linear Models）的主要函数。线性模型是一种统计方法，用于描述一个或多个自变量（预测变量、解释变量）与因变量（响应变量）之间的关系…...

编程日记 2025/9/13 11:46:28

git开发流程以及github社区企业版

常规开发流程 1、将仓库 clone 到本地，已经 clone 的要 fetch & pull，保证本地 master 分支已经更新到最新状态 2、在 master 最新分支的基础上 checkout 一个开发分支，分支命名要求规范，如带用户名、日期、bug id 等关键信…...

编程日记 2025/9/13 11:46:26

DeepSeek + Vue实战开发

利用DeepSeek V3模型、siliconflow大模型一站式云服务平台以及vue3.0实现一个在线人工智能客服对话系统。因为deepseek官网的api密钥使用起来比较缓慢，所以可以使用第三方的，具体操作请自行查阅资料。 siliconflow官网 SiliconFlow, Accelerate AGI …...

编程日记 2025/9/13 11:46:24

从安装软件到flask框架搭建可视化大屏（二）——创建一个flask页面，搭建可视化大屏，零基础也可以学会

附录：所有文件的完整代码 models.py # models/models.py from flask_sqlalchemy import SQLAlchemydb SQLAlchemy()class User(db.Model):__tablename__ user # 显式指定表名为 userid db.Column(db.Integer, primary_keyTrue)username db.Column(db.String(…...

编程日记 2025/9/13 11:46:23