当前位置：首页 > news >正文

书生实战营之沐曦专场

news 来源：原创 2025/7/21 12:00:13

一：实验环境进入和启动实验容器(D.run平台)

1.1首先进入平台进行注册

D.run平台https://console.d.run/

注册和登录环节就跳过了。

1.2 启动实验容器--详细步骤如下

1.2.1选择容器的名称、区域、镜像（注意镜像必须选择Dlinfer）

1.2.2可以选择Jupyter Lab作为实验环境（VS code、SSH登录可选）

在这里我选择Jupyter lab作为环境

1.2.3 Jupyter Lab工作区域如下，打开终端可以看到对应的终端的说明

如果时间过久还是启动中，可以刷新试试，刷新页面后，就会是运行中

1.2.4激活conda环境，并查看dlinfer安装情况

二 LMDeploy推理及验证

2.1 下载源码安装LMDeploy：

# 安装addict软件包
pip install addict mmengine mmengine-lite fire accelerate==0.32.1 nvidia-ml-py# 解决LMDeploy对tranformers版本要求的Iusse：
pip install transformers==4.47.1# 下载lmdeploy，并进入目录
git clone https://github.com/InternLM/lmdeploy.git
cd lmdeploy

2.1.1建议使用以下 commit进行源码安装：

# checkout对应的版本
git checkout 832bfc45b4497e8d16e08ecfd663671e634aae40
# 安装lmdeploy
LMDEPLOY_TARGET_DEVICE=maca python setup.py develop

2.2 部署验证结果，用internlm3-8b-instruct模型验证

验证程序如下：

2.2.1 新建test.py文件

2.2.2 在test.py文件中添加如下的代码内容

import lmdeploy
from lmdeploy import PytorchEngineConfigif __name__ == "__main__":pipe = lmdeploy.pipeline("/root/public-model/models/internlm/internlm3-8b-instruct",backend_config = PytorchEngineConfig(tp=1,cache_max_entry_count=0.8, device_type="maca",block_size=16))question = ["Shanghai is", "Please introduce China", "How are you?"]response = pipe(question, request_output_len=256, do_preprocess=False)for idx, r in enumerate(response):print(f"Q: {question[idx]}")print(f"A: {r.text}")print()

2.2.3 验证程序执行如下：

2.2.4 运行之后出现了如下的错误

python test.py
/opt/conda/lib/python3.10/site-packages/torchvision/io/image.py:13: UserWarning: Failed to load image Python extension: 'libpng16.so.16: cannot open shared object file: No such file or directory'If you don't plan on using image functionality from `torchvision.io`, you can ignore this warning. Otherwise, there might be something wrong with your environment. Did you have `libjpeg` or `libpng` installed before building `torchvision` from source?warn(
/opt/conda/lib/python3.10/site-packages/torchvision/datapoints/__init__.py:12: UserWarning: The torchvision.datapoints and torchvision.transforms.v2 namespaces are still Beta. While we do not expect major breaking changes, some APIs may still change according to user feedback. Please submit any feedback you may have in this issue: https://github.com/pytorch/vision/issues/6753, and you can also check out https://github.com/pytorch/vision/issues/7319 to learn more about the APIs that we suspect might involve future changes. You can silence this warning by calling torchvision.disable_beta_transforms_warning().warnings.warn(_BETA_TRANSFORMS_WARNING)
/opt/conda/lib/python3.10/site-packages/torchvision/transforms/v2/__init__.py:54: UserWarning: The torchvision.datapoints and torchvision.transforms.v2 namespaces are still Beta. While we do not expect major breaking changes, some APIs may still change according to user feedback. Please submit any feedback you may have in this issue: https://github.com/pytorch/vision/issues/6753, and you can also check out https://github.com/pytorch/vision/issues/7319 to learn more about the APIs that we suspect might involve future changes. You can silence this warning by calling torchvision.disable_beta_transforms_warning().warnings.warn(_BETA_TRANSFORMS_WARNING)

2.2.5 解决步骤如下：

这个警告表明环境中缺少 libpng16.so.16 文件，这通常是由于 libpng 库未正确安装或未被正确链接。• torchvision.io 模块依赖于 libpng 和 libjpeg 来处理图像文件，如果这些库未正确安装，可能会导致图像加载功能无法正常工作。

sudo apt-get update
sudo apt-get install libpng-dev libjpeg-dev

重新安装 torchvision

pip uninstall torchvision
pip install torchvision

pip uninstall torch torchvision
pip install torch==2.4.0 torchvision==0.19.0pip install lmdeploy==0.7.0

在test.py的代码中添加以下内容：

import torchvision
torchvision.disable_beta_transforms_warning()

pip uninstall torch torchvision
pip install torch==2.4.0 torchvision==0.19.0
pip uninstall vllm
pip install vllm==0.7.0

pip uninstall torch torchvision outlines
pip install torch==2.4.0 torchvision==0.19.0 outlines==0.0.9

pip uninstall torch torchvision outlines xformers
pip install torch==2.5.1 torchvision==0.20.1 outlines==0.1.11 xformers==0.0.28.post3
pip install vllm==0.7.0

依赖越下载越不对劲，因此重新创建一个实例，这个实例卸载重新测试。

最后终于成功了。

三 XTuner微调

3.1 环境准备

实训环境选择及启动：（已安装xtuner镜像直接启动即可，无需安装）

创建实例过程如下所示：

3.2 安装必要的软件包及激活xtuner环境

3.2.1进入终端命令行激活环境：

 conda activate base

3.2.2安装依赖环境包

apt -y install git
conda activate base
pip install mpi4py

为了验证 XTuner 是否安装正确，我们将使用命令打印配置文件。

打印配置文件：在命令行中使用 xtuner list-cfg 验证是否能打印配置文件列表。

xtuner list-cfg |grep internlm

#git clone 本repo
git clone https://github.com/InternLM/Tutorial.git -b camp4
mkdir -p /root/finetune && cd /root/finetune

3.3 修改提供的数据集

3.3.1. 创建一个新的文件夹用于存储微调数据

mkdir -p /root/finetune/data && cd /root/finetune/data
cp -r /root/Tutorial/data/assistant_Tuner.jsonl  /root/finetune/data

3.3.2 创建修改脚本

我们写一个脚本生成修改我们需要的微调训练数据，在当前目录下创建一个 change_script.py 文件，内容如下：

# 创建 change_script.py 文件
touch /root/finetune/data/change_script.py

(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# touch /root/finetune/data/change_script.py
touch: cannot touch '/root/finetune/data/change_script.py': Not a directory
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# cd data
bash: cd: data: Not a directory
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# pwd
/root/finetune
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# touch change_script.py

打开该change_script.py文件后将下面的内容复制进去。

import json
import argparse
from tqdm import tqdmdef process_line(line, old_text, new_text):# 解析 JSON 行data = json.loads(line)# 递归函数来处理嵌套的字典和列表def replace_text(obj):if isinstance(obj, dict):return {k: replace_text(v) for k, v in obj.items()}elif isinstance(obj, list):return [replace_text(item) for item in obj]elif isinstance(obj, str):return obj.replace(old_text, new_text)else:return obj# 处理整个 JSON 对象processed_data = replace_text(data)# 将处理后的对象转回 JSON 字符串return json.dumps(processed_data, ensure_ascii=False)def main(input_file, output_file, old_text, new_text):with open(input_file, 'r', encoding='utf-8') as infile, \open(output_file, 'w', encoding='utf-8') as outfile:# 计算总行数用于进度条total_lines = sum(1 for _ in infile)infile.seek(0)  # 重置文件指针到开头# 使用 tqdm 创建进度条for line in tqdm(infile, total=total_lines, desc="Processing"):processed_line = process_line(line.strip(), old_text, new_text)outfile.write(processed_line + '\n')if __name__ == "__main__":parser = argparse.ArgumentParser(description="Replace text in a JSONL file.")parser.add_argument("input_file", help="Input JSONL file to process")parser.add_argument("output_file", help="Output file for processed JSONL")parser.add_argument("--old_text", default="尖米", help="Text to be replaced")parser.add_argument("--new_text", default="闻星", help="Text to replace with")args = parser.parse_args()main(args.input_file, args.output_file, args.old_text, args.new_text)

然后修改如下：打开 change_script.py ，修改 --new_text 中 default="闻星" 为你的名字。

if __name__ == "__main__":parser = argparse.ArgumentParser(description="Replace text in a JSONL file.")parser.add_argument("input_file", help="Input JSONL file to process")parser.add_argument("output_file", help="Output file for processed JSONL")parser.add_argument("--old_text", default="尖米", help="Text to be replaced")
-        parser.add_argument("--new_text", default="闻星", help="Text to replace with")
+   parser.add_argument("--new_text", default="沐曦", help="Text to replace with")args = parser.parse_args()

3.3.3 执行脚本

# usage：python change_script.py {input_file.jsonl} {output_file.jsonl}
cd ~/finetune/data
python change_script.py ./assistant_Tuner.jsonl ./assistant_Tuner_change.jsonl

出错了，按照那个直接复制粘贴执行，我的出现了这个错误，显示data都是一个文件而不是文件夹

详细解决过程如下所示：

bash: cd: /root/finetune/data: Not a directory
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# python change_script.py ./assistant_Tuner.jsonl ./assistant_Tuner_change.jsonl
Traceback (most recent call last):File "/root/finetune/change_script.py", line 47, in <module>main(args.input_file, args.output_file, args.old_text, args.new_text)File "/root/finetune/change_script.py", line 27, in mainwith open(input_file, 'r', encoding='utf-8') as infile, \
FileNotFoundError: [Errno 2] No such file or directory: './assistant_Tuner.jsonl'
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# cd  /root/finetune/data
bash: cd: /root/finetune/data: Not a directory
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# cd  /root/Tutorial/data
(base) root@ins-txrwm-c598d768f-c8l85:~/Tutorial/data# ls
assistant_Tuner.jsonl  data
(base) root@ins-txrwm-c598d768f-c8l85:~/Tutorial/data# cp assistant_Tuner.jsonl /root/finetune
(base) root@ins-txrwm-c598d768f-c8l85:~/Tutorial/data# cd  /root/finetune
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
assistant_Tuner.jsonl  change_script.py  data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# mkdir data
mkdir: cannot create directory ‘data’: File exists
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# rm data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# mkdir data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ll
total 2580
drwxr-xr-x 3 root root    4096  5月  2 13:50 ./
drwx------ 1 root root    4096  5月  2 13:44 ../
-rw-r--r-- 1 root root 2621026  5月  2 13:50 assistant_Tuner.jsonl
-rw-r--r-- 1 root root    1844  5月  2 13:37 change_script.py
drwxr-xr-x 2 root root    4096  5月  2 13:50 data/
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# cd data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune/data# ls
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune/data# cd ..
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
assistant_Tuner.jsonl  change_script.py  data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# mv change_script.py data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
assistant_Tuner.jsonl  data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# cd data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune/data# ls
change_script.py
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune/data# cd ..
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
assistant_Tuner.jsonl  data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# mv assistant_Tuner.jsonl data
(base) root@ins-txrwm-c598d768f-c8l85:~/finetune# ls
data

进入data目录再次执行脚本文件

python change_script.py ./assistant_Tuner.jsonl ./assistant_Tuner_change.jsonl

3.3.4 查看数据

cat assistant_Tuner_change.jsonl | head -n 3

3.4 准备训练脚本

模型文件位置【用1.8B模型微调】：/root/public- model/models/Shanghai_AI_Laboratory/internlm2_5-1_8b-chat

xtuner的微调官方配置文件位置：/workspace/xtuner/examples

获取官方写好的训练配置文件：

# 切换到finetune的目录，cd {path/to/finetune}
cd /root/finetune
mkdir ./config
cd config
# 这里使用lora微调
cp /workspace/xtuner/examples/lora/internlm2_5_1.8b_lora_alpaca_e3_copy.py .

3.4.1训练参数调整及训练启动

步骤1：修改微调参数

internlm2_5_1.8b_lora_alpaca_e3_copy.py修改如下【关注黄色部分】：

# Copyright (c) OpenMMLab. All rights reserved.
import torch
from datasets import load_dataset
from mmengine.dataset import DefaultSampler
from mmengine.hooks import (CheckpointHook, DistSamplerSeedHook, IterTimerHook,LoggerHook, ParamSchedulerHook)
from mmengine.optim import AmpOptimWrapper, CosineAnnealingLR, LinearLR
from peft import LoraConfig
from torch.optim import AdamW
from transformers import (AutoModelForCausalLM, AutoTokenizer,BitsAndBytesConfig)from xtuner.dataset import process_hf_dataset
from xtuner.dataset.collate_fns import default_collate_fn
from xtuner.dataset.map_fns import alpaca_map_fn, template_map_fn_factory
from xtuner.engine.hooks import (DatasetInfoHook, EvaluateChatHook,ThroughputHook,VarlenAttnArgsToMessageHubHook)
from xtuner.engine.runner import TrainLoop
from xtuner.model import SupervisedFinetune
from xtuner.parallel.sequence import SequenceParallelSampler
from xtuner.utils import PROMPT_TEMPLATE, SYSTEM_TEMPLATE#######################################################################
#                          PART 1  Settings                           #
#######################################################################
# Model
pretrained_model_name_or_path = '/root/public-model/models/Shanghai_AI_Laboratory/internlm2_5-1_8b-chat'
use_varlen_attn = False# Data
alpaca_en_path = '/root/finetune/data/assistant_Tuner_change.jsonl'
prompt_template = PROMPT_TEMPLATE.internlm2_chat
max_length = 2048
pack_to_max_length = True# parallel
sequence_parallel_size = 1# Scheduler & Optimizer
batch_size = 1  # per_device
accumulative_counts = 1
accumulative_counts *= sequence_parallel_size
dataloader_num_workers = 0
max_epochs = 3
optim_type = AdamW
lr = 2e-4
betas = (0.9, 0.999)
weight_decay = 0
max_norm = 1  # grad clip
warmup_ratio = 0.03# Save
save_steps = 500
save_total_limit = 2  # Maximum checkpoints to keep (-1 means unlimited)# Evaluate the generation performance during the training
evaluation_freq = 500
SYSTEM = SYSTEM_TEMPLATE.alpaca
evaluation_inputs = ['请介绍一下你自己', 'Please introduce yourself'
]#######################################################################
#                      PART 2  Model & Tokenizer                      #
#######################################################################
tokenizer = dict(type=AutoTokenizer.from_pretrained,pretrained_model_name_or_path=pretrained_model_name_or_path,trust_remote_code=True,padding_side='right')model = dict(type=SupervisedFinetune,use_varlen_attn=use_varlen_attn,llm=dict(type=AutoModelForCausalLM.from_pretrained,pretrained_model_name_or_path=pretrained_model_name_or_path,trust_remote_code=True,torch_dtype=torch.float16,quantization_config=dict(type=BitsAndBytesConfig,load_in_4bit=True,load_in_8bit=False,llm_int8_threshold=6.0,llm_int8_has_fp16_weight=False,bnb_4bit_compute_dtype=torch.float16,bnb_4bit_use_double_quant=True,bnb_4bit_quant_type='nf4')),lora=dict(type=LoraConfig,r=64,lora_alpha=16,lora_dropout=0.1,bias='none',task_type='CAUSAL_LM'))#######################################################################
#                      PART 3  Dataset & Dataloader                   #
#######################################################################
alpaca_en = dict(type=process_hf_dataset,dataset=dict(type=load_dataset, path='json', data_files=dict(train=alpaca_en_path)),tokenizer=tokenizer,max_length=max_length,dataset_map_fn=None,template_map_fn=dict(type=template_map_fn_factory, template=prompt_template),remove_unused_columns=True,shuffle_before_pack=True,pack_to_max_length=pack_to_max_length,use_varlen_attn=use_varlen_attn)sampler = SequenceParallelSampler \if sequence_parallel_size > 1 else DefaultSampler
train_dataloader = dict(batch_size=batch_size,num_workers=dataloader_num_workers,dataset=alpaca_en,sampler=dict(type=sampler, shuffle=True),collate_fn=dict(type=default_collate_fn, use_varlen_attn=use_varlen_attn))#######################################################################
#                    PART 4  Scheduler & Optimizer                    #
#######################################################################
# optimizer
optim_wrapper = dict(type=AmpOptimWrapper,optimizer=dict(type=optim_type, lr=lr, betas=betas, weight_decay=weight_decay),clip_grad=dict(max_norm=max_norm, error_if_nonfinite=False),accumulative_counts=accumulative_counts,loss_scale='dynamic',dtype='bfloat16')# learning policy
# More information: https://github.com/open-mmlab/mmengine/blob/main/docs/en/tutorials/param_scheduler.md  # noqa: E501
param_scheduler = [dict(type=LinearLR,start_factor=1e-5,by_epoch=True,begin=0,end=warmup_ratio * max_epochs,convert_to_iter_based=True),dict(type=CosineAnnealingLR,eta_min=0.0,by_epoch=True,begin=warmup_ratio * max_epochs,end=max_epochs,convert_to_iter_based=True)
]# train, val, test setting
train_cfg = dict(type=TrainLoop, max_epochs=max_epochs)#######################################################################
#                           PART 5  Runtime                           #
#######################################################################
# Log the dialogue periodically during the training process, optional
custom_hooks = [dict(type=DatasetInfoHook, tokenizer=tokenizer),dict(type=EvaluateChatHook,tokenizer=tokenizer,every_n_iters=evaluation_freq,evaluation_inputs=evaluation_inputs,system=SYSTEM,prompt_template=prompt_template),dict(type=ThroughputHook)
]if use_varlen_attn:custom_hooks += [dict(type=VarlenAttnArgsToMessageHubHook)]# configure default hooks
default_hooks = dict(# record the time of every iteration.timer=dict(type=IterTimerHook),# print log every 10 iterations.logger=dict(type=LoggerHook, log_metric_by_epoch=False, interval=1),# enable the parameter scheduler.param_scheduler=dict(type=ParamSchedulerHook),# save checkpoint per `save_steps`.checkpoint=dict(type=CheckpointHook,by_epoch=False,interval=save_steps,max_keep_ckpts=save_total_limit),# set sampler seed in distributed evrionment.sampler_seed=dict(type=DistSamplerSeedHook),
)# configure environment
env_cfg = dict(# whether to enable cudnn benchmarkcudnn_benchmark=False,# set multi process parametersmp_cfg=dict(mp_start_method='fork', opencv_num_threads=0),# set distributed parametersdist_cfg=dict(backend='nccl'),
)# set visualizer
visualizer = None# set log level
log_level = 'INFO'# load from which checkpoint
load_from = None# whether to resume training from the loaded checkpoint
resume = False# Defaults to use random seed and disable `deterministic`
randomness = dict(seed=None, deterministic=False)# set log processor
log_processor = dict(by_epoch=False)

修改完成之后的文件内容如下所示：

# Copyright (c) OpenMMLab. All rights reserved.
import torch
from datasets import load_dataset
from mmengine.dataset import DefaultSampler
from mmengine.hooks import (CheckpointHook, DistSamplerSeedHook, IterTimerHook,LoggerHook, ParamSchedulerHook)
from mmengine.optim import AmpOptimWrapper, CosineAnnealingLR, LinearLR
from peft import LoraConfig
from torch.optim import AdamW
from transformers import (AutoModelForCausalLM, AutoTokenizer,BitsAndBytesConfig)from xtuner.dataset import process_hf_dataset
from xtuner.dataset.collate_fns import default_collate_fn
from xtuner.dataset.map_fns import alpaca_map_fn, template_map_fn_factory
from xtuner.engine.hooks import (DatasetInfoHook, EvaluateChatHook,ThroughputHook,VarlenAttnArgsToMessageHubHook)
from xtuner.engine.runner import TrainLoop
from xtuner.model import SupervisedFinetune
from xtuner.parallel.sequence import SequenceParallelSampler
from xtuner.utils import PROMPT_TEMPLATE, SYSTEM_TEMPLATE#######################################################################
#                          PART 1  Settings                           #
#######################################################################
# Model
pretrained_model_name_or_path = '/root/public-model/models/Shanghai_AI_Laboratory/internlm2_5-1_8b-chat'
use_varlen_attn = False# Data
alpaca_en_path = '/root/finetune/data/assistant_Tuner_change.jsonl'
prompt_template = PROMPT_TEMPLATE.internlm2_chat
max_length = 2048
pack_to_max_length = True# parallel
sequence_parallel_size = 1# Scheduler & Optimizer
batch_size = 1  # per_device
accumulative_counts = 1
accumulative_counts *= sequence_parallel_size
dataloader_num_workers = 0
max_epochs = 3
optim_type = AdamW
lr = 2e-4
betas = (0.9, 0.999)
weight_decay = 0
max_norm = 1  # grad clip
warmup_ratio = 0.03# Save
save_steps = 500
save_total_limit = 2  # Maximum checkpoints to keep (-1 means unlimited)# Evaluate the generation performance during the training
evaluation_freq = 500
SYSTEM = SYSTEM_TEMPLATE.alpaca
evaluation_inputs = ['请介绍一下你自己', 'Please introduce yourself'
]#######################################################################
#                      PART 2  Model & Tokenizer                      #
#######################################################################
tokenizer = dict(type=AutoTokenizer.from_pretrained,pretrained_model_name_or_path=pretrained_model_name_or_path,trust_remote_code=True,padding_side='right')model = dict(type=SupervisedFinetune,use_varlen_attn=use_varlen_attn,llm=dict(#type=AutoModelForCausalLM.from_pretrained,#pretrained_model_name_or_path=pretrained_model_name_or_path,#trust_remote_code=True,#torch_dtype=torch.bfloat16,#quantization_config=None),type=AutoModelForCausalLM.from_pretrained,pretrained_model_name_or_path=pretrained_model_name_or_path,trust_remote_code=True,torch_dtype=torch.float16,quantization_config=dict(type=BitsAndBytesConfig,load_in_4bit=True,load_in_8bit=False,llm_int8_threshold=6.0,llm_int8_has_fp16_weight=False,bnb_4bit_compute_dtype=torch.float16,bnb_4bit_use_double_quant=True,bnb_4bit_quant_type='nf4')),lora=dict(type=LoraConfig,r=64,lora_alpha=16,lora_dropout=0.1,bias='none',task_type='CAUSAL_LM'))#######################################################################
#                      PART 3  Dataset & Dataloader                   #
#######################################################################
alpaca_en = dict(type=process_hf_dataset,#dataset=dict(type=load_dataset, path=alpaca_en_path),dataset=dict(type=load_dataset, path='json', data_files=dict(train=alpaca_en_path)),tokenizer=tokenizer,max_length=max_length,dataset_map_fn=None,template_map_fn=dict(type=template_map_fn_factory, template=prompt_template),remove_unused_columns=True,shuffle_before_pack=True,pack_to_max_length=pack_to_max_length,use_varlen_attn=use_varlen_attn)sampler = SequenceParallelSampler \if sequence_parallel_size > 1 else DefaultSampler
train_dataloader = dict(batch_size=batch_size,num_workers=dataloader_num_workers,dataset=alpaca_en,sampler=dict(type=sampler, shuffle=True),collate_fn=dict(type=default_collate_fn, use_varlen_attn=use_varlen_attn))#######################################################################
#                    PART 4  Scheduler & Optimizer                    #
#######################################################################
# optimizer
optim_wrapper = dict(type=AmpOptimWrapper,optimizer=dict(type=optim_type, lr=lr, betas=betas, weight_decay=weight_decay),clip_grad=dict(max_norm=max_norm, error_if_nonfinite=False),accumulative_counts=accumulative_counts,loss_scale='dynamic',dtype='bfloat16')# learning policy
# More information: https://github.com/open-mmlab/mmengine/blob/main/docs/en/tutorials/param_scheduler.md  # noqa: E501
param_scheduler = [dict(type=LinearLR,start_factor=1e-5,by_epoch=True,begin=0,end=warmup_ratio * max_epochs,convert_to_iter_based=True),dict(type=CosineAnnealingLR,eta_min=0.0,by_epoch=True,begin=warmup_ratio * max_epochs,end=max_epochs,convert_to_iter_based=True)
]# train, val, test setting
train_cfg = dict(type=TrainLoop, max_epochs=max_epochs)#######################################################################
#                           PART 5  Runtime                           #
#######################################################################
# Log the dialogue periodically during the training process, optional
custom_hooks = [dict(type=DatasetInfoHook, tokenizer=tokenizer),dict(type=EvaluateChatHook,tokenizer=tokenizer,every_n_iters=evaluation_freq,evaluation_inputs=evaluation_inputs,system=SYSTEM,prompt_template=prompt_template),dict(type=ThroughputHook)
]if use_varlen_attn:custom_hooks += [dict(type=VarlenAttnArgsToMessageHubHook)]# configure default hooks
default_hooks = dict(# record the time of every iteration.timer=dict(type=IterTimerHook),# print log every 10 iterations.logger=dict(type=LoggerHook, log_metric_by_epoch=False, interval=1),# enable the parameter scheduler.param_scheduler=dict(type=ParamSchedulerHook),# save checkpoint per `save_steps`.checkpoint=dict(type=CheckpointHook,by_epoch=False,interval=save_steps,max_keep_ckpts=save_total_limit),# set sampler seed in distributed evrionment.sampler_seed=dict(type=DistSamplerSeedHook),
)# configure environment
env_cfg = dict(# whether to enable cudnn benchmarkcudnn_benchmark=False,# set multi process parametersmp_cfg=dict(mp_start_method='fork', opencv_num_threads=0),# set distributed parametersdist_cfg=dict(backend='nccl'),
)# set visualizer
visualizer = None# set log level
log_level = 'INFO'# load from which checkpoint
load_from = None# whether to resume training from the loaded checkpoint
resume = False# Defaults to use random seed and disable `deterministic`
randomness = dict(seed=None, deterministic=False)# set log processor
log_processor = dict(by_epoch=False)

步骤2：启动微调

cd /root/finetune
xtuner train ./config/internlm2_5_1.8b_lora_alpaca_e3_copy.py --deepspeed deepspeed_zero2 --work-dir ./work_dirs/assistTuner

由于这一步时间太长，出问题了，试了好多次都不行，所以去重新创建了个实例。

然后再次重复上面的操作，最终成功了。

步骤 3. 权重转换【HuggingFace格式文件】

cd /root/finetune/work_dirs/assistTuner
export MKL_SERVICE_FORCE_INTEL=1
export MKL_THREADING_LAYER=GNU

注意：这里选择的模型迭代最后一次的文件

xtuner convert pth_to_hf internlm2_5_1.8b_lora_alpaca_e3_copy.py  /root/finetune/work_dirs/assistTuner/iter_927.pth .pth ./hf

步骤 4. 模型合并

cd /root/finetune/work_dirs/assistTuner
export MKL_SERVICE_FORCE_INTEL=1
export MKL_THREADING_LAYER=GNU# 把微调模型合并成成一个
xtuner convert merge /root/public-model/models/Shanghai_AI_Laboratory/internlm2_5-1_8b-chat ./hf ./merged --max-shard-size 2GB

步骤 5. 验证结果

采用tranformers做一个简单的测试程序'test.py'如下：

from transformers import AutoTokenizer, AutoModelForCausalLM# 使用GPU
model_name = "/root/finetune/work_dirs/assistTuner/merged"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name).to('cuda')# 处理输入
prompt = "请介绍一下你自己"
inputs = tokenizer(prompt, return_tensors="pt").to('cuda')# 生成配置
outputs = model.generate(input_ids=inputs.input_ids,max_new_tokens=100,do_sample=True,temperature=0.8,top_p=0.95,pad_token_id=tokenizer.eos_token_id
)# 解码结果
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

到此为止，终于完成了这个任务，几经波折！！！！

书生实战营之沐曦专场

一：实验环境进入和启动实验容器(D.run平台) 1.1首先进入平台进行注册 D.run平台https://console.d.run/ 注册和登录环节就跳过了。 1.2 启动实验容器--详细步骤如下 1.2.1选择容器的名称、区域、镜像（注意镜像必须选择Dlinfer） 1.2.2可以选…...

编程日记 2025/7/21 12:00:13

在运行 Hadoop 作业时，遇到“No such file or directory”，如何在windows里打包在虚拟机里运行

最近在学习Hadoop集群map reduce分布运算过程中，经多方面排查可能是电脑本身配置的原因导致每次运行都会报“No such file or directory”的错误，最后我是通过打包文件到虚拟机里运行得到结果，具体步骤如下： 前提是要保证maven已经…...

编程日记 2025/7/21 11:48:25

基于YOLOV5的目标检测识别

基于YOLOV5的目标检测识别舰船目标检测口罩目标检测飞机目标检测舰船目标检测口罩目标检测飞机目标检测...

编程日记 2025/6/29 5:21:04

第4篇：服务层抽象与复用逻辑

在业务系统复杂度指数级增长的今天，服务层（Service Layer）的合理设计直接影响着系统的可维护性和扩展性。本文将深入剖析 Egg.js 框架中的服务层架构设计，从基础实现到高级封装，全方位讲解企业级应用的开发实践。一、…...

编程日记 2025/6/29 5:21:10

RoboMP 2 ^2 2: A Robotic Multimodal Perception-Planning Framework with Multimodal Large Language Models ➡️ 论文标题：RoboMP 2 ^2 2: A Robotic Multimodal Perception-Planning Framework with Multimodal Large Language Models ➡️ 论文作者&#xff…...

编程日记 2025/6/29 5:21:12

中小企业MES系统详细设计

版本：V1.1 日期：2025年5月2日一、设备协议兼容性设计 1.1 设备接入框架 #mermaid-svg-PkwqEMRIIlIBPP58 {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-PkwqEMRIIlIBPP58 .error-icon{fill…...

编程日记 2025/6/29 1:19:44

第二十周:项目开发中遇到的相关问题(一)

自十九周开始，我们便开始着手写项目（关于新闻资讯类的Web项目），当然，在这之中我们也学到了很多高效且有用的好技术，在接下来的内容中将去具体的描述这些好技术，介绍它们的具体用法和应用场景。本…...

编程日记 2025/7/21 11:43:31

WebRtc10: 端对端1v1传输基本流程

媒体能力协商过程 RTCPeerConnection（核心类） 基本格式 pc new RTCPeerConnection([configiration]); RTCPeerConnection方法分类媒体协商Stream/Track传输相关方法统计相关方法媒体协商过程协商状态变化媒体协商方法 createOffercreateAnswe…...

编程日记 2025/6/29 5:56:14

【云备份】配置文件加载模块

目录一.为什么要配置文件二.配置文件的实现三.单例文件配置类设计四.源码一.为什么要配置文件我们将服务端程序运行中用到的一些关键信息保存到配置文件中，这样可以使程序的运行更加灵活。这样做的好处是，未来如果我们想要修改一些关键信息&…...

编程日记 2025/6/29 8:07:37

重构之道：识别并替换不合适使用的箭头函数

1、引言 JavaScript 自 ES6 引入了箭头函数（Arrow Function）后，因其简洁的语法和对 this 的词法绑定机制，迅速成为开发者喜爱的写法之一。然而，并不是所有场景都适合使用箭头函数。在实际开发中，我们常常会因为追求代码简洁而忽视其潜在问题，例如： this 指向错误不适…...

编程日记 2025/7/21 11:54:27

git问题记录-如何切换历史提交分支，且保留本地修改

问题记录我在本地编写了代码，突然想查看之前提交的代码，并且想保留当前所在分支所做的修改通过git stash对本地的代码进行暂存使用git checkout <commit-hash>切换到之前的提交记录。查看完之后我想切换回来，恢复暂存的本地代码…...

编程日记 2025/6/29 5:21:11

【MySQL】事务管理

事务管理一. 事务的概念二. 事务的特征三. 事务的版本支持四. 事务的提交方式五. 事务的常见操作六. 事务的隔离级别1. 查看与设置隔离级别2. 读未提交 (Read Uncommitted)3. 读提交 (Read Committed)4. 可重复读 (Repeatable Read)5. 串行化 (Serializable)6. 隔离级别的总结…...

编程日记 2025/6/29 7:37:05

【点对点协议（PPP）全解析】从原理到工程实践

目录前言技术背景与价值当前技术痛点解决方案概述目标读者说明一、技术原理剖析核心概念图解核心作用讲解关键技术模块说明技术选型对比二、实战演示环境配置要求核心配置实现案例1：基础PPP链路建立案例2：CHAP认证配置运行结果验证三、性能对比测试…...

编程日记 2025/6/29 5:27:20

环境搭建：开启 Django 开发之旅

一、环境搭建：开启 Django 开发之旅 （一）安装 Python 先确保电脑上装有 Python 3.6 及以上版本，Django 5.1 的话，至少得 Python 3.8 哦。安装前，先查下有没有装过 Python ，终端（Wi…...

编程日记 2025/6/29 6:34:16

如何配置NGINX作为反向代理服务器来缓存后端服务的响应？

大家好，我是锋哥。今天分享关于【如何配置NGINX作为反向代理服务器来缓存后端服务的响应？】面试题。希望对大家有帮助； 如何配置NGINX作为反向代理服务器来缓存后端服务的响应？ 1000道互联网大厂Java工程师精选面试题-Java资源…...

编程日记 2025/6/29 8:11:20

【Java IO流】File类基础详解

参考笔记：java File类基础万字详解（通俗易懂）-CSDN博客目录 1.前言 2. File类介绍 3. File类构造方法 4.File类常用的方法案例演示 4.1 创建文件/文件夹的方法 4.2 删除文件/文件夹的方法 4.3 判断文件/文件夹是否存在的方法 4.4 …...

编程日记 2025/6/29 5:21:20

《C#数据结构与算法》—201线性表

线性表的实现方式顺序表线性表的顺序存储是指在内存中用一块地址连续的空间依次存放线性表的数据元素，用这种方式存储的线性表叫顺序表。特点：表中相邻的数据元素在内存中存储位置也相邻。顺序表接口实现： 方法名参数返回值描述GetLen…...

编程日记 2025/6/29 5:21:21

MATLAB绘制局部放大图

今天，我将分享一段 MATLAB 代码，该代码生成了一个主副图结合的可视化展示，用于比较不同控制系统性能表现。 clc; clear; close all;% 生成时间向量 t 0:0.1:12;% 生成模拟数据 zero_feedback 0.5 * ones(size(t)); % 恒定…...

编程日记 2025/6/29 7:17:38

TS 常用类型

JS不会检查变量类型的变化给变量规定特定的数据类型，错误赋值时会报错优势：TS会标记出代码中的意外行为，尤其是typeerrors 具体实现：类型注解 JS和TS中数据类型的变化...

编程日记 2025/7/21 11:44:51

[Control-Chaos] Toxic Cascade(毒性級鏈)

信息信息描述靶場名稱Toxic Cascade地址GitHub: Toxic Cascade難度中等人數推薦1人類型CTF、APT 攻擊模擬、故事解謎、化工工程與逆向工程描述Toxic Cascade 是一個結合 CTF、APT 攻擊模擬、故事解謎、化工工程與逆向工程的高度沉浸式靶場。該靶場具有獨特的情境背景與模擬真…...

编程日记 2025/6/29 7:52:19

纳米AI搜索体验：MCP工具的实际应用测试，撰写报告 / 爬虫小红书效果惊艳

1. 引言近期测试了纳米AI搜索的MCP工具功能，重点体验了其智能体在报告生成和社交媒体数据分析方面的表现。平台整合了100多个MCP工具，通过本地化部署的方式，为用户提供了不同于云端方案的操作体验。本文将分享实际测试结果，包括智…...

编程日记 2025/7/21 11:52:25

React useMemo函数

第一个参数是回调函数，返回计算的结果，第二个参数是依赖项，该函数只监听count1变量的变化 import { useReducer, useState } from react; import ./App.css;// 定义一个Reducer函数根据不同的action进行不同的状态修改 function reducer(st…...

编程日记 2025/7/21 11:47:19

第 1 篇：起点的选择：为何需要超越数组与链表？

大家好，欢迎来到“数据结构选型指南”系列！在软件开发中，数据是核心，而如何高效地组织和访问这些数据，则是程序性能的关键。选择合适的数据结构，就像为你的 Java 应用选择最优的“引擎零件”。今天&#xf…...

编程日记 2025/7/21 11:57:42

MySQL 索引不生效的情况

MySQL 索引不生效的 SQL 查询需要避免的情况索引是提高 MySQL 查询性能的关键，但某些 SQL 写法会导致索引失效，从而影响查询效率。以下是需要避免的常见情况： 1. 使用 NOT、! 或 <> 操作符 -- 索引可能失效 SELECT * FROM users WH…...

编程日记 2025/7/21 11:51:21

【阿里云大模型高级工程师ACP学习笔记】2.9 大模型应用生产实践 (上篇)

特别说明：由于这一章节是2025年3月官方重点更新的部分，新增内容非常多，因此我不得不整理成上、下两篇，方便大家参考。学习目标备考阿里云大模型高级工程师ACP认证，旨在全面掌握大模型应用生产实践的专业知识，提升在该领域的实操技能与理论水平，为职业发展增添助力。具…...

编程日记 2025/6/29 7:19:34

STM32 ZIBEE DL-20 无线串口模块

一.配置方法二.串口中断 u8 i; u16 buf[20],res; u8 receiving_flag 0; // 新增一个标志，用于标记是否开始接收数组 void USART1_IRQHandler(void) {if(USART_GetITStatus(USART1, USART_IT_RXNE) ! RESET) //接收中断{res USART_ReceiveData(USART1);if(receiv…...

编程日记 2025/6/29 5:21:17

【算法基础】选择排序算法 - JAVA

一、算法基础 1.1 什么是选择排序选择排序是一种简单直观的排序算法，它的工作原理是：首先在未排序序列中找到最小（或最大）元素，存放到排序序列的起始位置，然后再从剩余未排序元素中继续寻找最小&#xf…...

编程日记 2025/6/29 5:21:35

FastAPI 与数据库交互示例

目录安装必要的包完整代码示例运行应用使用说明API 端点说明代码解析下面将创建一个简单的 FastAPI 应用程序，演示如何与 SQLite 数据库进行交互。这个例子包括创建、读取、更新和删除（CRUD）操作。安装必要的包首先，需要安装…...

编程日记 2025/6/29 7:16:11

（六——下）RestAPI 毛子（Http resilience/Refit/游标分页）

文章目录项目地址一、Refit1.1 安装需要的包1.2 创建接口IGitHubApi1.3 创建RefitGitHubService1. 实现接口2. 注册服务 1.4 修改使用方法二、Http resilience2.1 安装所需要的包2.2 创建resilience pipeline简单版2.3 创建全局的resilience处理1. 创建清理全局ResilienceHan…...

编程日记 2025/7/21 11:55:30

Rust 学习笔记：关于枚举与模式匹配的练习题

Rust 学习笔记：关于枚举与模式匹配的练习题 Rust 学习笔记：关于枚举与模式匹配的练习题以下程序能否通过编译？若能，输出是什么？考虑这两种表示结果类型的方式，若计算成功，则包含值 T&#xff1b…...

编程日记 2025/6/29 6:25:04

父子组件双向绑定

v-model 语法糖实现 vue中我们在input中可以直接使用v-model来完成双向绑定，这个时候 v-model 通常会帮我们完成两件事： v-bind:value的数据绑定@input的事件监听如果我们现在封装了一个组件，其他地方在使用这个组件时，是否也可以使用v-model来同时完成这两个功能呢？当我…...

编程日记 2025/6/29 5:37:17

系统思考与第一性原理

最近一直有客户提到“第一性原理”，希望借此穿透纷繁复杂的现象，看清事情的本质。我第一反应是：这与系统思考中的冰山模型不谋而合。冰山模型中提到：我们看到的只是表面事件，事件背后有趋势，趋势背后有结…...

编程日记 2025/6/29 7:19:53

基于Redis实现-UV统计

基于Redis实现-UV统计本文将使用HyperLogLog来实现UV统计。首先我们搞懂两个概念： UV：全称Unique Visitor，也叫独立访客量，是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站，只记录一次…...

编程日记 2025/6/29 5:22:26

【iOS】类与对象底层探索

类与对象底层探索 Clang探索对象本质objc_setProperty源码探索cls与类的关联原理isa的类型isa_t原理探索类&类的结构什么是元类NSObject到底有几个isa走位&继承关系图objc_class&objc_object 类结构分析计算cache类中的内存大小获取bits属性列表（prope…...

编程日记 2025/6/29 5:21:28

2025年- H18-Lc126-54.螺旋矩阵（矩阵）---java版

1.题目描述 2.思路* 思路1： 补充2： directions[1][0] // 表示“下”这个方向的行增量（1） directions[1][1] // 表示“下”这个方向的列增量（0） int[][] directions {{0, 1}, {1, 0}, {0, -1}, {-…...

编程日记 2025/6/29 5:48:52

Paddle Serving|部署一个自己的OCR识别服务器

前言之前使用C部署了自己的OCR识别服务器，Socket网络传输部分是自己写的，回过头来一看，自己犯傻了，PaddleOCR本来就有自己的OCR服务器项目，叫PaddleServing，这里记录一下部署过程。 1 下载依赖环境 1.1 …...

编程日记 2025/6/29 5:55:34

yolov5 本地训练

YOLOv5 | Kaggle 直接gitclone他的源码用Vscode看（也可以直接把jupyter下下来） 他要1.8，我的是2.7，他这个代码可能有点年头了两年前了他的环境我的环境我就是不懂为什么清华源的torch windows默认下出来是cpu版本 . 在终端…...

编程日记 2025/6/29 6:50:22

同城跑腿小程序帮取帮送接单抢单预约取件智能派单同城配送全开源运营版源码优创

一、源码描述这是一套同城跑腿小程序，基于FastadminUniapp框架，全开源无加密，可私有化部署，包含用户端、骑手端和运营端（后端），支持帮取/帮送模式，支持一键接单/抢单，主…...

编程日记 2025/6/29 8:04:06

基于SpringBoot的药房药品销售管理系统

作者：计算机学姐开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等，“文末源码”。专栏推荐：前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码精品专栏：…...

编程日记 2025/6/29 5:29:12

机器学习中的学习率及其衰减方法全面解析

摘要： 本文深入解析机器学习中的学习率及其衰减方法，涵盖学习率的作用、常用衰减参数及七种主流衰减策略（分段常数、指数、自然指数、多项式、余弦、线性余弦、噪声线性余弦）。通过公式推导与图示对比，揭示不同衰减方式…...

编程日记 2025/6/29 5:21:33

硬件性能与能效比竞赛：解码 PC 硬件的 “速度与激情”

引言：当性能遇见能效，一场永不停歇的算力革命在数字内容爆炸式增长的时代，无论是 4K/8K 游戏的极致画质追求，还是 AI 大模型的本地化部署需求，亦或是内容创作者对实时渲染的效率渴求，都在推动 PC 硬件走向…...

编程日记 2025/6/29 6:09:31

大模型在终末期肾脏病风险预测与临床方案制定中的应用研究

目录一、引言 1.1 研究背景与意义 1.2 研究目的与创新点 1.3 研究方法与数据来源二、终末期肾脏病概述 2.1 定义与诊断标准 2.2 发病机制与影响因素 2.3 现状与危害三、大模型技术原理及应用现状 3.1 大模型基本原理 3.2 在医疗领域应用案例 3.3 在终末期肾脏病…...

编程日记 2025/6/29 7:19:41

【C++11】智能指针

📝前言： 这篇文章我们来讲讲C11——智能指针： 🎬个人简介：努力学习ing 📋个人专栏：C学习笔记 🎀CSDN主页愚润求学 🌄其他专栏：C语言入门基础，pyt…...

编程日记 2025/6/29 5:21:18

华为云Astro轻应用利用自定义连接器调用第三方接口实际操作

样图说明华为云Astro轻应用通过自定义连接器调用第三方接口具有多方面的作用，主要体现在以下几点：扩展功能与集成能力调用第三方服务：通过配置自定义连接器，Astro轻应用可以调用第三方提供的Rest协议接口，实现第三方提供的业务功能，扩展应用的能力。集成外部系统：…...

编程日记 2025/6/29 6:30:14

【中间件】brpc_基础_butex.h

butex.h 学习笔记源码 1 概述 butex.h 提供了一种用户态同步原语 butex（类似 Linux 的 futex），专为 bthread 设计，用于高效协调线程的阻塞与唤醒。其核心是通过原子操作结合等待队列管理，减少内核态切换开销&#…...

编程日记 2025/6/29 5:21:19

数字智慧方案5876丨智慧交通枢纽智能化系统建设方案（56页PPT）（文末有下载方式）

篇幅所限，本文只提供部分资料内容，完整资料请看下面链接 https://download.csdn.net/download/2301_78256053/89575493 资料解读：智慧交通枢纽智能化系统建设方案详细资料请看本解读文章的最后内容。随着城市化进程的加速，交…...

编程日记 2025/6/29 7:45:22

深度学习笔记40_中文文本分类-Pytorch实现

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊 | 接辅导、项目定制一、我的环境 1.语言环境：Python 3.8 2.编译器：Pycharm 3.深度学习环境： torch1.12.1cu113torchvision…...

编程日记 2025/7/21 7:49:23

python设置word字体的方法

在Python中，可以使用python-docx库来设置Word文档的字体样式，以下为具体方法和示例代码： 一、设置段落中字体样式使用python-docx库时，Word文档中的文本通常被组织成段落（Paragraph对象），而一…...

编程日记 2025/7/13 23:13:17

golang常用库之-标准库text/template

文章目录 golang常用库之-标准库text/template背景什么是text/templatetext/template库的使用 golang常用库之-标准库text/template 背景在许多编程场景中，我们经常需要把数据按照某种格式进行输出，比如生成HTML页面，或者生成配置文件。这…...

编程日记 2025/7/13 14:25:58

【JAVA】如何快速阅读一个基于maven构建的springboot项目

一、摘要在JAVA项目开发过程中，现在比较流行的是springboot机构，特别是在后端开发的项目中，springboot应用的非常普遍。springboot很好将大型的、复杂的项目进行分解，以模块或者服务的表现形式组成项目。那么当我们接手一个陌生的…...

编程日记 2025/6/29 7:45:39