当前位置：首页 > news >正文

day11 python超参数调整

news 来源：原创 2025/9/18 18:50:12

模型组成：模型 = 算法 + 实例化设置的外参（超参数）+ 训练得到的内参
调参评估：调参通常需要进行两次评估。若不使用交叉验证，需手动划分验证集和测试集；但许多调参方法自带交叉验证功能，实际中可省略该步骤
超参数学习：每个模型都有对应超参数且各具意义。若仅为追求精度或完成科研，可直接使用调参工具，无需深入研究每个超参数原理

一、数据预处理

首先执行数据预处理代码，为后续模型训练做准备：

import pandas as pd    # 用于数据处理和分析，支持表格数据操作
import numpy as np     # 用于高效的数值计算，提供数组操作功能
import matplotlib.pyplot as plt    # 用于绘制各类图表
import seaborn as sns   # 基于matplotlib的高级绘图库，生成美观的统计图形# 设置中文字体，解决中文显示问题
plt.rcParams['font.sans-serif'] = ['SimHei']  # Windows系统常用黑体字体
plt.rcParams['axes.unicode_minus'] = False    # 确保负号正常显示
data = pd.read_csv('data.csv')    # 读取数据# 筛选字符串类型变量
discrete_features = data.select_dtypes(include=['object']).columns.tolist()# Home Ownership 标签编码
home_ownership_mapping = {'Own Home': 1,'Rent': 2,'Have Mortgage': 3,'Home Mortgage': 4
}
data['Home Ownership'] = data['Home Ownership'].map(home_ownership_mapping)# Years in current job 标签编码
years_in_job_mapping = {'< 1 year': 1,'1 year': 2,'2 years': 3,'3 years': 4,'4 years': 5,'5 years': 6,'6 years': 7,'7 years': 8,'8 years': 9,'9 years': 10,'10+ years': 11
}
data['Years in current job'] = data['Years in current job'].map(years_in_job_mapping)# Purpose 独热编码，并将bool类型转换为数值
data = pd.get_dummies(data, columns=['Purpose'])
data2 = pd.read_csv("data.csv") # 重新读取原始数据，用于列名对比
list_final = [] # 新建空列表，存储独热编码后新增的特征名
for i in data.columns:if i not in data2.columns:list_final.append(i) # 保存独热编码后的特征名
for i in list_final:data[i] = data[i].astype(int) # 将独热编码后的特征转换为整数类型# Term 0 - 1 映射
term_mapping = {'Short Term': 0,'Long Term': 1
}
data['Term'] = data['Term'].map(term_mapping)
data.rename(columns={'Term': 'Long Term'}, inplace=True) # 重命名列# 筛选连续型特征列名
continuous_features = data.select_dtypes(include=['int64', 'float64']).columns.tolist()# 用中位数填充连续型特征的缺失值
for feature in continuous_features:     mode_value = data[feature].mode()[0]            # 获取该列的众数data[feature].fillna(mode_value, inplace=True)  # 用众数填充缺失值，直接修改原数据

二、数据集划分

2.1 两次划分数据集（演示）

由于调参需两次评估，这里演示如何两次划分数据集（因相关函数一次只能划分一次）：

from sklearn.model_selection import train_test_split
X = data.drop(['Credit Default'], axis=1)  # 提取特征，按列删除指定列
y = data['Credit Default']  # 提取标签# 第一次划分：80%训练集，20%临时集
X_train, X_temp, y_train, y_temp = train_test_split(X, y, test_size=0.2, random_state=42)# 第二次划分：临时集再分为50%验证集和50%测试集
X_val, X_test, y_val, y_test = train_test_split(X_temp, y_temp, test_size=0.5, random_state=42)print("Data shapes:")
print("X_train:", X_train.shape)
print("y_train:", y_train.shape)
print("X_val:", X_val.shape)
print("y_val:", y_val.shape)
print("X_test:", X_test.shape)
print("y_test:", y_test.shape)

运行结果：

Data shapes:
X_train: (6000, 31)
y_train: (6000,)
X_val: (750, 31)
y_val: (750,)
X_test: (750, 31)
y_test: (750,)

2.2 一次划分数据集（实际使用）

考虑到多数调参函数自带交叉验证，实际中常进行一次划分（8:2 划分训练集和测试集）：

from sklearn.model_selection import train_test_split
X = data.drop(['Credit Default'], axis=1)  # 提取特征
y = data['Credit Default'] # 提取标签# 80%训练集，20%测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

三、超参数调整方法概述

常见的超参数调整方法包括随机搜索、网格搜索和贝叶斯优化。在正式调参前，先构建基线模型（使用默认参数的 RandomForestClassifier），作为性能对比基准。

3.1 网格搜索 (GridSearchCV)

原理：定义参数网格（param_grid），穷举所有参数组合进行评估
缺点：计算成本高，参数组合随参数数量呈指数级增长，通常需缩小搜索范围或结合预筛选

3.2 随机搜索 (RandomizedSearchCV)

原理：定义参数分布，在指定次数内随机采样评估
优势：在高维参数空间中效率更高，较少迭代次数即可找到较优参数

3.3 贝叶斯优化 (BayesSearchCV from skopt)

原理：基于历史评估结果构建概率模型（如高斯过程），预测最优参数组合
优势：尤其适用于模型训练耗时场景，能用更少迭代次数达到更好性能

选择建议：计算资源充足选网格搜索；资源有限选贝叶斯优化；随机搜索应用相对较少。

四、模型训练与调参实战

4.1 默认参数的随机森林（基线模型）

import time 
print("--- 1. 默认参数随机森林 (训练集 -> 测试集) ---")
start_time = time.time() # 记录开始时间from sklearn.ensemble import RandomForestClassifier # 导入随机森林分类器
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score # 评估指标
from sklearn.metrics import classification_report, confusion_matrix # 生成分类报告和混淆矩阵
import warnings # 用于忽略警告信息
warnings.filterwarnings("ignore") # 忽略所有警告rf_model = RandomForestClassifier(random_state=42)
rf_model.fit(X_train, y_train) # 在训练集上训练
rf_pred = rf_model.predict(X_test) # 在测试集上预测end_time = time.time() # 记录结束时间
print(f"训练与预测耗时: {end_time - start_time:.4f} 秒")
print("\n默认随机森林 在测试集上的分类报告：")
print(classification_report(y_test, rf_pred))
print("默认随机森林 在测试集上的混淆矩阵：")
print(confusion_matrix(y_test, rf_pred))

运行结果：

--- 1. 默认参数随机森林 (训练集 -> 测试集) ---
训练与预测耗时: 0.9972 秒默认随机森林 在测试集上的分类报告：precision    recall  f1-score   support0       0.77      0.97      0.86      10591       0.79      0.30      0.43       441accuracy                           0.77      1500macro avg       0.78      0.63      0.64      1500
weighted avg       0.77      0.77      0.73      1500默认随机森林 在测试集上的混淆矩阵：
[[1023   36][ 309  132]]

4.2 网格搜索优化随机森林

print("\n--- 2. 网格搜索优化随机森林 (训练集 -> 测试集) ---")
from sklearn.model_selection import GridSearchCV# 定义参数搜索网格
param_grid = {'n_estimators': [50, 100, 200],'max_depth': [None, 10, 20, 30],'min_samples_split': [2, 5, 10],'min_samples_leaf': [1, 2, 4]
}# 创建网格搜索对象
grid_search = GridSearchCV(estimator=RandomForestClassifier(random_state=42), # 随机森林分类器param_grid=param_grid, # 参数网格cv=5, # 5折交叉验证n_jobs=-1, # 使用所有可用CPU核心并行计算scoring='accuracy' # 以准确率为评分标准
)start_time = time.time()
grid_search.fit(X_train, y_train) # 在训练集上执行网格搜索
end_time = time.time()print(f"网格搜索耗时: {end_time - start_time:.4f} 秒")
print("最佳参数: ", grid_search.best_params_) # 获取最佳参数组合# 使用最佳参数模型进行预测
best_model = grid_search.best_estimator_ # 获取最佳模型
best_pred = best_model.predict(X_test) # 在测试集上预测print("\n网格搜索优化后的随机森林 在测试集上的分类报告：")
print(classification_report(y_test, best_pred))
print("网格搜索优化后的随机森林 在测试集上的混淆矩阵：")
print(confusion_matrix(y_test, best_pred))

运行结果：

--- 2. 网格搜索优化随机森林 (训练集 -> 测试集) ---
网格搜索耗时: 56.7938 秒
最佳参数:  {'max_depth': 20, 'min_samples_leaf': 1, 'min_samples_split': 2, 'n_estimators': 200}网格搜索优化后的随机森林 在测试集上的分类报告：precision    recall  f1-score   support0       0.76      0.97      0.86      10591       0.80      0.28      0.42       441accuracy                           0.77      1500macro avg       0.78      0.63      0.64      1500
weighted avg       0.77      0.77      0.73      1500网格搜索优化后的随机森林 在测试集上的混淆矩阵：
[[1028   31][ 317  124]]

4.3 贝叶斯优化随机森林

print("\n--- 3. 贝叶斯优化随机森林 (训练集 -> 测试集) ---")
from skopt import BayesSearchCV
from skopt.space import Integer
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix
import time# 定义参数搜索空间
search_space = {'n_estimators': Integer(50, 200),'max_depth': Integer(10, 30),'min_samples_split': Integer(2, 10),'min_samples_leaf': Integer(1, 4)
}# 创建贝叶斯优化搜索对象
bayes_search = BayesSearchCV(estimator=RandomForestClassifier(random_state=42),search_spaces=search_space,n_iter=32,  # 迭代次数cv=5, # 5折交叉验证n_jobs=-1,scoring='accuracy'
)start_time = time.time()
bayes_search.fit(X_train, y_train) # 在训练集上执行贝叶斯优化
end_time = time.time()print(f"贝叶斯优化耗时: {end_time - start_time:.4f} 秒")
print("最佳参数: ", bayes_search.best_params_)# 使用最佳参数模型进行预测
best_model = bayes_search.best_estimator_
best_pred = best_model.predict(X_test)print("\n贝叶斯优化后的随机森林 在测试集上的分类报告：")
print(classification_report(y_test, best_pred))
print("贝叶斯优化后的随机森林 在测试集上的混淆矩阵：")
print(confusion_matrix(y_test, best_pred))

运行结果：

--- 3. 贝叶斯优化随机森林 (训练集 -> 测试集) ---
贝叶斯优化耗时: 43.6849 秒
最佳参数:  OrderedDict([('max_depth', 21), ('min_samples_leaf', 3), ('min_samples_split', 4), ('n_estimators', 85)])贝叶斯优化后的随机森林 在测试集上的分类报告：precision    recall  f1-score   support0       0.76      0.97      0.85      10591       0.78      0.27      0.40       441accuracy                           0.76      1500macro avg       0.77      0.62      0.63      1500
weighted avg       0.77      0.76      0.72      1500贝叶斯优化后的随机森林 在测试集上的混淆矩阵：
[[1026   33][ 321  120]]

4.4 另一种贝叶斯优化实现（拓展）

此方法可自定义目标函数、灵活控制交叉验证，通过 verbose 参数输出中间过程：

print("\n--- 3. 贝叶斯优化随机森林 (训练集 -> 测试集) ---")
from bayes_opt import BayesianOptimization
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import cross_val_score
from sklearn.metrics import classification_report, confusion_matrix
import time
import numpy as np# 假设 X_train, y_train, X_test, y_test 已定义# 定义目标函数，使用交叉验证评估模型性能
def rf_eval(n_estimators, max_depth, min_samples_split, min_samples_leaf):n_estimators = int(n_estimators)max_depth = int(max_depth)min_samples_split = int(min_samples_split)min_samples_leaf = int(min_samples_leaf)model = RandomForestClassifier(n_estimators=n_estimators,max_depth=max_depth,min_samples_split=min_samples_split,min_samples_leaf=min_samples_leaf,random_state=42)scores = cross_val_score(model, X_train, y_train, cv=5, scoring='accuracy')return np.mean(scores)# 定义参数搜索空间
pbounds_rf = {'n_estimators': (50, 200),'max_depth': (10, 30),'min_samples_split': (2, 10),'min_samples_leaf': (1, 4)
}# 创建贝叶斯优化对象，设置verbose=2显示详细迭代信息
optimizer_rf = BayesianOptimization(f=rf_eval,  # 目标函数pbounds=pbounds_rf,  # 参数空间random_state=42,  # 随机种子verbose=2  # 显示详细迭代信息
)start_time = time.time()
# 开始贝叶斯优化
optimizer_rf.maximize(init_points=5,  # 初始随机采样点数n_iter=32  # 迭代次数
)
end_time = time.time()print(f"贝叶斯优化耗时: {end_time - start_time:.4f} 秒")
print("最佳参数: ", optimizer_rf.max['params'])# 使用最佳参数的模型进行预测
best_params = optimizer_rf.max['params']
best_model = RandomForestClassifier(n_estimators=int(best_params['n_estimators']),max_depth=int(best_params['max_depth']),min_samples_split=int(best_params['min_samples_split']),min_samples_leaf=int(best_params['min_samples_leaf']),random_state=42
)
best_model.fit(X_train, y_train)
best_pred = best_model.predict(X_test)print("\n贝叶斯优化后的随机森林 在测试集上的分类报告：")
print(classification_report(y_test, best_pred))
print("贝叶斯优化后的随机森林 在测试集上的混淆矩阵：")
print(confusion_matrix(y_test, best_pred))

通过实践掌握了随机森林模型超参数调整方法，网格搜索虽能找到较优解但计算耗时久，随机搜索效率高但稳定性不足，贝叶斯优化结合历史数据预测最优参数组合，在效率与效果间取得平衡，同时也意识到数据预处理和数据集划分对模型性能的重要影响。

@浙大疏锦行

day11 python超参数调整

模型组成：模型算法实例化设置的外参（超参数） 训练得到的内参调参评估：调参通常需要进行两次评估。若不使用交叉验证，需手动划分验证集和测试集；但许多调参方法自带交叉验证功能，实际中可省略…...

编程日记 2025/9/18 18:50:12

Linux C++ xercesc xml 怎么判断路径下有没有对应的节点

在Linux环境下使用Xerces-C库处理XML文件时，判断路径下是否存在对应的节点可以通过以下几个步骤实现： 加载XML文档首先，你需要加载XML文档。这可以通过创建一个xercesc::DOMParser对象并使用它的parse方法来实现。 #include <xercesc/…...

编程日记 2025/9/18 18:48:03

罗技K580蓝牙键盘连接mac pro

罗技K580蓝牙键盘，满足了我们的使用需求。最棒的是，它能够同时连接两个设备，通过按F11和F12键进行切换，简直不要太方便！ 连接电脑 💻 USB连接 1、打开键盘：双手按住凹槽两边向前推&#xff0…...

编程日记 2025/9/18 18:49:22

Socket-UDP

Socket（套接字 ）是计算机网络中用于实现进程间通信的重要编程接口，是对 TCP/IP 协议的封装 ，可看作是不同主机上应用进程之间双向通信端点的抽象。以下是详细介绍： 作用与地位作为应用层与传输层、网络层协议间的中…...

编程日记 2025/9/18 18:48:02

【游戏ai】从强化学习开始自学游戏ai-2 使用IPPO自博弈对抗pongv3环境

文章目录前言一、环境设计二、动作设计三、状态设计四、神经网路设计五、效果展示其他问题总结前言本学期的大作业，要求完成多智能体PPO的乒乓球对抗环境，这里我使用IPPO的方法来实现。正好之前做过这个单个PPO与pong环境内置的ai对抗的训练&#…...

编程日记 2025/9/18 18:46:20

LeRobot 项目部署运行逻辑（三）——机器人及舵机配置

Lerobot 目前的机器人硬件以舵机类型为主，并未配置机器人正逆运动学及运动学，遥操作映射以舵机关节角度为主因此，需要在使用前需要对舵机各项参数及初始位置进行配置目录 1 Mobile ALOHA 配置 2 Dynamixel 配置 2.1 配置软件 2.2 SDK …...

编程日记 2025/9/18 18:49:24

Ubuntu20.04安装NVIDIA Warp

Ubuntu20.04安装NVIDIA Warp 安装测试 Warp的gitee网址 Warp的github网址写在前面：建议安装前先参考readme文件自检系统驱动和cuda是否支持，个人实测建议是python3.9，但python3.8.20也可以使用。写在前面：后续本人可能会使用这…...

编程日记 2025/9/18 18:46:22

电子病历高质量语料库构建方法与架构项目（临床情景理解模块篇）

引言随着人工智能技术在医疗健康领域的广泛应用，电子病历（Electronic Medical Records，EMR）作为临床医疗数据的重要载体，已成为医学研究和临床决策支持的关键资源。电子病历高质量语料库的构建为医疗人工智能模型的训练和应用提供了基础支撑，其中临床情境理解模块是连接…...

编程日记 2025/9/18 18:46:23

WPF性能优化集锦一、UI渲染性能优化 1. 虚拟化技术 ListView/GridView虚拟化： <ListView VirtualizingStackPanel.IsVirtualizing="True"VirtualizingStackPanel.VirtualizationMode="Recycling"ScrollViewer.IsDeferredScrollingEnabled=…...

编程日记 2025/9/18 18:49:12

【CUDA pytorch】

ev win10 3050ti 联想笔记本 nvcc --version 得到 PS C:\Users\25515> nvcc --version nvcc: NVIDIA (R) Cuda compiler driver Copyright (c) 2005-2022 NVIDIA Corporation Built on Tue_May__3_19:00:59_Pacific_Daylight_Time_2022 Cuda compilation tools, release …...

编程日记 2025/9/18 18:46:38

mac下载homebrew 安装和使用git

mac下载homebrew 安装和使用git 本人最近从windows换成mac，记录一下用homebrew安装git的过程打开终端 command 空格，搜索终端安装homebrew 在终端中输入下面命令，来安装homebrew /bin/bash -c "$(curl -fsSL https://raw.githu…...

编程日记 2025/9/18 18:46:21

Elasticsearch入门速通01：核心概念与选型指南

一、Elasticsearch 是什么？ 一句话定义： 开源分布式搜索引擎，擅长处理海量数据的实时存储、搜索与分析，是ELK技术栈（ElasticsearchKibanaBeatsLogstash）的核心组件。核心能力： 近实时搜索&…...

编程日记 2025/9/18 18:48:04

应对过度处方挑战：为药物推荐任务微调大语言模型(Xiangnan He)

Abstract 药物推荐系统因其有潜力根据患者的临床数据提供个性化且有效的药物组合，在医疗保健领域备受关注。然而，现有方法在适应不同的电子健康记录（EHR）系统以及有效利用非结构化数据方面面临挑战，导致其泛化能力有限…...

编程日记 2025/9/7 2:09:54

41 python http之requests 库

Python 的requests库就像你的 "接口助手"，用几行代码就能发送 HTTP 请求，自动处理复杂的网络交互，让你告别手动拼接 URL 和解析响应的痛苦！一、快速入门：3 步搞定基本请求 1.1 安装库：一键开启助手功能 pip install requests 1.2 发送 GET 请求 import r…...

编程日记 2025/9/9 9:41:11

百度网盘golang实习面经

goroutine内存泄漏的情况？如何避免？ goroutine内存泄漏基本上是因为异常导致阻塞, 可以导致阻塞的情况 1 死锁, goroutine 等待的锁发生了死锁情况 2 chan没有正常被关闭,导致读取读chan的goroutine阻塞如何避免 1 避免死锁 2 正常关闭 3 使用context管…...

编程日记 2025/9/10 0:12:55

super_small_toy_tpu

super_small_toy_tpu 小狼http://blog.csdn.net/xiaolangyangyang 1、基础框图 2、源码下载： GitHub - dldldlfma/super_small_toy_tpu 3、安装iverilog、vvp、gtkwave windows安装：https://bleyer.org/icarus/ ubuntu安装：sudo ap…...

编程日记 2025/9/18 12:36:55

Redis缓存穿透、缓存击穿与缓存雪崩：如何在.NET Core中解决

在高并发的互联网系统中，缓存技术作为优化系统性能的重要手段，已被广泛应用。然而，缓存系统本身也存在一些常见的问题，尤其是缓存穿透、缓存击穿和缓存雪崩。这些问题如果处理不当，可能导致系统性能严重下降&#x…...

编程日记 2025/9/14 23:00:16

驱动车辆诊断测试创新 | 支持诊断测试的模拟器及数据文件转换生成

一背景和挑战 | 背景： 随着汽车功能的日益丰富，ECU和域控制器的复杂性大大增加，导致测试需求大幅上升，尤其是在ECU的故障诊断和性能验证方面。然而，传统的实车测试方法难以满足高频率迭代和验证需求，不仅…...

编程日记 2025/9/4 21:42:59

VS Code技巧2：识别FreeCAD对象

在使用VS Code阅读FreeCAD代码或者FreeCAD的工作台代码时，VS Code无法识别FreeCAD对象，会提示Import “FreeCAD” could not be resolved： 问题解决如下几步即可。第一步：确认 FreeCAD 的 Python 环境路径在FreeCAD的Python控制…...

编程日记 2025/9/10 2:09:12

泰迪杯特等奖案例学习资料：基于多模态融合与边缘计算的智能温室环境调控系统

（第十二届泰迪杯数据挖掘挑战赛特等奖案例解析）一、案例背景与核心挑战 1.1 应用场景与行业痛点在现代设施农业中，温室环境调控直接影响作物产量与品质。传统温室管理存在以下问题：环境参数耦合性高：温度、湿度、光照、CO₂浓度等参数相互影响，人工调控易顾此失彼。…...

编程日记 2025/9/3 12:42:12

猿人学web端爬虫攻防大赛赛题第13题——入门级cookie

1. F12开发者模式刷新第一页，仔细研究发现里面有三次请求名为13的请求，根据题目提示cookie关键字，所以主要留意请求和响应的cookie值。三次请求都带了sessionid，说明存在session（后面写代码要用session来写&#x…...

编程日记 2025/9/17 5:51:29

机器指标监控技术方案

文章目录机器指标监控技术方案架构图组件简介Prometheus 简介核心特性适用场景 Grafana 简介核心特性适用场景 Alertmanager 简介核心特性适用场景数据采集机器Node ExporterMySQL ExporterRedis ExporterES ExporterRocketMQ ExporterSpringcloud ExporterNacos 数据存储短期…...

编程日记 2025/9/7 3:29:57

数据库设计理论：从需求分析到实现的全流程解析

引言在当今信息爆炸的时代，数据已成为企业和组织最宝贵的资产之一。如何有效地组织、存储和管理这些数据，是数据库设计需要解决的核心问题。一个优秀的数据库设计能够提高系统性能，确保数据一致性，降低维护成本，而糟…...

编程日记 2025/9/11 16:36:22

一文详解 Linux下的开源打印系统CUPS（Common UNIX Printing System）

文章目录前言一、CUPS 简介二、CUPS 常用指令解析2.1 安装 CUPS2.2 启动/重启服务2.3 添加打印机（核心操作）2.4 设置默认打印机2.5 打印文件2.6 查看打印任务2.7 取消打印任务2.8 查看、移除已添加的打印机三、调试与常见问题3.1 日志查看3.2 驱动问题…...

编程日记 2025/9/15 6:57:46

uniapp打包apk详细教程

目录 1.打apk包前提条件 2.获取uni-app标识 3.进入dcloud开发者后台 4.开始打包 1.打apk包前提条件 1.在HBuilderX.exe软化中，登录自己的账号 2.在dcloud官网，同样登录自己的账号。没有可以免费注册。 2.获取uni-app标识获取方法：点…...

编程日记 2025/9/12 1:28:45

C++初阶-string类2

目录 1.迭代器 1.1普通迭代器的使用 1.2string::begin 1.3string::end 1.4const迭代器的使用 1.5泛型迭代器和const反向迭代器 1.6string::rbegin 1.6string::rend 1.7string::cbegin、string::cend、string::crbegin、string::crend 与begin/end、rbegin/rend的区别 …...

编程日记 2025/9/9 0:23:21

Qt QComboBox 下拉复选多选（multicombobox）

Qt QComboBox 下拉复选多选（multicombobox），备忘，待更多测试【免费】QtQComboBox下拉复选多选（multicombobox）资源-CSDN文库...

编程日记 2025/8/17 13:58:19

逻辑回归之参数选择：从理论到实践

在机器学习的广阔领域中，逻辑回归作为一种经典的有监督学习算法，常用于解决分类问题。它以其简单易懂的原理和高效的计算性能，在实际应用中备受青睐。然而，要充分发挥逻辑回归的优势，参数选择是关键环节。本文将结合信…...

编程日记 2025/9/3 9:23:29

10、属性和数据处理---c++17

一、[[fallthrought]] 用途：在 switch 语句中标记某个分支 (case) 故意不写 break，明确告知编译器“执行穿透”是有意为之。仅在需要向下穿透时使用，且应添加注释说明原因 #include<cstdio> #include<iostream> using namesp…...

编程日记 2025/9/6 14:11:19

conda管理python环境

安装conda 使用anaconda官网安装地址：https://www.anaconda.com/download/success 配置镜像环境 conda config --add channels Index of /anaconda/pkgs/main/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror conda config --add channels Index of /an…...

编程日记 2025/9/16 2:47:47

【Python学习路线】零基础到项目实战系统

目录 🌟 前言技术背景与价值当前技术痛点解决方案概述目标读者说明 🧠 一、技术原理剖析核心概念图解核心作用讲解关键技术模块说明技术选型对比 💻 二、实战演示环境配置要求核心代码实现运行结果验证 ⚡ 三、性能对比测试方法论量化数据对比…...

编程日记 2025/9/10 14:03:10

C/C++核心机制深度解析：指针、结构体与动态内存管理（面试精要）

C/C核心机制深度解析：指针、结构体与动态内存管理（面试精要） 引言在系统级编程领域，C/C语言凭借对硬件的直接操作能力和高效的内存管理机制，长期占据主导地位。面试中，指针、结构体和动态内存管理作为三…...

编程日记 2025/9/18 18:10:17

宇树科技举办“人型机器人格斗大赛”

2025 年 5 月至 6 月，一场全球瞩目的科技盛宴 —— 全球首场 “人形机器人格斗大赛”，将由杭州宇树科技盛大举办。届时，观众将迎来机器人格斗领域前所未有的视觉震撼。为打造最强参赛阵容，宇树科技技术团队在过去数周里&#xf…...

编程日记 2025/9/11 19:11:08

getattr 的作用

getattr 是 Python 内置的一个函数，用于“动态地”获取对象的属性。**它允许你在运行时通过属性名称（字符串形式）来访问对象的属性，而不用在代码中直接硬编码属性名。**下面详细介绍该方法的用法和注意事项： ────…...

编程日记 2025/9/17 15:13:10

腾讯云服务器性能提升全栈指南（2025版）

腾讯云服务器性能提升全栈指南（2025版） 一、硬件选型与资源优化 1. 实例规格精准匹配腾讯云服务器提供计算型CVM、内存型MEM、大数据型Hadoop等12种实例类型。根据业务特性选择： • 高并发Web应用：推荐SA3实例&#xff0…...

编程日记 2025/8/17 11:56:46

Kotlin与Jetpack Compose的详细使用指南

Kotlin与Jetpack Compose的详细使用指南，综合最新技术实践和官方文档整理： 一、环境配置与基础架构 ‌项目创建‌ 在Android Studio中选择Empty Compose Activity模板，默认生成包含Composable预览的MainActivity2要求Kotlin版本≥1.8.0&…...

编程日记 2025/9/8 0:30:29

潇洒郎： 100% 成功搭建Docker私有镜像仓库并管理、删除镜像

1、Registry Web管理界面 2、拉取Registry-Web镜像创建配置文件 tee /opt/zwx-registry/web-config.yml <<-EOF registry:url: http://172.28.73.90:8010/v2name: registryreadonly: falseauth:enabled: false EOF 拉取docker-registry-web镜像并绑定Registry仓库 …...

编程日记 2025/9/3 8:01:23

【Spring Boot 注解】@ConfigurationProperties

文章目录 ConfigurationProperties注解一、简介二、依赖引入三、基本用法四、主要特性五、激活方式六，优点七、与 Value 对比 ConfigurationProperties注解一、简介 ConfigurationProperties 是 Spring Boot 提供的一个强大注解，用于将外部配置&#…...

编程日记 2025/9/11 4:13:19

阿里云服务迁移实战: 06-切换DNS

概述按前面的步骤，所有服务迁移完毕之后，最后就剩下 DNS 解析修改了。修改解析在域名解析处，修改域名的解析地址即可。如果 IP 已经过户到了新账号，则不需要修改解析。何确保业务稳定域名解析更换时，由于 D…...

编程日记 2025/9/15 3:09:12

Java实现归并排序算法

1. 归并排序原理图解归并排序是一种分治算法，其核心思想是将数组分成两半，分别对这两半进行排序，然后将排序后的两半合并。以下是归并排序的步骤： 1. 分治： - 将数组分成两半。 - 递归地对每半部分进行归并排序。 2. …...

编程日记 2025/9/8 2:10:55

Vue 项目中运行 `npm run dev` 时发生的过程

步骤1：找到「任务说明书」(package.json) 当你输入 npm run dev，系统首先会去查项目的「任务说明书」（即 package.json 文件），看看 dev 这个任务具体要做什么。示例代码（package.json 片段）…...

编程日记 2025/9/12 16:58:47

Python3（19）数据结构

在 Python 编程中，数据结构是组织和存储数据的重要方式，合理选择和使用数据结构能显著提升程序的效率和可读性。这篇博客通过丰富的代码示例深入学习 Python3 的数据结构知识，方便日后复习回顾。一、列表（List） 1.1…...

编程日记 2025/9/12 6:40:40

macOS 安装了Docker Desktop版终端docker 命令没办法使用

macOS 安装了Docker Desktop版终端docker 命令没办法使用 1、检查Docker Desktop能否正常运行。确保Docker Desktop能正常运行。 2、检查环境变量是否添加 1、添加环境变量如果环境变量中没有包含Docker的路径，你可以手动添加。首先，找到Docker的…...

编程日记 2025/9/15 6:54:50

VR 汽车线束培训：探索高效学习新路径

在汽车线束生产领域，VR 汽车线束培训对于新员工的成长至关重要，它是一个关键环节，直接影响着生产效率和产品质量。传统的培训方式，通常是新员工在老员工的指导下，通过实际操作来学习线束装配流程。这种方式不仅耗费大量…...

编程日记 2025/9/18 12:37:30

k8s术语之Deployment

Deployment为Pod和Replica Set(下一代Replication Controller)提供声明式更新您只需要在Deployment中描述您想要的目标状态是什么，Deployment controller就会帮您将Pod和ReplicaSet的实际状态改变到您的目标状态。您可以定义一个全新的Deployment Controller的职责…...

编程日记 2025/9/15 10:19:30

对js的Date二次封装，继承了原Date的所有方法，增加了自己扩展的方法，可以实现任意时间往前往后推算多少小时、多少天、多少周、多少月；

封装js时间工具概述该方法继承了 js 中 Date的所有方法；同时扩展了一部分自用方法： 1、任意时间往前推多少小时，天，月，周；参数1、2必填，参数3可选beforeDate(num,formatter,dateVal); befo…...

编程日记 2025/9/10 2:09:07

17、商品管理：魔药商店运营——React 19 CRUD实现

一、魔药商店的炼金基石 1. 魔药配方契约（数据模型设计） // 预言池契约（Supabase Schema） interface Potion { id: uuid, name: string, effect: healing | transformation | attack, stock: number, moonSensitive: boo…...

编程日记 2025/8/25 0:22:17

2025-04-30 AIGC-如何做短片视频

摘要: 2025-04-30 AIGC-如何做短片视频如何做短片视频: 一、画图修图 1.保存视频（无水保存） 2.文案提取（提取文案） 3. DeepSeek(提示词） 4.小梦Ai（图片视频） 5.修图Ai 6.扩图Ai 7.养生…...

编程日记 2025/9/18 14:04:39

【自然语言处理与大模型】如何获取特定领域的微调数据集？

在特定领域中，数据集通常由提出需求的一方提供。然而，在某些情况下，如果他们未能提供所需的数据，或者你正在独立开展一个项目，并且需要相应的数据来推进工作，这时你应该怎么办呢？本文提供一种思…...

编程日记 2025/9/10 19:43:52

算法导论第6章思考题

6.3-2 func(A) 1 A.heap-sizeA.len 2 \quad for i ⌊ A . l e n 2 ⌋ \lfloor {A.len\over2}\rfloor ⌊2A.len⌋ downto 1 3 \qquad MAX-HEAPIFY(A,i) 对于第2行的循环控制变量i来说，为啥要求它是从 ⌊ A . l e n 2 ⌋ \lfloor {A.len\over2}\rfloor ⌊2A.len⌋…...

编程日记 2025/9/12 18:44:13

一、数据预处理

二、数据集划分

2.1 两次划分数据集（演示）

2.2 一次划分数据集（实际使用）

三、超参数调整方法概述

3.1 网格搜索 (GridSearchCV)

3.2 随机搜索 (RandomizedSearchCV)

3.3 贝叶斯优化 (BayesSearchCV from skopt)

四、模型训练与调参实战

4.1 默认参数的随机森林（基线模型）

4.2 网格搜索优化随机森林

4.3 贝叶斯优化随机森林

4.4 另一种贝叶斯优化实现（拓展）

相关文章：