当前位置：首页 > news >正文

Kaggler日志-Day4

news 来源：原创 2025/9/21 1:01:47

进度24/12/14

昨日复盘：
Pandas课程完成
Intermediate Mechine Learning2/7

今日记录：
Intermediate Mechine Learning之类型变量
读两篇讲解如何提问的文章，在提问区里发起一次提问
实战：自己从头到尾首先Housing Prices Competition for Kaggle Learn Users并成功提交

Intermediate Mechine Learning之管道（pipeline之前一直错译为工作流）

Categorical Variables

将学习三种处理类别特征的方式

我的文章里更倾向于将Variables翻译为特征
特征类型通常分为数值型和类别型

策略一：丢弃
策略二：顺序编码：为每一个种类分配一个独特的数值。不是所有的类型变量都能有一个排序来对应到顺序编码上，但是对于树形模型，有序编码通常可以很好地工作。
策略三：One-hot编码，为每一类创建新的列。通常在类型没有内在顺序时工作地很好，但是类型数量不能过多。

获取是字符类型的特征：

# Get list of categorical variables
s = (X_train.dtypes == 'object')
object_cols = list(s[s].index)print("Categorical variables:")
print(object_cols)

策略一：丢弃

drop_X_train = X_train.select_dtypes(exclude=['object'])
drop_X_valid = X_valid.select_dtypes(exclude=['object'])

策略二：顺序编码

from sklearn.preprocessing import OrdinalEncoder# Make copy to avoid changing original data 
label_X_train = X_train.copy()
label_X_valid = X_valid.copy()# Apply ordinal encoder to each column with categorical data
ordinal_encoder = OrdinalEncoder()
label_X_train[object_cols] = ordinal_encoder.fit_transform(X_train[object_cols])
label_X_valid[object_cols] = ordinal_encoder.transform(X_valid[object_cols])

问题出现，有些在train中没有出现过的类型应该如何处理，首先对数据进行探索，将类别列分成可以安全编码的列和不可以安全编码的列

# Categorical columns in the training data
object_cols = [col for col in X_train.columns if X_train[col].dtype == "object"]
# Columns that can be safely ordinal encoded
good_label_cols = [col for col in object_cols if set(X_valid[col]).issubset(set(X_train[col]))]
# Problematic columns that will be dropped from the dataset
bad_label_cols = list(set(object_cols)-set(good_label_cols))
print('Categorical columns that will be ordinal encoded:', good_label_cols)
print('\nCategorical columns that will be dropped from the dataset:', bad_label_cols)

当前最简策略是：丢弃不可以进行安全编码的类别列，之后再应用顺序编码。
label_X_train = X_train.drop(bad_label_cols, axis=1)
label_X_valid = X_valid.drop(bad_label_cols, axis=1)

策略三：独热编码

from sklearn.preprocessing import OneHotEncoder# Apply one-hot encoder to each column with categorical data
OH_encoder = OneHotEncoder(handle_unknown='ignore', sparse=False)
OH_cols_train = pd.DataFrame(OH_encoder.fit_transform(X_train[object_cols]))
OH_cols_valid = pd.DataFrame(OH_encoder.transform(X_valid[object_cols]))# One-hot encoding removed index; put it back
OH_cols_train.index = X_train.index
OH_cols_valid.index = X_valid.index# Remove categorical columns (will replace with one-hot encoding)
num_X_train = X_train.drop(object_cols, axis=1)
num_X_valid = X_valid.drop(object_cols, axis=1)# Add one-hot encoded columns to numerical features
OH_X_train = pd.concat([num_X_train, OH_cols_train], axis=1)
OH_X_valid = pd.concat([num_X_valid, OH_cols_valid], axis=1)# Ensure all columns have string type
OH_X_train.columns = OH_X_train.columns.astype(str)
OH_X_valid.columns = OH_X_valid.columns.astype(str)

在开始之前，首先调查类别特征信息

# Get number of unique entries in each column with categorical data
object_nunique = list(map(lambda col: X_train[col].nunique(), object_cols))
d = dict(zip(object_cols, object_nunique))# Print number of unique entries by column, in ascending order
sorted(d.items(), key=lambda x: x[1])

与上一个方法一样，先找出本方法适用的列，对于列别数量过多的列，可以直接丢弃或者使用顺序编码。

# Columns that will be one-hot encoded
low_cardinality_cols = [col for col in object_cols if X_train[col].nunique() < 10]
# Columns that will be dropped from the dataset
high_cardinality_cols = list(set(object_cols)-set(low_cardinality_cols))
print('Categorical columns that will be one-hot encoded:', low_cardinality_cols)
print('\nCategorical columns that will be dropped from the dataset:', high_cardinality_cols)

最终代码

from sklearn.preprocessing import OneHotEncoder# Use as many lines of code as you need!
# low_OH_X_train = X_train.drop(high_cardinality_cols, axis=1)
# low_OH_X_valid = X_valid.drop(high_cardinality_cols, axis=1)OH_encoder = OneHotEncoder(handle_unknown='ignore', sparse_output=False)
OH_cols_train = pd.DataFrame(OH_encoder.fit_transform(X_train[low_cardinality_cols]))
OH_cols_valid = pd.DataFrame(OH_encoder.transform(X_valid[low_cardinality_cols]))OH_cols_train.index = low_OH_X_train.index
OH_cols_valid.index = low_OH_X_valid.indexnum_X_train = X_train.drop(object_cols, axis=1)
num_X_valid = X_valid.drop(object_cols, axis=1)OH_X_train = pd.concat([num_X_train, OH_cols_train], axis=1) # Your code here
OH_X_valid = pd.concat([num_X_valid, OH_cols_valid], axis=1) # Your code hereOH_X_train.columns = OH_X_train.columns.astype(str)
OH_X_valid.columns = OH_X_valid.columns.astype(str)print(OH_X_train.columns)
# Check your answer
step_4.check()

问题

为什么最后需要将所有列转化为字符串类型？
在论坛里提问，首先查看两篇提问说明
Kaggle Community Guidelines
Frequently Asked Questions

Ask Question in discussion area

发出提问。

实战：利用Missing Value和Categorical variable的知识自己写一份Notebook并成功提交

# This Python 3 environment comes with many helpful analytics libraries installed
# It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python
# For example, here's several helpful packages to loadimport numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)# Input data files are available in the read-only "../input/" directory
# For example, running this (by clicking run or pressing Shift+Enter) will list all files under the input directoryimport os
for dirname, _, filenames in os.walk('/kaggle/input'):for filename in filenames:print(os.path.join(dirname, filename))# You can write up to 20GB to the current directory (/kaggle/working/) that gets preserved as output when you create a version using "Save & Run All" 
# You can also write temporary files to /kaggle/temp/, but they won't be saved outside of the current session

# Load original data
from sklearn.model_selection import train_test_splitX_full = pd.read_csv("/kaggle/input/home-data-for-ml-course/train.csv")
X_test = pd.read_csv("/kaggle/input/home-data-for-ml-course/test.csv")X_full.dropna(axis=0, subset=['SalePrice'], inplace=True)
y = X_full.SalePrice
X_full.drop(['SalePrice'], axis=1, inplace=True)X_train, X_valid, y_train, y_valid = train_test_split(X_full, y, train_size=0.8, test_size=0.2,random_state=0)

# define evaluation functions,
# and submit file generation functions
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_absolute_errordef score_dataset(X_train, X_valid, y_train, y_valid, model):model.fit(X_train, y_train)preds = model.predict(X_valid)return mean_absolute_error(y_valid, preds)def generate_submit_file(X_test, model):preds_test = model.predict(X_test)output = pd.DataFrame({'Id': X_test.Id,'SalePrice': preds_test})output.to_csv('submission.csv', index=False)print("submission.csv saved.")return outputprint("func defined")

# define data_preprocesser
from sklearn.preprocessing import OrdinalEncoderdef na_processer(X_data, non_cols, is_train=False):# non_cols = [col for col in X_data.columns if X_data[col].isnull().any()]X_data = X_data.drop(non_cols, axis=1)return X_data# def cate_processer(X_data, bad_cols, good_cols, is_train=False):
#     # cate_cols = [col for col in X_data.columns if X_data[col].dtype=="object"]#     X_data = X_data.drop(cate_cols, axis=1)#     return X_datadef data_preprocesser(train, valid, test):"""X_data referce to datasetis_train is used to show whether X_data is training data"""# missing valuestrain_non_cols = [col for col in train.columns if train[col].isnull().any()]valid_non_cols = [col for col in valid.columns if valid[col].isnull().any()]test_non_cols = [col for col in test.columns if test[col].isnull().any()]non_cols = train_non_cols + valid_non_cols + test_non_cols# drop na colsX_train = na_processer(train, non_cols, is_train=True)X_valid = na_processer(valid, non_cols)X_test = na_processer(test, non_cols)# categorical variable: odinary encodingobject_cols = [col for col in X_train.columns if X_train[col].dtype == "object"]good_label_cols = [col for col in object_cols if set(X_valid[col]).issubset(set(X_train[col])) and set(X_test[col]).issubset(set(X_train[col]))]bad_label_cols = list(set(object_cols)-set(good_label_cols))ordinal_encoder = OrdinalEncoder()# encode good colsX_train[good_label_cols] = ordinal_encoder.fit_transform(X_train[good_label_cols])X_valid[good_label_cols] = ordinal_encoder.transform(X_valid[good_label_cols])X_test[good_label_cols] = ordinal_encoder.transform(X_test[good_label_cols])# drop bad colsX_train.drop(bad_label_cols, axis=1, inplace=True)X_valid.drop(bad_label_cols, axis=1, inplace=True)X_test.drop(bad_label_cols, axis=1, inplace=True)return X_train, X_valid, X_testprint("func defined")

# train and valid
model = RandomForestRegressor(n_estimators=100, random_state=0)final_X_train, final_X_valid, final_X_test = data_preprocesser(X_train, X_valid, X_test)# print(final_X_train.dtypes)
score = score_dataset(final_X_train, final_X_valid, y_train, y_valid, model)
print(f"MAE socre is {score}")# generate test output
output = generate_submit_file(final_X_test, model)

问题：提交失败，经过查看发现是Id列的问题

def generate_submit_file(X_test, model):preds_test = model.predict(X_test)output = pd.DataFrame({'Id': X_test.index,  #这里应该写成X_test.Id'SalePrice': preds_test})output.to_csv('submission.csv', index=False)print("submission.csv saved.")return output

修改后提交成功
在这里插入图片描述

Pipeline

管道是一种组织预处理和建模代码的简单方法。打包预处理和建模过程中的各个步骤。

虽然有些人完全不用pipeline，它的好处如下：

清晰的代码
更少的Bug
更方便投产
更多的验证选择

超级简洁明了的代码，比之前的清晰很多，但需要详细了解一下pipeline的用法。

from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer
from sklearn.preprocessing import OneHotEncoder# Preprocessing for numerical data
numerical_transformer = SimpleImputer(strategy='constant')# Preprocessing for categorical data
categorical_transformer = Pipeline(steps=[('imputer', SimpleImputer(strategy='most_frequent')),('onehot', OneHotEncoder(handle_unknown='ignore'))
])# Bundle preprocessing for numerical and categorical data
preprocessor = ColumnTransformer(transformers=[('num', numerical_transformer, numerical_cols),('cat', categorical_transformer, categorical_cols)])from sklearn.ensemble import RandomForestRegressormodel = RandomForestRegressor(n_estimators=100, random_state=0)from sklearn.metrics import mean_absolute_error# Bundle preprocessing and modeling code in a pipeline
my_pipeline = Pipeline(steps=[('preprocessor', preprocessor),('model', model)])# Preprocessing of training data, fit model 
my_pipeline.fit(X_train, y_train)# Preprocessing of validation data, get predictions
preds = my_pipeline.predict(X_valid)# Evaluate the model
score = mean_absolute_error(y_valid, preds)
print('MAE:', score)

pipeline和columnTransformer极大简化了代码和编码流程。可以更加专注于策略的选择。

Kaggler日志-Day4

进度24/12/14 昨日复盘： Pandas课程完成 Intermediate Mechine Learning2/7 今日记录： Intermediate Mechine Learning之类型变量读两篇讲解如何提问的文章，在提问区里发起一次提问实战：自己从头到尾首先Housing Prices Compe…...

编程日记 2025/9/21 1:01:47

onnx算子的注册详解及案例（完整版）

文章目录 1. 介绍1.1 导出onnx不成功1.2 分析和解决方案2. 案例2.1 Asinh算子注册2.1.1 导出onnx2.1.2 算子注册2.2 自定义算子的注册2.1 直接导出自定义算子2.2 自定义算子的注册并导出2.3 导出带deformable conv 的onnx2.3.1 直接导出deformable conv2.3.2 注册并导出deforma…...

编程日记 2025/9/18 5:42:14

2024生命科学前沿技术

前沿技术是指高技术领域中具有前瞻性、先导性和探索性的重大技术，是未来高技术更新换代和新兴产业发展的重要基础，是国家高技术创新能力的综合体现。选择前沿技术的主要原则一是代表世界高技术前沿的发展方向。二是对国家未来新兴产业的形成和发展具有引…...

编程日记 2025/9/20 23:45:18

游戏引擎学习第47天

仓库: https://gitee.com/mrxiao_com/2d_game 昨天我们花了一点时间来修复一个问题，但基本上是在修复这个问题的过程中，我们决定添加一个功能，那就是在屏幕上控制多个实体。所以如果我有一个手柄，我可以添加另一个角色&#xff0…...

编程日记 2025/9/16 6:51:14

1.编写 Prompt 的原则

一、环境配置使用 OpenAI 的 ChatGPT API，需要有 API_KEY，并安装 OpenAI 库。安装命令：pip install openai 和 pip install zhipuai。配置方法：直接设置 openai.api_key 或通过环境变量设置。二、两个基本原则 2.1 原则一&am…...

编程日记 2025/9/21 11:43:22

【JavaEE】网络（2）

一、网络编程套接字 1.1 基础概念【网络编程】指网络上的主机，通过不同的进程，以编程的方式实现网络通信；当然，我们只要满足进程不同就行，所以即便是同一个主机，只要是不同进程，基于网络来传…...

编程日记 2025/9/19 13:39:06

SAS - Subtractive Port

在SAS（串行连接SCSI，Serial Attached SCSI）协议中，subtractive port 是一种特殊类型的端口，主要用于设备间的路由功能。它的作用是在路径选择过程中充当默认路径，以处理未明确指定路径的请求。以下是它的定…...

编程日记 2025/9/16 8:02:08

Unity3D项目为什么要使用FairyGUI

前言 Unity3D项目选择使用FairyGUI的原因是多方面的，主要涵盖性能优化、设计模式、编辑器支持、跨平台兼容性以及丰富的功能特性。以下是对这些方面的详细解析以及相关的代码实现。对惹，这里有一个游戏开发交流小组，希望大家可以点击进来一…...

编程日记 2025/9/19 9:00:41

Pytest接口自动化测试框架Python自动化测试开发

一、引言在软件开发过程中，接口测试是确保软件各个组件之间数据传输和功能交互正常工作的重要环节。通过接口测试，可以提高软件的整体质量和稳定性。Pytest是一个流行的Python自动化测试框架，提供了丰富的断言方法和灵活的测试组织结构&…...

编程日记 2025/9/20 16:42:53

MySQL追梦旅途之性能优化

1、索引优化索引可以显著加速查询操作，但过多或不适当的索引也会带来负面影响（如增加写入开销）。因此，选择合适的索引至关重要。创建索引： 为经常用于WHERE子句、JOIN条件和ORDER BY排序的列创建索引。 CREATE I…...

编程日记 2025/9/21 2:50:26

数字校园：信息时代的教育新形态

现如今，我们生活在一个信息爆炸的时代，每一天都有海量的信息产生。而在教育领域，也正在经历一场数字化的变革，这就是所谓的“数字校园”。数字校园可不是简单的把课本搬到电脑上那么简单，它其实是一个综合性的平台&…...

编程日记 2025/9/19 12:08:40

数字产业化和产业数字化到底是什么？

“数字产业化”和“产业数字化”在很多官方文件和领导人讲话中都是成对出现的，这两个术语看起来非常相似，但它们作为数字经济的两个重要组成部分，既有联系又有区别。在谈数字产业化和产业数字化之前，我这里需要先给大家介绍一个概…...

编程日记 2025/9/21 8:20:15

每日十题八股-2024年12月14日

1.类加载器有哪些？ 2.双亲委派模型的作用 3.讲一下类加载过程？ 4.讲一下类的加载和双亲委派原则 5.什么是Java里的垃圾回收？如何触发垃圾回收？ 6.判断垃圾的方法有哪些？ 7.垃圾回收算法是什么，是为了解决了…...

编程日记 2025/9/21 18:20:17

大模型呼入机器人有哪些功能特点？(转)

大模型呼入机器人有哪些功能特点？(转) 原作者：开源呼叫中心FreeIPCC，其Github：https://github.com/lihaiya/freeipcc 大模型呼入机器人，作为现代通信技术与人工智能深度融合的产物，正逐渐成为企业提升服务…...

编程日记 2025/9/19 15:21:13

EasyExcel设置表头上面的那种大标题（前端传递来的大标题）

1、首先得先引用easyExcel的版本依赖，我那 <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>2.2.6</version> </dependency> 2、然后得弄直接的实体类，&…...

编程日记 2025/9/21 1:17:20

[笔记] 编译LetMeowIn（C++汇编联编程序）过程

文章目录前言过程下载源码vs2017 创建空项目引入编译文件改项目依赖属性改汇编编译属性该项目还需注意编译运行总结前言编译LetMeowin 项目发现是个混编项目，c调用汇编的程序，需要配置一下，特此记录一下过程下载源码首先下载源码…...

编程日记 2025/9/21 2:08:38

（三）机器学习 - 标准差/方差

标准差标准差是统计学中一个非常重要的概念，它用来衡量一组数据的离散程度，即数据点与平均值之间的偏离程度。标准差越大，表示数据点越分散；标准差越小，表示数据点越集中。标准差的计算步骤如下： 计算数…...

编程日记 2025/9/19 23:01:19

笔记：在WPF中InvalidateMeasure，InvalidateArrange，InvalidateVisual，UpdateLayout主要功能

一、目的：简要介绍在WPF中InvalidateMeasure，InvalidateArrange，InvalidateVisual，UpdateLayout主要功能在 WPF 中，InvalidateMeasure、InvalidateArrange、InvalidateVisual 和 UpdateLayout 是用于控制布局系统的四…...

编程日记 2025/9/16 14:59:21

[笔记]Qt下使用SendMessage、PostMessage和接收window消息

1.头文件和库引用首先必须要包含windows.h这个头文件，如果使用一些扩展函数，还需要包含windowsx.h。网上说使用FindWindow要添加头文件winuser.h，不过应该windows.h是自动包含这个依赖的（我没有添加） #include <…...

编程日记 2025/9/18 12:59:31

使用echarts实现3d柱状图+折线图

以下代码有问题请直接问国内直连GPT/Claude HTML 需要注意threeDchart一定要设置宽度高度，不然图不显示,然后echarts版本不要太低，不然也不显示 <div id"threeDchart" class"threeDchart"></div>js set3DBarChart2(dat…...

编程日记 2025/9/20 15:40:16

【经验分享】容器云搭建的知识点

最近忙于备考没关注，有次点进某小黄鱼发现首页出现了我的笔记还被人收费了虽然我也卖了一些资源，但我以交流、交换为主，笔记都是免费给别人看的由于当时刚刚接触写的并不成熟，为了避免更多人花没必要的钱，所以决定公…...

编程日记 2025/9/21 12:12:31

JAVA ｜日常开发中Websocket详解

JAVA ｜日常开发中Websocket详解前言一、Websocket 概述1.1 定义1.2 优势二、Websocket 协议基础2.1 握手过程2.2 消息格式2.3 数据传输方式三、Java 中使用 Websocket3.1 Java WebSocket API（JSR - 356）3.2 第三方库（如 Tyrus&…...

编程日记 2025/9/13 17:48:57

30.攻防世界unserialize3

进入场景解读一下这个类 xctf 中有一个公共属性 $flag ，其值为 111 ，并且定义了一个 __wakeup 魔术方法，当对象被反序列化时会自动调用该方法，该方法会输出 bad requests 并终止程序的执行。 ?code提示了参数 <?php clas…...

编程日记 2025/9/19 15:30:53

IS-IS协议

IS-IS协议介绍 IS-IS（Intermediate System to Intermediate System）协议是一种链路状态的内部网关协议（IGP），用于在同一个自治系统（Autonomous System, AS）内部的路由器之间交换路由信息。IS-I…...

编程日记 2025/9/11 20:44:14

接口文档之swagger、kinife4j的基本使用

1.swagger3的使用： 1.1pom.xml中加入依赖： <dependency><groupId>io.springfox</groupId><artifactId>springfox-boot-starter</artifactId><version>3.0.0</version> </dependency> <!--swagger的…...

编程日记 2025/9/15 13:14:44

Oracle plsqldev1106 安装及TNS配置

Oracle plsqldev1106 安装及TNS配置下载好安装包，直接双击安装点击 I Agree 默认是C盘的，我改了D盘，根据自己实际情况修改这里用默认的for current user 也可以，我选了for all user 点Finish，等待安装完成即可 …...

编程日记 2025/9/21 9:39:22

[数据结构]无向图的深度优先非递归遍历

采用邻接表存储实现无向图的深度优先非递归遍历。输入格式: 先输入两个整数（m,n）（分别表示待创建的图顶点数和边数），之后是m个顶点的信息，再之后是n 条边。输出格式: 对每一组输入，在一行…...

编程日记 2025/9/20 23:32:14

Android后端签到flask迁移到rust的axum的过程-签到性能和便携

本次变更了以下内容: 为了使用之前ip2sta的ip到端点名的python,dic变量,将其存入redis hashset.使用地址/api/ip2dic 手动执行之.并且定义在/station/init,这个每天初始化redis的路径下.在rust axum使用redis 连接池在test中 ip2dic,IP转端点名,转本日此端网址.在前端的人名下…...

编程日记 2025/9/18 21:13:21

Android13开机向导

文章目录前言需求-场景第三方资料说明需求思路按照平台思路从配置上去 feature换个思路，去feature。SimMissingActivity 判断跳过逻辑SetupWizardUtils 判断SIM 、 hasSystemFeature FEATURE_TELEPHONYPackageManager.FEATURE_TELEPHONYApplicationPackageManage…...

编程日记 2025/9/21 13:43:06

泷羽sec学习打卡-brupsuite6暴力破解与验证码识别绕过

声明学习视频来自B站UP主泷羽sec,如涉及侵权马上删除文章笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负关于brupsuite的那些事儿-验证码绕过以及字典爆破如何利用brpsuite进行验证码绕过呢？1、下…...

编程日记 2025/9/21 8:49:47

vue季度选择器(antd2.0 版本无此控件，单独写一个)

vue季度选择器效果显示效果显示 <template><div><a-popoverplacement"bottom"overlayClassName"season-picker"trigger"click"v-model"showSeason"><template #content><div class"season-picker-b…...

编程日记 2025/9/18 14:24:36

Microsemi Libero使用技巧11——CoreUARTAPB RX管脚分配时不显示

调用串口IP核CoreUARTAPB，并例化到顶层设计，发现UART_RX管脚在进行管脚分配时没有显示出来，最后发现是CoreAPB3总线IP核配置不对导致，改为如下配置后正常。...

编程日记 2025/9/21 18:09:08

回归预测 | MATLAB实现SVM-Adaboost集成学习结合支持向量机多输入单输出回归预测

回归预测 | MATLAB实现SVM-Adaboost集成学习结合支持向量机多输入单输出回归预测目录回归预测 | MATLAB实现SVM-Adaboost集成学习结合支持向量机多输入单输出回归预测基本介绍程序设计基本介绍 SVM-Adaboost集成学习是一种将支持向量机（SVM）与AdaBoost算法相结合的集成学习…...

编程日记 2025/9/20 4:59:57

Keil-MDK开发环境编译后axf自动转换bin格式文件

编译选项添加如下，调用fromelf工具自动完成转换： fromelf --bin -o "$LL.bin" "#L"...

编程日记 2025/9/18 21:37:32

计算机组成原理（五）：程序装载

在计算机组成原理中，程序装载（Program Loading）是指将程序从外存（如磁盘）加载到内存中，并为其运行做好准备的过程。程序装载是实现程序从静态存储状态到动态运行状态的关键环节，涉及地址映射、内…...

编程日记 2025/9/18 22:38:52

开发EDA工具常用的三方开源

EDA软件是制造芯片重要工具，是现在举国的大难题。这个工具难在哪里，几句话说不清，但它确实也有一些非常通用的功能，这些功能依赖一些成熟的轮子，这些轮子，就是三方的开源项目，下面列举一些常用的…...

编程日记 2025/9/5 1:22:47

微信小程序中 crypto-js 加解密全攻略

一、引言在微信小程序开发中，数据的安全至关重要。加解密技术在保护用户数据和应用程序的安全性方面起着关键作用。小程序在与服务器进行数据交互时，面临着数据泄露、篡改等安全风险。为了确保用户信息的安全，选择合适的加解密算法变得尤为…...

编程日记 2025/9/21 15:30:50

Vue2 - 最新实现将多个文件批量导出为ZIP压缩包格式并下载功能，纯前端下载多个文件打包输出成zip格式，vue2将文件批量下载打包成ZIP下载保存本地（后端二进制文件流/base64图片/url

前言 Vue3 版本，请访问这篇文章。在 vue2 | nuxt2 项目开发中，详解实现把多个文件组合成一个ZIP压缩包格式下载到用户本地，将文件批量下载打包成zip格式并自定义压缩包命名名称，vue批量下载文件并导出为压缩包的功能，如何将后端返回的二进制文件流打包成zip格式，支持任…...

编程日记 2025/9/17 3:08:15

The Rise and Potential of Large Language ModelBased Agents:A Survey---摘要、背景、引言

题目基于大语言模型的Agent的兴起与发展前景论文地址：https://arxiv.org/pdf/2309.07864.pdf 项目地址：https:/github.com/WooooDyy./LLM-Agent–Paper-List 摘要长期以来，人类一直在追求等同于或超越人类水平的人工智能(A)，…...

编程日记 2025/9/20 4:03:12

【unity】从零开始制作平台跳跃游戏--界面的认识，添加第一个角色！

在上一篇文章中，我们已经完成了unity的环境配置与安装⬇️ 【Unity】环境配置与安装-CSDN博客接下来，让我们开始新建一个项目吧！ 新建项目首先进入unityHub的项目页面，点击“新项目”： 我们这个系列将会以2D平台…...

编程日记 2025/9/21 13:59:13

Java中的Stream

1. 什么是 Stream？ Stream 是 Java 8 引入的一种新方式，目的是帮助我们更简洁、更高效地处理集合（如 List、Set、Map 等）。你可以把 Stream 想象成一条“流水线”，数据就像是流水线上的原材料，经过流水线的…...

编程日记 2025/9/14 17:41:59

ARM学习（36）静态扫描规则学习以及工具使用

笔者来学习了解一下静态扫描以及其规则，并且亲身是实践一下对arm 架构的代码进行扫描。 1、静态扫描认识静态扫描：对代码源文件按照一定的规则进行扫描，来发现一些潜在的问题或者风险，因为不涉及代码运行，所以其一般只是发现一些规范或则一些质量问题，当然这些可能存在潜…...

编程日记 2025/9/20 23:09:09

前端将base64转pdf页面预览

前端将base64转pdf页面预览 <embed :src"pdfList" width"100%" height"100%" type"application/pdf" />pdfList.value data:application/pdf;base64,${res}//后端传jpg或pdf格式可直接 :src“返回内容”显示...

编程日记 2025/9/17 4:48:07

Java-26 深入浅出 Spring - 实现简易Ioc-02 无IoC与AOP场景下实现业务

点一下关注吧！！！非常感谢！！持续更新！！！ 大数据篇正在更新！https://blog.csdn.net/w776341482/category_12713819.html 目前已经更新到了： MyBatis&#xff…...

编程日记 2025/9/21 4:35:23

能不能用一句话或者简洁地凝练深度学习的本质和精髓？

深度学习就是学习输入与输出之间的映射关系。深度学习模型本质上只是个参数量很大的函数，其中函数的参数可以通过训练样本进行调整。根据训练样本的不同，进一步可以分为以下几类： 一、给定输入以及对应的输出，其中输出是唯一的…...

编程日记 2025/9/21 10:34:59

我的宝贵经验

在技术的浩瀚海洋中，一份优秀的技术文档宛如精准的航海图。它是知识传承的载体，是团队协作的桥梁，更是产品成功的幕后英雄。然而，打造这样一份出色的技术文档并非易事。你是否在为如何清晰阐释复杂技术而苦恼？是否纠结…...

编程日记 2025/9/19 20:13:56

发现一个对话框中的按钮，全部失效，点击都没有任何反应，已经解决

前端问题，技术vue2，ts。发现一个对话框中的按钮，全部失效，点击都没有任何反应。因为我只在template标签中加入下面这个代码，并没有注册。只要有一个子组件没有注册，就会影响所有的按钮，使当前…...

编程日记 2025/9/14 18:52:51

深度学习中损失函数(loss function)介绍

深度学习中损失函数(loss function)介绍在深度学习的宏伟城堡中，损失函数扮演着国王的角色，它决定了模型训练的方向和目标。损失函数，也被称为代价函数，是衡量模型预测与实际结果之间差异的函数。在深度学习的训练过程中&…...

编程日记 2025/9/21 14:44:36

【渗透测试】信息收集二

其他信息收集在渗透测试中，历史漏洞信息收集是一项重要的工作，以下是相关介绍： 历史漏洞信息收集的重要性提高效率：通过收集目标系统或应用程序的历史漏洞信息，可以快速定位可能存在的安全问题，避免重复…...

编程日记 2025/9/21 14:06:45

前端三大框架 Vue、React 和 Angular 的市场占比分析

一、引言 ?? 随着前端技术的迅速发展，Vue.js、React 和 Angular 已成为全球最受欢迎的三大前端框架。在国内外，不同的框架在市场中的占比和流行程度存在显著差异。本文将从全球和中国市场的角度，对这三大框架的市场占比进行分析&#xff0…...

编程日记 2025/9/21 17:53:30