当前位置：首页 > news >正文

机器学习数据集

news 来源：原创 2025/8/11 18:32:06

数据集

1. scikit-learn工具介绍
- 1.1 scikit-learn安装
- 1.2 Scikit-learn包含的内容
2 数据集
- 2.1 sklearn玩具数据集介绍
- 2.2 sklearn现实世界数据集介绍
- 2.3 sklearn加载玩具数据集
- - 示例1：鸢尾花数据
  - 示例2：分析糖尿病数据集
- 2.4 sklearn获取现实世界数据集
- - 示例：获取20分类新闻数据
- 2.5数据集的划分
- - (1) 函数
  - (2)示例
  - - 列表数据集划分
    - 二维数组数据集划分
    - DataFrame数据集划分
    - 字典数据集划分
    - 鸢尾花数据集划分
    - 现实世界数据集划分

1. scikit-learn工具介绍

在这里插入图片描述

Python语言机器学习工具
Scikit-learn包括许多智能的机器学习算法的实现
Scikit-learn文档完善，容易上手，丰富的API接口函数
Scikit-learn官网：https://scikit-learn.org/stable/#
Scikit-learn中文文档：https://scikitlearn.com.cn/
scikit-learn中文社区

1.1 scikit-learn安装

参考以下安装教程：https://www.sklearncn.cn/62/

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-learn

1.2 Scikit-learn包含的内容

在这里插入图片描述

2 数据集

2.1 sklearn玩具数据集介绍

数据量小，数据在sklearn库的本地，只要安装了sklearn，不用上网就可以获取
在这里插入图片描述

2.2 sklearn现实世界数据集介绍

数据量大，数据只能通过网络获取
在这里插入图片描述

2.3 sklearn加载玩具数据集

示例1：鸢尾花数据

from sklearn.datasets import load_iris
iris = load_iris()#鸢尾花数据

鸢尾花数据集介绍

特征有:

花萼长 sepal length

花萼宽sepal width

花瓣长 petal length

花瓣宽 petal width

三分类：

0-Setosa山鸢尾

1-versicolor变色鸢尾

2-Virginica维吉尼亚鸢尾

sklearn.datasets.load_iris()：加载并返回鸢尾花数据集

在这里插入图片描述
sklearn数据集的使用
sklearn数据集返回值介绍
load和fetch返回的数据类型datasets.base.Bunch（字典格式）

data：特征数据数组，是[n_samples * n_features]的二维numpy.ndarry数组
target：标签数组，是n_samples的一维numpy.ndarry数组
DESCR：数据描述
feature_names：特征名，新闻数据，手写数字、回归数据集没有
target_names：标签名
代码如下：

#获取鸢尾花数据集的库
from sklearn.datasets import load_iris
import numpy as np
import pandas as pd
# 获取鸢尾花数据集
iris=load_iris()
# iris字典中有几个重要属性: 
# data 特征
data=iris.data
# print('鸢尾花数据集的前5条数据',data[:5])
'''[[5.1 3.5 1.4 0.2][4.9 3.  1.4 0.2][4.7 3.2 1.3 0.2][4.6 3.1 1.5 0.2][5.  3.6 1.4 0.2]]'''# feature_names 特征描述
feature_names=iris.feature_names
print(feature_names)#['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
# target  目标
target=iris.target
# 获取前五条数据的目标值
print(target[:5])# [0 0 0 0 0]
# target_names  目标描述
target_names=iris.target_names
print(target_names) #['setosa(山鸢尾)' 'versicolor（变色鸢尾花）' 'virginica（维基利亚鸢尾）']
# DESCR 数据集的描述
res=iris.DESCR
print(res)
# filename 下后到本地保存后的文件名
iris_filename=iris.filename
print(iris_filename)#iris.csv

示例2：分析糖尿病数据集

这是回归数据集，有442个样本，有可能就有442个目标值。
代码如下：

# 获取糖尿病数据集的库
from sklearn.datasets import load_diabetes
import numpy as np
import pandas as pd
dia=load_diabetes()
# print(dia)
data=dia.data
# print('糖尿病数据的特征的前五条',data[:5])
'''
糖尿病数据的特征的前五条 [[ 0.03807591  0.05068012  0.06169621  0.02187239 -0.0442235  -0.03482076-0.04340085 -0.00259226  0.01990749 -0.01764613][-0.00188202 -0.04464164 -0.05147406 -0.02632753 -0.00844872 -0.019163340.07441156 -0.03949338 -0.06833155 -0.09220405][ 0.08529891  0.05068012  0.04445121 -0.00567042 -0.04559945 -0.03419447-0.03235593 -0.00259226  0.00286131 -0.02593034][-0.08906294 -0.04464164 -0.01159501 -0.03665608  0.01219057  0.02499059-0.03603757  0.03430886  0.02268774 -0.00936191][ 0.00538306 -0.04464164 -0.03638469  0.02187239  0.00393485  0.015596140.00814208 -0.00259226 -0.03198764 -0.04664087]]
'''
#获取特征名
feature_names=dia.feature_names
print(feature_names) #['age', 'sex', 'bmi', 'bp', 's1', 's2', 's3', 's4', 's5', 's6']
#获取目标值
target=dia.target
print(target[:5]) #[151.  75. 141. 206. 135.]
#获取目标名
# target_names=dia.target_names
# print(target_names[:5]) 因为糖尿病数据集是回归的，所以它的目标值是线上的点没有对应的名称
#获取糖尿病的描述
res=dia.DESCR
# print(res)

注意：

因为糖尿病数据集是回归的，所以它的目标值是线上的点没有对应的名称

2.4 sklearn获取现实世界数据集

(1)所有现实世界数据，通过网络才能下载后，默认保存的目录可以使用下面api获取。实际上就是保存到home目录

from sklearn import datasets
datasets.get_data_home()  #查看数据集默认存放的位置

(2)下载时，有可能回为网络问题而出问题，要“小心”的解决网络问题，不可言……

(3)第一次下载会保存的硬盘中，如果第二次下载，因为硬盘中已经保存有了，所以不会再次下载就直接加载成功了。

示例：获取20分类新闻数据

(1)使用函数: sklearn.datasets.fetch_20newsgroups(data_home,subset)

(2)函数参数说明:

(2.1) data_home

None这是默认值，下载的文件路径为 “C:/Users/ADMIN/scikit_learn_data/20news-bydate_py3.pkz”
自定义路径例如 “./src”, 下载的文件路径为“./20news-bydate_py3.pkz”

(2.2) subset

“train”，只下载训练集
“test”，只下载测试集
“all”， 下载的数据包含了训练集和测试集

(2.3) return_X_y，决定着返回值的情况

False，这是默认值
True,

(3) 函数返值说明:

当参数return_X_y值为False时， 函数返回Bunch对象,Bunch对象中有以下属性*data:特征数据集, 长度为18846的列表list, 每一个元素就是一篇新闻内容， 共有18846篇*target:目标数据集，长度为18846的数组ndarray, 第一个元素是一个整数，整数值为[0,20)*target_names:目标描述，长度为20的list*filenames：长度为18846的ndarray, 元素为字符串,代表新闻的数据位置的路径当参数return_X_y值为True时，函数返回值为元组，元组长度为2， 第一个元素值为特征数据集，第二个元素值为目标数据集

代码

import sklearn.datasets as datasets
from sklearn.datasets import fetch_20newsgroups
import numpy as np
import pandas as pd
path=datasets.get_data_home()
news=fetch_20newsgroups(data_home='./src',subset='all')
# print(news.data[0])
# print(news.target_names[:5])data,target=fetch_20newsgroups(data_home='./src',subset='all',return_X_y=True)

2.5数据集的划分

"""
1. 复习不定长参数
一个"*" 把多个参数转为元组
两个"*" 把多个关键字参数转为字典 
"""
def m(*a, **b):print(a)       #('hello', 123)print(b)       #{'name': '小王', 'age': 30, 'sex': '男'}    
m("hello", 123,  name="小王", age=30, sex="男")2. 复习列表值的解析
list = [11,22,33]
a, b, c = list # a=11   b=22  c=33
a, b = ["小王",  30] #a="小王" b=30

(1) 函数

sklearn.model_selection.train_test_split(*arrays，**options)
参数
(1) *array 这里用于接收1到多个"列表、numpy数组、稀疏矩阵或padas中的DataFrame"。	
(2) **options， 重要的关键字参数有：test_size 值为0.0到1.0的小数，表示划分后测试集占的比例random_state 值为任意整数，表示随机种子，使用相同的随机种子对相同的数据集多次划分结果是相同的。否则多半不同strxxxx 分层划分,填y
2 返回值说明返回值为列表list, 列表长度与形参array接收到的参数数量相关联, 形参array接收到的是什么类型，list中对应被划分出来的两部分就是什么类型

(2)示例

列表数据集划分

因为随机种子都使用了相同的整数(22)，所以划分的划分的情况是相同的。
代码如下：

# 导入数据集划分的库
from sklearn.model_selection import train_test_split
# 1.列表数据集的划分
x=[1,2,3,4,5,6,7,8,9]#作为特征值
y=['1a','2a','3a','4a','5a','6a','7a','8a','9a']#作为目标值
# x,y的长度要一致
# 直接对特征值进行划分为训练集0.8和测试集0.2
x_train,x_test=train_test_split(x,test_size=0.2,shuffle=True,random_state=5)
# shuffle:表示是否打乱,random_state：设置随机种子
# print(x_train,x_test)#[9, 5, 8, 2, 1, 3, 6] [7, 4]顺序是随机的
# 对特征值和目标值进行划分为训练集0.8和测试集0.2
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,shuffle=True,random_state=5)
print(x_train,x_test)#[9, 8, 2, 1, 6, 7, 4] [3, 5]
print(y_train,y_test)#['9a', '8a', '2a', '1a', '6a', '7a', '4a'] ['3a', '5a']
# 划分时特征值和目标值划分的位置是一一对应的

注意：

1.x（特征值）,y（目标值）的长度要一致
2.划分时特征值和目标值划分的位置是一一对应的

二维数组数据集划分

# 2.二维数组数据集划分
x=np.arange(16).reshape(4,4)
y=np.arange(0,160,10).reshape(4,4)
# print(x)
# print(y)
# x,y的长度要一致
# 直接对特征值进行划分为训练集0.8和测试集0.2
x_train,x_test=train_test_split(x,test_size=0.2,shuffle=True,random_state=5)
# shuffle:表示是否打乱,random_state：设置随机种子
# print(x_train,x_test)#[9, 5, 8, 2, 1, 3, 6] [7, 4]顺序是随机的
# 对特征值和目标值进行划分为训练集0.8和测试集0.2
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,shuffle=True,random_state=5)
print(x_train)
print("="*20)
print(x_test)
print("="*20)
print(y_train)
print("="*20)
print(y_test)
'''
[[ 4  5  6  7][ 8  9 10 11][12 13 14 15]]
====================
[[0 1 2 3]]
====================
[[ 40  50  60  70][ 80  90 100 110][120 130 140 150]]
====================
[[ 0 10 20 30]]
'''

DataFrame数据集划分

可以划分DataFrame, 划分后的两部分还是DataFrame

x= np.arange(1, 16, 1)
x.shape=(5,3)
df = pd.DataFrame(x, index=[1,2,3,4,5], columns=["one","two","three"])
# print(df)x_train,x_test = train_test_split(df,  test_size=0.4, random_state=22)
print("\n", x_train)
print("\n", x_test)
'''one  two  three
4   10   11     12
1    1    2      3
5   13   14     15one  two  three
2    4    5      6
3    7    8      9
'''

字典数据集划分

可以划分非稀疏矩阵

用于将字典列表转换为特征向量。这个转换器主要用于处理类别数据和数值数据的混合型数据集

1.对于类别特征DictVectorizer 会为每个不同的类别创建一个新的二进制特征，如果原始数据中的某个样本具有该类别，则对应的二进制特征值为1，否则为0。

2.对于数值特征保持不变，直接作为特征的一部分

这样，整个数据集就被转换成了一个适合机器学习算法使用的特征向量形式
代码如下：

# 字典数据集的划分
# 引入字典向量化的模块
from sklearn.feature_extraction import DictVectorizer
from sklearn.model_selection import train_test_split
# 创建一个字典
data = [{'city':'成都', 'age':30, 'temperature':20}, {'city':'重庆','age':33, 'temperature':60}, {'city':'北京', 'age':42, 'temperature':80},{'city':'上海', 'age':22, 'temperature':70},{'city':'成都', 'age':72, 'temperature':40},]
# 将字典进行向量化并转换为稀疏矩阵
transfer=DictVectorizer(sparse=True)
# 将data进行向量化
data_new=transfer.fit_transform(data)
# print("data_new\n",data_new)
'''
<Compressed Sparse Row sparse matrix of dtype 'float64'with 15 stored elements and shape (5, 6)>Coords        Values(0, 0)        30.0(0, 3)        1.0(0, 5)        20.0(1, 0)        33.0(1, 4)        1.0(1, 5)        60.0(2, 0)        42.0(2, 2)        1.0(2, 5)        80.0(3, 0)        22.0(3, 1)        1.0(3, 5)        70.0(4, 0)        72.0(4, 3)        1.0(4, 5)        40.0
'''
data=data_new.toarray()
# print(x,type(x))
'''
[[30.  0.  0.  1.  0. 20.][33.  0.  0.  0.  1. 60.][42.  0.  1.  0.  0. 80.][22.  1.  0.  0.  0. 70.][72.  0.  0.  1.  0. 40.]] <class 'numpy.ndarray'>'''
x=data[:,:5]
y=data[:,5]
# print(x)
# print(y)
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,shuffle=True,random_state=42)
print(x_train.shape,x_test.shape)
print(y_train.shape,y_test.shape)
print(y_train)
'''
(4, 5) (1, 5)
(4,) (1,)
[40. 80. 20. 70.]
'''

注意：

因为机器学习时只能对数字进行处理字典中不是数字的键不能直接处理，需要进行特征处理（向量化就是把他转化为数字）

鸢尾花数据集划分


from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
x,y=load_iris(return_X_y=True)
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,shuffle=True,random_state=42)
print(x_train.shape,x_test.shape)
print(y_train.shape,y_test.shape)
print(y_train)
'''
(120, 4) (30, 4)
(120,) (30,)
[0 0 1 0 0 2 1 0 0 0 2 1 1 0 0 1 2 2 1 2 1 2 1 0 2 1 0 0 0 1 2 0 0 0 1 0 12 0 1 2 0 2 2 1 1 2 1 0 1 2 0 0 1 1 0 2 0 0 1 1 2 1 2 2 1 0 0 2 2 0 0 0 12 0 2 2 0 1 1 2 1 2 0 2 1 2 1 1 1 0 1 1 0 1 2 2 0 1 2 2 0 2 0 1 2 2 1 2 11 2 2 0 1 2 0 1 2]'''

现实世界数据集划分

from sklearn.datasets import fetch_20newsgroups
from sklearn.model_selection import train_test_split
import numpy as np
news = fetch_20newsgroups(data_home=None, subset='all')
list = train_test_split(news.data, news.target,test_size=0.2, random_state=22)
# """
# 返回值是一个list:其中有4个值，分别为训练集特征、测试集特征、训练集目标、测试集目标
# 与iris相同点在于x_train和x_test是列表，而iris是
# """
x_train, x_test, y_train, y_test = list
#打印结果为: 15076 3770 (15076,) (3770,)
print(len(x_train), len(x_test), y_train.shape, y_test.shape)

机器学习数据集

数据集 1. scikit-learn工具介绍1.1 scikit-learn安装1.2 Scikit-learn包含的内容 2 数据集2.1 sklearn玩具数据集介绍2.2 sklearn现实世界数据集介绍2.3 sklearn加载玩具数据集示例1：鸢尾花数据示例2：分析糖尿病数据集 2.4 sklearn获取现实世界数据集示…...

编程日记 2025/8/11 18:32:06

JVM运行时数据区域(Run-Time Data Areas)的解析

#　JVM运行时数据区域(Run-Time Data Areas)的解析欢迎来到我的博客：TWind的博客我的CSDN:：Thanwind-CSDN博客我的掘金：Thanwinde 的个人主页本文参考于：深入理解Java虚拟机：JVM高级特性与最佳实践本文的JVM均…...

编程日记 2025/8/5 10:46:31

一.序列和索引 1.1 用索引检索字符串中的元素 # 正向递增 shelloworld for i in range (0,len(s)):# i是索引print(i,s[i],end\t\t) print(\n--------------------------) # 反向递减 for i in range (-10,0):print(i,s[i],end\t\t)print(\n--------------------------) print(…...

编程日记 2025/8/5 10:46:30

在k8s中，如何实现服务的访问,k8s的ip是变化的，怎么保证能访问到我的服务

在K8S中，Pod的IP动态变化确实无法直接通过固定IP限制访问，但可以通过标签（Label）、服务（Service）和网络策略（NetworkPolicy）的组合，实现动态身份识别的访问控制&#xff…...

编程日记 2025/8/11 18:23:29

用NVivo革新企业创新：洞悉市场情绪，引领金融未来

在当今快速变化的商业环境中，理解市场和客户的情感脉动是企业成功的关键。尤其在金融行业，无论是评估经济走势、股票市场波动，还是洞察消费者信心，精准把握隐藏在新闻报道、社交媒体和消费者反馈中的情感倾向至关重要。而NVivo这款…...

编程日记 2025/8/11 18:32:04

如何使用极狐GitLab 软件包仓库功能托管 helm chart？

极狐GitLab 是 GitLab 在中国的发行版，关于中文参考文档和资料有： 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网软件包库中的 Helm charts (BASIC ALL) WARNING:Helm chart 库正在开发中，由于功能有限，尚未准备好用…...

编程日记 2025/8/10 11:12:37

Qt 通过控件按钮实现hello world + 命名规范（7）

文章目录使用编辑框来完成 hello world通过编辑图形化界面方式通过纯代码方式通过按钮的方式来创建 hello world通过编辑图形化界面方式通过纯代码方式总结Qt Creator中的快捷键如何使用文档命名规范简介：这篇文章着重点并不在于创建hello world程序&#xff0c…...

编程日记 2025/8/5 13:07:55

uniapp index.html怎么改都不生效

打开 manifest.json index.html 模板路径默认为空，所以你改的 index.html 是没用的，uni-app 根本没用这个模板设置模板后就会生效了...

编程日记 2025/8/5 13:07:52

ABP vNext + gRPC 实现服务间高速通信

ABP vNext gRPC 实现服务间高速通信 💨 在现代微服务架构中，服务之间频繁的调用往往对性能构成挑战。尤其在电商秒杀、金融风控、实时监控等对响应延迟敏感的场景中，传统 REST API 面临序列化负担重、数据体积大、通信延迟高等瓶颈。本文…...

编程日记 2025/8/5 13:07:49

【JAVA】十三、基础知识“接口”精细讲解！(三)(新手友好版~)

目录 1. Object类 1.1 Object的概念 1.2 Object例子 2. toString 2.1 toString的概念 2.2 为什么要重写toString 2.3 如何重写toString 3. 对象比较equals方法 3.1 equals( ) 方法的概念 3.2 Object类中的默认equals实现 3.3 如何正确重写equals方法 4. hashCode方…...

编程日记 2025/8/10 5:47:09

每周靶点分享：Angptl3、IgE、ADAM9及文献分享：抗体的多样性和特异性以及结构的新见解

本期精选了《脂质代谢的关键调控者Angptl3》《T细胞活化抑制因子VISTA靶点》《文献分享：双特异性抗体重轻链配对设计》三篇文章。以下为各研究内容的概述： 1. 脂质代谢的关键调控者Angptl3 血管生成素相关蛋白3（Angptl3）是血管生…...

编程日记 2025/8/8 9:37:14

网络协议之DHCP和PXE分析

写在前面本文看下DHCP和PXE相关内容。 1：正文不知道你自己手动配置过IP地址没有，在Linux的环境中可以通过如下的命令们来进行配置： $ sudo ifconfig eth1 10.0.0.1/24 $ sudo ifconfig eth1 up以及：$ sudo ip addr add 10.0…...

编程日记 2025/8/5 13:07:39

SSH 服务部署指南

本指南涵盖 OpenSSH 服务端的安装、配置密码/公钥/多因素认证，以及连接测试方法。适用系统：Ubuntu/Debian、CentOS/RHEL 等主流 Linux 发行版。 1. 安装 SSH 服务端 Ubuntu/Debian # 更新软件包索引 sudo apt update# 安装 OpenSSH 服务端 sudo apt i…...

编程日记 2025/8/5 13:07:37

表达式求值（算法题）

#include <bits/stdc.h> // 引入常用头文件 using namespace std;stack<int> num; // 存储操作数的栈 stack<char> op; // 存储运算符的栈/* 执行一次运算操作：1. 从num栈弹出两个操作数(n2先弹出，作为右操作数)2. 从op栈弹出运算符…...

编程日记 2025/8/5 13:07:33

IO流--13--MultipartFile

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录 MultipartFile1. 概述2. 常用方法解析2.1 getName方法2.2 getOriginalFileName方法2.3 getContentType方法2.4 isEmpty方法2.5 getSize方法2.6 getBytes方法2.7 get…...

编程日记 2025/8/6 22:22:32

leetcode 242. Valid Anagram

题目描述因为s和t仅仅包含小写字母，所以可以开一个26个元素的数组用来做哈希表。不过如果是unicode字符，那就用编程语言自带的哈希表。 class Solution { public:bool isAnagram(string s, string t) {int n s.size();if(s.size() ! t.size())return …...

编程日记 2025/8/9 1:05:22

内核态函数strlcpy及strscpy以及用户态函数strncpy

一、背景编写C程序时有一类看似简单实则经常暗藏漏洞的问题就是字符串的处理。对于字符串的处理，常用的函数如strcpy，sprintf，strcat等，这些函数的区别无外乎就是处理\0结尾相关的逻辑。字符串的长度有时候并不能很好确定&#…...

编程日记 2025/8/11 18:32:05

Matlab 车辆四自由度垂向模型平稳性

1、内容简介 Matlab221-车辆四自由度垂向模型平稳性可以交流、咨询、答疑 2、内容说明略 3、仿真分析略 4、参考论文略基于Simulink的汽车平顺性仿真_1_杜充基于Simulink的汽车平顺性仿真分析_谢俊淋...

编程日记 2025/8/5 13:07:22

【hadoop】Sqoop数据迁移工具的安装部署

一、Sqoop安装与配置步骤： 1、使用XFTP将Sqoop安装包sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz发送到master机器的主目录。 2、解压安装包： tar -zxvf ~/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz 3、修改文件夹的名字，将其改为s…...

编程日记 2025/8/5 13:07:19

只出现一次的数字（暴力、哈希查重、异或运算）

目录一.题目题目解析题目链接二.解题过程俗手（暴力：数组模拟哈希表） 思路代码示例提交情况本手：哈希查重思路代码示例提交情况妙手：异或运算思路代码示例提交情况作者的个人gitee 作者…...

编程日记 2025/8/11 18:32:04

Spark缓存

生活中缓存容量受成本和体积限制（比如 CPU 缓存只有几 MB 到几十 MB），但会通过算法（如 “最近最少使用” 原则）智能决定存什么，确保存的是 “最可能被用到的数据”。 1. 为什么需要缓存？ 惰性执…...

编程日记 2025/8/11 18:30:01

linux中的常用命令(一)

目录常用的快捷键 1- tab键:命令或者路径提示及补全； 2-ctrlc:放弃当前输入，终止当前任务或程序 3-ctrll;清屏 4-ctrlinsert:复制 5-鼠标右键:粘贴； 6-altc:断开连接/ctrlshift r 重新连接 7-alt1/2/3/等：切换回话窗口 8-上下键…...

编程日记 2025/8/9 0:31:17

Lua学习笔记

文章目录前言1. Lua的数据类型2. Lua的控制结构2.1 循环2.1.1 for2.1.1.1 数值循环2.1.1.2 迭代循环2.1.2 while2.1.3 repeat-until 2.2 条件语句2.3 函数 3. Lua中的变量作用域前言 Lua是一种轻量级的、高效的、可扩展的脚本语言，由巴西里约热内卢天主教大学&am…...

编程日记 2025/8/5 13:07:08

5月8日星期四今日早报简报微语报早读

5月8日星期四，农历四月十一，早报#微语早读。 1、外交部回应中美经贸高层会谈：这次会谈是应美方请求举行的； 2、河南许昌官方：胖东来联合京东物流打造的供应链产业基地将于今年投入运营； 3、我国外汇储备…...

编程日记 2025/8/5 13:07:04

P2415 集合求和详解

此题我认为主要考数学逻辑，这个题目考的是你面对代码时，是否会从中去找规律推导一个数学公式。先看题目: 此题目与集合有关，所以对于数学基础不好的同学，我会先给你讲一下这个集合的相关知识。一，首先，…...

编程日记 2025/8/6 15:31:32

#define ccw (0)和#define ccw 0什么区别

目录区别一般建议简单总结 #define ccw (0) 和 #define ccw 0 这两者在大多数情况下的功能非常相似，但在细节上有一些区别，主要涉及宏展开时的行为。区别 #define ccw (0)：宏定义的内容是（0），带括…...

编程日记 2025/8/8 9:38:39

跨平台移动开发框架React Native和Flutter性能对比

背景与架构 React Native 和 Flutter 都是跨平台移动开发框架，但它们的性能表现因架构差异而异。React Native 在 2025 年采用了 Bridgeless New Architecture（版本 0.74），使用 JavaScript Interface (JSI) 替代传统的 JavaScrip…...

编程日记 2025/8/5 13:06:56

【PhysUnits】2 SI 量纲实现解析（prefix.rs）

源码这是一个编译时量纲检查的物理单位库。 //! Physical Units Library with Type-Level Dimension Checking //! 带类型级量纲检查的物理单位库 //! //! This module provides type-safe physical unit representations using Rusts type system //! to enforce dimension…...

编程日记 2025/8/5 13:06:53

新能源汽车赛道变局：传统车企子品牌私有化背后的战略逻辑

2025年5月，一则资本市场动态引发行业震动：某国内头部传统车企宣布拟以每股2.57美元的价格私有化旗下高端新能源品牌，若交易完成，该新能源品牌将正式从纽交所退市。这一决策发生在全球新能源汽车行业经历剧烈洗牌、资本市场估值逻辑…...

编程日记 2025/8/11 10:36:38

[matlab]private和+等特殊目录在新版本matlab中不允许添加搜索路径解决方法

当我们目录包含有private,或者时候matlab搜索目录不让添加，比如截图： 在matlab2018以前这些都可以加进去后面版本都不行了。但是有时候我们必须要加进去才能兼容旧版本matlab库，比如mexopencv库就是这种情况。因此我们必须找到一个办法加进去…...

编程日记 2025/8/5 13:06:46

ImportError: cannot import name ‘Optional‘ from ‘pydantic‘

概览再使用Optional定义fastapi可选参数时，出现了错误： ImportError: cannot import name Optional from pydantic python version: 3.8 pydantic version: 2.9.2 快速解决方案 Optional导入修改为typing包，如下 from typing import List…...

编程日记 2025/8/5 13:06:43

“水木精灵” 王泫梓妍时尚造型引关注

“水木精灵” 王泫梓妍一组时尚照片曝光，再次展现其独特时尚品味与青春活力。照片中，王泫梓妍身着白色针织开衫搭配深蓝色牛仔短裙，开衫上精致的水钻装饰与深蓝色海军领增添了细节亮点，牛仔短裙的金色纽扣设计别致，整…...

编程日记 2025/8/10 18:12:14

数据结构-堆排序

1.定义 -堆中每个节点的值都必须大于等于（或小于等于）其左右子节点的值。如果每个节点的值都大于等于其子节点的值，这样的堆称为大根堆（大顶堆）；如果每个节点的值都小于等于其子节点的值，称为…...

编程日记 2025/8/5 13:06:40

影响服务器性能的主要因素是什么

在这个数字化高速发展的时代，服务器就像是幕后的超级英雄，默默支撑着我们丰富多彩的网络世界。首先，硬件配置堪称服务器性能的基石。就好比一辆跑车，强大的引擎（CPU）、宽敞的跑道（内存&#xff…...

编程日记 2025/8/6 16:34:53

为什么 MySQL 用 B+ 树作为数据的索引，以及在 InnoDB 中数据库如何通过 B+ 树索引来存储数据以及查找数据

http://www.liuzk.com/410.html 索引是一种数据结构，用于帮助我们在大量数据中快速定位到我们想要查找的数据。索引最形象的比喻就是图书的目录了。注意这里的大量，数据量大了索引才显得有意义，如果我想要在 [1,2,3,4] 中找到 4 这个数据&am…...

编程日记 2025/8/9 15:27:37

若依框架Ruoyi-vue整合图表Echarts中国地图标注动态数据

若依框架Ruoyi-vue整合图表Echarts中国地图概述创作灵感预期效果整合教程前期准备整合若依框架1、引入china.json2、方法3、data演示数据4、核心代码完整代码[毫无保留]组件调用总结概述首先，我需要回忆之前给出的回答，确保这次的内容不重复&#…...

编程日记 2025/8/5 13:06:30

可撤销并查集，原理分析，题目练习

零、写在前面可撤销并查集代码相对简单，但是使用场景往往比较复杂，经常用于处理离线查询，比较经典的应用是结合线段树分治维护动态连通性问题。在一些较为综合的图论问题中也经常出现。前置知识：并查集，扩展域并查…...

编程日记 2025/8/5 13:06:27

中介者模式（Mediator Pattern）详解

文章目录 1. 中介者模式概述1.1 定义1.2 基本思想2. 中介者模式的结构3. 中介者模式的UML类图4. 中介者模式的工作原理5. Java实现示例5.1 基本实现示例5.2 飞机空中交通控制示例5.3 GUI应用中的中介者模式6. 中介者模式的优缺点6.1 优点6.2 缺点7. 中介者模式的适用场景8. 中介…...

编程日记 2025/8/7 8:20:55

Java网络编程：深入剖析UDP数据报的奥秘与实践

在浩瀚的计算机网络世界中，数据传输协议扮演着至关重要的角色。其中，用户数据报协议（UDP，User Datagram Protocol）以其独特的“轻量级”和“无连接”特性，在众多应用场景中占据了一席之地。与更为人熟知的传输控制协议（TCP，Transmission Control Protocol）相比，UDP提…...

编程日记 2025/8/5 13:06:18

17.thinkphp的分页功能

一．分页功能 1.不管是数据库操作还是模型操作，都使用paginate()方法来实现(第一种方式)； //查找user表所有数据，每页显示5条 returnView::fetch(index, [list > User::paginate(5)]); 页数： 2.创建一个静态模版页面…...

编程日记 2025/8/5 13:06:14

Pandas比MySQL快？

知乎上有人问，处理百万级数据，Python列表、Pandas、Mysql哪个更快？ Pands是Python中非常流行的数据处理库，拥有大量用户，所以拿它和Mysql对比也是情理之中。实测来看，MySQL > Pandas > Python列表…...

编程日记 2025/8/5 13:06:09

问题｜低空经济未来发展前景机遇及挑战

低空经济 **一、发展前景与机遇**1. **政策红利加速释放，顶层设计逐步完善**2. **技术突破驱动商业化落地**3. **应用场景多元化拓展**4. **万亿级市场潜力** **二、主要挑战**1. **空域管理与安全监管难题**2. **技术瓶颈与产业链短板**3. **法规与标准体系待完善*…...

编程日记 2025/8/10 0:39:31

Matlab 分数阶PID控制

1、内容简介 Matlab218-分数阶PID控制可以交流、咨询、答疑 2、内容说明略 3、仿真分析略 4、参考论文略...

编程日记 2025/8/10 18:01:25

如何对 Oracle 日志文件进行校验

目录一、基本概述二、基础知识 1、工具介绍（1）BBED （2）dump 2、数据解析（1）BLOCK 0 （2）BLOCK 1 （3）Block n（ >=2 ）（4）redo record header （5）redo change 1）redo change header 2）redo change length list （6）Example 三、参考代码…...

编程日记 2025/8/8 6:35:58