【机器学习02--模型评估】
机器学习 --- 模型评估
- 你需要得到更好的模型,怎么判断模型更好呢?
- 你需要先得到训练集和测试集,怎么划分它们呢?
- 训练完模型之后,在验证集上测试的时候,用什么指标衡量好坏呢?
- 云里雾里,考察的重点来哩!
- ROC曲线的含义与作用
- AUC的定义
- 计算AUC的过程
- AUC的实现
- 基础面试题
你需要得到更好的模型,怎么判断模型更好呢?
在机器学习任务中,通常将训练集上的误差叫做训练误差或经验误差,在新样本上的误差叫做泛化误差,我们肯定是希望模型或者得到的学习器的训练误差越小越好,但是一般情况下,我们并不知道新的样本,所以我们只能关注于经验误差,但是经验误差就算是0,也不能保证泛化误差很小,相反,如果泛化误差很小,一般说明对样本中不重要的特征也记录下来了,一般就会导致过拟合。那么我们应该怎么根据训练集来判断模型之间的好坏呢?就需要一套评价标准。
你需要先得到训练集和测试集,怎么划分它们呢?
一帮情况下,我们会将得到的数据划分为训练集和测试集,通过测试集上的性能来近似评估训练出的模型的泛化性能,因为最终训练出的模型的参数和训练集有关,所以不同的划分方式,可能就会导致得到的模型参数不同,从而导致泛化性能也不同,下面是几种常用的划分训练集和测试集的方法。
- 留出法:直接将数据集划分为互斥的两个集合,一般70%-80%作为训练集,剩余的作为测试集,并且要注意的是,为了让训练的模型在整个数据集上的偏差较小,一般训练集和测试集中正负样本的数目是相同的,也就是正样本占50%,负样本占50%。
- 交叉验证法:这种方法将整个数据集划分为互斥的大小相似的k个子集,然后去其中一个作为验证集,一般k取10。若另k=m(样本数量),则每一个子集包含一个样本。这种划分的好处是,使得在训练集上训练的模型和数据集上想要训练出的模型较为相似,但是会导致需要训练的模型很多,计算量很大(因为在k次划分的时候,需要重复p次取不同的训练集训不同的模型)。
- 自助法:每一次从数据集D中随机抽一个,假设数据集D有m个样本,那么该样本被抽到的概率为 1 m \frac{1}{m} m1,不被抽到的概率为 ( 1 − 1 m ) (1-\frac{1}{m}) (1−m1),抽取m次,则一个样本不被抽到的概率为 ( 1 − 1 m ) m (1-\frac{1}{m})^m (1−m1)m,当m趋于无穷的时候,一个样本不被抽到的概率近似为 1 e \frac{1}{e} e1(因为m是整数,所以先换元,再洛必达,便得到极限值),即一个样本不被抽到的概率近似为0.368,自助法在数据集较小,难以有效划分训练集和测试集时比较有效,但是自助法产生的数据集改变了初始数据集的分布,会引入估计偏差。
训练完模型之后,在验证集上测试的时候,用什么指标衡量好坏呢?
在衡量一个模型的好坏的时候,需要借助多种性能度量方法,一般有以下几种:
错误率与精度,这个完全就是按照你从测试集中的样本总数中,预测的错误的数量除以总数,从而得到错误率。
查准率、查全率与F1。
查准率,就是在自己预测的所有的正样本中,预测正确的正样本的比率。
查全率,就是在所有的正样本中,预测的正样本的数量与所有正样本的数量的比率。
F1,就是跟这两有关的一个函数
P-R曲线通过将查准率作为纵轴,查全率作为横轴画的图。
ROC的纵轴为真正利率,横轴为假正利率。AUC为ROC下的面积。
云里雾里,考察的重点来哩!
ROC曲线的含义与作用
ROC曲线(Receiver Operating Characteristic Curve) 是一种常用于二分类模型的评价工具,用于可视化模型在不同分类阈值下的表现。ROC曲线描绘了 假正例率(FPR) 和 真正例率(TPR) 之间的关系,帮助我们评估模型在各种分类阈值下的分类能力。
这里提到的真正例率表示所有真样本中,预测出的正的比例,假正例率为所有假的样本中,预测出的正的比例。你看,ROC就是不一样,它既考虑正样本的分类能力,又考虑负样本下的预测分类能力,不像其他,只考虑一个。
AUC的定义
AUC(Area Under the Curve)是ROC(Receiver Operating Characteristic)曲线下的面积,衡量的是模型在不同分类阈值下的表现。AUC值越大,表示模型对正负类样本的区分能力越强。具体来说,AUC的值介于0和1之间,越接近1表示模型越好;AUC为0.5时表示模型表现与随机猜测相似。
AUC实际上刻画的是模型对正负类样本的整体区分能力,不受具体分类阈值的影响。因此,AUC越高,表示模型在 几乎所有的分类阈值下 都能更好地区分正类和负类。
- AUC = 1:完美分类器,所有正类样本的分数都大于负类样本的分数。
- AUC = 0.5:随机分类器,模型无法有效地区分正负类,等同于随机猜测。
- AUC < 0.5:模型性能很差,比随机猜测还要差。
AUC通过对ROC曲线下的面积计算得出,而ROC曲线是由不同的分类阈值下的 假正例率(FPR) 和 真正例率(TPR) 组成的。
计算AUC的过程
AUC的计算可以通过以下步骤来实现:
- 计算模型的输出概率
模型通常会输出每个样本属于正类的概率,而不是直接给出分类标签。AUC基于这些概率来评估模型的区分能力。 - 将样本按预测的概率排序
将所有测试样本按模型预测的概率从高到低排序,较高的概率表示模型更倾向于该样本是正类。 - 计算真正例率和假正例率
对于每个可能的阈值(即每个预测概率),计算TPR和FPR:
TPR(召回率) = True Positives True Positives + False Negatives \frac{\text{True Positives}}{\text{True Positives} + \text{False Negatives}} True Positives+False NegativesTrue Positives
FPR = False Positives False Positives + True Negatives \frac{\text{False Positives}}{\text{False Positives} + \text{True Negatives}} False Positives+True NegativesFalse Positives
然后,绘制ROC曲线,横轴是FPR,纵轴是TPR。 - 计算ROC曲线下的面积(AUC)
AUC值即为ROC曲线下的面积。常用的计算方法包括 梯形法则(Trapezoidal Rule) 来近似计算AUC。
AUC的实现
import numpy as np
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt# 假设y_true是真实标签,y_scores是模型预测的概率值
y_true = np.array([0, 0, 1, 1]) # 真实标签(0表示负类,1表示正类)
y_scores = np.array([0.1, 0.4, 0.35, 0.8]) # 模型预测的概率值# 计算ROC曲线的FPR和TPR
fpr, tpr, thresholds = roc_curve(y_true, y_scores)# 计算AUC
roc_auc = auc(fpr, tpr)# 输出AUC
print(f'AUC: {roc_auc}')# 绘制ROC曲线
plt.figure()
plt.plot(fpr, tpr, color='darkorange', lw=2, label='ROC curve (area = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic (ROC)')
plt.legend(loc="lower right")
plt.show()
基础面试题
- 有哪些评价指标?
错误率、精度、查准率、查全率(Recall、查全率)、F1分数、ROC、AUC、PR曲线
AUC是ROC曲线的面积,衡量的是模型的分类能力,值越大表示模型越好,AOC等于0.5,相当于随机判断模型。 - AOC的计算方式?
ROC曲线下的面积,即梯度的面积公式
相关文章:
【机器学习02--模型评估】
机器学习 --- 模型评估 你需要得到更好的模型,怎么判断模型更好呢?你需要先得到训练集和测试集,怎么划分它们呢?训练完模型之后,在验证集上测试的时候,用什么指标衡量好坏呢?云里雾里࿰…...
【人工智能】深入解析Python中的聚类算法:从K-Means到DBSCAN
解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 聚类是一种无监督学习的核心技术,用于将数据点分组到不同的簇中,使得同一簇内的点相似度最大化,不同簇间的点差异性最大化。K-Means和DBSCAN是两种最常见的聚类算法,分别适用于密度驱动和形状复杂的数据分组需…...
【STM32 Modbus编程】-作为主设备读取线圈和输入
作为主设备读取线圈和输入 文章目录 作为主设备读取线圈和输入1、硬件准备与连接1.1 RS452模块介绍1.2 硬件配置与接线1.3 软件准备2、读取线圈2.1 主设备发送请求2.2 从设备响应请求2.3 主机接收数据3、读取输入4、结果本文将在前面文章的基础上,实现主设备通过ModBus协议对从…...
数据结构(栈Stack)
1.前言: 在计算机科学中,栈(Stack)是一种基础而存在的数据结构,它的核心特性是后进先出(LIFO,Last In, First Out)。想象一下,在现实生活中我们如何处理一堆托盘——我们…...
Maven 中scope 的provided、compile、runtime、test、system 含义
在 Maven 中,<scope> 定义了依赖的可见性和生命周期。不同的 scope 值指示 Maven 在编译、测试和运行时如何处理这些依赖。以下是 Maven 中的几种常用依赖范围及其详细说明: 1. <scope>provided</scope> 含义:provided 范…...
Nginx 负载均衡和反向代理
Nginx 是一个高性能的 HTTP 服务器和反向代理服务器,广泛应用于负载均衡中。它的负载均衡功能支持多种策略,可以有效分配流量到后端服务器,提升系统的可靠性和可用性。 负载均衡 首先,Nginx 负载均衡配置是通过在 Nginx 配置文件…...
【网络安全】数据集合集!
本文将为您介绍经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。 1 SecGPT 更新时间:2024-05-08 访问地址: GitHub 描述: SecGPT的愿景是将人工智能技术引入网络安全领域,以提高网络防御的效率和效果。其使命是推动…...
大数据(一)MaxCompute
一、引言 作者后面会使用MaxCompute,所以在进行学习研究,总会有一些疑问产生,这里讲讲作者的疑问和思路 二、介绍 MaxCompute(原名 ODPS - Open Data Processing Service)是阿里云提供的大数据处理平台,专…...
数据科学与大数据之间的区别
什么是数据科学? 数据科学是一个跨学科领域,它将统计学和计算方法相结合,旨在从数据中提取见解和知识。它涉及收集、处理、分析以及解读数据,以揭示可用于为决策过程提供依据并推动创新的模式、趋势和关系。 数据科学涵盖了广泛…...
IP 地理位置定位技术原理概述
本文深入探讨 IP 地理位置定位技术的原理。介绍了 IP 地址的基本概念及其在网络中的作用,随后阐述了基于数据库查询、基于网络拓扑分析以及基于机器学习算法的三种主要 IP 地理位置定位技术原理中的基于IP数据库查询。 IP 地址基础 IP 地址是互联网协议࿰…...
多进程multiprocessing通信multiprocessing.Queue
multiprocessing.Queue 通常只能在主模块(即 if __name__ "__main__": 块)中创建和使用。这是因为 multiprocessing 模块在 Windows 系统上需要通过 if __name__ "__main__": 块来避免递归导入问题。 from multiprocessing import…...
工业—使用Flink处理Kafka中的数据_ChangeRecord2
使用 Flink 消费 Kafka 中 ChangeRecord 主题的数据,每隔 1 分钟输出最近 3 分钟的预警次数最多的 设备,将结果存入Redis 中, key 值为...
微信小程序4-内容溢出滚动条
感谢阅读,初学小白,有错指正。 一、功能描述 在前一篇文章的隐藏框页面的功能里(《微信小程序3-显标记信息和弹框》),我想添加一个内容溢出的时候,可通过滑动滚动条,实现查看溢出部分的内容&a…...
python源码实例游戏开发小程序办公自动化网络爬虫项目开发源码(250+个项目、26.6GB)
文章目录 源代码下载地址项目介绍预览 项目备注源代码下载地址 源代码下载地址 点击这里下载源码 项目介绍 python源码实例游戏开发小程序办公自动化网络爬虫项目开发源码(250个项目、26.6GB) 预览 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情…...
ProjectSend 身份认证绕过漏洞复现(CVE-2024-11680)
0x01 产品描述: ProjectSend 是一个开源文件共享网络应用程序,旨在促进服务器管理员和客户端之间的安全、私密文件传输。它是一款相当流行的应用程序,被更喜欢自托管解决方案而不是 Google Drive 和 Dropbox 等第三方服务的组织使用。0x02 漏洞描述: ProjectSend r1720 之前…...
算法训练-搜索
搜索 leetcode102. 二叉树的层序遍历 法一:广度优先遍历 leetcode103. 二叉树的锯齿形层序遍历 法一:双端队列 法二:倒序 法三:奇偶逻辑分离 leetcode236. 二叉树的最近公共祖先 法一:递归 leetcode230. 二叉…...
【C++】map和set
个人主页 : zxctscl 如有转载请先通知 文章目录 1. 关联式容器2. 键值对3. set3.1 set的模板参数列表3.2 set的构造3.3 set的迭代器3.4 set的容量3.5 set修改操作3.6 multiset 4. map4.1 map的模板参数说明4.2 map的构造4.3 map的迭代器4.4 map的容量与元素访问4.5 …...
MongoDB安装|注意事项
《疯狂Spring Boot讲义》是2021年电子工业出版社出版的图书,作者是李刚 《疯狂Spring Boot终极讲义》不是一本介绍类似于PathVariable、MatrixVariable、RequestBody、ResponseBody这些基础注解的图书,它是真正讲解Spring Boot的图书。Spring Boot的核心…...
使用playwright自动化测试时,npx playwright test --ui打开图形化界面时报错
使用playwright自动化测试时,npx playwright test --ui打开图形化界面时报错 1、错误描述:2、解决办法3、注意符号的转义 1、错误描述: 在运行playwright的自动化测试项目时,使用npm run test无头模式运行正常,但使用…...
Linux ufw 命令详解
简介 UFW(Uncomplicated Firewall) 简单防火墙是一款基于 iptables 构建的、用于管理防火墙规则的用户友好型工具。它简化了在 Linux 系统上配置防火墙的过程。 安装 在 Ubuntu/Debian 上安装 sudo apt update sudo apt install ufw在 CentOS/Red Hat 上安装 sudo yum ins…...
3248. 矩阵中的蛇
3248. 矩阵中的蛇 题目链接:3248. 矩阵中的蛇 代码如下: class Solution { public:int finalPositionOfSnake(int n, vector<string>& commands){int i 0, j 0;for (string& command : commands){if (command "LEFT") { j…...
图片的懒加载
目录 懒加载的来源 事件监听 IntersectionObserver 懒加载的来源 图片的来加载其实就是延迟加载,我们知道浏览器的可视范围是有限的,现在网页的内容越来越丰富,一般网页的内容都是需要滚动才能完成浏览 如果网页有很多图片,然…...
网络脚本生成器
网络官网地址 网络配置生成工具 终端-接入-汇聚-核心-防火墙-互联网路由器 一 开局配置 华为设备配置命令 system-viewsysname SW-JR-Switchvlan 10 vlan 20 vlan 30 vlan 40 quitinterface Vlan-interface 40 ip address 192.168.40.1 255.255.255.0 quitip route-static 1…...
Kibana server is not ready yet
遇到“Kibana server is not ready yet”错误通常表示Kibana无法连接到Elasticsearch。以下是一些常见原因及其解决方案: 1.常见原因 1.1.Elasticsearch未运行: 确保Elasticsearch服务已启动并正常运行。您可以通过访问 http://localhost:9200 来检查…...
Git 高频命令及其功能、作用与使用场景
在软件开发的世界里,Git 已经成为了版本控制的代名词。无论你是开发小型项目还是参与大型团队协作,Git 都是你不可或缺的得力助手。今天我们来聊聊 Git 中的一些高频命令,了解它们的功能、作用以及常见的使用场景,帮助你在日常开发…...
将word里自带公式编辑器编辑的公式转换成用mathtype编辑的格式
文章目录 将word里自带公式编辑器编辑的公式转换成用mathtype编辑的格式MathType安装问题MathType30天试用延期MathPage.wll文件找不到问题 将word里自带公式编辑器编辑的公式转换成用mathtype编辑的格式 word自带公式编辑器编辑的公式格式: MathType编辑的格式&a…...
【HarmonyOS】Component组件引入报错 does not meet UI component syntax.
【HarmonyOS】Component组件引入报错 一、问题背景 有时会碰到引入组件时,无法import引入组件,导致引入的组件报错。 或者提示does not meet UI component syntax. (不符合UI组件语法。) 如下图所示,在引入组件时&a…...
力扣-图论-1【算法学习day.51】
前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向和记录学习过程(例如想要掌握基础用法,该刷哪些题?)我的解析也不会做的非常详细,只会提供思路和一些关键点,力扣上的大佬们的题解质量是非…...
使用lumerical脚本语言创建定向耦合器并进行数据分析(纯代码实现)
本文使用lumerical脚本语言创建定向耦合器波导、计算定向耦合器的偶数和奇数模式、分析定向耦合器的波长依赖性、分析定向耦合器的间隙依赖性(代码均有注释详解)。 一、绘制定向耦合器波导 1.1 代码实现 # 这段代码主要实现了绘制定向耦合器波导几何结构的功能。通过定义各种…...
Java面试要点50 - List的线程安全实现:CopyOnWriteArrayList
文章目录 一、引入二、实现原理解析2.1 写时复制机制2.2 读写分离策略 三、性能测试分析四、应用场景分析4.1 事件监听器管理4.2 缓存实现 五、最佳实践建议5.1 性能优化技巧5.2 常见陷阱规避 总结 一、引入 在并发编程中,线程安全的集合类扮演着重要角色。CopyOnWriteArrayLi…...
python脚本实现csv中百度经纬度转84经纬度
数据准备 csv文件,带百度经纬度字段:bd09_x,bd09_y 目的 将百度经纬度转换为84经纬度,并在csv文件中添加两个字段:84_x,84_y python脚本 from ChangeCoordinate import ChangeCoordimport pandas as pd import numpy as npcoord = ChangeCoord()def bd09_to_wgs84...
Vue2和Vue3的区别
响应式系统 Vue 2 技术基础:使用 Object.defineProperty 实现响应式。局限性: 无法监听新增属性:如果在创建实例后添加新属性,这些属性不会自动成为响应式的。数组变更检测问题:直接通过索引设置值或长度不会触发更新…...
JavaEE-经典多线程样例
文章目录 单例模式设计模式初步引入为何存在单例模式饿汉式单例模式饿汉式缺陷以及是否线程安全懒汉式单例模式基础懒汉式缺陷以及是否线程安全懒汉式单例模式的改进完整代码(变量volatile) 阻塞队列生产者消费者模型生产者消费者模型的案例以及优点请求与响应案例解耦合削峰填…...
Android显示系统(04)- OpenGL ES - Shader绘制三角形
一、前言: OpenGL 1.0采用固定管线,OpenGL 2.0以上版本重要的改变就是采用了可编程管线,Shader 编程是指使用着色器(Shader)编写代码来控制图形渲染管线中特定阶段的处理过程。在图形渲染中,着色器是在 GP…...
PMP–一、二、三模、冲刺–分类–10.沟通管理
文章目录 技巧十、沟通管理 一模10.沟通管理--1.规划沟通管理--文化意识--军事背景和非军事背景人员有文化差异5、 [单选] 项目团队由前军事和非军事小组成员组成。没有军事背景的团队成员认为前军事团队成员在他们的项目方法中过于结构化和僵化。前军事成员认为其他团队成员更…...
flutter windows 使用c++、dll等实践记录
在flutter的windows平台引入dll文件 https://juejin.cn/post/7223676609794015287 google官方说法(感觉不太实用) https://groups.google.com/a/dartlang.org/g/misc/c/fyh2W38AEVo Using a C DLL in Flutter Windows desktop app(未尝试&…...
JUnit介绍:单元测试
1、什么是单元测试 单元测试是针对最小的功能单元编写测试代码(Java 程序最小的功能单元是方法)单元测试就是针对单个Java方法的测试。 2、为什么要使用单元测试 确保单个方法运行正常; 如果修改了代码,只需要确保其对应的单元…...
电脑插入耳机和音响,只显示一个播放设备
1. 控制面板-硬件和声音-Realtek高清音频-扬声器-设备高级设置-播放设备里选择使用前部和后部输出设备同时播放两种不同的音频流 在声音设置中就可以看到耳机播放选项...
【每日刷题】Day162
【每日刷题】Day162 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 3302. 字典序最小的合法序列 - 力扣(LeetCode) 2. 44. 通配符匹配 - 力扣&…...
使用 EasyExcel 实现高效的 Excel 读写操作
在日常开发中,Excel 文件的读写操作是一个常见的需求。EasyExcel 是阿里巴巴开源的一个高性能、易用的 Excel 读写库,可以大幅提高处理 Excel 文件的效率。它通过事件驱动模型优化了大数据量 Excel 的读写性能,非常适合处理大文件或高并发场景…...
千益畅行,旅游卡有些什么优势?
千益畅行共享旅游卡是一种创新的旅游服务模式,旨在通过整合各类旅游资源,为用户提供一站式的旅游解决方案。这张旅游卡支持2至6人同行,涵盖了接机、酒店、用餐、大巴、导游、景区门票等服务,用户只需自行承担往返交通费用即可享受…...
Hive分区裁剪(Partition Pruning)详解
Hive分区裁剪是一种优化技术,旨在查询时只读取与条件匹配的分区,从而减少不必要的数据扫描。这种机制依赖于分区表的设计和查询优化器的工作,特别是在处理大规模数据时,分区裁剪可以显著提高查询性能。 1. 什么是分区裁剪…...
云原生数据库 PolarDB
PolarDB 是阿里云推出的一款云原生数据库,旨在为企业提供高性能、高可靠性的数据库解决方案。它基于云计算环境设计,特别适用于云上的大规模数据处理和存储需求。PolarDB 是一种兼具关系型数据库(RDS)和分布式数据库特性的新型数据…...
数据库原理-期末基础知识
1、数据库管理系统有哪些功能? 数据定义功能、数据操作功能、数据库的运行管理、数据库的建立与维护。 2、数据库设计分哪几个阶段? 需求分析->概念设计->逻辑设计->物理设计->数据库实施->数据的运营与维护 3、简述三级封锁协议的内…...
Java版-速通数据结构-树基础知识
现在面试问mysql,红黑树好像都是必备问题了。动不动就让手写红黑树或者简单介绍下红黑树。然而,我们如果直接去看红黑树,可能会一下子蒙了。在看红黑树之前,需要先了解下树的基础知识,从简单到复杂,看看红黑树是在什么…...
量化交易系统开发-实时行情自动化交易-8.4.MT4/MT5平台
19年创业做过一年的量化交易但没有成功,作为交易系统的开发人员积累了一些经验,最近想重新研究交易系统,一边整理一边写出来一些思考供大家参考,也希望跟做量化的朋友有更多的交流和合作。 接下来会对于MT4/MT5平台介绍。 MetaT…...
Git 的基本概念和使用方式
Git是一个分布式版本控制系统,用于跟踪文件内容的变化和协作开发。 Git的主要概念包括: 仓库(Repository):存储代码和历史记录的地方。可以是本地仓库(Local Repository)或远程仓库(…...
Conda-Pack打包:高效管理Python环境
在Python开发中,环境管理是一个不可忽视的重要环节。Conda是一个流行的包管理器和环境管理器,它允许用户创建隔离的环境,以避免不同项目之间的依赖冲突。Conda-pack是一个工具,可以帮助我们将一个conda环境打包成一个可移植文件&a…...
Python语法基础---正则表达式
🌈个人主页:羽晨同学 💫个人格言:“成为自己未来的主人~” 我们这个文章所讲述的,也是数据分析的基础文章,正则表达式 首先,我们在开始之前,引出一个问题。也是我们接下来想要解决的问题。…...
深入理解ROS中的参数服务器及其应用
深入理解ROS中的参数服务器及其应用 在Robot Operating System (ROS) 中,参数服务器(Parameter Server)是一个中心化服务,它允许节点在运行时存储和检索配置信息。这种机制是为了支持数据的共享和灵活的参数管理而设计的…...