机器学习中的分类和回归问题
1. 分类问题
机器学习中的分类问题是一种监督学习任务,其核心目标是将数据样本分配到预定义的离散类别中,例如判断邮件是否为垃圾邮件、识别图像中的物体类型等。
- 分类通过已知标签的训练数据(如带类别标注的样本)学习特征与类别之间的映射关系,形成分类模型(分类器)。新数据输入时,模型根据其特征预测其所属类别
- 分类需要标签数据作为“正确答案”指导模型训练,与无监督学习的聚类(无标签数据分组)形成对比
1.1. 输出形式
- 离散类别标签:例如二分类中的“是/否”(垃圾邮件检测),多分类中的“猫/狗/鸟”(图像识别)
- 概率输出:部分算法(如逻辑回归)还会输出样本属于某类的概率(如“垃圾邮件概率为90%”)
1.2. 应用场景与分类类型
- 金融:信用评分(预测用户是否违约)、欺诈检测
- 医疗:疾病诊断(根据症状分类疾病类型)
- 自然语言处理:情感分析(文本分为正面/负面/中性)、新闻主题分类
- 计算机视觉:人脸识别、手写数字分类(如MNIST数据集)
1.3. 分类任务类型
类型 | 描述 | 示例 |
---|---|---|
二分类 | 仅区分两个类别 | 垃圾邮件 vs 正常邮件 |
多分类 | 区分三个及以上互斥类别 | 手写数字0-9识别 |
多标签分类 | 单个样本可同时属于多个类别 | 一篇新闻同时属于“科技”和“政治” |
序数分类 | 类别具有顺序关系(如评级A/B/C/D) | 学生成绩分级 |
1.4. 关键算法与模型
- 传统算法:逻辑回归(概率映射)、决策树(特征分割规则)、支持向量机(最大化分类间隔)等
- 集成方法:随机森林(多决策树投票)、梯度提升树(GBDT/XGBoost)
- 深度学习:神经网络(如卷积神经网络用于图像分类)
1.5. 评估指标
- 准确率(Accuracy):正确预测样本占总样本的比例,适用于类别均衡的数据
- 精确率(Precision)与召回率(Recall):关注模型在特定类别上的性能(如疾病诊断需高召回率减少漏诊)
- F1分数:精确率与召回率的调和平均,综合衡量模型表现
- ROC-AUC曲线:评估模型在不同阈值下的分类能力,适用于二分类
2. 回归问题
回归问题是机器学习中一种监督学习任务,其核心目标是预测连续的数值输出,而非离散的类别标签。例如,预测房价、气温、销售额等连续值。其名称源于统计学中的“回归效应”,由高尔顿在研究父母与子女身高关系时提出,描述数据向平均值靠近的趋势,后被扩展为预测连续值的统称。
- 核心目标:建立特征与目标值之间的数学关系(如线性方程、多项式函数等),最小化预测值与真实值之间的误差。
2.1. 典型应用场景
- 金融领域:股票价格预测、风险评估(如预测企业违约概率)
- 医疗领域:疾病风险评分(如糖尿病患病概率)、药物剂量疗效预测
- 工业制造:设备故障时间预测、产品质量控制(如预测零件尺寸误差)
- 交通与能源:交通流量预测、电力需求分析
2.3. 输入与输出
- 输入:一组特征(数值型或可数值化的数据),如房屋面积、年龄、历史股价等
- 输出:连续值(如房价为325.6万元、气温为28.5℃等)。
2.4. 关键算法
- 线性回归:通过拟合直线(或超平面)建立线性关系
- 支持向量回归(SVR):利用核函数处理非线性数据,最大化误差容忍范围内的预测稳定性
- 神经网络回归:通过多层非线性变换拟合复杂函数关系
- 随机森林回归:集成多棵决策树的预测结果以降低方差
2.5. 关键评估指标
- 均方误差(MSE):预测值与真实值的平均平方差,对异常值敏感。
- 平均绝对误差(MAE):误差绝对值的平均,更鲁棒但忽略误差方向。
- R²分数:解释模型对数据变异的拟合程度,取值0~1,越接近1越好。
- 均方根误差(RMSE):MSE的平方根,与目标值单位一致,直观反映误差大小。
3. 分类和回归问题对比
维度 | 回归问题 | 分类问题 |
---|---|---|
输出类型 | 连续数值(如温度、价格) | 离散类别标签(如“是/否”) |
评估指标 | 均方误差(MSE)、R²分数 | 准确率、F1分数、ROC-AUC |
损失函数 | 均方误差(MSE) | 交叉熵(Cross-Entropy) |
应用场景 | 预测具体数值(如股票价格) | 判断类别归属(如垃圾邮件识别) |
注:此文为AI生成后编辑。
相关文章:
机器学习中的分类和回归问题
1. 分类问题 机器学习中的分类问题是一种监督学习任务,其核心目标是将数据样本分配到预定义的离散类别中,例如判断邮件是否为垃圾邮件、识别图像中的物体类型等。 分类通过已知标签的训练数据(如带类别标注的样本)学习特征与类别…...
pip命令
安装&卸载 -- 安装numpy pip install numpy1.26.4 -- 从索引安装(自定义源) pip install package_name --index-url https://custom_url -- 安装本地文件或目录 pip install /path/to/package.whl pip install D:\Downloads\transformers-4.40.0-py…...
n8n工作流自动化平台的实操:Cannot find module ‘iconv-lite‘
解决问题: 1.在可视化界面,执行const iconv require(iconv-lite);,报Cannot find module iconv-lite [line 2]错误; 查看module的路径 进入docker容器 #docker exec -it n8n /bin/sh 构建一个test.js,并写入如何代码 vi tes…...
AIGC时代——语义化AI驱动器:提示词的未来图景与技术深潜
文章目录 一、技术范式重构:从指令集到语义认知网络1.1 多模态语义解析器的进化路径1.2 提示词工程的认知分层 二、交互革命:从提示词到意图理解2.1 自然语言交互的认知进化2.2 专业领域的认知增强 三、未来技术图谱:2025-2030演进路线3.1 20…...
基于Springboot高校网上缴费综合务系统【附源码】
基于Springboot高校网上缴费综合务系统 效果如下: 系统登陆页面 个人中心页面 论坛交流页面 发表评论页面 付款页面 教师缴费页面 新增缴费类型页面 审核页面 研究背景 随着高校信息化建设进程的加速,传统手工缴费模式因效率低、错误率高、管理成本高…...
返回倒数第k个节点题解
这题要用到快慢指针的思想。 1.定义两个指针,一个快指针,一个慢指针,初始都指向头结点 2.先让快指针往后走k步,也就是移动k个节点,这个时候快指针比慢指针领先k 3.现在让快慢指针同时往后移动,两指针之间…...
《操作系统精髓与设计原理》第4章课后题答案-线程、对称多处理器和微内核
1.表3.5列出了在一个没有线程的操作系统中进程控制块的基本元素。对于多线程系统,这些元素中哪些可能属于线程控制块,哪些可能属于进程控制块? 对于不同的系统来说通常是不同的,但一般来说,进程是资源的所有者…...
《ATPL地面培训教材13:飞行原理》——第4章:亚音速气流
翻译:刘远贺;工具:Cursor & Claude 3.7;过程稿 第4章:亚音速气流 目录 翼型术语气流基础二维气流总结习题答案 翼型术语 翼型 一种能够以较高效率产生升力的特殊形状。 弦线 连接翼型前缘和后缘曲率中心的直…...
5月3日星期六今日早报简报微语报早读
5月3日星期六,农历四月初六,早报#微语早读。 1、五一假期多地政府食堂对外开放:部分机关食堂饭菜“秒没”; 2、2025年五一档电影新片票房破3亿; 3、首日5金!中国队夺得跳水世界杯总决赛混合团体冠军&…...
2024 虚拟电厂与大电网三道防线的关系探讨【附全文阅读】
本文围绕虚拟电厂与大电网三道防线展开探讨。大电网三道防线包括第一道防线的预防性控制和继电保护、第二道防线的稳控系统、第三道防线的失步解列及频率电压紧急控制装置 ,新型电力系统建设对第三道防线带来频率稳定等挑战。当前新型配电网第三道防线建设存在问题&…...
【c++】模板详解
目录 泛型编程模板的使用函数模板函数模板的本质函数模板的实例化显式实例化隐式实例化 函数模板的模板参数的匹配原则 类模板类模板的本质类模板的实例化 非类型模板参数模板特化函数模板特化类模板特化类模板全特化类模板偏特化(半特化) 模板分离编译t…...
【Linux】驱动开发方法
使用Petalinux学习驱动开发时的一些经验。 部分图片和经验来源于网络,若有侵权麻烦联系我删除,主要是做笔记的时候忘记写来源了,做完笔记很久才写博客。 专栏目录:记录自己的嵌入式学习之路-CSDN博客 目录 1 基础——字符设备驱动 1.1 分配设备号(驱动入口使用)…...
BUUCTF——禁止套娃
BUUCTF——禁止套娃 进入靶场 一个近乎空白的页面 看一下框架 没什么有用的信息,扫个目录吧 只扫出来给flag.php,但是0B,估计又是个空网站 拼接访问一下 果然又是什么都没有 没有突破口 githack找找看看也没有源码吧 <?php include …...
Spring MVC @RequestBody 注解怎么用?接收什么格式的数据?
RequestBody 注解的作用 RequestBody 将方法上的参数绑定到 HTTP 请求的 Body(请求体)的内容上。 当客户端发送一个包含数据的请求体(通常在 POST, PUT, PATCH 请求中)时,RequestBody 告诉 Spring MVC 读取这个请求体…...
线性DP(动态规划)
线性DP的概念(视频) 学习线性DP之前,请确保已经对递推有所了解。 一、概念 1、动态规划 不要去看网上的各种概念,什么无后效性,什么空间换时间,会越看越晕。从做题的角度去理解就好了,动态规划…...
Qt中实现工厂模式
在Qt中实现工厂模式可以通过多种方式,具体选择取决于需求和场景。以下是几种常见的实现方法: 1. 简单工厂模式通过一个工厂类根据参数创建不同对象。cppclass Shape {public: virtual void draw() 0; virtual ~Shape() default;};class Circle : publ…...
基于 Dify + vLLM插件 + Qwen3 构建问答机器人Docker版
前提条件 硬件要求: 推荐 NVIDIA GPU (至少 16GB 显存,Qwen3 可能需要更多) 至少 32GB 内存 足够的存储空间 (Qwen3 模型文件较大) 软件要求: Docker 和 Docker Compose Python 3.8 CUDA 和 cuDNN (与你的 GPU 兼容的版本) 安装步骤…...
【Linux】Linux应用开发小经验
基于Petalinux工具链的Linux应用开发小经验,未完待续... 部分图片和经验来源于网络,若有侵权麻烦联系我删除,主要是做笔记的时候忘记写来源了,做完笔记很久才写博客。 专栏目录:记录自己的嵌入式学习之路-CSDN博客 目录…...
第39课 绘制原理图——绘制命令在哪里?
绘制原理图符号的命令在哪里? 在新建完原理图之后,我们就可以在原理图上绘制各种相关的符号了。 我们基本会从以下的两个地方,找到绘制各种符号的命令: 菜单栏中的“放置”菜单; 悬浮于设计窗口中的快速工具条 在初…...
第十四篇:系统分析师第三遍——15章
目录 一、目标二、计划三、完成情况四、意外之喜(最少2点)1.计划内的明确认知和思想的提升标志2.计划外的具体事情提升内容和标志 五、总结六、后面准备怎么做? 一、目标 通过参加考试,训练学习能力,而非单纯以拿证为目的。 1.在复习过程中&…...
市面上所有大模型apikey获取指南(持续更新中)
阿里云(千问) 官方文档: 百炼控制台 1. 登录百炼控制台 2.前往我的api页面百炼控制台 3.创建api4. 添加描述(用于aichat) Deepseek 官方文档:首次调用 API | DeepSeek API Docs 1. 登录api平台 DeepSeek 开放平台 2. Deep…...
Java框架“若依RuoYi”前后端分离部署
运行环境 Eclipse IDE for Enterprise Java and Web Developers 下载Eclipse解压Eclipse到文件夹 Maven 下载Maven解压Maven到文件夹配置环境变量MAVEN_HOME为Maven安装位置配置环境变量path为%MAVEN_HOME%\bin Redis 下载Redis解压Redis到文件夹配置环境变量path为Redis安装位…...
计网_可靠传输ARQ机制
2024.09.04:网工老姜&beokayy网工学习笔记 第5节 可靠传输机制 5.1 可靠传输5.2 ARQ机制、ARQ协议5.3 ARQ简介(可靠传输)5.3.1 停止等待协议(1)无差错情况(2)有差错情况确认丢失确认迟到 5.…...
实验-组合电路设计1-全加器和加法器(数字逻辑)
目录 一、实验内容 二、实验步骤 2.1 全加器的设计 2.2 加法器的设计 三、调试过程 3.1 全加器调试过程 2.加法器的调试过程 四、实验使用环境 五、实验小结和思考 一、实验内容 a) 介绍 在这次实验中,你将熟悉 Logisim 的操作流程,并且学习…...
软件管理(安装方式)
1.rpm安装 1.1.rpm介绍 rpm软件包名称: 软件名称 版本号(主版本、次版本、修订号) 操作系统 -----90%的规律 举例:openssh-6.6.1p1-31.el7.x86_64.rpm 数字是版本号:第一位主版本号,第二位次版本号,带横杠的是修订号, el几---操作系统的版本。 #用rpm安装需要考虑如下信…...
工作记录 2015-07-15
工作记录 2015-07-15 序号 工作 相关人员 1 在CDAEditor上增加签名的处理,已经基本改完。明天整理说明文档,更新193服务器。 郝 需要改了签名的处理 增加了签名的按钮: 已经签名过的会有提示: 签名后PDF的预览如下…...
《算法导论(第4版)》阅读笔记:p4-p5
《算法导论(第4版)》学习第 3 天,p4-p5 总结,总计 2 页。 一、技术总结 1.instance Thus, given the input sequence h31; 41; 59; 26; 41; 58i, a correct sorting algorithm returns as output the sequence h26; 31; 41; 41; 58; 59i. Such an inp…...
【Mytais系列】Update语句执行流程
以下是通过 时序图 和 文字说明 详细描述的 MyBatis 执行 UPDATE/INSERT/DELETE 语句的完整流程,包括缓存清理、事务提交和数据库操作的各个环节: 时序图(Sequence Diagram) 详细执行流程解析 1. 客户端发起更新请求 客户端调用…...
LeetCode —— 145. 二叉树的后序遍历
😶🌫️😶🌫️😶🌫️😶🌫️Take your time ! 😶🌫️😶🌫️😶🌫️😶🌫️…...
Python函数参数机制深度解析与最佳实践
引言 在Python开发中,函数的参数机制是构建灵活、可维护代码的核心要素。本文将通过7个关键维度深入剖析函数参数的底层原理与高级用法,结合代码实例揭示参数传递的本质规律,助您掌握工业级函数设计技巧(基于Python 3.12环境验证…...
ARM 算数指令
加法 ADD 减法 SUB 取负 NEG 比较 CMP 乘法 MUL 移位 LSL、LSR、ASL、ASR、ROL、ROR加法和减法 绝大多数微处理器都实现了带进位的加法指令,能够将两个操作数和条件码寄存器中的进位位加到一起。这条指令会使字长大于计算机固有字长的链接运算更加方便。 说明了如何…...
普通IT的股票交易成长史--20250502 突破(2)
声明:本文章的内容只是自己学习的总结,不构成投资建议。文中观点基本来自yt站方方土priceaction,综合自己的观点得出。感谢他们的无私分享。 送给自己的话: 仓位就是生命,绝对不能满仓!!&#…...
什么是 Redis?
什么是 Redis? Redis(全称是 Remote Dictionary Server,远程字典服务器)是一个非常快的开源内存数据库,它主要用来存储“键-值”对类型的数据。与传统的数据库不太一样,Redis的数据主要存放在内存中,所以它读写速度特别快。 通俗比喻: 想象你有一个小仓库,里面放了…...
IEEE LaTeX会议模板作者对齐、部门长名称换行
第二行作者对齐 参考链接: https://tex.stackexchange.com/questions/458204/ieeetran-document-class-how-to-align-five-authors-properly/458208#458208https://tex.stackexchange.com/questions/582487/how-to-align-four-author-names-in-the-ieee-conferenc…...
前端面经-VUE3篇(二)--vue3组件知识(二)依赖注入、异步组件、生命周期、组合式函数、插件
目录 一、依赖注入 1、 依赖注入是什么? 2、最基础的使用 3、为什么使用依赖注入? 4、 使用 Symbol 作注入名 二、异步组件 1、什么是异步组件? 2、最基础用法:defineAsyncComponent 3、在模板中使用异步组件 4、配置加载状态…...
Manus联合创始人:公司产品基于Claude和阿里千问大模型开发
3月11日消息,日前,Manus官方在社交平台转发了公司联合创始人、首席科学家季逸超对Manus的技术解读,季逸超在评论区回复网友关于“Manus使用了哪一个基础大模型”这一问题时回复称,“我们用过Claude,也用过不同版本的Qw…...
华为云Flexus+DeepSeek征文|快速搭建Dify LLM应用开发平台教程
目录 部署Dify-LLM应用开发平台开始使用一键卸载注意事项 部署Dify-LLM应用开发平台 1、首先需要访问快速搭建Dify-LLM应用开发平台-华为云 2、使用"一键部署"功能快速搭建Dify平台快速搭建Dify LLM应用开发平台-云社区-华为云,本文在这里选择一键部署&…...
简介QML中的Canvas
2025年5月3日,周六晚上 QML中的Canvas是一个强大的绘图组件,允许开发者通过JavaScript在界面上进行动态的2D图形绘制。它类似于HTML5的<canvas>元素,适用于实现自定义图形、动画、游戏开发以及图表绘制等场景。 核心特性 绘图能力 • …...
装饰器@wraps(func)详解
1. wraps(func) 的核心作用 wraps 是 Python 标准库 functools 提供的装饰器,用于保留被装饰函数的原始元信息。 它通过将原函数的 __name__、__doc__、__module__ 等属性复制到装饰器内部的包装函数中,避免装饰器对函数身份信息的“掩盖”。 2. 元信息…...
vue的diff算法是什么、比较方式,原理分析、示例解释讲解
Vue Diff算法概述 Vue 的 Diff 算法是一种高效的虚拟 DOM 更新机制,用于最小化真实 DOM 的操作开销。它通过比较新旧 Virtual DOM 树中的差异,仅更新那些实际发生改变的部分,从而提升性能。 定义 Diff 算法的核心目标是在 MVVM 开发模式下…...
Day04 新增套餐
###今天的任务主要是自主完成套餐管理的模块### 1.新增套餐 在前端页面接口中我们可以看到在新增套餐的时候需要选择添加到菜单中的菜品 因此我们需要设计一个接口可以通过根据分类id(category_id)来查询该分类下的菜品 1.1根据分类id查询分类下的菜…...
WEB前端小练习——记事本
一、登陆页面 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>记事本登录注册</title><link…...
在多线程环境下如何设计共享数据结构保证原子操作与数据一致性
在多线程环境下如何设计共享数据结构保证原子操作与数据一致性 1. 引言 在现代软件开发中,多线程编程是提升程序性能和响应速度的重要手段。然而,多线程环境下的 共享数据管理 极具挑战性,若处理不当,可能引发 竞争条件(Race Conditions)、数据不一致(Data Inconsiste…...
洛谷 P1850 [NOIP 2016 提高组] 换教室
题目传送门 前言 终于自己想出概率期望 d p dp dp 的状态了,但是依旧没能相对转移方程。(招笑) 暴力 这题部分分和特殊情况分给的挺多的,所以先拿部分分。 一、思路 先跑一边 F l o y d Floyd Floyd 最短路求出两点间最短距…...
1penl配置
好的,根据您提供的 1pctl 命令输出信息,我们来重新依次回答您的所有问题: 第一:1Panel 怎么设置 IP 地址? 根据您提供的 user-info 输出: 面板地址: http://$LOCAL_IP:34523/93d8d2d705 这里的 $LOCAL_I…...
Windows下调试WebRTC源码
一、引言 《Windows下编译WebRTC源码》讲述了Windows下编译WebRTC源码的方法。本文在其基础之上,讲述使用Visual Studio调试WebRTC源码的方法。 二、生成Visual Studio工程文件 按照 《Windows下编译WebRTC源码》编译出webrtc.lib 后,执行下面的命令生…...
基于大模型的肾结石诊疗全流程风险预测与方案制定研究报告
目录 一、引言 1.1 研究背景与意义 1.2 国内外研究现状 1.3 研究目标与内容 二、大模型技术原理与应用概述 2.1 大模型的基本原理 2.2 大模型在医疗领域的应用进展 2.3 适用于肾结石预测的大模型选择与依据 三、术前风险预测与准备 3.1 患者身体状况评估 3.2 结石情…...
《ATPL地面培训教材13:飞行原理》——第5章:升力
翻译:刘远贺;工具:Cursor & Claude 3.7;过程稿 第5章:升力 目录 空气动力系数基本升力方程回顾升力曲线升力曲线的解释速度-动压关系密度高度翼型剖面升力特性阻力特性简介升阻比飞机重量对最小飞行速度的影响表…...
STM32部分:2、环境搭建
飞书文档https://x509p6c8to.feishu.cn/wiki/DQsBw76bCiWaO4kS8TXcWDs0nAh Keil MDK用于编写代码,编译代码芯片支持包,用于支持某类芯片编程支持STM32CubeMX用于自动生成工程,减少手动重复工作 STM32F1系列芯片支持包 软件下载 直接下载&am…...
STL之list容器
list的介绍 1.list的底层是双向链表结构,双向链表中的每个元素在互不相关的独立结点中,在结点中通过指针指向前一个元素和后一个元素 2.list是可以在常数范围内在任意位置的插入和删除的序列式容器,并且该容器可以前后双向迭代 3.vector的…...