当前位置：首页 > news >正文

【动手学深度学习】1.3. 各种机器学习问题

news 来源：原创 2025/8/27 0:59:03

- 1.3. 各种机器学习问题
- - 1）监督学习（supervisedlearning）
  - - （1）回归（regression）
    - （2）分类（classification）
    - （3）标记问题
    - （4）搜索
    - （5）推荐系统（recommender system）
    - （6）序列学习
  - 2）无监督学习
  - 3）与环境互动
  - 4）强化学习

1.3. 各种机器学习问题

1）监督学习（supervisedlearning）

监督学习（supervised learning）：

擅长在“给定输入特征”的情况下预测标签。
每个“特征-标签”对都称为一个样本（example）。
我们的目标是生成一个模型，能够将任何输入特征映射到标签（即预测）。

监督学习过程：

获取训练数据集：数据样本+标签。有时样本已有标签；有时样本需要被人工标记；
生成模型：有监督学习算法+训练数据集=“已完成学习的模型”；
预测标签：将没有见过的样本特征放到“已完成学习的模型”中，使用模型的输出作为相应标签的预测。

图1.3.1 监督学习：

在这里插入图片描述

（1）回归（regression）

回归（regression）是监督学习任务之一。

"回归"指的是通过建立输入变量（自变量）与输出结果（因变量）之间的数学关系模型，来预测一个具体的数值结果。简单来说，它就像用一条线或曲线来“拟合”数据点，从而根据已知因素推测未知数值。

（2）分类（classification）

分类（classification）问题：希望模型能够预测样本属于哪个类别（category，正式称为类（class））。

二项分类（binomial classification）：只有两个种类；
多项分类（multiclass classification）：有多个种类；
层次分类（hierarchical classification）：层次结构假定在许多类之间存在某种关系。

（3）标记问题

学习预测不相互排斥的类别的问题称为多标签分类（multi-label classification）。

举个例子，一篇典型的文章可能会用5～10个标签。

（4）搜索

在信息检索领域，我们希望对一组项目进行排序。搜索结果的排序也十分重要，学习算法需要输出有序的元素子集。

该问题一种解决方案：先为集合每个元素分配相应的相关性分数，然后检索评级最高的元素。

（5）推荐系统（recommender system）

推荐系统（recommender system），它的目标是向特定用户进行“个性化”推荐。

（6）序列学习

序列学习是处理输入或输出是可变长度序列的机器学习方法，要求模型能“记住”历史信息来处理前后关联的任务。与传统模型（固定输入输出，如图像分类）不同。

序列学习几种典型的特殊情况：

标记和解析 ：是对文本序列进行注释，输入和输出数量基本相同，例如标注出句子中的命名实体等。
自动语音识别 ：输入是音频录音，输出是对应的文本记录，音频帧数远多于文本字符数，属于输出比输入短得多的序列到序列学习。
文本到语音 ：与自动语音识别相反，输入是文本，输出是音频文件，输出比输入长很多。
机器翻译 ：输入和输出的顺序及数量通常都不相同，像德语和英语间的翻译，存在词序调整等情况。

此外，序列学习还在确定用户阅读网页顺序、对话问题等众多其他学习任务中有应用，是当前热门的研究领域。

2）无监督学习

无监督学习（unsupervised learning）：处理无标签数据，旨在自主发现数据内在模式或结构，无需明确的“目标”指导。

数据中不含有“目标”的机器学习问题通常被为无监督学习（unsupervised learning）；

无监督学习可以回答什么样的问题呢？

聚类（clustering）问题：没有标签的情况下，我们是否能给数据分类呢？比如，给定一组用户的网页浏览记录，我们能否将具有相似行为的用户聚类呢？
主成分分析（principal component analysis）问题：我们能否找到少量的参数来准确地捕捉数据的线性相关属性？比如，一个球的运动轨迹可以用球的速度、直径和质量来描述。
因果关系（causality）和概率图模型（probabilistic graphical models）问题：我们能否描述观察到的许多数据的根本原因？例如，如果我们有关于房价、污染、犯罪、地理位置、教育和工资的人口统计数据，我们能否简单地根据经验数据发现它们之间的关系？
生成对抗性网络（generative adversarial networks）：目标是，合成与真实数据分布一致的复杂数据（如图像、音频）。**机制，**通过生成器与判别器的对抗训练，使生成数据难以被区分真伪。

3）与环境互动

传统的监督学习和无监督学习通常属于离线学习（offline learning），即先收集大量数据，然后在与环境断开的情况下进行学习。

离线学习的优点是可以在孤立的环境中进行模式识别，但其应用范围有限。

与环境互动的学习模式推动机器学习从静态预测迈向动态决策，解决更复杂的现实问题，但需应对环境反馈、动态变化及策略影响等挑战。

图1.3.6 从环境中为监督学习收集数据。

在这里插入图片描述

4）强化学习

强化学习（Reinforcement Learning, RL）关注智能体（agent）通过与环境的动态交互学习最优决策策略，核心特点如下：

Agent交互循环：智能体在时间序列中持续与环境互动，循环流程为：

观察（Observation）：接收环境状态信息（如游戏画面）。
行动（Action）：根据策略选择动作（如移动角色）。
奖励（Reward）：环境反馈即时收益（如得分增减）。

图1.3.7 强化学习和环境之间的相互作用

在这里插入图片描述

强化学习的目标是产生一个好的策略（policy）。强化学习智能体选择的“动作”受策略控制，即一个从环境观察映射到行动的功能。

当环境可被完全观察到时，强化学习问题被称为马尔可夫决策过程（markov decision process）。当状态不依赖于之前的操作时，我们称该问题为上下文赌博机（contextual bandit problem）。当没有状态，只有一组最初未知回报的可用动作时，这个问题就是经典的多臂赌博机（multi-armed bandit problem）。

声明：资源可能存在第三方来源，若有侵权请联系删除！

【动手学深度学习】1.3. 各种机器学习问题

目录 1.3. 各种机器学习问题1）监督学习（supervisedlearning）（1）回归（regression）（2）分类（classification）（3）标记问题&…...

编程日记 2025/8/27 0:59:03

OS进程调度

tss Q1：你是如何保证两个进程不能同时访问共享资源的？ ✅ 推荐回答： 我实现了基于结构体的互斥锁，使用 mutex_lock() 来加锁资源。如果已有任务持有锁，则当前任务会被阻塞并加入等待队列，直到被唤醒。解锁…...

编程日记 2025/8/24 2:23:51

MCP和 AI agent 有什么区别和联系

MCP 是什么？ MCP（Model Context Protocol，模型上下文协议）是一种开源通信协议，旨在为大型语言模型（LLM）与外部数据源、工具或服务之间建立标准化、安全且灵活的双向连接。它类似于“AI 的 USB-…...

编程日记 2025/8/26 16:57:00

用Recommenders，实现个性化推荐

文章目录引言一、Recommenders简介二、选择Recommenders的原因三、智能推荐系统的设计与实现四、总结引言在这个信息如洪流般涌来的时代，你是否常常在茫茫的信息海洋中迷失方向，为找不到自己心仪的内容而苦恼？今天咱们就来聊聊基于Micros…...

编程日记 2025/8/17 7:30:52

MCP-1：MCP组件与工作流程

MCP-1：MCP组件与工作流程 1.什么是MCP2.MCP架构组件2.1.MCP Hosts2.2.MCP Client2.3.MCP Server3.交互流程3.1.用户提问3.2.LLM 推理选择MCP Server（大模型规划）3.3.调用 MCP Tool3.4.返回结果3.5.数据清洗3.6.反馈信息给用户1.什么是MCP MCP（Model Context Proto…...

编程日记 2025/8/22 23:25:53

NVIDIA GPU 性能调优与诊断完全指南

本文为多 GPU 用户（如 3*RTX A4000 系统）提供一份全面的调优与诊断手册，涵盖功率限制、风扇控制、频率锁定、缓存清理、GPU 重置与性能测试工具等操作命令，适合开发者与研究人员在部署前进行系统级优化与验证。 📌 目录…...

编程日记 2025/8/27 0:58:11

从运维告警到业务决策：可观测性正在重新定义企业数据基础设施

可观测性（Observability）与传统监控（Monitoring）的核心差异，本质上是一种数据维度的主动暴露与被动采集的范式转变。传统监控就像在黑暗森林中设置有限的探照灯，运维人员必须预先假设可能的故障路径&#x…...

编程日记 2025/8/27 0:46:41

配电网运行状态综合评估方法研究

1评估指标体系的构建 [1]冷华,童莹,李欣然,等.配电网运行状态综合评估方法研究[J].电力系统保护与控制,2017,45(01):53-59. 1.1评估范围图1为配电系统组成示意图，其中A、B、C分别表示高、中、低压配电系统。高压配变(也称主变)将35kV或110kV的电压降到10kV&#…...

编程日记 2025/8/24 19:49:11

Linux中I/O复用机制epoll

1. 为什么会出现 epoll？ 在早期的网络编程中，select 是一个非常常用的 I/O 复用机制，用于在多个文件描述符（如套接字）上进行 I/O 操作的检测。select 会将多个文件描述符传入，轮询检查它们的状态&#xff…...

编程日记 2025/8/26 9:56:12

数据库表关系详解

一、一对多关系特征：表A的一条记录对应表B的多条记录，表B的一条记录仅对应表A的一条记录示例： 学生表（子表） | id | name | class_id | |-----|------|----------| |1001| 张三 | 111 | |1002| 张四 | 222 | 班级表…...

编程日记 2025/8/25 16:32:32

Agentic Loop与MCP：大模型能力扩展技术解析

一、什么是MCP MCP（Model Context Protocol）是一种用于大语言模型与外部工具交互的协议框架。它允许大语言模型能够调用各种外部工具来扩展其能力边界，如访问文件系统、搜索引擎、数据库等。 MCP的核心价值能力扩展：使大语言模…...

编程日记 2025/8/26 18:21:14

贪心算法 Part04

总结下重叠区间问题 LC 452. 用最少数量的箭引爆气球和 LC 435. 无重叠区间本质上是一样的。 LC 452. 用最少数量的箭引爆气球是求n个区间当中 ， 区间的种类数量 k。此处可以理解为，重叠在一起的区间属于同一品种，没有重叠的区间当然…...

编程日记 2025/8/27 0:58:12

Spring事务简单操作

什么是事务？ 事务是一组操作的集合，是一个不可分割的操作事务会把所有的操作作为⼀个整体, ⼀起向数据库提交或者是撤销操作请求. 所以这组操作要么同时成功, 要么同时失败. 事务的操作分为三步： 1. 开启事start transaction/ begin …...

编程日记 2025/8/25 4:45:16

04算法学习_209.长度最小的子数组

04算法学习_209.长度最小的子数组题目描述：个人代码：学习思路：第一种写法：题解关键点： 第二种写法：题解关键点： 个人学习时疑惑点解答： 04算法学习_209.长度最小的子数组力扣题目链…...

编程日记 2025/8/23 1:44:50

./build/mkfs.jffs2: Command not found

参考文章：https://blog.csdn.net/FLM19990626/article/details/132070195 sudo apt-get install lib32stdc6 sudo apt-get install lib32z1 sudo apt-get install mtd-utils sudo apt-get install man-db sudo apt-get install liblzo2-dev:i386sudo ldconfig...

编程日记 2025/8/26 11:21:59

从零基础到最佳实践：Vue.js 系列（4/10）：《Vue Router 路由管理：深入探索与实战应用》

引言在现代前端开发中，单页应用（SPA）凭借其流畅的用户体验和高性能成为主流。Vue Router 作为 Vue.js 的官方路由管理工具，为开发者提供了强大的路由管理能力，帮助实现页面导航、权限控制和动态内容加载。本文将从基…...

编程日记 2025/8/24 6:05:30

深入解析C++静态成员变量与函数

当然可以！下面是对这段 C 代码的逐行详细注释说明和解释，帮助你理解静态成员变量和静态成员函数的使用。 🧱 类定义部分：MyClass cpp 深色版本 #include <iostream> 说明：包含标准输入输出流库，用于…...

编程日记 2025/8/24 18:10:37

基于JDBC的信息管理系统，那么什么是JDBC呢？什么又是DAO类？

1.JDBC JDBC 即 Java Database Connectivity，是 Java 语言中用于与数据库进行交互的一套 API。它提供了一种标准的方式，让 Java 程序能够连接到各种不同类型的数据库，并执行 SQL 语句来实现对数据库的查询、插入、更新和删除等操作。主要功…...

编程日记 2025/8/26 19:33:51

Java虚拟机 -虚拟机栈

虚拟机栈详解虚拟机栈概述案例常见的跟虚拟栈异常相关的异常StackOverflowError异常OutOfMemoryError异常栈的基本存储单位局部变量表IDEA Jclasslib Bytecode Viewer插件slot 操作数栈方法调用（待后续补充） 虚拟机栈上一篇文章，我们简单…...

编程日记 2025/8/27 0:58:13

【AI News | 20250521】每日AI进展

AI Repos 1、OpenHands OpenHands（前身为OpenDevin）是一个由AI驱动的软件开发代理平台，它能够像人类开发者一样修改代码、运行命令、浏览网页、调用API，甚至从StackOverflow复制代码片段。用户可以通过OpenHands Cloud轻松上手&a…...

编程日记 2025/8/27 0:58:11

RAG 挑战赛冠军方案解析：从数据解析到多路由器检索的工程实践，推荐阅读！

多路由器动态知识库：RAG 冠军方案的核心技术揭秘源码地址：https://github.com/IlyaRice/RAG-Challenge-2/tree/main 公司年报智能问答比赛任务简介比赛的任务是基于公司年度报告构建一个问答系统。简单来说，比赛当天的流程如下&#xff…...

编程日记 2025/8/20 2:46:52

Java基础 Day17

一、递归方法直接或者间接调用本身将大问题, 层层转化为一个与原问题相似的、规模更小的问题来解决二、异常程序在编译或执行过程中，出现的非正常的情况 (错误) 语法错误不是异常 1、阅读异常信息从下往上看：发生异常的位置、异常名称、发生异…...

编程日记 2025/8/25 17:18:03

系分论文《论软件系统安全分析和应用》

系统分析师论文范文系列【摘要】 2023年3月，我司承接了某知名电商企业“智能化供应链管理系统”的开发任务，我作为系统分析师负责全面的安全分析与设计工作。该系统以提升电商供应链效率为核心，整合仓储、物流、支付等模块，并需应…...

编程日记 2025/8/24 8:55:14

蓝耘Ubantu服务器测试最新 PP-StructureV3 教程

一、服务器配置二、安装Anaconda3 进入云服务器后删除minconda文件夹官网： https://repo.anaconda.com/archive/ 在里面找到自己系统的安装包，然后右击复制链接安装。一定要选择Anaconda,因为很多依赖问题用Minconda容易报错。 wget https://repo…...

编程日记 2025/8/26 15:00:59

File文件

路径： 相对路径：以当前工作目录（或指定的基准目录）为起点，描述目标文件或目录的位置，不包含根目录信息，仅表示与基准目录的相对位置关系。绝对路径：从文件系统的根目录开始&…...

编程日记 2025/8/27 0:58:10

Wireshark抓包分析小程序接口请求教程

## 1. 准备工作 ### 1.1 安装Wireshark - 访问Wireshark官网 (https://www.wireshark.org/) 下载最新版本 - 按照安装向导完成安装 - 确保安装时选择安装WinPcap或Npcap（用于网络数据包捕获） ### 1.2 配置环境 - 确保电脑已连接网络 - 如果使用手机…...

编程日记 2025/8/24 17:51:09

C++之模板进阶（探索C++模板：非类型参数与特化技巧）

本节目标： 1.非类型模板参数 2.类模板的特化 3.类模板特化的应用之类型萃取 4.模板的分离编译非类型模板参数模板参数分类型形参与非类型形参类型形参：出现在模板参数列表中，跟在class或者typename之类的参数类型名称非类型形…...

编程日记 2025/8/26 3:56:21

【项目记录】准备工作及查询部门

1 开发规范 1.1 前后端分离开发现在的企业项目开发有2种开发模式：前后台混合开发和前后台分离开发。前后台混合开发，顾名思义就是前台后台代码混在一起开发这种开发模式有如下缺点： 1. 沟通成本高：后台人员发现前端有问题&a…...

编程日记 2025/8/25 22:35:17

chromedp -—— 基于 go 的自动化操作浏览器库

chromedp chromedp 是一个用于 Chrome 浏览器的自动化测试工具，基于 Go 语言开发，专门用于控制和操作 Chrome 浏览器实例。 chromedp 安装 go get -u github.com/chromedp/chromedp基于chromedp 实现的的简易学习通刷课系统目前实现的功能&#xff…...

编程日记 2025/8/24 12:37:22

企业级调度器LVS

访问效果涉及内容：浏览拆分、 DNS 解析、反向代理、负载均衡、数据库等 1 集群 1.1 集群类型简介对于⼀个业务项⽬集群来说，根据业务中的特性和特点，它主要有三种分类： 高扩展 (LB) ：单个主机负载不足的时候&#xf…...

编程日记 2025/8/20 2:46:57

MySQL中的重要常见知识点（入门到入土！）

基础篇基础语法添加数据 -- 完整语法 INSERT INTO 表名 (字段名1, 字段名2, ...) VALUES (值1, 值2, ...);-- 示例 insert into employee(id,workno,name,gender,age,idcard,entrydate) values(1,1,Itcast,男,10,123456789012345678,2000-01-01) 修改数据 -- 完整语法 UPDA…...

编程日记 2025/8/24 23:29:39

29.第二阶段x64游戏实战-技能冷却

免责声明：内容仅供学习参考，请合法利用知识，禁止进行违法犯罪活动！ 本次游戏没法给内容参考于：微尘网络安全上一个内容：28.第二阶段x64游戏实战-代码实现遍历技能找技能冷却要通过一个技能cd长点的&…...

编程日记 2025/8/16 5:41:40

第19天-Python自动化生成PPT图文教程（基于python-pptx）

环境准备 pip install python-pptx Pillow 基础示例：批量插入图片 from pptx import Presentation from pptx.util import Inches import os from PIL import Image def create_image_slides(): # 初始化演示文稿 prs = Presentation() # 获取当前目录所…...

编程日记 2025/8/17 2:06:58

基于STM32的骑行语音播报系统

目录一、前言二、项目功能说明三、主要元器件四、原理图与PCB 五、手机APP 六、完整资料一、前言项目成品图片： 哔哩哔哩视频链接： 咸鱼商品链接： 基于STM32的骑行语音播报系统二、项目功能说明基础功能： 1&…...

编程日记 2025/8/23 10:18:16

springboot链接nacos测试

代码资料链接：https://download.csdn.net/download/ly1h1/90881498 场景说明：本次测试是springboot项目，可以链接上ncaos，将对应命名空间下的配置信息读取出俩，然后可以在接口进行返回显示。 0.环境配置 1.代码结构 …...

编程日记 2025/8/18 13:32:58

【初识】内网渗透——基础概念，基本工具使用

目录一、域，工作组，域控制器，活动目录相关概念： 域环境： 工作组： 域控制器DC： 活动目录AD： 二、内网的基本场景： 三、内网渗透基本测试方案： #案例1一基本信…...

编程日记 2025/8/22 14:04:05

AI练习：混合圆

方法一：在圆内 1.画圆选择椭圆工具，按住Shift键绘制正圆； CtrlC复制，CtrlF原地粘贴，按住Shift键缩小圆，移动位置； 再CtrlC，CtrlF，再按住Shift键缩小圆，移…...

编程日记 2025/8/26 0:28:36

心知天气 API 获取天气预报 2025/5/21

心知天气 API 获取天气预报 2025/5/21 URL格式: https://api.seniverse.com/v3/weather/now.json?key填你的秘钥&locationbeijing(这里填城市可以用拼音)&languagezh-Hans&unitc 返回格式如下:...

编程日记 2025/8/23 2:23:54

PCB设计教程【入门篇】——电路分析基础-元件数据手册

前言本教程基于B站Expert电子实验室的PCB设计教学的整理，为个人学习记录，旨在帮助PCB设计新手入门。所有内容仅作学习交流使用，无任何商业目的。若涉及侵权，请随时联系，将会立即处理目录前言一、数据手册的重要…...

编程日记 2025/8/26 12:01:34

java上机测试错题回顾（1）

平时不能摸鱼太多，这样导致到最后不能摸鱼...... 看了看日历原来是6.12就结课了，啊哈哈，真没几天准备了，期末月你要来了吗？ 1 参数传递，值传递~！ 题目以下代码的输出结果为（ &a…...

编程日记 2025/8/19 2:17:52

HTTP相关内容

应用层自定义应用层协议,协议:约定 1.约定好通信传输的信息 2.约定好数据的组织格式(xml, json(重点), protobuf) 也可以基于现成的应用层协议,来进行开发协议的种类非常多(HTTP 协议属于翘楚,1.手机,2 网站) 跟正确的说,咱们现在使用的是 HTTPS 这个协议,HTTP和HTTPS …...

编程日记 2025/8/25 5:12:13

【笔记】排查并解决Error in LLM call after 3 attempts: (status code: 502)

#工作记录一、问题描述在部署运行部署对冲基金分析工具 ai-hedge-fund 时，不断出现以下报错，导致项目运行异常： Error in LLM call after 3 attempts: (status code: 502) Error in LLM call after 3 attempts: [WinError 10054] 远程主…...

编程日记 2025/8/21 6:01:20

基于python的机器学习（七）—— 数据特征选择

目录一、特征选择概念二、特征选择的方法 2.1 过滤式特征选择 2.1.1 方差分析 2.1.2 相关系数 2.1.3 卡方检验 2.2 包裹式特征选择 2.2.1 递归特征消除 2.3 嵌入式特征选择 2.3.1 决策树特征重要性一、特征选择概念特征选择是机器学习非常重要的一个步骤&#x…...

编程日记 2025/8/25 0:57:18

从电商角度设计大模型的 Prompt

从电商角度设计大模型的 Prompt，有一个关键核心思路：围绕具体业务场景明确任务目标输出格式，帮助模型为运营、客服、营销、数据分析等工作提效。以下是电商场景下 Prompt 设计的完整指南，包含通用思路、模块范例、实战案例等内容。…...

编程日记 2025/8/23 10:49:27

从零基础到最佳实践：Vue.js 系列（5/10）：《状态管理》

引言你是不是正在用 Vue.js 开发一个很酷的应用，然后发现组件之间的数据传递变得越来越混乱？比如，一个按钮的状态要传到好几层组件，或者多个页面需要共享同一个用户信息。这时候，状态管理就登场了！在 Vue…...

编程日记 2025/8/24 10:57:17

git checkout HEAD

git checkout HEAD 主要用于将工作目录和暂存区的内容重置为当前 HEAD 指向的提交状态，常用于撤销未提交的修改15。具体行为如下： 一、核心作用 ‌恢复工作区文件‌ 将指定文件或全部文件恢复到 HEAD 指向的提交状态，丢弃工作区中未暂存的修改…...

编程日记 2025/8/26 21:45:21

git工具使用

安装Git 在开始使用Git之前，需要在本地计算机上安装Git工具。Git支持Windows、macOS和Linux系统。可以从Git官方网站下载适合操作系统的安装包，并按照安装向导进行安装。 bash复制插入 # 在Linux上安装Git sudo apt-get install git# 在macOS上安装Git…...

编程日记 2025/8/20 8:49:29

极大似然估计与机器学习

复习概统的时候突然发现好像极大似然估计MLE与机器学习的数据驱动非常相似，都是采样样本然后估计模型参数。貌似，后知后觉的才意识到极大似然估计就是机器学习有效的数学保证下面以拟合线性分布的最小二乘与分类问题为例推到以下如何从似然函数推导出M…...

编程日记 2025/8/16 5:57:00

基于 Guns v5.1 框架的分页教程

基于 Guns v5.1 框架的分页教程第一步：Controller 层处理前端请求在 Controller 中，需要接收 Bootstrap Table 传来的分页参数（limit, offset, sort, order）。Guns 提供了封装好的 PageFactory 类来简化 Page 对象的创建。 R…...

编程日记 2025/8/24 8:06:03

从零搭建SpringBoot Web 单体项目【基础篇】2、SpringBoot 整合数据库

系列文章从零搭建SpringBoot Web单体项目【基础篇】1、IDEA搭建SpringBoot项目从零搭建 SpringBoot Web 单体项目【基础篇】2、SpringBoot 整合数据库目录一、项目基础环境说明二、数据库整合流程 1. 添加 MyBatis-Plus 相关依赖（pom.xml） 2…...

编程日记 2025/8/26 7:13:10

目录

1.3. 各种机器学习问题

1）监督学习（supervisedlearning）

（1）回归（regression）

（2）分类（classification）

（3）标记问题

（4）搜索

（5）推荐系统（recommender system）

（6）序列学习

2）无监督学习

3）与环境互动

4）强化学习

相关文章：