吴恩达深度学习复盘(9)多类分类与SoftMax回归
多类分类
概念
对于分类问题,并非只有0或1两个标签,而是可以有两个以上的开放标签。以手写数字分类问题为例,之前只是区分0和1, 但在实际生活中,如读取信封上的数字或邮政编码,会涉及十个可能的数字识别;在对病人疾病分类时,可能要区分三种或五种不同疾病,这都属于多类分类问题。
例子
检测工厂生产的有视觉缺陷的部件,观察制药公司生产的药片图片,判断其是否有拉伸效果、变色缺陷或芯片缺陷等,这些不同类型的缺陷就代表了多个类别,是多类分类问题的实际体现。
多类分类与二元分类的区别
二元分类的数据集特征为X1,遗留回归会拟合一个模型来估计在特征X下Y为1的概率,因为Y只有0或1两种情况。而在多类分类问题中,数据集会有多种类别表示,例如用圆形代表一个类别,叉号代表另一个类别,三角形代表第三类,正方形代表第四类。此时不只是估计Y等于1的概率,还要估计Y等于2、3、4等其他类别的概率。
多类分类的模型与算法
决策边界不同,将X的空间分成多个区域(如四个),而不只是像二元分类那样分成两个类别。多类分类问题的定义中,softmax算法,它是逻辑回归的推广,可用于多类分类。之后会把softmax拟合到新的神经网络中,以便训练神经网络执行多类分类任务。
SoftMax回归
1. SoftMax回归的定位
SoftMax回归是对logistic回归(逻辑回归)的一种推广,逻辑回归是二元分类算法,而SoftMax回归适用于多类别分类环境。
2. 逻辑回归回顾
当输出值只有0或1两种可能时应用逻辑回归。计算过程是先计算与
的点积,然后通过一个信号函数
得到结果。逻辑回归估计的是在给定输入特征下
的概率,且
和
的概率之和为1。例如,若
的概率是
,那么
的概率就是
。为了更好地理解和推广逻辑回归,可以将其看作是计算两个数字,即给定
时
的概率和
的概率。
3. SoftMax回归例子
以可以取1、2、3、4这四种可能输出的情况为例,SoftMax回归的计算过程如下:
- 计算,
,
,
(其中和
是SoftMax回归的参数)。
- 计算,
被解释为在给定输入特征
下
的估计概率;
,
是
的估计概率;类似地,
和
也按此方式计算,且
。
4. SoftMax回归的一般公式
对于Y可以取1到n等任意可能值的一般情况,SoftMax回归计算(参数为
到
以及
到
),然后
,
被解释为在给定输入特征X下Y = j的估计概率,且
。当n = 2时,SoftMax回归最终计算结果和逻辑回归一样,只是参数会略有不同,所以SoftMax回归是逻辑回归的推广。
5. SoftMax回归的损失函数
- 回顾逻辑回归的损失函数,最初为,由于
,可简化为
,即Y = 1时损失是
,Y = 0时损失是
,模型的代价函数是整个训练集上损失的平均值。
- SoftMax回归的损失函数是:如果算法预测的概率分布为到
,真实标签是Y。当Y = 1时,损失是
;当Y = 2时,损失是
;以此类推,当Y = j时,损失是
。该损失函数的特点是,Y在每个训练样例中只能取一个值,所以只计算对应真实值的概率的负对数。例如,若Y = 2,则计算
。
的曲线特性是,当
接近1时损失小,当
较小时损失大,这激励算法使a_j尽可能大,即让模型预测的Y为真实值的概率尽可能大。
模型构建
1. 新网络的构建目的与模型应用
为了构建能够进行多类分类的新网络,将SoftMax回归模型放入新网络的输出层。以前在进行手写数字识别(仅两个类别)时使用了特定架构的网络,现在若要对0到9这10个数字进行手写数字分类,需将新网络的输出层改为有10个单元的SoftMax输出层,有时也称为SoftMax输出层。
2. 新网络的传播方式
在新网络中,给定输入X,前序计算(得到隐藏层的激活值)和之前一样,接着计算输出层的激活值。对于10个类别的情况,通过特定表达式计算到
(
),
是上一层的激活值),
然后计算,
表示预测为第i类的概率估计,从而得到1到10这10个可能标签的概率估计。
3. SoftMax激活函数的特点
SoftMax激活函数(有时也称为SoftMax激活函数)与其他激活函数(如Sigmoid、ReLU、线性激活函数)不同。其他激活函数中,激活值是单个z值的函数(如是
的函数),而SoftMax激活函数的每个激活值
依赖于所有的z值(即
是
到
的函数),这是SoftMax激活函数的独特属性。
Tensorflow 代码
import tensorflow as tf
from tensorflow.keras.datasets import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.utils import to_categorical# 加载手写数字数据集
(X_train, y_train), (X_test, y_test) = mnist.load_data()# 数据预处理
X_train = X_train.reshape(-1, 28 * 28).astype('float32') / 255.0
X_test = X_test.reshape(-1, 28 * 28).astype('float32') / 255.0# 构建模型
model = Sequential([# 第一层:25 个单元,ReLU 激活函数Dense(25, activation='relu', input_shape=(28 * 28,)),# 第二层:15 个单元,ReLU 激活函数Dense(15, activation='relu'),# 第三层:10 个输出单元,SoftMax 激活函数Dense(10, activation='softmax')
])# 编译模型
model.compile(optimizer='adam',loss='sparse_categorical_crossentropy',metrics=['accuracy'])# 训练模型
model.fit(X_train, y_train, epochs=10, batch_size=32, validation_data=(X_test, y_test))# 评估模型
test_loss, test_acc = model.evaluate(X_test, y_test)
print(f"Test accuracy: {test_acc}")
相关文章:
吴恩达深度学习复盘(9)多类分类与SoftMax回归
多类分类 概念 对于分类问题,并非只有0或1两个标签,而是可以有两个以上的开放标签。以手写数字分类问题为例,之前只是区分0和1, 但在实际生活中,如读取信封上的数字或邮政编码,会涉及十个可能的数字识别&…...
【力扣hot100题】(068)有效的括号
犹记得第一次做这题的时候是怎样一番惨状,现在已经得心应手了。 class Solution { public:bool isValid(string s) {stack<char> zhan;for(int i0;i<s.size();i){if(s[i]{||s[i](||s[i][) zhan.push(s[i]);else{if(zhan.empty()) return 0;if(zhan.top(){…...
深度学习篇---Prophet时间序列预测工具
文章目录 前言一、什么是Prophet?易用性自动化灵活性鲁棒性快速拟合 二、Prophet的核心原理1. 趋势模型a. 分段线性模型(默认)b. 逻辑增长模型 2. 季节性模型3. 节假日效应 三、Prophet使用方法安装ProphetPython基本使用示例1. 准备数据2. 创…...
TDengine JAVA 语言连接器
简介 本节简介 TDengine 最重要且使用最多的连接器, 本节内容是以教科书式方式列出对外提供的接口及功能及使用过程中要注意的技术细节,大家可以收藏起来做为今后开发 TDengine 的参考资料。 taos-jdbcdriver 是 TDengine 的官方 Java 语言连接器,Java…...
vue3工程中使用vditor完成markdown渲染并防止xss攻击
vue3工程中使用vditor完成markdown渲染并防止xss攻击 背景环境解决方案引入依赖 组件封装实现效果 背景 做oj系统时,题目使用的时markdown语法字符串,前端查看时需要将markdown转html再渲染到页面上。 环境 vitevue3pnpm 解决方案 引入依赖 pnpm install vdit…...
Java面向对象编程详解
面向对象编程是Java的核心特性之一,它通过类和对象的概念来解决实际问题,使程序设计更加符合人类对事物的认知方式。本文将深入探讨Java中的面向对象编程概念和特性。 1. 面向对象的基本概念 1.1 什么是面向对象? 面向对象程序设计(Object …...
重温java 系列一 Java基础
文件拷贝的5种方式 传统字节拷贝 public static void main(String[] args) throws IOExecption{try(InputStream is new FileInputStream("source.txt");OutputStream os new FileOutputStream("target.txt")){byte[] buffer new byte[1024];int leng…...
Java基础 4.7
1.成员方法传参机制 引用数据类型的传参机制 引用类型传递的是地址(其实也是值,只不过值是地址),可以通过形参影响实参! public class MethodParameter01 {public static void main(String[] args) {int[] arr {1,…...
基础IO(一)之回顾C语言文件接口
文章目录 共识原理回顾C文件接口打开文件的方式以w的方式打开文件以a的方式打开文件 stdin & stdout & stderr 共识原理 1.文件内容属性 就算内容是空的,也会有属性,内容和属性(两者都是数据)都要在磁盘当中保存 2.文件分为 打开的文件 和 没…...
PandaAI:一个基于AI的对话式数据分析工具
PandaAI 是一个基于 Python 开发的自然语言处理和数据分析工具,支持问答式(ChatGPT)的数据分析和报告生成功能。PandaAI 提供了一个开源的框架,主要核心组件包含用于数据处理的数据准备层(Pandas)以及实现 …...
Rollup详解
Rollup 是一个 JavaScript 模块打包工具,专注于 ES 模块的打包,常用于打包 JavaScript 库。下面从它的工作原理、特点、使用场景、配置和与其他打包工具对比等方面进行详细讲解。 一、 工作原理 Rollup 的核心工作是分析代码中的 import 和 export 语句…...
【NLP 56、实践 ⑬ LoRA完成NER任务】
目录 一、数据文件 二、模型配置文件 config.py 三、数据加载文件 loader.py 1.导入文件和类的定义 2.初始化 3.数据加载方法 代码运行流程 4.文本编码 / 解码方法 ① encode_sentence(): ② decode(): 代码运行流程 ③ padding(): 代码…...
Unity ViewportConstraint
一、组件功能概述 ViewportConstraint是一个基于世界坐标的UI边界约束组件,主要功能包括: 将UI元素限制在父容器范围内支持自定义内边距(padding)可独立控制水平和垂直方向的约束 二、实现原理 1. 边界计算(世界坐…...
项目实战--路由权限
封装 单独抽象成组件,写一个新的关于路由的NewsRouter.jsx: import SideMenu from "../../components/sandbox/SideMenu"; import TopHeader from "../../components/sandbox/TopHeader"; import { Routes, Route } from "re…...
Async 注解原理分析
Async 注解由 Spring 框架提供,被该注解标注的类或方法会在 异步线程 中执行。这意味着当方法被调用时,调用者将不会等待该方法执行完成,而是可以继续执行后续的代码。 Async 注解的使用非常简单,需要两个步骤: 在启…...
pyTorch-迁移学习-图片数据增强-四种天气图片的多分类问题
目录 1.导包 2.加载数据、拼接训练与测试数据的文件夹路径 3数据预处理 3.1数据增强 3.2用分类存储的图片数据创建dataloader 4.加载预训练好的模型 (迁移学习) 4.1固定、修改预训练好的模型 5.将模型拷到GPU上 6.定义优化器与损失函数 7.学习率衰减 8.定义训…...
Linux脚本基础详解
一、基础知识 Linux 脚本主要是指在 Linux 系统中编写的用于自动化执行任务的脚本程序,其中最常用的便是 Bash 脚本。下面我们将从语法、使用方法和示例三个方面详细讲解 Linux 脚本。 1. 脚本简介 定义:Linux 脚本是一系列命令的集合,可以…...
MQTT-Dashboard-数据集成-WebHook、日志管理
常用的 Docker Volume 命令及其用法。 1、创建数据卷 使用 docker volume create 命令可以创建一个新的数据卷。例如,创建一个名为 my_volume 的数据卷: docker volume create my_volume 2、列出数据卷 使用 docker volume ls 命令可以列出所有的数据卷…...
Elixir语言的移动应用安全
Elixir语言的移动应用安全解析 引言 在当今的数字化时代,移动应用已经成为我们日常生活中不可或缺的一部分。从购物、社交到在线银行,几乎每一个生活领域都与移动应用紧密相连。然而,随着应用的普及,安全问题也随之而来。如何确…...
【科学技术部政务服务平台-用户注册/登录安全分析报告】
前言 由于网站注册入口容易被黑客攻击,存在如下安全问题: 暴力破解密码,造成用户信息泄露短信盗刷的安全问题,影响业务及导致用户投诉带来经济损失,尤其是后付费客户,风险巨大,造成亏损无底洞…...
HTTP 教程 : 从 0 到 1 全面指南 教程【全文三万字保姆级详细讲解】
目录 HTTP 的请求-响应 HTTP 方法 HTTP 状态码 HTTP 版本 安全性 HTTP/HTTPS 简介 HTTP HTTPS HTTP 工作原理 HTTPS 作用 HTTP 与 HTTPS 区别 HTTP 消息结构 客户端请求消息 服务器响应消息 实例 HTTP 请求方法 各个版本定义的请求方法 HTTP/1.0 HTTP/1.1 …...
【LeetCode 热题100】139:单词拆分(动态规划全解析+细节陷阱)(Go语言版)
🚀 LeetCode 热题 139:单词拆分(Word Break)| 动态规划全解析细节陷阱 📌 题目描述 给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请判断 s 是否可以由字典中出现的单词拼接成。 说明:不要求字典…...
2025年招投标行业的深度变革:洞察趋势,把握未来
2025年,随着政府工作报告对招投标行业的一系列改革措施的提出,整个行业正面临一场前所未有的深度变革。这些政策旨在推动全国统一大市场的建设、加速数字化转型、促进绿色低碳发展,并强化风险防控。在这场变革中,企业不仅要适应新…...
树莓派学习专题<3>:使能VNC远程桌面与VNC文件传输
树莓派学习专题<3>:使能VNC远程桌面与VNC文件传输 1. 配置VNC2. 使用VNC viewer连接到树莓派3. 使用VNC viewer传输文件 1. 配置VNC 在终端或SSH中,使用如下命令打开树莓派系统配置项: sudo su raspi-config以上两项…...
AI烘焙大赛中的算法:理解PPO、GRPO与DPO最简单的方式
🧠 向所有学习者致敬! “学习不是装满一桶水,而是点燃一把火。” —— 叶芝 我的博客主页: https://lizheng.blog.csdn.net 🌐 欢迎点击加入AI人工智能社区! 🚀 让我们一起努力,共创…...
qt自定义信号槽需要注意的事项
在 Qt 中,自定义信号和槽是与事件和对象交互的核心机制之一。创建自定义信号和槽时,有几个重要事项需要注意,以确保它们能够正确工作。以下是一些需要注意的关键点: 1. 信号和槽的声明 信号声明:信号应该在 signals …...
OpenCV--图像轮廓检测
在图像处理与计算机视觉领域,轮廓检测是一项极为关键的技术。轮廓作为物体边界的重要表征,承载了图像中物体的形状、尺寸和位置等关键信息。通过轮廓检测,我们能够提取出图像中物体的轮廓,为后续的物体识别、图像分割、形状分析等…...
从搜索丝滑过渡到动态规划的学习指南
搜索&动态规划 前言砝码称重满分代码及思路solution 1(动态规划)solution 2(BFS) 跳跃满分代码及思路solution 1(动态规划)solution 2 (BFS) 积木画满分代码及思路动态规划思路讲解solution 前言 本文主要是通过一些竞赛真题…...
通用文字识别技术的出现,深刻改变信息的处理方式
在数字化浪潮席卷全球的今天,文字作为人类文明最基础的载体,正经历着一场前所未有的技术革命。通用文字识别(OCR,Optical Character Recognition)技术已经从简单的"图片转文字"工具,进化为能够理…...
linux 下du 和 ls-alh 的区别
我一直以为du -m 可以显示文件大小。发现不对。正确的做法你是用ls -alh 来使用...
【k8s学习之CSI】理解 LVM 存储概念和相关操作
鸟哥的 Linux 私房菜 – Quota, Software RAID, LVM, iSCSI 0 | 理解 vg 相关概念 在 Linux LVM(逻辑卷管理) 中,以下是 partition(分区)、PV(物理卷)、VG(卷组)、LV&am…...
【分享开发笔记,赚取电动螺丝刀】使用STM32F103的hal库,采用PWM+DMA发送方式驱动WS2812的RGB彩灯
简单和大家介绍一下本文章的主要内容:使用STM32F103C8最小系统板,使用STM32 cubeMX 6.14版本生成底层的驱动库、结合定时器的PWM 输出功能、使用DMA发送数据的 方式,驱动WS2812 的RGB三色灯。 本次小的DIY所需的物料:stm32f103c8…...
CubeMX配置STM32VET6实现网口通信(无操作系统版-附源码)
下面是使用CubeMX配置STM32F407VET6,实现以太网通讯(PHY芯片为LAN8720)的具体步骤总结: 一、硬件连接方式: 硬件原理图: 使用外部晶振为PHY芯片提供时钟。 STM32F407VET6 与 LAN8720 采用 RMII 模式连接。…...
一种反激式开关电源设计流程
引:随着生产和技术的发展,对环保和能源的要求也越来越高,开关电源的应用也越来越广泛,开关电源电路结构种类繁多,包括单端转换器和双端转换器。本文介绍一种利用反激式变换电路实现5V开关电源的设计方法,以…...
数据结构实验3.2:链栈的基本操作与括号匹配问题
文章目录 一,问题描述二,基本要求三,算法分析(一)链栈的存储结构设计(二)链栈基本操作的时间复杂度分析(三)括号匹配算法分析 四,示例代码五,实验…...
一周学会Pandas2 Python数据处理与分析-NumPy算术运算和统计计算
锋哥原创的Pandas2 Python数据处理与分析 视频教程: 2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 算术运算 数组的灵魂就在于可以进行批量的运算而不是要在循环里面进行元素的运算: 示例: …...
2011年-全国大学生数学建模竞赛(CUMCM)试题速浏、分类及浅析
2011年-全国大学生数学建模竞赛(CUMCM)试题速浏、分类及浅析 全国大学生数学建模竞赛(China Undergraduate Mathematical Contest in Modeling)是国家教委高教司和中国工业与应用数学学会共同主办的面向全国大学生的群众性科技活动,目的在于激励学生学习数学的积极性,提高学…...
科普:GBDT与XGBoost比较
本文不去讲GBDT与XGBoost算法的原理及算法本身,而是从应用者的角度,对二者比较,以便选择。 XGBoost是GBDT的“工程化增强版”,在保持Boosting核心思想的同时,通过数学优化(二阶导数、正则化)和工…...
大数据技术之 Scala(5)
以下是今天学习的知识点与代码测试: 一、不可变数组与可变数组的转换 说明 arr1.toBuffer //不可变数组转可变数组arr2.toArray //可变数组转不可变数组 arr2.toArray 返回结果才是一个不可变数组,arr2 本身没有变化arr1.toBuffer 返回结果才是一个可变…...
int 与 Integer 的区别详解
1. 本质区别 特性intInteger类型基本数据类型(Primitive)包装类(Wrapper Class)存储位置栈(或作为对象成员在堆中)堆(对象实例)默认值0null(可能导致 NullPointerExcept…...
初阶数据结构(3)顺序表
Hello~,欢迎大家来到我的博客进行学习! 目录 1.线性表2.顺序表2.1 概念与结构2.2 分类2.2.1 静态顺序表2.2.2 动态顺序表 2.3 动态顺序表的实现初始化尾插头插尾删头删查找指定位置之前插入数据删除指定位置的数据销毁 1.线性表 首先我们需要知道的是,…...
智能DNS解析:解决高防IP地区访问异常的实战指南
摘要:针对高防IP在部分地区无法访问的问题,本文设计基于智能DNS的流量调度方案,提供GeoDNS配置与故障切换代码示例。 一、问题背景 运营商误拦截或线路波动可能导致高防IP在福建、江苏等地访问异常。传统切换方案成本高,智能DNS可…...
瑞芯微RK3568嵌入式AI项目实战:项目方向(三)
基于RK3568的成熟开源项目和实战资源丰富,以下是针对小白的精选推荐及学习路径规划,结合多个开源项目和详细教程,帮助快速入门嵌入式开发: 一、OpenHarmony智能设备开发 1. 凌蒙派-RK3568开发板项目 项目特点:支持Op…...
go游戏后端开发26:红中麻将发牌逻辑
首先,麻将游戏创建房间的逻辑与之前我们做过的“赢三张”创建房间的逻辑是一致的,整体上没有问题。不同之处在于,我们在创建房间时会根据游戏类型来创建对应的“game”,即创建的是麻将的“game”。大家之前写过相关代码࿰…...
DataFrame的遍历、排序、去重与分组
一.遍历 1.1 series遍历 import pandas as pds pd.Series([a,b,c,d,e,f],index[1,2,3,4,5,6])for i in s:print(i) a b c d e f 可见,遍历series会直接拿到其中的值 1.2 DataFrame遍历 1.2.1 直接遍历 import pandas as pd data {name: [Alice, Bob, Charlie]…...
QEMU源码全解析 —— 块设备虚拟化(17)
接前一篇文章:QEMU源码全解析 —— 块设备虚拟化(16) 本文内容参考: 《趣谈Linux操作系统》 —— 刘超,极客时间 《QEMU/KVM源码解析与应用》 —— 李强,机械工业出版社 《KVM实战 —— 原理、进阶与性能调优》—— 任永杰 程舟,机械工业出版社...
Java 中使用 File 类创建文件
文章目录 Java 中的 File 类一、文件(File)定义 二、File 类的介绍1 创建文件对象的相关构造器2 createNewFile() 的作用3 获取文件相关信息的常用方法4 目录的操作和文件的删除 Java 中的 File 类 在 Java 中,文件和文件流是处理数据输入/输…...
PowerBI-按钮过滤筛选-宜宾五粮液股份有限公司财务分析
下面为Powerbi制作的财务主题数据分析模版,以可视化的效果展示了某股份有限公司的财务关键指标数据,如营业收入、净利润、毛利率和净利率等。以瀑布图的方式展示了利润表项目金额情况,以树图方式展示了企业资产负债数据。另外图表可以进行筛选…...
【PyQt5】QSS样式表如何使用
在 PyQt5 中,使用 QSS(Qt Style Sheets)来为窗口中的各个控件添加样式是非常方便的,类似于 HTML 中的 CSS。你可以通过 QWidget.setStyleSheet() 方法应用 QSS 样式,或者通过 .qss 文件来设置样式。 基本步骤…...
数据结构:用生活中的例子解释 AOE 网中活动的最早和最迟开始时间的含义和计算方法
生活实例:装修房子中的活动安排 假设你要装修一套房子,主要流程如下: 拆旧(活动 A,3 天) → 拆旧完成(事件 X)水电改造(活动 B,4 天) → 水电完…...