CNN张量输入形状和特征图
CNN张量输入形状和特征图
这个是比较容易理解的张量的解释,比较直观
卷积神经网络
在这个神经网络编程系列中,我们正在逐步构建一个卷积神经网络(CNN),所以让我们看看CNN的张量输入。
在最后两篇文章中,我们介绍了张量和基本的张量属性秩、轴和形状。如果你还没有看过那些文章,我强烈建议你去查看。
我现在想做的是,用一个实际的例子来应用秩、轴和形状的概念。为此,我们将考虑将图像输入作为CNN的张量。
卷积神经网络是图像识别任务的首选网络,因为它们非常适合检测空间模式。
记住,张量的形状编码了关于张量轴、秩和索引的所有相关信息,所以我们将在示例中考虑形状,这将使我们能够计算出其他值。让我们开始。
CNN输入的形状
CNN输入的形状通常有四个长度。这意味着我们有一个秩为4的张量,有四个轴。张量形状中的每个索引代表一个特定的轴,每个索引处的值给出了相应轴的长度。
张量的每个轴通常代表输入数据的某种现实世界或逻辑特征。如果我们理解这些特征及其在张量中的轴位置,那么我们就可以很好地理解张量数据结构的整体。
为了分解这一点,我们将从右到左反向工作,考虑轴。记住,我们从最后一个轴开始,这是我们将要开始的地方,是实际数字或数据值所在的位置。
如果我们沿着最后一个轴运行并在那里检查一个元素,我们将看到一个数字。如果我们沿着任何其他轴运行,元素是多维数组。
对于图像,原始数据以像素的形式出现,由数字表示,并使用两个维度(高度和宽度)布局。
图像高度和宽度
为了表示两个维度,我们需要两个轴。
图像的高度和宽度在最后两个轴上表示。这里可能的值是28 x 28
,就像我们将在CNN项目中使用的fashion-MNIST数据集中的图像数据一样,或者是VGG16神经网络使用的224 x 224
图像大小,或者我们可以想象的任何其他图像尺寸。
图像颜色通道
下一个轴代表颜色通道。这里典型的值是3
,对于RGB图像,或者是1
,如果我们处理的是灰度图像。这种颜色通道的解释只适用于输入张量。
我们将在片刻后揭示,这个轴的解释在张量通过卷积层后会发生变化。
到目前为止,使用最后三个轴,我们已经将一个完整的图像表示为一个张量。我们有了颜色通道和高度和宽度,都以张量形式布局,使用了三个轴。
在这一点上,为了访问数据,我们需要三个索引。我们选择一个颜色通道,一个高度和一个宽度,以到达一个特定的像素值。
图像批次
这使我们来到了四个轴中的第一个,它代表批量大小。在神经网络中,我们通常使用样本的批次而不是单个样本,所以这个轴的长度告诉我们批次中有多少个样本。
这使我们能够看到,整个图像批次使用一个秩为4的张量表示。
假设我们有一个给定张量的形状[3, 1, 28, 28]
。使用形状,我们可以确定我们有三个图像的批次。
[批次大小,颜色通道,高度,宽度]
每张图像有一个单一的颜色通道,图像的高度和宽度分别是28 x 28
。
- 批次大小
- 颜色通道
- 高度
- 宽度
这给我们一个单一的秩为4的张量,最终将流经我们的卷积神经网络。
给定这样的图像张量,我们可以使用四个索引导航到批次中特定图像的特定颜色通道的特定像素。
NCHW vs NHWC vs CHWN
在阅读API文档和学术论文时,通常可以看到B
被N
替换。N
代表批次中的_样本数量_。
此外,我们在实际中经常遇到的另一个区别是维度的_重新排序_。常见的排序如下:
-
NCHW
-
NHWC
-
CHWN
正如我们所看到的,PyTorch使用NCHW
,而TensorFlow和Keras默认使用NHWC
(可以配置)。最终,选择使用哪一个主要取决于性能。一些库和算法更适合这些排序中的一种或另一种。
输出通道和特征图
让我们看看张量通过卷积层转换后,颜色通道轴的解释如何变化。
假设我们有一个张量,包含来自单个28 x 28
灰度图像的数据。这给我们提供了以下张量形状:[1, 1, 28, 28]
。
现在假设这个图像被传递到我们的CNN,并通过第一个卷积层。当这种情况发生时,我们的张量形状和底层数据将被卷积操作改变。
卷积改变了高度和宽度维度以及通道数量。输出通道的数量根据卷积层中使用的过滤器数量而变化。
假设我们有三个卷积过滤器,让我们看看通道轴会发生什么变化。
由于我们有三个卷积过滤器,我们将有三个来自卷积层的通道输出。这些通道是卷积层的输出,因此被称为输出_通道,而不是_颜色通道_。
三个过滤器中的每一个都对原始的单一输入通道进行卷积,产生三个输出通道。输出通道仍然由像素组成,但像素已经被卷积操作修改。根据过滤器的大小,输出的高度和宽度维度也会改变,但我们将在未来的文章中讨论这些细节。
特征图
有了输出通道,我们不再有颜色通道,而是有我们称之为_特征图_的修改后的通道。这些所谓的特征图是使用输入颜色通道和卷积过滤器进行卷积的结果。
特征图是由卷积产生的输出通道。
“特征”这个词被使用是因为输出代表了图像中的特定特征,例如边缘,并且这些映射在训练过程中网络学习时出现,并随着我们在网络中深入而变得更加复杂。
总结
我们现在应该对CNN输入张量的总体形状,以及秩、轴和形状的概念如何适用于这种理解有了很好的理解。
当我们开始构建CNN时,我们将在未来的文章中加深对这些概念的理解。在此之前,我们将在下一篇文章中见到你!
相关文章:
CNN张量输入形状和特征图
CNN张量输入形状和特征图 这个是比较容易理解的张量的解释,比较直观 卷积神经网络 在这个神经网络编程系列中,我们正在逐步构建一个卷积神经网络(CNN),所以让我们看看CNN的张量输入。 在最后两篇文章中&…...
RK3399开发板Linux实时性改造
本次测试基于NanoPC-T4开发板(国产化处理器RK3399),4.19.111内核Xenomai实时性改造测试。 Xenomai下载网站:https://xenomai.org/downloads/ NanoPC-T4网站:https://wiki.friendlyarm.com/wiki/index.php/NanoPC-T4/z…...
ASP.NET Core 中的高效后台任务管理
一、引言 在当今快速发展的 Web 开发领域,ASP.NET Core 凭借其卓越的性能、强大的功能和高度的灵活性,已然成为众多开发者构建现代 Web 应用程序的首选框架。它不仅能够高效地处理各种复杂的业务逻辑,还为开发者提供了丰富多样的工具和功能&…...
Spring Boot 2 学习指南与资料分享
Spring Boot 2 学习资料 Spring Boot 2 学习资料 Spring Boot 2 学习资料 在当今竞争激烈的 Java 后端开发领域,Spring Boot 2 凭借其卓越的特性,为开发者们开辟了一条高效、便捷的开发之路。如果你渴望深入学习 Spring Boot 2,以下这份精心…...
知识追踪模型DKT,DLKT详解及代码复现
定义与应用 知识追踪是一种 教育技术领域的重要方法 ,旨在通过分析学生的学习行为和表现,预测其掌握特定知识点的程度。这种方法的核心在于建立能够反映学习者认知状态的动态模型,从而实现对学生学习进度的实时监控和个性化指导。 DKT模型 DKT模型 是最早的知识追踪模型之…...
一类特殊积分的计算
一类特殊积分的计算 前言一、第一个引理二、第二个引理三、积分的计算后记 前言 今天讨论的这类积分是十分有趣的,在 Mathematics Stack Exchange 看见后,便打算在此将其中的计算过程完善一下。在本篇文章中,我们重点考虑求解如下积分&#…...
VScode 配置 C语言环境
遇到的问题集合 mingw官方下载网站(https://sourceforge.net/projects/mingw-w64/files/)更新之后,与网上大多数教程上写的界面不同了。 网上大多数教程让下载这个: 但是现在找不到这个文件。 写hello.c文件时,报错&…...
spring mvc源码学习笔记之十一
pom.xml 内容如下 <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/P…...
小结:路由器和交换机的指令对比
路由器和交换机的指令有一定的相似性,但也有明显的区别。以下是两者指令的对比和主要差异: 相似之处 基本操作 两者都支持类似的基本管理命令,比如: 进入系统视图:system-view查看当前配置:display current…...
ffmpeg7.0 aac转pcm
#pragma once #define __STDC_CONSTANT_MACROS #define _CRT_SECURE_NO_WARNINGSextern "C" { #include "libavcodec/avcodec.h" }//缓冲区大小(缓存5帧数据) #define AUDIO_INBUF_SIZE 40960 /*name depthu8 8s16 …...
C#读取本地网络配置信息全攻略
一、引言 在当今数字化时代,网络已深度融入我们生活与工作的方方面面。对于软件开发而言,掌握本地计算机的网络配置信息显得尤为关键。想象一下,你正在开发一款网络诊断工具,需要精准定位网络连接问题,此时 IP 地址、…...
解决aerich init -t xx 报错ModuleNotFoundError: No module named ‘tomli_w‘
今天在学习fastapi的时候,发现一款数据库迁移工具,通过这个工具可以根据模型类来对数据库做出改变。 随跟着学: 在执行 aerich init -t settings.TORTOISE_ORM的时候, 彼其娘之。。 报了一些错误: Traceback (most recent ca…...
python检测gitlab中某个标签在一个月内添加和移除了多少次
可以通过 Python 脚本和 GitLab API 检测一个标签在一个月内被添加和移除的次数。以下是实现的步骤和示例代码: 步骤 获取 GitLab API 访问令牌:在 GitLab 中生成一个 Personal Access Token。设置时间范围:确定一个月的时间范围。调用 Git…...
学习模板之一
学习目标: 提示:这里可以添加学习目标 例如: 一周掌握 Java 入门知识 学习内容: 提示:这里可以添加要学的内容 例如: 搭建 Java 开发环境掌握 Java 基本语法掌握条件语句掌握循环语句 学习时间&#x…...
2025-微服务—SpringCloud-1~3
2025-微服务—SpringCloud 第一章、从Boot和Cloud版本选型开始说起1、Springboot版本2、Springcloud版本3、Springcloud Alibaba4、本次讲解定稿版 第二章 关于Cloud各种组件的停更/升级/替换1、微服务介绍2、SpringCloud是什么?能干吗?产生背景…...
centos7.6 安装nginx 1.21.3与配置ssl
1 安装依赖 yum -y install gcc zlib zlib-devel pcre-devel openssl openssl-devel2 下载Nginx wget http://nginx.org/download/nginx-1.21.3.tar.gz3 安装目录 mkdir -p /data/apps/nginx4 安装 4.1 创建用户 创建用户nginx使用的nginx用户。 #添加www组 # groupa…...
PL/SQL语言的数据库交互
PL/SQL语言的数据库交互 引言 在当今的信息化时代,数据库管理系统(DBMS)在各行各业中扮演着至关重要的角色。为了高效地与数据库进行交互,许多程序员、数据库管理员和系统分析师选择使用PL/SQL(Procedural Language/…...
ARP欺骗
文章目录 ARP协议ARP欺骗原理断网攻击ARP欺骗(不断网) ARP协议 在局域网中,网络传输的是帧,帧里面有目标主机的MAC地址。arp协议负责将IP地址解析成对应的MAC地址 ARP欺骗原理 即通过伪造IP地址和MAC地址实现ARP欺骗,能够在网络中产生大量…...
Genymotion配套VirtualBox所在地址
在 Genymotion打开虚拟机前需要先打开VirtualBox中的虚拟机 C:\Program Files\Oracle\VirtualBox\VirtualBox.exe 再开启genymotion中的虚拟机开关...
TPS61022 PFM的机制以及TPS61xxx转换器的PFM与PWM之间的负载阈值
引言 TI 的大多数 TPS61xxx 低压升压转换器都配备了 PSM(省电模式),以帮助提高轻负载效率。但是,当它处于重负载状态时,输出纹波通常会高于 PWM。此外,PSM 和 PWM 之间的负载电流阈值不会直观地写入数据表中…...
1. npm 常用命令详解
npm 常用命令详解 npm(Node Package Manager)是 Node.js 的包管理工具,用于安装和管理 Node.js 应用中的依赖库。下面是 npm 的一些常用命令及其详细解释和示例代码。 镜像源 # 查询当前使用的镜像源 npm get registry# 设置为淘宝镜像源 …...
黑马linux入门笔记(01)初始Linux Linux基础命令 用户和权限 实用操作
B站 黑马程序员 的视频 BV1n84y1i7td 黑马程序员新版Linux零基础快速入门到精通,全涵盖linux系统知识、常用软件环境部署、Shell脚本、云平台实践、大数据集群项目实战等 增强自控力 冥想慢呼吸绿色锻炼充分休息减少决策次数优先做重要的事情(早晨)融入强自控群控…...
Markdown中甘特图的使用
Markdown中甘特图的使用 1. 前言2. 语法详解2.1 甘特图语法 3. 使用场景及实例4. 小结5. 其他文章快来试试吧🖊️ Markdown中甘特图的使用 👈点击这里也可查看 1. 前言 Markdown 的原生语法不支持绘制图形,但通过扩展模块,我们可…...
Django创建数据表、模型、ORM操作
1、创建项目 django-admin startproject PersonInfosProject 2、创建项目应用,进入PersonInfosProject文件夹,新建index应用,使用命令 cd PersonInfosProject python manage.py startapp 新建完成之后的目录结构 3、新建数据模型…...
No. 31 笔记 | Web安全-SQL手工注入技术学习 Part 2
一、研究背景 背景介绍 SQL注入是一种常见且高危的Web安全漏洞。攻击者可以通过构造恶意SQL查询语句来绕过验证机制,执行未授权操作,如获取敏感信息、篡改数据库内容甚至控制服务器。 研究内容 本笔记探讨以下数据库的手工注入技术: MySQLAc…...
Spring Boot中的扫描注解如何使用
在 Spring Boot 中,扫描注解是指通过注解来告诉 Spring 框架应该扫描哪些包、哪些类或哪些特定的组件,并将其作为 Spring 容器中的 bean 进行管理。Spring Boot 主要通过以下几种注解来实现自动扫描: ComponentScanSpringBootApplicationCom…...
用 Python 从零开始创建神经网络(十九):真实数据集
真实数据集 引言数据准备数据加载数据预处理数据洗牌批次(Batches)训练(Training)到目前为止的全部代码: 引言 在实践中,深度学习通常涉及庞大的数据集(通常以TB甚至更多为单位)&am…...
深入探讨 Vue.js 的动态组件渲染与性能优化
Vue.js 作为一款前端领域中备受欢迎的渐进式框架,以其简单优雅的 API 和灵活性受到开发者的喜爱。在开发复杂应用时,动态组件渲染是一项极其重要的技术,它能够在页面中动态地加载或切换组件,从而显著提升应用的灵活性与用户体验。…...
qml TextArea、TextEdit、TextField、TextInput的区别于联系
在 QML 中,TextArea、TextEdit、TextField 和 TextInput 都是用来接收用户输入的控件,但它们之间有一些区别和联系。 区别: TextArea:用于多行文本输入,可以接收多行文本输入。TextEdit:也用于多行文本输入…...
《探索 PC 端的开源神经网络多模态模型宝藏》
《探索 PC 端的开源神经网络多模态模型宝藏》 一、多模态模型:开启智能交互新纪元二、主流 PC 端开源多模态模型大赏1. Obsidian:轻量级多模态先锋2. GLM-Edge 系列:移动端与 PC 端的全能选手3. Minicpm-llama3-v2.6:紧凑高效的多…...
centos 搭建nginx+配置域名+windows访问
准备工作:一个完整的centos环境,nginx安装包(可以从官网下载)nginx: download 一:centos可能有精简版,部分环境没有相关依赖包, 需要检查以下项: 1.gcc检查:gcc -v(回车后应当有版…...
docker的数据卷和自定义镜像
docker的数据卷: 容器与宿主机之间,或者容器和容器之间的数据共享(目录)。 创建容器的时间,通过指定目录,实现容器于宿主机之间,或者容器和容器之间的数据共享。 容器的生命周期有限,…...
在 Linux 下Ubuntu创建同权限用户
我是因为不小心把最开始创建的用户的文件夹颜色搞没了,再后来全白用习惯了,就不想卸载了,像创建一个和最开始创建的用户有一样的权限可以执行sudo -i进入root一样的用户 如图这是最原始的样子 第一步 创建新用户,我这里是因为之前…...
计算机视觉算法实战——面部特征点检测
✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连 ✨ ✨个人主页欢迎您的访问 ✨期待您的三连✨ 1. 领域介绍✨✨ 面部特征点检测(Facial Landmark Detection)是计算机视觉中…...
电力场景红外测温图像均压环下的避雷器识别分割数据集labelme格式2436张1类别
数据集格式:labelme格式(不包含mask文件,仅仅包含jpg图片和对应的json文件) 图片数量(jpg文件个数):2436 标注数量(json文件个数):2436 标注类别数:1 标注类别名称:["arrester"] 每个类别标注的框数&am…...
4种革新性AI Agent工作流设计模式全解析
文章目录 导读:AI Agent的四种关键设计模式如下:1. 反思2. 工具使用3. 规划4. 多Agent协作 总结内容简介: 导读: AI Agent是指能够在特定环境中自主执行任务的人工智能系统,不仅接收任务,还自主制定和执行…...
C#基础 枚举 Enumeration从基础到进阶
目录 一、入门篇:枚举基础1. 枚举类型的定义2. 枚举类型的优点3. 枚举的基本使用3.1 枚举的类型转换3.2 遍历枚举成员3.3 判断枚举值是否有效3.4枚举的比较 4. 枚举的设计规范 二、深入底层篇:存储、值与继承限制1. 枚举的存储与表示2. 枚举底层类型选择…...
SOME/IP 协议详解——服务发现
文章目录 1. Introduction (引言)2. SOME/IP Service Discovery (SOME/IP-SD)2.1 General(概述)2.2 SOME/IP-SD Message Format2.2.1 通用要求2.2.2 SOME/IP-SD Header2.2.3 Entry Format2.2.4 Options Format2.2.4.1 配置选项(Co…...
android studio使用DataBinding
DataBinding 是谷歌官方发布的在android上对MVVM设计模式的一个实现框架,其作用是实现数据绑定。 Android DataBinding主要实现了View和ViewModel的双向绑定,包括用户的响应。并且实现了自动更新。 DataBinding优点: 1.大量减少Act…...
记一次学习skynet中的C/Lua接口编程解析protobuf过程
1.引言 最近在学习skynet过程中发现在网络收发数据的过程中数据都是裸奔,就想加入一种数据序列化方式,json、xml简单好用,但我就是不想用,于是就想到了protobuf,对于protobuf C/C的使用个人感觉有点重,正好…...
JavaSE面试
final和static对比 static知识点介绍static代码块当JVM加载类时,static代码块会且只会被执行一次。可用于优化程序性能。实例代码块在每次创建对象时,都会自动执行。static方法static方法中不能使用this和super关键字。静态内部类静态内部类的创建不需要…...
【Rust自学】11.10. 集成测试
喜欢的话别忘了点赞、收藏加关注哦,对接下来的教程有兴趣的可以关注专栏。谢谢喵!(・ω・) 11.10.1. 什么是集成测试 在Rust里,集成测试完全位于被测试库的外部。集成测试调用库的方式和其他代码一样,这也…...
Redis :redis的大Key问题
问题 : 什么是redis 的大key 呢? redis 是一个单线程应用程序。他的请求类似于队列处理,命令排队执行,逐个处理。 这样就会出现一个问题,一旦队列前面的命令请求处理时间过程,那么后续执行命令就会被迫的等…...
IntelliJ IDEA中Maven项目的配置、创建与导入全攻略
大家好,我是袁庭新。 IntelliJ IDEA是当前最流行的Java IDE(集成开发环境)之一,也是业界公认最好用的Java开发工具之一。IntelliJ IDEA支持Maven的全部功能,通过它我们可以很轻松地实现创建Maven项目、导入Maven项目、…...
如何确保获取的淘宝详情页数据的准确性和时效性?
要确保获取的淘宝详情页数据的准确性和时效性,可从以下几个方面着手: 合法合规获取数据 遵守平台规则:在获取淘宝详情页数据之前,务必仔细阅读并严格遵守淘宝平台的使用协议和相关规定。明确哪些数据可以获取、以何种方式获取以及…...
如何将json字符串格式化
文章目录 如何对json字符串进行格式化显示hutool方案的示例和不足使用fastjson的方案 如何对json字符串进行格式化显示 将json字符串内容进行格式化的输出显示。本文介绍 hutool的方案和alibaba 的fastjson方案 hutool方案的示例和不足 引入依赖 <dependency><grou…...
【Vue + Antv X6】可拖拽流程图组件
使用事项: ❗先放个组件上来,使用手册有空会补全 ❗需要下载依赖 “antv/x6”: “^2.18.1”, “antv/x6-plugin-dnd”: “^2.1.1”, 组件: 组件使用: <flowChart :key"flowChartKey" ref"flowChart" lef…...
反转链表题目
文章目录 反转链表题目链接:[在线OJ](https://leetcode.cn/problems/reverse-linked-list/description/)题目详解思路1:思路1算法复杂度 思路2代码实现思路2算法复杂度 结语 欢迎大家来到我的博客,给生活来点impetus 让我们进入《题海探骊》…...
利用Python爬虫获取义乌购店铺所有商品列表:技术探索与实践
在当今数字化时代,数据的重要性不言而喻。对于采购商而言,能够快速、准确地获取供应商店铺内的所有商品信息,是提升采购效率、优化采购决策的关键。义乌购作为国内知名的在线批发平台,汇聚了海量的商品资源,为采购商提…...
基于FPGA的多功能数字钟设计
基于FPGA的多功能数字钟设计 前言基础知识按键数码管 系统概述按键使用说明模块描述模块设计button_debouncebutton_controllerclock_controllerdigital_tube 整体资源用量测试视频 前言 本工程主要是数码管、按键、LED的应用开发。 注:本工程所有IP均使用源码开发…...