经典卷积神经网络
目录
经典卷积神经网络
一、卷积神经网络基础回顾
二、LeNet:开启 CNN 先河
三、AlexNet:突破性进展
四、ZFNet:继承与优化
五、GoogLeNet:引入 Inception 模块
六、VggNet:深度与简单结构的融合
七、ResNet:解决深层网络训练难题
八、DenseNet:促进特征复用
九、MobileNet:专注移动端应用
十、ShuffleNet:优化移动端模型
十一、SENet:聚焦通道间特征依赖
十二、实战案例与代码实现
卷积神经网络(Convolutional Neural Network,CNN)在计算机视觉领域占据着举足轻重的地位,为图像识别、目标检测等任务提供了强大的解决方案。本文深入剖析经典卷积神经网络的原理、结构及应用,涵盖 LeNet、AlexNet、ZFNet、GoogLeNet、VggNet、ResNet、DenseNet、MobileNet、ShuffleNet、SENet 等重要模型。
一、卷积神经网络基础回顾
卷积神经网络模拟视觉皮层机制,由卷积层、激活层、池化层和全连接层构成。卷积层运用卷积核提取局部特征,激活层引入非线性,池化层下采样特征图,全连接层整合特征输出预测结果。
二、LeNet:开启 CNN 先河
LeNet 是最早的卷积神经网络之一,由 Yann LeCun 提出,主要用于手写数字识别。其结构包含两个卷积层、两个池化层和三个全连接层。LeNet 的卷积层使用小尺寸卷积核提取图像边缘和纹理特征,池化层采用平均池化下采样,全连接层整合特征完成分类。LeNet 的提出为后续 CNN 的发展奠定了基础。
三、AlexNet:突破性进展
AlexNet 在 2012 年 ImageNet 挑战赛中崭露头角,凭借卓越性能推动 CNN 进入深度学习时代。它包含 5 个卷积层和 3 个全连接层,引入 ReLU 激活函数、Dropout 技术和多 GPU 训练策略。ReLU 激活函数加速训练过程,Dropout 技术有效防止过拟合,多 GPU 训练提升效率。AlexNet 的成功彰显了深度 CNN 的强大性能,激发了 CNN 领域的创新热情。
四、ZFNet:继承与优化
ZFNet 在 AlexNet 基础上改进,优化网络结构提升性能。ZFNet 调整卷积核数量和全连接层神经元数量,扩大网络宽度和深度,增强特征表达能力。它在 ImageNet 挑战赛中取得优异成绩,成为 CNN 发展的重要里程碑。
五、GoogLeNet:引入 Inception 模块
GoogLeNet 以 Inception 模块为核心,显著提升计算效率。Inception 模块融合多种尺寸卷积核和池化操作,提取多尺度特征,拓宽网络结构。GoogLeNet 的深度达 22 层,采用辅助分类器缓解梯度消失问题,加速训练收敛。它在 ImageNet 挑战赛中夺冠,凸显了 Inception 模块的优势。
六、VggNet:深度与简单结构的融合
VggNet 强调网络深度与结构一致性,使用小尺寸卷积核(3×3)和深度结构(16 - 19 层),逐层提取图像特征。VggNet 的卷积层和池化层交替使用,全连接层置于网络末端。它在 ImageNet 挑战赛中表现突出,验证了深度网络提取复杂特征的能力,为后续研究提供新方向。
七、ResNet:解决深层网络训练难题
ResNet 提出残差学习机制,通过残差块连接输入输出,缓解深层网络训练难题。残差块包含两个卷积层和一个 shortcut 连接,将输入直接加到输出上。这种设计助 ResNet 达到 100 多层,提升性能。ResNet 在 ImageNet 挑战赛中夺冠,成为 CNN 发展的又一里程碑。
八、DenseNet:促进特征复用
DenseNet 在 ResNet 基础上创新,每个层接收前面所有层的特征图,强化特征复用。其连接模式提升参数效率,减少计算量,增强特征传播和利用效率。DenseNet 在多个图像分类任务中表现出色,验证了其高效特征利用策略的优势。
九、MobileNet:专注移动端应用
MobileNet 针对移动端计算资源受限问题,采用深度可分离卷积替代传统卷积,大幅削减计算量与参数量。深度可分离卷积分解卷积操作为深度卷积和逐点卷积,降低资源消耗。MobileNet 在保持较高准确率的同时,实现高效运行,适用于移动设备场景。
十、ShuffleNet:优化移动端模型
ShuffleNet 在 MobileNet 基础上引入 channel shuffle 操作,优化特征通道交互,提升模型性能。其创新的 ShuffleUnit 模块结合逐点组卷积和通道重排技术,在降低计算成本的同时取得良好效果,进一步推动移动端深度学习应用发展。
十一、SENet:聚焦通道间特征依赖
SENet 提出通道注意力机制,通过学习通道间依赖关系,增强关键特征表达。SENet 的 SE 模块包含全局平均池化、全连接层和 sigmoid 激活函数,生成通道注意力权重,调整特征图。这种机制使 SENet 能聚焦关键特征,提升分类准确性,在 ImageNet 挑战赛中取得佳绩。
十二、实战案例与代码实现
本文为每个 CNN 模型提供实战案例与 PyTorch 代码实现,助力读者加深理解掌握应用。以 AlexNet 为例,代码如下:
import torch
import torch.nn as nnclass AlexNet(nn.Module):def __init__(self, num_classes=1000):super(AlexNet, self).__init__()self.features = nn.Sequential(nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=3, stride=2),nn.Conv2d(64, 192, kernel_size=5, padding=2),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=3, stride=2),nn.Conv2d(192, 384, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(384, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(256, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=3, stride=2),)self.classifier = nn.Sequential(nn.Dropout(),nn.Linear(256 * 6 * 6, 4096),nn.ReLU(inplace=True),nn.Dropout(),nn.Linear(4096, 4096),nn.ReLU(inplace=True),nn.Linear(4096, num_classes),)def forward(self, x):x = self.features(x)x = x.view(x.size(0), 256 * 6 * 6)x = self.classifier(x)return x# 测试 AlexNet
net = AlexNet()
input_tensor = torch.randn(1, 3, 224, 224)
output = net(input_tensor)
print(output.shape)
其他模型的代码实现类似,通过定义网络结构、前向传播函数,构建模型并输入数据测试输出。这些实战案例为实际应用开发奠定基础。
相关文章:
经典卷积神经网络
目录 经典卷积神经网络 一、卷积神经网络基础回顾 二、LeNet:开启 CNN 先河 三、AlexNet:突破性进展 四、ZFNet:继承与优化 五、GoogLeNet:引入 Inception 模块 六、VggNet:深度与简单结构的融合 七、ResNet&a…...
Reactor模型详解与C++实现
Reactor模型详解与C实现 一、Reactor模型核心思想 Reactor模式是一种事件驱动的并发处理模型,核心通过同步I/O多路复用实现对多个I/O源的监听,当有事件触发时,派发给对应处理器进行非阻塞处理。 关键特征: 非阻塞I/Oÿ…...
观测云产品更新 | 安全监测、事件中心、仪表板AI智能分析等
观测云更新 安全监测 新增 SIEM 功能模块:实时分析企业各类系统(如服务器、应用、网络设备)的日志和事件数据,自动发现潜在威胁,帮助团队迅速定位异常,充分发挥安全监控中枢的作用。 注意:目…...
【HTML】个人博客页面
目录 页面视图编辑 页面代码 解释: HTML (<body>): 使用了更加语义化的HTML5标签,例如<header>, <main>, <article>, <footer>。文章列表使用了<article>包裹,结构清晰。添加了分页导航。使用了Font…...
OrangePi Zero 3学习笔记(Android篇)10 - SPI和从设备
目录 1. 配置内核 2. 修改设备数 3. 修改权限 4. 验证 Zero 3的板子有2个SPI Master接口,其中SPI0接的是板载16MB大小的SPI Nor Flash,SPI1则是导出到26pin的接口上。 spi和i2c有点不同,spi是直接生成spi虚拟设备,所以在dev里…...
《Java 大视界——Java 大数据在智能电网分布式能源协同调度中的应用与挑战》
随着风电、光伏等分布式能源大规模接入电网,传统调度系统面临数据规模激增、响应延迟显著、多源异构数据融合困难等核心问题。本文聚焦Java生态下的大数据技术体系,深入探讨其在智能电网实时监测、负荷预测、资源优化配置等场景中的落地实践。通过分析Sp…...
基于正点原子探索者开发板的简易音乐播放器
1、概述 本次实验的名称叫做“基于正点原子探索者开发板的简易音乐播放器”。本实验的功能框图如下: 从图上我们可以清晰的看到本实验所需的实现的功能、以及每个功能需要怎么实现。 这次实验使用的是正点原子的探索者开发板,此开发板采用的MCU是STM32F4…...
【CF】Day59——Codeforces Round 914 (Div. 2) D
D. Set To Max 题目: Easy 思路: 简单题 由于题目的数据给的很小,所以我们可以用 n 的复杂度过,那我们来观察一下我们应该怎么操作 显然,如果 a[i] > b[i] 时是无法构造的,同时 a[i] b[i] 时就不用管…...
【Linux专栏】Linux进程间关系和守护进程
文章目录 1、进程间关系1.1 进程组1.2 组长进程 2、会话?2.1 查看会话2.2 创建会话 3、控制终端4、作业控制4.1 前台/后台进程 5、守护进程5.1 如何创建守护进程?5.2 杀掉守护进程 1、进程间关系 主要描述两个名称概念:即进程组和组长进程。…...
AutoVACUUM (PostgreSQL) 与 DBMS_STATS.GATHER_DATABASE_STATS_JOB_PROC (Oracle) 对比
AutoVACUUM (PostgreSQL) 与 DBMS_STATS.GATHER_DATABASE_STATS_JOB_PROC (Oracle) 对比 核心功能对比 特性PostgreSQL AutoVACUUMOracle GATHER_DATABASE_STATS_JOB_PROC主要目的空间回收 统计信息更新仅优化器统计信息收集底层机制MVCC(多版本并发控制)维护CBO(基于成本的…...
go依赖查询工具之godepgraph(分析main.go的依赖树)
文章目录 go依赖查询工具之godepgraph(分析main.go的依赖树)什么是服务间的隐式耦合?分析main.go的依赖树方法1. godepgraph (配合 Graphviz 可视化) - 最直观【推荐】方法2. go list go依赖查询工具之godepgraph(分析main.go的依…...
市场差分探头信号输出形式的一些因素考量
在5G/6G通信、新能源汽车电控等高频测量场景中,差分探头的信号输出架构直接影响测试系统的信噪比与可靠性。根据IEEE仪器与测量协会2024年度报告,单端输出方案的市场渗透率较2020年提升42%,这一趋势背后蕴含着深刻的技术变革逻辑。 一、核心…...
SQL练习——day01
力扣——SQL练习总结 DENSE_RANK()窗口函数 这是排名函数的一种,它在处理相同值时,会给相同的值分配相同的排名,并且后续的排名不会跳过。比如有三个分数并列第一,那么它们的排名都是 1,接下来的分数排名就是 2&#…...
断点续传使用场景,完整前后端实现示例,包括上传,下载,验证
断点续传在多个场景中非常有用,包括但不限于大文件上传、跨国或跨区域文件传输、移动设备文件传输、备份和同步以及软件更新等。接下来,我将为你提供一个基于Java的后端实现示例,结合前端逻辑来完成整个断点续传的功能,包括上传、…...
Xinference推理框架
概述 GitHub,官方文档。 核心优势 性能优化:通过vLLM、SGLang等引擎实现低延迟推理,吞吐量提升2-3倍;企业级支持:支持分布式部署、国产硬件适配及模型全生命周期管理;生态兼容:无缝对接LangC…...
技术更新频繁,团队如何适应变化
构建持续学习机制、引入技术雷达与预研机制、通过敏捷方法快速响应变化、推动跨团队知识协作与传承 是应对技术更新频繁、团队保持适应力的核心策略。其中,构建持续学习机制尤为关键。通过制度化、场景化的学习安排,团队可以主动追踪新技术趋势ÿ…...
解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-MCP大模型上下文解析
解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-MCP大模型上下文解析 我们首先来看一下 整个MCP的一个基本的一个流程,他解决的一个问题。我们回到这里,他解决的一个问题是什么呢?他解决这个问题就是你的大…...
游戏代码混淆的作用与应用分析
1. 防止逆向工程 核心保护对象:游戏引擎、算法(如物理模拟、AI行为树)、加密逻辑等。实例:Unity游戏使用 ConfuserEx 混淆C#代码,使反编译工具(如dnSpy)只能显示杂乱命名,难以理解逻…...
信息系统运行管理员:临阵磨枪版
信息系统运行管理员考试 - 全覆盖详细背诵大纲 (根据考情分析和原始材料,力求完整覆盖考点细节) 第一部分:基础知识与运维概览 Chapter 1: 信息系统运维概述 (上午题 5分) 信息: 含义:香农 - 减少随机不确定性的东西;…...
PWM(脉宽调制)的配置参数[预分频器\自动重载值]的自动计算
文章目录 前言一、数据结构二、二分法搜索最佳预分频器和自动重载值三、示例 前言 pwm是嵌入式开发过程中很常见的一个模块,而配置pwm的过程中就少不了频率参数的计算,大多数32位机的pwm频率都由时钟、预分频器(prescaler)、自动…...
manuskript开源程序是面向作家的开源工具
一、软件介绍 文末提供程序和源码下载 manuskript开源程序是面向作家的开源工具,Manuskript 可在 GNU/Linux、Mac OS X 和 Windows 上运行。 二、Features 特征 Manuskript provides a rich environment to help writers create their first draft and then furt…...
antd 主题色定制
定制方案: 1. 全局定制 整个应用范围内的组件都生效 全局文件 theme.css :root:root {--adm-color-primary: #a062d4; } antd-mobile 中的主题变量也是在 :root 下声明的,所以在有些情况会由于优先级的问题无法覆盖。通过 :root:root 显式地让你所…...
召回11:地理位置召回、作者召回、缓存召回
GeoHash 召回 属于地理位置召回,用户可能对附近发生的事情感兴趣。GeoHash 是一种对经纬度的编码,地图上每个单位矩形的 GeoHash 的前几位是相同的,GeoHash 编码截取前几位后,将相同编码发布的内容按时间顺序(先是时间…...
leetcode0767. 重构字符串-medium
1 题目:重构字符串 官方标定难度:中 给定一个字符串 s ,检查是否能重新排布其中的字母,使得两相邻的字符不同。 返回 s 的任意可能的重新排列。若不可行,返回空字符串 “” 。 示例 1: 输入: s “aab” 输出: “…...
vue基本介绍
Vue是一款流行的JavaScript前端框架,以下是其基本介绍: 发展历程 - 2014年,尤雨溪发布了Vue的第一个版本。 - 此后,Vue不断发展和完善,陆续发布了多个版本,功能逐渐强大,社区也日益活跃。 …...
【vue】【环境配置】项目无法npm run serve,显示node版本过低
解决方案:安装高版本node,并且启用高版本node 步骤: 1、查看当前版本 node -v2、配置nvm下载镜像源 1)查看配置文件位置 npm root2)找到settings.txt文件 修改镜像源为: node_mirror: https://npmmirro…...
第35周Zookkeeper+Dubbo JDK不同版本介绍
一、JDK 新特性全解析 JDK9 - 模块化:化繁为简的魔法 模块化特性:JDK9 给 Java 程序带来模块化特性,就像把一个大公司划分成多个部门,每个部门(模块)各司其职。模块比包更大,一个模块包含多个…...
【ORB-SLAM3】CreateNewKeyFrame()函数阅读
void Tracking::CreateNewKeyFrame() void Tracking::CreateNewKeyFrame() {// 如果局部建图线程正在初始化且没做完或关闭了,就无法插入关键帧if(mpLocalMapper->IsInitializing() && !mpAtlas->isImuInitialized())return;if(!mpLocalMapper->SetNotStop(t…...
腾讯开源实时语音大模型VITA-audio,92mstoken极速响应,支持多语言~
简介 VITA-Audio 是一个由腾讯优图实验室(Tencent Youtu Lab)、南京大学和厦门大学的研究人员共同开发的项目,旨在解决现有语音模型在流式生成(streaming)场景下生成第一个音频令牌(token)时的高…...
使用 TypeScript + dhtmlx-gantt 在 Next.js 中实现
1. 安装依赖(确保已安装) npm install dhtmlx-gantt2. 创建 pages/gantt.tsx use clientimport { useRef, useEffect } from react import { gantt } from dhtmlx-gantt import dhtmlx-gantt/codebase/dhtmlxgantt.cssinterface Task {id: number | st…...
web第四次课后作业--页面操作实现数据库的增删查改
一、环境配置 1. 创建一个java web(maven构建)的项目2. 配置tomcat3. 连接数据库二、页面呈现 登录页面 详细信息 删除一条信息后 更新 更新后的信息 三、目录结构 四、代码实现 4.1 denglu.jsp <% page language"java" cont…...
DeepSearch:字节新一代 DeerFlow 框架
项目地址:https://github.com/bytedance/deer-flow/ 【全新的 Multi-Agent 架构设计】独家设计的 Research Team 机制,支持多轮对话、多轮决策和多轮任务执行。与 LangChain 原版 Supervisor 相比,显著减少 Tokens 消耗和 API 调用次数&#…...
uniapp中vue3和pinia安装依赖npm install失败
目录 一、问题描述 二、问题原因 三、问题解析及解决方案 一、问题描述 用uni-app开发小程序的时候,使用了vue3pinia,安装依赖的时候发现vue和pinia的版本问题,安装失败, npm ERR! code ERESOLVE npm ERR! ERESOLVE could not resolve np…...
【java】synchronized关键字详解
目录 一、线程同步与线程安全问题线程不安全Demo线程不安全的原因 二、synchronized关键字关键字锁粒度修饰对象修饰代码块修饰方法修饰静态方法修饰类 synchronized 锁总结 synchronized加锁原理MarkWordsynchronized锁升级synchronized锁原理synchronized关键字总结 其他同步…...
使用 `perf` 和火焰图(Flame Graph)进行性能分析
在现代软件开发中,性能优化是提升应用程序响应速度和资源利用率的关键步骤。当一个进程的 CPU 占用率异常高时,识别并优化性能瓶颈显得尤为重要。本文将详细介绍如何使用 Linux 下强大的性能分析工具 perf 以及火焰图(Flame Graph)…...
Cocos Creator 3.8.5 构建依赖环境配置文档
Cocos Creator 3.8.5 构建依赖环境配置文档 文章目录 Cocos Creator 3.8.5 构建依赖环境配置文档✅ 构建依赖汇总表✅ 构建平台配置说明👉 Windows 构建👉 Android 构建 ✅ 推荐构建环境组合(稳定)✅ 常见问题提示 适用于打包 An…...
# FlyEnv 环境下 MySQL 操作全攻略:从基础到字段修改
在使用 FlyEnv 搭建开发环境时,MySQL 数据库的操作是开发过程中不可或缺的一环。无论是修改字段结构,还是执行其他常见操作,都需要熟练掌握相关技能。下面将为你详细介绍 FlyEnv 环境下 MySQL 的操作,以及修改字段的多种方法。 一…...
C语言_自动义类型:联合和枚举
1. 联合体 1.1 联合体类型的声明 与结构体相似,联合体也是有一个或多个成员(可以是不同类型)构成;但是编译器只为最大的成员分配足够的内存空间 联合体的特点是所有成员共用同一块内存空间,所以联合体也叫ÿ…...
Golang基础知识—cond
cond 通常指 sync.Cond,它是标准库 sync 包中用于实现 条件变量 的同步原语。条件变量在多 goroutine 协作场景中非常有用,尤其在需要根据特定条件协调多个 goroutine 的执行顺序时。 sync.Cond 的核心作用 条件变量用于 等待某个条件满足 或 通知其他等…...
深入探索向量数据库:构建智能应用的新基础
📌 友情提示: 本文内容由银河易创AI(https://ai.eaigx.com)创作平台的gpt-4-turbo模型辅助生成,旨在提供技术参考与灵感启发。文中观点或代码示例需结合实际情况验证,建议读者通过官方文档或实践进一步确认…...
实验5 DNS协议分析与测量
实验5 DNS协议分析与测量 1、实验目的 了解互联网的域名结构、域名系统DNS及其域名服务器的基本概念 熟悉DNS协议及其报文基本组成、DNS域名解析原理 掌握常用DNS测量工具dig使用方法和DNS测量的基本技术 2、实验环境 硬件要求:阿里云云主机ECS 一台。 软件要…...
1200/1500 PID 学习笔记
一 准备 1. 仿真库文件,下载链接放在最后 2.PID仿真,不支持1200.所以组CPU需要1500. 3.PID必须在循环中断里面调用。 二 试水 1. 拉一个PID指令 2. 库文件拉入 3 仿真试水,可以看到已经开始调节了。 、 三 组态设置 1. Input: 输入值&a…...
深度学习中--模型调试与可视化
第一部分:损失函数与准确率的监控(Loss / Accuracy Curve) 1. 为什么要监控 Loss 与 Accuracy? Loss 是模型优化的依据,但它可能下降了 Accuracy 反而没变(过拟合信号) Accuracy 才是评估效果的…...
tomcat项目重构踩坑易错点
是的,没错,弄了一个特别老的项目。重构真是头疼啊。其实好吧,还是用的太少。 前提条件:用idea工具非社区版。注意是非社区版。点击设置- project Structure 1.配置Modules 点击import module 添加好模块后。 重点来了࿰…...
如何安全擦除 SSD 上的可用空间
无论您是要处理旧 SSD 还是只是想确保敏感信息的私密性,擦除可用空间都是至关重要的一步。那么,您可以擦除 SSD 上的可用空间吗?是的,可以擦除 SSD 上的可用空间,我们在本指南中提供了两种有效的方法。是的,…...
增强 HTNN 服务网格功能:基于 Istio 的BasicAuth 与 ACL 插件开发实战
目录 1.引言 什么是HTNN? 为什么开发 BasicAuth 和 ACL 插件? 2.技术背景 技术栈概览 Istio 与服务网格简述 HTNN 框架与插件机制概览 3.插件开发详解:BasicAuth 与 ACL 3.1 BasicAuth插件 功能点 实现细节 3.2 ACL插件 功能点 …...
从概念到可工程化智能体的转变路径——以“知识奇点工程师”为例
产品部门定义了一个如下概念性的“知识奇点工程师”,他们构建的不仅仅是一个数据库或知识图谱,而是一个活的、能自我进化的知识生态系统,是整个“Neuralink for Education”宏伟蓝图的基石。他们的工作难度和重要性,不亚于为AI引擎…...
docker(四)使用篇一:docker 镜像仓库
前文我们已经介绍了 docker 并安装了 docker,下面我们将正式步入使用环节,本章是第一个使用教学:docker 镜像仓库。 一、什么是镜像仓库 所谓镜像仓库,其实就是负责存储、管理和分发镜像的仓库,并且建立了仓库的索引…...
S7-1500 与 IM60 进行 PROFINET 通信
S7-1500 与 IM60 进行 PROFINET 通信 本文档介绍使用 S7-1500 CPU 与 IM 60 进行 PROFINET 通信,实现对 IM60 及 AM03 的控制。 使用软件及硬件 软件:工控人加入PLC工业自动化精英社群 TIA Portal V19 ET 200 SMART IM60 GSD 文件下载链接ÿ…...
车载诊断架构 ---车载总线对于功能寻址的处理策略
我是穿拖鞋的汉子,魔都中坚持长期主义的汽车电子工程师。 老规矩,分享一段喜欢的文字,避免自己成为高知识低文化的工程师: 钝感力的“钝”,不是木讷、迟钝,而是直面困境的韧劲和耐力,是面对外界噪音的通透淡然。 生活中有两种人,一种人格外在意别人的眼光;另一种人无论…...