深度学习奠基作 AlexNet 论文阅读笔记(2025.2.25)
文章目录
- 训练数据集
- 数据预处理
- 神经网络模型
- 模型训练
- 正则化技术
- 模型性能
- 其他补充
训练数据集
- 模型主要使用2010年和2012年的
ImageNet
大规模视觉识别挑战赛(ILSVRC)提供的ImageNet
的子集进行训练,这些子集包含120万张图像。 - 最终,模型还使用2009年秋天版本的完整
ImageNet
数据集进行了训练,该数据集包含8900万张图像,分属于10184个类别。数据集中一半的图像用于训练,另一半用于测试。
数据预处理
- 图像裁剪:因为模型需要固定大小的图像输入,因此首先将数据集中的图像的短边缩放到
256
个像素,再从得到的图像中裁剪出中间的256 × 256
的图像块。 - 像素处理:从每张图像的像素中减去了所有图像中该像素的平均值。这样的处理即对像素数据进行了归一化,可以加速模型的训练并使得训练更加稳定。
- 数据增强:
- CPU运行的数据增强:
AlexNet
使用了两种计算量都很低的数据增强方式,所以增强后的图像无需存储在计算机的硬盘中备用。数据增强过程使用 Python 进行编程,在CPU上运行。由于数据增强无需使用正在训练模型的GPU,因此作者们认为数据增强是“计算免费”的,即不会影响模型的训练过程。 - 两种数据增强方式:
- 图像平移和水平翻转:从
256 × 256
的图像中提取正中央和四个角的224 × 224
的图片块及其水平翻转得到的图片块(共十张),并最终平均网络的Softmax
对十张新图片的分类结果得到最终的分类结果。作者们发现如果不这样做,模型就会产生严重的过拟合。 - 改变图像中RGB通道的强度:对整个
ImageNet
训练集中的RGB像素值执行主成分分析(PCA),作者们发现这种方式可以降低模型的分类错误率。
- 图像平移和水平翻转:从
- CPU运行的数据增强:
备注:由于GPU技术的发展比CPU快多了,因此如果从现在的角度看,在CPU上做数据增强反而会成为模型效率的瓶颈。
神经网络模型
- 模型主要特点:非常大且非常深,是截至当时最大的卷积神经网络。
- 模型参数量:
6000万
参数和65万
神经元。 - 模型基本结构:
- 神经网络层构成:包含五个卷积层(一些卷积层带有最大池化层)、三个全连接层和一个最终的 1000-way 的
Softmax
层。 - 卷积核情况:第一个卷积层的卷积核大小是
11 × 11 × 3
,个数为96个,步长为5;第二个卷积层的卷积核大小为5 × 5 × 48
,个数为256个;第三个卷积层的卷积核大小为3 × 3 × 256
,个数为 384 个;第四卷积层有 384 个大小为3 × 3 × 192
的核;第五个卷积层有 256个3 × 3 × 192
的核。 - 全连接层情况:每个全连接层都有4096个神经元。
- 神经网络层构成:包含五个卷积层(一些卷积层带有最大池化层)、三个全连接层和一个最终的 1000-way 的
- 层叠池化方法:作者们发现层叠池化可以略微降低模型分类的错误率,但是也会使得模型会变得略微难以收敛。
备注:
- AlexNet 中包含的两个隐藏的全连接层是其性能的一大瓶颈,也是其设计的缺陷。现在的CNN不会使用那么大的全连接层,因此Dropout的使用减少了,反而是循环神经网络系列的模型使用 Dropout 更多。
- 层叠池化方法在后续的卷积神经网络中已经基本上没有继续使用了。
模型训练
- 激活函数:使用
ReLU
作为激活函数,文中称为一种非饱和神经元,用于加速训练过程。作者们认为相较于当时主流的激活函数tanh
,ReLU
激活函数可以大大加快模型的训练过程。在模型中,每一个卷积层和全连接层的输出都使用了ReLU
激活函数进行处理。 - 训练设备:使用GPU进行高效的卷积操作。具体而言,使用的是两个型号为
GTX 580
的GPU,两个GPU的显存都是3GB
。 - 分布式训练:
- 基本模式:受限于GPU的显存,作者们将模型分布在两个GPU上进行训练。作者们将模型的卷积核对半分到两个GPU上,且两个GPU只在模型中的某些层进行交互。作者们发现使用双GPU的网络训练时间比使用单GPU的网络更快一些。
- 两个GPU训练结果的区别:作者们最后发现第一个GPU对颜色敏感,而第二个GPU对颜色不敏感,并且每一次训练模型都是这样,他们不清楚是什么原因。
- 优化器:
- 优化器类型:使用随机梯度下降优化器(
SGD
)进行模型训练。 - 优化器超参数设置:批次大小设置为
128
,动量设置为0.9
,权重衰减设置为0.0005
。作者们发现少量的权重衰减非常重要,因为减少了模型的训练误差。所有的层采用相同的学习率,初始化为0.01
,当验证错误率随着学习率的提高而升高时,将学习率除以10
。现在设置模型的学习率时,往往从小到大,然后慢慢减小。
- 优化器类型:使用随机梯度下降优化器(
- 模型初始化:
- 权重初始化:以标准差为
0.01
的零均值高斯分布来初始化模型每一层的权重。 - 偏置初始化:用常数
1
来初始化第二、第四和第五卷积层以及全连接隐藏层中的神经元偏置,剩余层的偏置初始化为0
。作者们认为这样的偏置设置可以为ReLU
提供积极的输入来加速早期的学习。
- 权重初始化:以标准差为
- 迭代次数和训练时间:迭代了
90
次,总共花费了五到六天的时间进行模型训练。
备注:
- 现在看起来,使用 ReLU 作为激活函数并没有比其他的激活函数对模型训练有多强的加速效果,只是单纯因为它足够简单。
- 在目前看来,将 AlexNet 拆分到两个GPU上进行训练,这个非常工程化的细节并不是特别重要。并且,实际上 在代码编写得好的情况下,使用一个 GTX 580 GPU也是可以训练模型的。
- 当年SGD并不是主流的模型训练器,因为其调参过程相对而言比较困难。但是现在SGD已经是最主流的模型学习器。
- 权重衰减实际上就是L2正则项,其不是加在模型上,而是优化算法上。
- 现在设置模型优化器的学习率时,往往从小到大,然后慢慢再减小,类似于一个余弦曲线。
正则化技术
- Dropout:
- 功能和原理:用于缓解全连接层的过拟合现象。对每一个隐藏神经元,有
0.5
的概率将其输出设置为0
,使得它们不参与前向传播和反向传播过程。在测试阶段,将所有神经元的输出都乘0.5
。作者们发现如果不使用Dropout
,模型就会存在严重的过拟合现象,但是Dropout
也会使得模型需要的迭代次数翻倍。 - 文中的观点:作者们认为,在处理模型的输入时,增加了 Dropout 之后相当于每一次都是不同的神经网络,这样迫使模型学习更加稳健的特征。
- 功能和原理:用于缓解全连接层的过拟合现象。对每一个隐藏神经元,有
- 局部响应归一化:一种正则化方法,作者们发现使用了该归一化方法也可以降低模型分类的错误率。局部响应归一化层在第一和第二卷积层之后。
备注:
- 目前的观点认为 Dropout 不是模型融合,而是在线性模型上等价于一个L2正则项。它产生一个正则的效果,但是无法构造出一个和它相同的正则方式。
- 局部响应归一化也不是很重要,后面基本上没有人继续使用。
模型性能
- 2010年 ImageNet 大规模图像识别挑战赛:top-1 和 top-5 的错误率分别为
37.5%
和17.0%
,显著优于之前最先进的模型。 - 2012年 ImageNet 大规模图像识别挑战赛:top-5 的错误率为
15.3%
,远高于第二名的26.2%
的水平。 - 特征向量使用:如果两张图像通过模型后获得的特征向量之间的欧氏距离很小,则可以认为这两张图像是相似的。
- 未来展望:作者们指出该模型的性能在出现了更快的GPU和更大的数据集时还可以继续提升。
其他补充
- 训练模型的启示:
- 为了提升机器学习算法的性能,我们可以收集更大的数据集、训练更强大的模型和使用更好的技术来防止过拟合。
- 数据集相关:
- 在 AlexNet 提出的时代,大部分有标注的图像数据集相对而言都比较小,只有数万张图片,例如
NORB
、Caltech-101/256
、CIFAR-10/100
等。 LabelMe
是一个包含有数十万张全分割的图像的数据集。ImageNet
包含有1500万张有标注的高分辨率的图像,这些图像分属于超过2200个类别。
- 在 AlexNet 提出的时代,大部分有标注的图像数据集相对而言都比较小,只有数万张图片,例如
- 模型相关:
- 卷积神经网络具有先验知识来弥补图像数据集不够大的问题,因为它们对图像的本质特征有假设。相较于相似规模的标准前馈神经网络,卷积神经网络的参数量和连接数都少得多,因此更加容易训练,它们的理论最优性能仅仅略低于前馈神经网络。
- 作者们发现模型的深度(即神经网络中的层数)非常重要,移除任意一个卷积层都会导致模型性能的下降,尽管卷积层的参数数量非常少。现在看来,这个观点不太对,因为虽然神经网络的深度非常重要,但是移除一个神经网络层不一定会导致性能下降,通过优化超参数可以达到相同的性能。
ReLU
的一个理想特性是,它不需要对输入进行归一化来防止饱和。只需要一些训练样本向ReLU
产生了正输入,那么学习就可以发生。- 卷积神经网络中的池化层用于汇总同一特征图中相邻神经元组的输出。
- 最简单和最常用的降低过拟合的方式是使用保留标注的数据增强来人为地扩大数据集。
- 结合多个不同模型的预测结果是一种降低测试错误率的好用的方法,但是往往代价高昂。
- 无监督预训练可以帮助神经网络获取较为优秀的早期权重,本文中作者也提到,虽然他们出于简化没有这么做,但是他们认为这么做是有帮助的。
- 神经网络的深度很重要,但是宽度也很重要,不能特别宽特别浅,也不能特别深但是特别窄。
- 过拟合是深度学习的一个派别,现在研究者们又认为正则不是那么重要,最重要的是模型本身的结构。
- 硬件相关:
- 2007年 NVIDIA 推出了
CUDA
库,使得用GPU训练模型变得普遍。当时的研究人员研究人员主要是使用 Matlab 进行编程。 - GPU对2D卷积进行了高度优化,能够很好地促进大型卷积神经网络的训练过程。
- 现代的GPU设计非常适合跨GPU并行,因为它们可以直接读写其他GPU的显存,而不需要以计算机的内存作为中介。
- 2007年 NVIDIA 推出了
- 论文阅读相关:
- 阅读机器学习和深度学习领域的论文,对于工程上的细节,如果不是需要复现,则可以暂时忽略掉。
- 论文的实验部分,如果不是领域专家或者需要复现论文,一般不用太了解,这样可以节约时间。
相关文章:
深度学习奠基作 AlexNet 论文阅读笔记(2025.2.25)
文章目录 训练数据集数据预处理神经网络模型模型训练正则化技术模型性能其他补充 训练数据集 模型主要使用2010年和2012年的 ImageNet 大规模视觉识别挑战赛(ILSVRC)提供的 ImageNet 的子集进行训练,这些子集包含120万张图像。最终ÿ…...
解决python项目无法安装openai模块的问题
问题描述: pip install openai Fatal error in launcher: Unable to create process using ‘“e:\private\github\navigation_site.venv\Scripts\python.exe” “E:\private\github\my_project\navigation_site.venv\Scripts\pip.exe” install OpenAI’: ??? 这…...
项目实践 之 pdf简历的解析和填充(若依+vue3)
文章目录 环境背景最终效果前端讲解左侧模块解析右侧上传模块解析前端步骤 后端讲解代码前端 环境背景 若依前后端分离框架 vue最后边附有代码哦 最终效果 前端讲解 左侧模块解析 1、左侧表单使用el-form 注意: 1、prop出现的字段,需要保证是该类所…...
RAGS评测后的数据 如何利用influxdb和grafan 进行数据汇总查看
RAGS(通常指相关性、准确性、语法、流畅性)评测后的数据能借助 InfluxDB 存储,再利用 Grafana 进行可视化展示,实现从四个维度查看数据,并详细呈现每个问题对应的这四个指标情况。以下是详细步骤: 1. 环境准备 InfluxDB 安装与配置 依据自身操作系统,从 InfluxDB 官网下…...
本地部署阿里的万象2.1文生视频(Wan2.1-T2V-1.3B)模型
文章目录 (零)在线体验(一)本地部署(1.1)克隆仓库(1.2)安装依赖(1.2.1)安装 flash-attention(1.2.2)重新安装依赖(1.2.3&a…...
centos设置 sh脚本开机自启动
1. start.sh脚本 #!/bin/bash# 依赖docker,等待xxx容器完全启动 sleep 60curl -X POST "localhost:8381/models?urlmymodel.mar&model_namemymodel&batch_size1&max_batch_delay10&initial_workers1"sudo /usr/local/nginx/sbin/nginx …...
一文读懂什么是K8s Admission Controller
#作者:曹付江 文章目录 1、什么是 Admission Controllers?2、如何创建 Admission Controllers?3、Admission 控制器的最佳实践 K8s 中的操作与安全标准执行机制: 1、什么是 Admission Controllers? Admission contro…...
江协科技/江科大-51单片机入门教程——P[1-3] 单片机及开发板介绍
前言:本节主要的任务是了解一下 51 单片机和所用的普中51开发板。 目录 一、单片机介绍 二、单片机的应用领域 三、STC89C52单片机 四、命名规则 五、单片机内部拆解 六、单片机内部结构图 七、单片机管脚图 八、单片机最小系统 九、开发板介绍 十、开发…...
一周学会Flask3 Python Web开发-Jinja2模板继承和include标签使用
锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 不管是开发网站还是后台管理系统,我们页面里多多少少有公共的模块。比如博客网站,就有公共的头部&…...
4.3MISC流量分析练习-wireshark-https
流量分析题目的例题 1.了解wireshark的过滤方式 2.了解tls跟ssl协议基本还原 3.了解xor基本变换方式,获取flag 附件是一个流量包,打开之后有各种流量,但是分析无果,然后丢到kali中使用binwalk进行分析,发现有一个r…...
wifi5和wifi6,WiFi 2.4G、5G,五类网线和六类网线,4G和5G的区别
wifi5和wifi6的区别 是Wi-Fi 5和Wi-Fi 6的选择与路由器密切相关。路由器是创建和管理无线网络的设备,它决定了网络的类型和性能。具体来说: 路由器的标准支持:路由器可以支持不同的Wi-Fi标准,如Wi-Fi 5(802.11ac)和Wi-Fi 6(802.11ax)。支持Wi-Fi 6的路由器能够提供更高…...
【二分查找】P9698 [GDCPC2023] Path Planning|普及
本文涉及的基础知识点 本博文代码打包下载 C二分查找 [GDCPC2023] Path Planning 题面翻译 【题目描述】 有一个 n n n 行 m m m 列的网格。网格里的每个格子都写着一个整数,其中第 i i i 行第 j j j 列的格子里写着整数 a i , j a_{i, j} ai,j。从 0…...
请介绍一下Java的面向对象特性
Java是一种纯面向对象的语言,它支持类、继承、封装和多态等面向对象的基本概念。以下是Java面向对象特性的详细介绍: 一、封装 封装是面向对象编程的核心思想之一,它指的是将对象的属性和方法结合在一起,并隐藏对象的内部实现细…...
使用ZFile打造属于自己的私有云系统结合内网穿透实现安全远程访问
文章目录 前言1.关于ZFile2.本地部署ZFile3.ZFile本地访问测试4.ZFile的配置5.cpolar内网穿透工具安装6.创建远程连接公网地址7.固定ZFile公网地址 前言 在数字化的今天,我们每个人都是信息的小能手。无论是职场高手、摄影达人还是学习狂人,每天都在创造…...
Spring 源码硬核解析系列专题(八):Spring Security 的认证与授权源码解析
在前几期中,我们从 Spring 核心到 Spring Boot,再到 Spring Cloud,逐步探索了 Spring 生态的底层原理。作为企业级应用的关键组件,Spring Security 提供了全面的安全解决方案,包括认证(Authentication)和授权(Authorization)。本篇将深入 Spring Security 的源码,剖析…...
Windows 图形显示驱动开发-WDDM 3.2-自动显示切换(七)
亮度数据 为了确保用户不会因为切换而注意到亮度变化,GPU0 和 GPU1 显示的所有亮度属性都必须相同。 此要求可确保在切换 GPU0 至 GPU1 之前的任何亮度级别,在切换至 GPU1 后都可以支持。 为此,GPU0 和 GPU1 的驱动程序必须: 使…...
Android ObjectBox数据库使用与集成指南
ObjectBox其核心特点ObjectBox与 SQLite 和 Realm 的对比Android集成ObjectBox创建ObjectBox实体对象创建ObjectBox操作管理类OBManager在Application初始化ObjectBox插入或更新数据查询数据统计数据分页数据查询删除数据总结今天分享一套Android另一个数据库ObjectBox。Object…...
C++ Qt常见面试题(3):Qt内存管理机制
Qt 内存管理机制是其框架的重要组成部分,目的是简化开发者对内存的管理,减少内存泄漏的风险,同时提供高效的资源使用方式。Qt 的内存管理机制主要依赖于 对象树(Object Tree) 和 父子关系(Parent-Child Relationship) 的设计,通过智能管理对象的生命周期来实现自动化的…...
到底什么是认证?
哈喽!欢迎来到程序视点,我是小二哥!本店菜品如下: #风暴过后以桶 认证和授权 什么是认证 认证 (Authentication) 是根据凭据验明访问者身份的流程。即验证“你是你所说的那个人”的过程。 身份认证,通常通过用户名…...
量子计算可能改变世界的四种方式
世界各地的组织和政府正将数十亿美元投入到量子研究与开发中,谷歌、微软和英特尔等公司都在竞相实现量子霸权。 这其中的利害关系重大,有这么多重要的参与者,量子计算机的问世可能指日可待。 为做好准备,,我们必须了…...
【Web安全】图片验证码DOS漏洞
文章目录 免责声明一、漏洞原理二、测试步骤三、测试案例四、修复方式免责声明 在网络安全领域,技术文章应谨慎使用,遵守法律法规,严禁非法网络活动。未经授权,不得利用文中信息进行入侵,造成的任何后果,由使用者自行承担,本文作者不负责。提供的工具仅限学习使用,严禁…...
鸿蒙Next如何自定义标签页
前言 项目需求是展示标签,标签的个数不定,一行展示不行就自行换行。但是,使用鸿蒙原生的 Grid 后发现特别的难看。然后就想着自定义控件。找了官方文档,发现2个重要的实现方法,但是,官方的demo中讲的很少&…...
一周学会Flask3 Python Web开发-Jinja2模板过滤器使用
锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 在Jinja2中,过滤器(filter)是一些可以用来修改和过滤变量值的特殊函数,过滤器和变量用一个竖线 | &a…...
HarmonyOS 5.0应用开发——鸿蒙接入高德地图实现POI搜索
【高心星出品】 文章目录 鸿蒙接入高德地图实现POI搜索运行结果:准备地图编写ArkUI布局来加载HTML地图 鸿蒙接入高德地图实现POI搜索 在当今数字化时代,地图应用已成为移动设备中不可或缺的一部分。随着鸿蒙系统的日益普及,如何在鸿蒙应用中…...
浅谈HTTP及HTTPS协议
1.什么是HTTP? HTTP全称是超文本传输协议,是一种基于TCP协议的应用非常广泛的应用层协议。 1.1常见应用场景 一.浏览器与服务器之间的交互。 二.手机和服务器之间通信。 三。多个服务器之间的通信。 2.HTTP请求详解 2.1请求报文格式 我们首先看一下…...
内存泄漏指什么?常见的内存泄漏有哪些?
内存泄漏是指程序在运行过程中,由于某些原因导致程序无法释放已经不再使用的内存,使得这部分内存持续被占用,最终可能导致系统可用内存逐渐减少,严重时会影响系统性能甚至导致程序崩溃。(内存泄漏是指程序中已经分配的…...
FFmpeg视频处理入门级教程
一、FFmpeg常规处理流程 #mermaid-svg-W8X1llNEyuYptV3I {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-W8X1llNEyuYptV3I .error-icon{fill:#552222;}#mermaid-svg-W8X1llNEyuYptV3I .error-text{fill:#552222;str…...
PINN求解固体力学问题——论文加代码
PINN求解固体力学问题——论文加代码 1. 训练2. 可视化 论文:Physics-Informed Deep Learning and its Application in Computational Solid and Fluid Mechanics 1. 训练 # %load Plane_Stress_W-PINNs.py """ Forward Problem for Plane Stress …...
HC32F460_SCI驱动(一)
在开始介绍HC32F460的SCI驱动之前,先重点说明一下功能组与串口相关参数,以便于更好的描述SCI驱动。 1. 功能组 1.1 基本概念 HC32F460的引脚功能复用机制通过Func_Grp(功能组)实现,其灵活性显著高于传统单片机(如STM32系列)。每个引脚支持多种外设功能,具体功能通过选…...
程序诗篇里的灵动笔触:指针绘就数据的梦幻蓝图
大家好啊,我是小象٩(๑ω๑)۶ 我的博客:Xiao Xiangζั͡ޓއއ 很高兴见到大家,希望能够和大家一起交流学习,共同进步。 这一节我们来学习指针的相关知识,学习内存和地址,指针变量和地址,包…...
QT:QPen、QBrush、与图形抗锯齿的关联
QPen QPen 是 Qt 框架中用于定义绘图时使用的画笔属性的类。在使用 QPainter 进行 2D 绘图时,QPen 可以控制线条的外观,比如线条的颜色、宽度、样式(如实线、虚线等)、端点样式(如方形端点、圆形端点等)和…...
数据结构秘籍(一)线性数据结构
1.数组 数组(Array)是一种很常见的数据结构。它由相同类型的元素(element)组成,并且是使用一块连续的内存来存储。 我们直接可以利用元素的索引(index)计算出该元素对应的存储地址。 数组的特…...
【数据分享】2000-2024年全国逐年归一化植被指数(NDVI)栅格数据(年平均值)
NDVI,全名为Normalized Difference Vegetation Index,中文名称为归一化植被指数。这个指数可以用来定性和定量评价植被覆盖及其生长活力,我们也可以简单地将它理解为体现植被密度和健康状况的一个指标。 之前我们给大家分享了来源于MOD13A3数…...
解决前端计算的浮点精度问题
问题:比如1001*1.11等于110.11 但是如果用前端开发处理的话 ,因为涉及到浮点数运算(这是因为JavaScript(以及其他许多编程语言)使用IEEE 754标准来表示浮点数,导致某些十进制小数无法精确表示,…...
C语言基本知识------指针(4)
1. 回调函数是什么? 回调函数就是⼀个通过函数指针调用的函数。 如果你把函数的指针(地址)作为参数传递给另⼀个函数,当这个指针被⽤来调⽤其所指向的函数 时,被调⽤的函数就是回调函数。 void qsort(void base,//指针…...
004 Kafka异常处理
6.异常处理 文章目录 6.异常处理1.异常分类与处理原则2.生产者异常处理1. 同步发送捕获异常2. 异步发送回调处理 3.消费者异常处理1.全局异常处理器2.方法级处理3.重试yml配置 4.死信队列(DLQ)配置1. 启用死信队列2. 手动发送到DLQ 5.事务场景异常处理1.…...
C++模拟实现map和set
C模拟实现map和set 1、STL源代码分析2、实现出复用红黑树的框架3、实现红黑树的迭代器4、解决map和set中key不可修改问题5、解决insert返回值问题完整代码 模拟实现map和set实际上是对红黑树的封装,如对红黑树的实现有疑问,请移步:C手撕红黑树…...
使用elasticdump导出/导入 -- ES数据
导出指定索引数据到指定文件夹: ./elasticdump --inputhttp://用户:密码IP:9201/索引名字 --output导出路径/out.json --typedata 将导出的文件导入 ./elasticdump --input路径/out.json --outputhttp://账号:密码IP:9201/索引名称 --typedata --fileTypejson 【el…...
CSDN年度评选揭晓,永洪科技AI技术与智能应用双星闪耀
近日,永洪科技在CSDN(中国专业开发者社区)的年度评选中,凭借在人工智能技术创新与vividime在行业应用中的卓越表现,一举斩获“人工智能企业”及“智能应用”双料大奖。这一荣誉不仅彰显了永洪科技在AI领域的领先地位&a…...
Kubernetes 资源利用率翻倍?离在线混合部署深度解析
还在为 Kubernetes 集群资源利用率低而烦恼?还在为高昂的云成本而头疼?今天,我们就来聊聊 Kubernetes 中的一项黑科技——离在线混合部署,让大家的集群资源利用率翻倍,成本减半! 🤔 什么是离在线…...
【Java】Spring Boot全量YAML配置说明
目录 Spring Boot 配置文件基础核心配置日志配置Web 服务器配置数据源配置JPA 配置缓存配置国际化配置邮件服务配置自定义配置使用示例1. Spring Boot 配置文件基础 Spring Boot 的配置文件可以使用以下文件格式: application.propertiesapplication.ymlSpring Boot 默认加载…...
【STL】7.STL常用算法(1)
STL常用算法(1) 前言简介一.遍历算法1.for_each2.transform 二.查找算法1.find2.find_if3.adjacent_find4.binary_search5.count6.cout_if 三.排序算法1.sort2.random_shuffle3.merge4.reverse 总结 前言 stl系列主要讲述有关stl的文章,使用S…...
弱监督语义分割学习计划(1)-简单实现CAM但是效果不好
零: 项目说明 是这样的一个事情,经过与deepseek的一番讨论和交流,DeepSeek为我设计了一个30天高强度学习计划,重点聚焦弱监督/无监督语义分割在野外场景的应用,结合理论与实践,并最终导向可落地的开源项目。目前开始了…...
内存泄漏问题分享
在前端开发中,内存泄漏(Memory Leak)是指由于代码问题导致浏览器无法回收不再使用的内存,从而影响网页的性能,导致页面变慢,甚至崩溃。前端内存泄漏通常由以下几种原因引起,理解和修复这些问题对…...
用 DeepSeek 打样!KubeSphere LuBan 用 3 天/3 分钟“干掉”大模型部署焦虑
用 DeepSeek 打样!KubeSphere LuBan 用 3 天/3 分钟“干掉”大模型部署焦虑 大模型落地,如何告别“部署焦虑”? DeepSeek-R1 的惊艳表现无需赘述,但企业落地时的高门槛却让许多开发者望而却步——复杂的部署流程、资源调度难题、…...
Java在云计算平台中的应用研究
Java在云计算平台中的应用研究 随着云计算的广泛应用,越来越多的企业和开发者开始选择基于云计算的架构来构建和部署应用。Java作为一种成熟的编程语言,凭借其跨平台性、强大的生态系统以及优秀的并发处理能力,已成为云计算平台中常用的编程…...
【学写LibreCAD】0 仿写LibreCAD简介
一、LibreCAD 核心模块: 核心模块(Core) 功能:处理 CAD 的核心逻辑,如几何计算、图形对象管理、坐标系转换等。关键组件: 图形对象:如直线、圆、圆弧、多段线等。数学工具:向量、矩…...
【质量管理】怎么评估职能部门当前质量管理成熟度
评估目的 在做质量管理时,我们需要先了解各职能部门当前质量管理成熟度。从而识别改进机会,为各职能部门后续质量提升计划提供依据。 直白说:就是让那些不肯动的人动起来,同时往往总经理对各部门的质量管理成熟度的评分要更低&…...
音乐游戏Dance Dance Revolution(DDR)模拟器
文章目录 (一)Dance Dance Revolution(1.1)基本情况(1.2)机体 (二)模拟器(2.1)主程序(2.2)模拟器主题 (三)曲谱…...
【Pandas】pandas Series filter
Pandas2.2 Series Computations descriptive stats 方法描述Series.align(other[, join, axis, level, …])用于将两个 Series 对齐,使其具有相同的索引Series.case_when(caselist)用于根据条件列表对 Series 中的元素进行条件判断并返回相应的值Series.drop([lab…...