音视频之H.265/HEVC量化
H.265/HEVC系列文章:
1、音视频之H.265/HEVC编码框架及编码视频格式
2、音视频之H.265码流分析及解析
3、音视频之H.265/HEVC预测编码
4、音视频之H.265/HEVC变换编码
5、音视频之H.265/HEVC量化
量化 (Quantization) 是指将信号的连续取值(或大量可能的离散取值)映射为有限多个离散幅值的过程,实现信号取值多对一的映射。在视频编码中,残差信号经过离散余弦变换 (DCT) 后,变换系数往往具有较大的动态范围。因此对变换系数进行量化可以有效地减小信号取值空间,进而获得更好的压缩效果。同时,由于多对一的映射机制,量化过程不可避免地会引入失真,它也是视频编码中产生失真的根本原因。由于量化同时影响着视频的质量与比特率,因此量化是视频编码中非常重要的一个环节。
一个量化器可由其输入端的范围划分方式以及对应的输出值唯一确定。根据输入输出数据的类型,量化器可分为标量量化器 (Scalar Quantizer) 和矢量量化器 (Vector Quantizer) 两种类型。其中标量量化器因其复杂度低、容易实现的特点受到了广泛的应用。目前主流的图像视频编码标准都使用了标量量化器。
一.标量量化:
1.基本原理:
在有损编码中,标量量化 (Scalar Quantization,SQ)是一种最基本的量化方法,它是指将一个幅度连续的信号映射成若干个离散的符号。图 6.1 给出了一个标量量化器的例子,如图所示,将横轴(输入信号)划分为 M个互不相交的区间(图中M =9 ):
以上描述标量量化的形式可由图6.2(a)表示,该量化器直接将输入入信号映射为重建值。此外,标量量化还有另一种表现形式,如图 6.2(b)所示。输入信号经量化后被映射为某些用于表示重建值的索引号 l,l经反量化过程后可得到重建值。由于重建值与其索引号有着一一对应的关系,因此这两种量化形式在本质上是统一的。二者主要区别在于,利用索引号表示重建值往往具有更加统一和简单的形式。因此在图像和视频编码中,更多地采用后者的形式。
2.均匀量化:
均匀标量量化(Uniform Scalar Quantization)是一种最简单的标量量化方法,它将输入值域划分成等距的区间,每个区间对应的输出值 (即重建值)为该区间的中点。区间的长度称为量化步长(Quantization Step),用表示。量化步长取决于输入信号的变化范围以及重建值的个数。设输入信号的最小值和最大值分别用 a 和 b表示,重建值个数为 M,则量化步长
可计算为:
图 6.3 (a) 给出了一个均匀量化器的示例,图 6.3 (b) 给出了其对应的量化误差曲线。由于重建值为每个区间的中点,因此量化误差必位于区间内。通常量化误差(即失真) 主要有 3 种衡量准则: 均方误差(Mean Square Error,MSE)、信噪比(Signal-to-Noise Ratio,SNR)和峰值信噪比 (Peak-Signal-to-Noise Ratio,PSNR)。下面分别介绍。
- MSE:MSE 是较为常用的一种失真衡量准则,直接反映失真的大小。其计算公式由式(6-1) 给出:
- SNR: 信号噪声功率比,反映了失真与信号的相对大小:
- PSNR: 峰值信号噪声功率比,反映了失真与信号峰值的相对大小:
对于服从均匀分布的输入信号,若采用 MSE 作为失真衡量准则,则其经均匀量化后的失真为
其中,为各区间的重建值,M 为重建值的个数。容易证明,对于均匀分布,使用上述均匀标量量化方法可以获得最小的失真,其失真大小与量化步长
的平方成正比。然而对于非均匀分布,使用均匀量化器可能无法获得较好的性能,下面介绍其最优量化方法Lloyd-Max 量化器。
3.Lloyd-Max 量化器:
最优标量量化器Lloyd-Max 量化器是由 S.PLloyd 和 J.Max 提出的。考虑服从任意分布的输入信号,设其概率密度函数为下面确定其最优量化器(重建值数量为 M)的判定边界
与
重建值采用 MSE 作为失真衡量准则,其失真为:
4. 熵编码量化器:
Lloyd-Max 量化器是在给定重建值数目 M 的约束条件下,使量化失真最小。若采用定长编码,则每传送一个量化输出值需要的比特位数为:
其中表示向上取整。考虑变长编码,如 Huffman 编码或算术编码。
此时每个量化输出值所需比特数可能不同,而其平均所需比特数接近于所有量化输出值的熵(Entropy),即
当且仅当所有输出值等概率分布时,等号成立。
对于 H() < log2m 的情形,Lloyd-Max 量化器并不是最优的。此时最优量化器应是在对熵的约束下使失真最小。设目标比特率为 R,失真用 MSE 准则,熵编码量化器在数学上可表达为:
由式 (6-8) 和式(6-9) 可以看出,熵编码量化器各区间重建值与Lloyd-Max 量化器相同,都为区间的“质心”;但二者区间划分边界有区别,熵编码量化器在 Lloyd-Max 量化器最邻近量化的基础上引入一个偏差。观察式(6-9)可发现该偏差的方向与相邻两个重建值的取值概率有关,相邻两个区间的划分点会向着取值概率较小的重建值方向偏移。也就是说,取值概率较大的量化重建值对应的量化区间也较大。由于概率越大的重建值编码时所需的比特数越小,因此这样做能有效地减少编码比特数。
在图像和视频编码中,常认为 DCT 系数服从零均值的拉普拉斯(Laplace) 分布,其主要特点是 0 值附近的系数概率较大。因此通常图像和视频编码中的量化器都会加宽以 0 为中心的区间,称为“量化死区”(Dead-zone),这样做能够带来一定率失真性能的提高。此外,视频编码中还有一种性能更优的量化方法一率失真优化量化 (RDOQ),它也是一种熵编码量化器。许多视频编码器都应用了这种量化方法,如H.264/AVC 标准对应的JM[8X264 以及 H265/HEVC 标准的官方测试编码器 HM等。
二.H.265/HEVC中的量化:
1.量化:
和 H.264/AVC 标准一样,H.265/HEVC 标准仅规定了反量化过程的实现方法,而将量化器的选择留给编码器自行决定。这使得编码端可以选择性能更优的量化方法,例如自适应量化 (Adaptive Quantization)以及的率失真优化量化 (RDOQ) 等。下面给出了H.265/HEVC 编码器可采用的传统标量量化方法,表示如下:
2.反量化:
3.RDOQ:
传统的标量量化器是以失真最小为目的进行设计的。而在视频编码中,编码比特率同样是一种影响编码性能的因素,因此视频编码中的量化器设计需要权衡失真与比特率。率失真优化量化(Rate-DistortionOptimized Quantization,RDOQ)就是这样一种量化器。其主要思想是将量化过程同率失真优化(RDO)准则相结合,对于一个变换系数G,给定多个可选的量化值并利用RDO 准则从中选出一个最优的量化值,计算如下:
H.265/HEVC的官方测试编码器HM使用了RDOQ。现将其主要实现方法和步骤介绍如下。
- 确定当前TU每个系数的可选量化值。用下式对当前TU所有系数进行预量化;
其中round(·)表示四舍五入。利用,的大小确定可选量化值,见表6.3:
- 利用 RDO 准则确定当前 TU所有系数的最优量化值。按扫描顺序遍历当前 TU所有系数,对于每一个系数,遍历其可选量化值,利用RDO准则确定每个系数的最优量化值。例如,对于系数
,其可选量化值为
和
,二者率失真代价分别计算如下:
其中,D()表示G量化
时,当前TU的总失真;R(
)表示
量化为
时,当前的TU总编码比特数(此时尚未确定量化值的系数,用其步骤1中预量化的结果计算)。若J(
)<J(
),则选取”为当前系数的最优量化值;反之,选取
作为最优量化值。
- 利用RDO准则确定当前TU每一个系数块组(CG)是否量化为全零组。H.265/HEVC在对一个TU进行熵编码(CABAC)时,会将其分成若干4x4的系数块组(Coefficient Group,CG),每个CG都含有一个比特位用于标识其是否为全零CG。若当前G为全零CG,只需要编码全零标识;反之,则须编码非零标识以及当前CG内的所有系数。因此,若当前CG仅含有极少个数且幅值较小的非零系数时,将其量化为全零CG可能会获得更好的率失真性能。
该步骤按CG扫描顺序遍历当前TU的所有CG,分别计算其量化为全零CG时的率失真代价,并与原率失真代价比较。若全零G对应的率失真代价较小,则令当前CG为全零CG。
- 利用RDO准则确定当前TU“最后一个非零系数”的位置。CABAC规定每个含有非零系数的TU都需要用一定的比特位表示“最后一个非零系数”(Last Significant Coefficient)的位置信息。这样可以省去编码拖尾零系数的比特。因此其位置在很大程度上影响着失真与编码比特数。
该步骤须首先确定“最后一个非零系数”可能的位置。利用步骤1预量化的结果,“最后一个非零系数”可能的选择为扫描顺序对应的“最后一个预量化值大于2的系数”与“最后一个预量化值大于1的系数”之间的所有非零系数。遍历这些非零系数,分别计算其作为“最后一个非零系数”时当前TU总的率失真代价。选择对应于最小率失真代价的系数作为当前TU的“最后一个非零系数”。
与标量量化相比,RDOQ提高了编码器的性能,但由于需要遍历多个可选量化值并计算率失真代价,其编码复杂度也有一定增加。实验结果表明,RDOQ能使编码性能提高3%~6%,总编码时间大约增加10%~15%。
4、量化参数:
在视频编码中,QP是非常重要的参数,它直接影响着视频的编码比特率。对于某些应用场合,尤其是当传输速率受限时,灵活地控制量化参数使得编码速率尽量接近给定速率尤为重要。为此,H.265/HEVC制定了一种非常灵活的 QP控制机制,它引入了量化组(Quantization Group,QG)的概念,规定一个CTB可以包含一个或多个固定大小的QG,同一个QG内的所有含有非零系数的CU共享一个QP,不同的QG可以使用不同的 QP。这样一来,编码器能够更灵活地进行速率控制,但同时也增加了 QP 解析算法的复杂度。
QC概念:
QG 是指将一幅图像分成的固定大小(NxN)的正方形像素块。其大小N由图像参数集(PPS)指定,且必须处于最大CU与最小CU之间(包含最大与最小CU)。图6.4给出了一个 32x32 QG的示意图,其中粗实线为CTB边界,粗虚线表示CU划分方式,细线为QG分界线。从图中可以看出,CU与QG 没有固定的大小关系。由于在一幅图像中,QG为固定大小,而CU 是根据视频内容自适应划分出来的,因此可能出现一个QG包含一个或多个CU的情形,也可能存在一个CU包含多个QG的情形.
QP的预测编码:
在 H.264/AVC 中,量化参数QP采用了预测编码的形式,只需要对实际 QP与预测 QP的差值进行编码,以避免直接编码QP所耗费的比特数。具体而言,Slice层QP使用PPS中给定的初始 QP进行预测,而一个Slice 内所有宏块的QP都使用当前Slice的QP 进行预测。H.265/HEVC 标准进一步发展了这一思想,它使用相邻已编码 QG 的信息来预测当前QG 的QP,这样能够使QP的预测更加准确。图6.5给出了H.265/HEVC中QP的预测模板,其中A和 B分别为当前 QG 左侧和上方的已编码 QG,则当前 QG 的预测 QP 可计算为:
需要注意的是,在OP预测过程中,在某些情况(例如Slice、Tile边界等)下A和B有可能不存在。下面分情况来说明。
- 对于一个Slice或Tile的第一个QG,A和B都不存在。此时使用当前 Slice 的 QP 作为该 QG 的预测 QP。
- 当QG位于一个 Slice 或Tile的上边界(非第一个QG)时,A存在而B不存在。此时将B替换为前一个已编码的QG。
- 当QG 位于一个 Slice 或 Tile 的左边界(非第一个QG)时,B存在而A不存在。此时将A替换为前一个已编码的QG。
CU 层 QP 的解析:
由于H.265/HEVC是以CU为单元进行解码的,因此 QP 的解析也是以CU为单元的。考虑到色度分量QP的计算需要使用亮度分量的QP,因此下面主要分析 CU 层亮度分量 QP的解析过程。
前文提到 H.265/HEVC对QP进行了预测编码,因此QP的解析需要QP的预测值(predQP)和预测误差(deltaQP)。下面分别介绍这两部分的解析过程。
预测QP(predQP)的获取:
前面介绍了 QG 层 QP的预测方法,由于CU和QG没有固定的大小关系,因此 CU层预测 QP的获取须分两种情况进行。
- 当一个 QG 包含一个或多个 CU 时,该 QG 内所有 CU 都使用一个预测 QP,即当前 QG 的预测 QP。
- 当一个 CU 包含多个 QG 时,将该 CU 内第一个 QG 的预测 QP作为当前 CU 的预测 QP。
QP预测误差(deltaQP)的解析:
deltaQP表示QG层QP与其预测QP 的差值,但它是以CU 为单元进行传递的。考虑到二者之间没有固定的大小关系,而且并非所有CU都含有 deltaQP信息(含有非零系数的CU才会携带deltaQP信息),因此 deltaQP 的解析也须分两种情况进行。
- 当一个 QG 包含一个或多个CU时,deltaQP会在解码顺序上的第一个含有非零系数的CU中传递。当前QG内在此之前所有CU的deltaQP都为0(即对于这些CU,直接使用predQP作为实际QP),在此之后的所有CU 都使用同一个deltaOP。如图6.6所示,粗线表示的是一个QG,细线表示CU划分方式。其中,H为第一个含有非零系数的CU,因而H中会传递当前QG的deltaQP 信息。此时,A~G 的 deltaQP 都为 0,而 H~M都使用H所携带的 deltaQP。
- 当一个CU包含多个QG时,该CU 只对应一个 deltaQP,即该CU中第一个含有非零系数的QG所携带的deltaQP。若所有QG 都不含非零系数,则令该CU的deltaQP为0。
QP的计算方法:
Slice 层QP的计算需要用到PPS 中给定的初始 QP(QPpps)以及 Slice层 QP 的偏移值(dQPslice),计算如下:
CU 层 QP的计算需要CU 层的预测 QP(predQP)以及预测误差(deltaQP)。具体来说,亮度分量的QP计算如下:
两个色度分量Cb和Cr的OP分别计算如下:
其中,pps_qp_offset和 slice_qp_offset 分别表示两个色度分量在 PPS 层和Slice 层QP 的偏移值。
相关语法元素:
下面介绍H.265/HEVC中与QP相关的语法元素。
PPS:
- init_qp_minus26:该语法元素给定当前图像中所有 Slice 的初始 QP。
- cu_qp_delta_enabled_flag:该语法元素指定是否允许在CU层调整QP,如果允许则会进一步指定 QG的大小。
- diff_cu_qp_delta_depth:该语法元素给定 QG 的大小。
- pps_cb_qp_offset和pps_cr_qp_offset:这两个语法元素在图像层指定色度分量 QP相对于亮度分量QP的偏移值。
- pps_slice_chroma_qp_offset_present_flag:该语法元素指定是否需要在Slice层进一步给出色度分量QP相对于亮度分量QP的偏移。若该语法元素为真,则会在Slice层给出slice_cb_qp_offset和slice_cr_qp_offset两个语法元素。
Slice 层:
- slice_qp_delta:该语法元素给出了 Slice 层 QP 相对于图像层初始 QP的偏移值。
- slice_cb_qp_offset和 slice_cr_qp_offset:这两个语法元素给出了 Slice层色度分量 QP相对亮度分量QP的偏移值。
CU层:
- cu_qp_delta_abs和cu_qp_delta_sign_flag:这两个语法元素给出了CU层 QP 的预测误差。
5、量化矩阵:
许多以往的图像、视频编码标准都使用了量化矩阵(QuantizationMatrix,QM)技术,如JEG、MPEG1、MPEG-2、MPEG-4、H.264/AVC等,其原理是对不同位置的系数使用不同的量化步长。例如,可以利用人眼对图像视频中的高频细节不敏感的特征,对高频系数使用较大的量化步长,而对低频系数使用较小的量化步长,这样做能够在保证一定压缩率的同时提高图像或视频的主观质量。
H.265/HEVC中的量化矩阵:
H.265/HEVC的变换量化过程如图6.7所示。其中,量化矩阵作用于比例缩放过程,其大小与TU相同,可为4x4、8x8、16x16 和 32x32。在比例缩放过程中,变换后的DCT(或DST)系数将与量化矩阵中对应位置的系数相除,所得的结果作为量化模块的输入。
H.265/HEVC 标准允许使用两种形式的量化矩阵:一种是标准推荐使用的量化矩阵(下文称之为“默认量化矩阵”),另一种是用户自行定义的量化矩阵(下文称之为“自定义量化矩阵”)。对于默认量化矩阵,其矩阵元素值与TU大小、预测方式(帧内、间)都有关系。
H.265/HEVC 标准定义了4x4和8x8 两种大小的默认量化矩阵,并规定16x16、32x32量化矩阵可由8x8量化矩阵通过上采样得到。4x4量化矩阵形式较为简单,其所有元素值都为16;而8x8量化矩阵依据内、帧间不同的预测方式分为如下两种形式。
从两个8x8的默认量化矩阵中可以看出,量化矩阵靠近右下角的元素值较大,说明高频系数会使用较大的量化步长,这样做符合人眼对高频分量不敏感的特性,能够提高编码视频的主观质量。
对于自定义量化矩阵,H.265/HEVC 允许编码器根据不同的应用场合自行决定量化矩阵各元素的值。此时,量化矩阵需要被写入码流传送至解码端。为节省传输比特,H.265/HEVC规定对量化矩阵中的元素使用差分编码。
相关语法元素:
与量化矩阵相关的语法元素在SPS和PPS中都有可能存在,当PPS中存在时,解码器使用PPS中的信息,否则使用SPS中的信息。
- scaling_list_enable_flag:该语法元素表明是否使用量化矩阵。
- sps_scaling_list_data_present_flag:该语法元素指出当前 SPS中是否存在量化矩阵信息。
- pps_scaling_list_data_present_flag:该语法元素指出当前PPS 中是否存在量化矩阵信息。
- scaling_list_pred_mode_flag:该语法元素表明当前量化矩阵的获取方式。若该值为0,表明当前量化矩阵与之前存在的量化矩阵相同,可直接通过预测得到;若该值为1,表明当前量化矩阵中的每个元素都需要重新计算得出。
- scaling_list_pred_matrix_id_delta:当量化矩阵需要通过预测得到时,该语法元素指明所用的预测矩阵。若该值为0,则当前量化矩阵采用H.265/HEVC 指定的默认矩阵。
以下语法元素都针对“自定义量化矩阵”的情形:
- scaling_list_dc_coef_minus8:该语法元素给出自定义量化矩阵中左上角元素(对应于DC系数)的值。
- scaling_list_delta_coef:通过该语法元素可计算出自定义量化矩阵中其余元素的值。量化矩阵中的第一个元素值可由语法元素scaling_list_dc_coef_minus8得到,对于其余元素,只需要传输其与前一个元素值的差异。
参考资料:
《新一代高效视频编码 H.265/HEVC 原理、标准与实现》——万帅 杨付正 编著
相关文章:
音视频之H.265/HEVC量化
H.265/HEVC系列文章: 1、音视频之H.265/HEVC编码框架及编码视频格式 2、音视频之H.265码流分析及解析 3、音视频之H.265/HEVC预测编码 4、音视频之H.265/HEVC变换编码 5、音视频之H.265/HEVC量化 量化 (Quantization) 是指将信号的连续取值(或大量可能的离散取…...
Tomcat:从零理解Java Web应用的“心脏”
目录 一、Tomcat是什么?为什么需要它? 二、Tomcat的核心架构(餐厅运营图) 1. 两大核心组件 2. 请求处理全流程(从点餐到上菜) 三、手把手搭建第一个网站(厨房开张实录) 环境准备…...
第七届能源系统与电气电力国际学术会议(ICESEP 2025)
重要信息 时间:2025年6月20-22日 地点:中国-武汉 官网:www.icesep.net 主题 能源系统 节能技术、能源存储技术、可再生能源、热能与动力工程 、能源工程、可再生能源技术和系统、风力发…...
【基础】Node.js 介绍、安装及npm 和 npx功能了解
前言 后面安装n8n要用到,做一点技术储备。主要是它的两个工具:npm 和 npx。 Node.js介绍 Node.js 是一个免费的、开源的、跨平台的 JavaScript 运行时环境,允许开发人员在浏览器之外编写命令行工具和服务器端脚本,是一个基于 C…...
【硬核干货】SonarQube安全功能
原文链接:【硬核干货】SonarQube安全功能 关于晓数神州 晓数神州坚持以“客户为中心”的宗旨,为客户提供专业的解决方案和技术服务,构建多引擎数字化体系。 核心业务1:聚焦DevOps全栈产品,打造需求管理、项目管理、开…...
微信小程序 tabbar底部导航栏
官方文档:https://developers.weixin.qq.com/miniprogram/dev/reference/configuration/app.html#tabBar 一、常规菜单格式 在app.json 文件中配置,其他关键点详见官方文档,后续更新不规则图标的写法...
如何将极狐GitLab 议题导出为 CSV?
极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 导出议题到 CSV (BASIC ALL) 您可以将问题从极狐GitLab 导出为 CSV 文件,这些文件将作为附件发送到您的默认通知…...
nodejs之Express-介绍、路由
五、Express 1、express 介绍 express 是一个基于 Node.js 平台的极简、灵活的 WEB 应用开发框架,官方网址: https://www.expressjs.com.cn/ 简单来说,express 是一个封装好的工具包,封装了很多功能,便于我们开发 WEB 应用(HTTP 服务) (1)基本使用 第一步:初始化项目并…...
极狐GitLab 如何从 CSV 导入议题?
极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 从 CSV 导入议题 (BASIC ALL) 您可以通过上传包含以下列的 CSV 文件将议题导入项目: 名称是否必需?…...
JW01三合一传感器详解(STM32)
目录 一、介绍 二、传感器原理 1.原理图 2.引脚描述 三、程序设计 main文件 usart3.h文件 usart3.c文件 四、实验效果 五、资料获取 项目分享 一、介绍 JW01三合一检测模块是一种用于检测空气中二氧化碳浓度的传感器模块。它可以广泛应用于室内空气质量检测、智能家…...
23种设计模式-行为型模式之策略模式(Java版本)
Java 策略模式(Strategy Pattern)详解 🧠 什么是策略模式? 策略模式是一种行为型设计模式,它定义了一系列算法,把它们一个个封装起来,并且使它们可以互相替换。策略模式让算法独立于使用它的客…...
ActiveMQ 快速上手:安装配置与基础通信实践(一)
一、引言 在当今分布式系统和微服务架构盛行的时代,消息通信作为实现系统间解耦、异步处理和可靠传输的关键技术,显得尤为重要。ActiveMQ 作为一款广泛应用的开源消息中间件,凭借其对 JMS 规范的全面支持、丰富的特性以及出色的性能…...
究竟什么是自动化测试?
自动化测试是一种软件测试方法,旨在通过使用自动化工具和脚本来执行测试任务,以减少人工操作,提高测试效率和准确性。 以下是对自动化测试的详细介绍: 一、定义与特点 定义:自动化测试是指利用自动化工具和脚本来执…...
【LLM+Code】Github Copilot Agent/VsCode Agent 模式PromptTools详细解读
一、前言 github copilot agent mode现在和vscode是强绑定的关系, 其实是一个东西: https://github.blog/news-insights/product-news/github-copilot-the-agent-awakens/https://code.visualstudio.com/docs/copilot/chat/chat-agent-mode 二、Syste…...
IDEA将本地的JAR文件手动安装到 Maven的本地仓库
例如这是要导入的依赖: mvn install:install-file -DfileD:\aliyun-java-sdk-ding.jar -DgroupIdcom.aliyun -DartifactIdaliyun-java-sdk-ding -Dversion1.0.0 -Dpackagingjar-DfileD:\aliyun-java-sdk-ding.jar 含义:指定要安装到本地 Maven 仓库的 …...
redis集群的三种部署方式
一、主从同步 redis的主从同步工作原理简单概括为: 1、从服务器(Slave Server)向(主服务器,Master)发送sync(同步)命令 2、master启动后台存盘进程,并收集所有修改数据命令 3、master完成存盘后,传送整个数据文件到slave 4、slave接受数据文件,加载到内存中完成首次…...
【GIT】github中的仓库如何删除?
你可以按照以下步骤删除 GitHub 上的仓库(repository): 🚨 注意事项: ❗️删除仓库是不可恢复的操作,所有代码、issue、pull request、release 等内容都会被永久删除。 🧭 删除 GitHub 仓库步骤…...
CIFAR10图像分类学习笔记(三)---数据加载load_cifar10
新创建一个load_cifar10源文件 需要导入的包 import glob from torchvision import transforms from torch.utils.data import DataLoader ,Dataset import os #读取工具 from PIL import Image import numpy as np 01同样定义10个类别的标签名数组 label_name ["airpl…...
基于Matlab的车牌识别系统
1.程序简介 本模型基于MATLAB,通过编程创建GUI界面,基于Matlab的数字图像处理,对静止的车牌图像进行分割并识别,通过编写matlab程序对图像进行灰度处理、二值化、腐蚀膨胀和边缘化处理等,并定位车牌的文字,实现字符的…...
【农气项目】基于适宜度的产量预报
直接上干货(复制到开发工具即可运行的代码) 1. 适宜度模型及作物適宜度计算方法 2. 产量分离 3. 基于适宜度计算产量预报 1. 适宜度模型及作物適宜度计算方法 // 三基点温度配置private final double tempMin;private final double tempOpt;private f…...
C#中实现JSON解析器
JSON(JavaScript Object Notation)即 JavaScript 对象表示法,是一种轻量级的数据交换格式。 起源与发展 JSON 源于 JavaScript 编程语言,是 JavaScript 对象字面量语法的一个子集。但如今它已经独立于 JavaScript,成…...
Android studio进阶开发(四)--okhttp的网络通信的使用
我们之前学过了socket服务器,这次我们继续来学习网络热门编程http/https的使用与交互 1)什么是Http协议? 答:hypertext transfer protocol(超文本传输协议),TCP/IP协议的一个应用层协议&#x…...
untiy 实现点击按钮切换天空盒子
1.新建材质DaySkybox和NightSkybox 设置 Shader 为 Skybox/6 Sided 2.创建ui 切换按钮,编写天空 盒子的脚本 using UnityEngine; using UnityEngine.UI;public class SkyboxSwitcher : MonoBehaviour {public Material daySkybox; // 拖入白天的天空盒材质publi…...
Docker从0-1搭建个人云盘(支持Android iOS PC)
一、Docker位置配置【遇到再大的事,先备份MYSQL数据库,说了多少遍】 ******************************************************************************************************************************************* docker rm -f $(docker ps -a -q…...
Java Agent 注入 WebSocket 篇
Agent 如果要对其进行Agent注入的编写,需要先理解三个名字premain,agentmain,Instrumentation premain方法在 JVM 启动阶段调用,一般维持权限的时候不会使用 agentmain方法在 JVM 运行时调用 常用的 Instrumentation实例为代理…...
Linux:git和gdb/cgdb
一:在XShell上使用git 步骤1:安装git命令行 sudo yum install git 步骤2:注册git账户和仓库,并点击克隆/下载,把HTTPS复制 步骤3: 在显示屏上输入下面命令,然后按提示输入自己的用户名和邮箱…...
深度对比评测:n8n vs Coze(扣子) vs Dify - 自动化工作流工具全解析
引言 在当今数字化转型的浪潮中,自动化工作流工具已成为企业和个人提升效率的关键利器。n8n、Coze(扣子)和Dify作为三款各具特色的自动化工具,在开发者社区和商业用户中都引起了广泛关注。本文将为您带来这三款工具的深度对比评测…...
如何用国产CAD软件皇冠CAD(CrownCAD)三维建模“橡胶座椅”?
皇冠CAD(CrownCAD)以『橡胶座椅』为例讲解“曲面设计、填充曲面、投影曲线、扫描曲面、放样曲面”等三维CAD操作技巧。 在现有模型边线、草图或曲面所定义的边框内填充一曲面。 点击进入填充曲面命令,其界面如下图所示: 各界面参…...
Whisper微调及制作方言数据集
本文不生产技术,只做技术的搬运工!!! 前言 最近在进行whisper微调实验,这个网上有很多成功案例,作者随机找了一个进行了复现,但是由于微调目的是适配本地方言,数据集的采集成为了一…...
实现营销投放全流程自动化 超级汇川推出信息流智能投放产品“AI智投“
随着消费者行为模式的多样化和媒体渠道的日益分散,数字营销行业面临挑战。传统人工数据分析效率低、误差率高,大幅制约广告预算效能。针对上述痛点,近期阿里巴巴旗下超级汇川广告平台推出“AI智投”信息流智能投放产品,基于AI大模…...
shell脚本2
条件测试分类 测试特定的表达式是否成立,当条件成立时,测试语句的返回值为0,否则为其他数值 测试命令格式:[ 条件表达式 ] 文件测试 格式:[ 操作符 文件或目录 ] -d:测试是否为目录(Di…...
2025年3月电子学会青少年机器人技术(五级)等级考试试卷-理论综合
青少年机器人技术等级考试理论综合试卷(五级) 分数:100 题数:30 一、单选题(共20题,共80分) 1. 2025年初,中国科技初创公司深度求索在大模型领域迅速崛起,其开源的大模型成为全球AI领域的焦…...
E3650工具链生态再增强,IAR全面支持芯驰科技新一代旗舰智控MCU
近日,全球嵌入式软件开发解决方案领导者IAR与全场景智能车芯引领者芯驰科技正式宣布,IAR Embedded Workbench for Arm已全面支持芯驰E3650,为这一旗舰智控MCU提供开发和调试一站式服务,进一步丰富芯驰E3系列智控芯片工具链生态&am…...
Linux之安装配置Nginx
Linux系统下安装配置Nginx的详细步骤如下: 一、准备工作 系统环境:确保Linux系统已安装,并且具有网络连接(以便在线安装依赖或下载Nginx)。 安装依赖:Nginx依赖于一些开发库和工具,如gcc、pcr…...
PC接入deepseek
<template> <div class"btn"> <el-button type"primary" plain click"openAIDrawer">AI问答</el-button> </div> <!-- deepSeek --> <el-drawer v-model"deepSeekData.drawerShow" :title&quo…...
Atlas 800I A2 离线部署 DeepSeek-R1-Distill-Llama-70B
一、环境信息 1.1、硬件信息 Atlas 800I A2 1.2、环境信息 注意:这里驱动固件最好用商业版,我这里用的社区版有点小问题 操作系统:openEuler 22.03 LTS NPU驱动:Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64.run NPU固…...
CF每日4题
1500左右的做到还是有点吃力 2093E 1500 二分答案 题意:给定一个长度为 n 的数组,现在要把它切成 k 份,求每一份最小的MEX中的最大值。 就是找最大值,但是这个值是所有段最小的值采用二分答案,二分这个值࿰…...
vue3 实现将html内容导出为图片、pdf和word
话不多说直接开始 本文使用到的开源插件库地址 wang1xiang 1.1 下载依赖 npm install html2canvas jspdf html-docx-js-typescript file-saver --save 2.1 下载工具 npm install html2image-pdf-word --save 3.1 页面使用 <template><div><div click"…...
手机端本地服务与后端微服务的技术差异
以下是手机内部本地服务与后端微服务架构及通信协议的对比分析,结合两者的核心设计差异与技术实现特点展开: 一、架构设计对比 维度手机端本地服务后端微服务核心目标资源效率、离线优先、动态更新高并发处理、分布式事务、服务治理服务拆分粒度按功能…...
音视频之H.265/HEVC环路后处理
H.265/HEVC系列文章: 1、音视频之H.265/HEVC编码框架及编码视频格式 2、音视频之H.265码流分析及解析 3、音视频之H.265/HEVC预测编码 4、音视频之H.265/HEVC变换编码 5、音视频之H.265/HEVC量化 6、音视频之H.265/HEVC环路后处理 类似于以往的视频编码标准,H…...
RSUniVLM论文精读
一些收获: 1. 发现这篇文章的table1中,有CDChat ChangeChat Change-Agent等模型,也许用得上。等会看看有没有源代码。 摘要:RSVLMs在遥感图像理解任务中取得了很大的进展。尽管在多模态推理和多轮对话中表现良好,现有模…...
redis特性及应用场景
文章目录 什么是redis?热库redis作为热库的特性redis适用场景 什么是redis? redis在系统架构中的位置就是冷热分离架构的热数据库位置, redis就是热库, 我们一般说缓存数据库。 其他的像MySQL、SQL Server这种关系数据库、MongoDB…...
Java中正则表达式使用方法
1. 正则表达式概述 正则表达式(Regular Expression,简称 Regex)是一种用于匹配字符串的模式工具。在 Java 中,正则表达式通过 java.util.regex 包实现,主要涉及以下两个类: Pattern:表示一个编…...
CSS基础
1. CSS入门 1.1. CSS是什么 CSS是Cascading Style Sheets的缩写,翻译为层叠样式表。CSS是一种样式表语言,用来描述HTML文档的表现方式,如字体、色彩、背景色等等。我们先从一段简单的CSS代码开始。 代码1 CSS示例 p {color: red; }这段代…...
【Linux系统篇】:什么是信号以及信号是如何产生的---从基础到应用的全面解析
✨感谢您阅读本篇文章,文章内容是个人学习笔记的整理,如果哪里有误的话还请您指正噢✨ ✨ 个人主页:余辉zmh–CSDN博客 ✨ 文章所属专栏:Linux篇–CSDN博客 文章目录 一.信号概念1.生活角度的信号2.技术应用角度的信号3.补充内容前…...
SpringSecurity源码解读AbstractAuthenticationProcessingFilter
一、介绍 AbstractAuthenticationProcessingFilter 是 Spring Security 框架里的一个抽象过滤器,它在处理基于表单的认证等认证流程时起着关键作用。它继承自 GenericFilterBean,并实现了 javax.servlet.Filter 接口。此过滤器的主要功能是拦截客户端发送的认证请求,对请求…...
Python torchvision.transforms 下常用图像处理方法
torchvision.transforms 是 PyTorch 用于处理图像数据的一个模块,提供了丰富的图像变换功能。 1. transforms.Compose 的使用方法 transforms.Compose 用于将多个 transforms 操作组合起来,形成一个变换序列,然后按顺序对图像进行处理。其输…...
Zynq7020 制作boot.bin及烧录到开发板全流程解析
Zynq7020作为Xilinx推出的经典SoC芯片,其PS(Processing System)与PL(Programmable Logic)协同工作的特性使其在嵌入式开发中广泛应用。然而,初次接触Zynq的开发者在制作启动文件boot.bin及烧录时࿰…...
【办公类-89-02】20250424会议记录模版WORD自动添加空格补全下划线
背景需求 4月23日听了一个MJB的征文培训,需要写会议记录 把资料黏贴到模版后,发现每行需要有画满下划线 原来做这套资料,就是手动按空格到一行末,有空格才会出现下划线,也就是要按很多的空格(凑满一行&…...
Python-36:饭馆菜品选择问题
问题描述 小C来到了一家饭馆,这里共有 nn 道菜,第 ii 道菜的价格为 a_i。其中一些菜中含有蘑菇,s_i 代表第 ii 道菜是否含有蘑菇。如果 s_i 1,那么第 ii 道菜含有蘑菇,否则没有。 小C希望点 kk 道菜,且希…...