当前位置: 首页 > news >正文

视频编解码种类/技术/区别/优缺点汇总

视频编解码种类/技术/区别/优缺点汇总

  • 按国家/机构划分的全球主要视频编码标准 (含优缺点)
  • 视频编解码涉及到的主要技术及通俗解释
  • 主流视频编码标准的实现方式

按国家/机构划分的全球主要视频编码标准 (含优缺点)

组织/国家分类标准名称 (常用名/别名)推出年份 (约)主要制定组织/背景优点 (Pros)缺点 (Cons)版税状况
国际合作 (ITU-T & ISO/IEC MPEG)联合或独立制定,全球影响力最大
H.1201984/1988ITU-T开创性工作,奠定基础概念压缩效率极低,图像质量差,基本已被淘汰传统标准 (通常需版税)
H.2611988/1990ITU-T VCEG第一个实用标准,引入核心技术 (宏块, DCT, MC)效率低,仅适用于低分辨率和低码率场景 (如 ISDN)传统标准 (通常需版税)
MPEG-1 Part 21993ISO/IEC MPEG首次实现消费级数字视频 (VCD),简单易实现压缩效率有限,质量不高,主要针对渐进式需版税
H.262 / MPEG-2 Part 21995ITU-T VCEG & ISO/IEC MPEG (联合)极其成功,广泛硬件支持,成熟稳定,良好支持隔行扫描 (广播)压缩效率远低于现代标准,版税要求需版税 (MPEG LA)
H.2631996+ITU-T VCEG针对低码率优化,推动了早期移动视频和视频会议效率和质量不如 H.264,应用场景受限需版税
MPEG-4 Part 2 (Visual)1999ISO/IEC MPEG相比 MPEG-2 效率提升,ASP Profile 流行 (DivX/Xvid 基础)相比 H.264 效率较低,Profile 众多易混淆,需版税需版税
H.264 / MPEG-4 Part 10 AVC2003JVT (ITU-T VCEG & ISO/IEC MPEG)优异的压缩效率与计算复杂度平衡,极广泛的应用和硬件支持,技术成熟,生态完善相比 HEVC/AV1 等效率较低 (尤其高分辨率),需支付版税需版税 (MPEG LA, Access Advance)
H.265 / MPEG-H Part 2 HEVC2013JVET (ITU-T VCEG & ISO/IEC MPEG)相比 H.264 效率显著提升 (~50%),非常适合 4K/8K/HDR 内容版税政策复杂且昂贵 (多个专利池),阻碍广泛采用;计算复杂度显著高于 H.264需版税 (多个版税池, 复杂)
EVC (MPEG-5 Part 1)2020ISO/IEC MPEG提供免版税的基础层选项,主层版税政策可能更清晰性能介于 HEVC/VVC 之间,生态系统非常不成熟,应用前景不明Baseline 免版税, Main 需版税
H.266 / MPEG-I Part 3 VVC2020JVET (ITU-T VCEG & ISO/IEC MPEG)目前标准化中压缩效率最高,功能更全面 (360°, 屏幕内容等)计算复杂度非常高,版税政策尚不明朗 (预计复杂且昂贵),硬件支持和应用刚起步需版税 (政策形成中, 可能复杂)
LCEVC (MPEG-5 Part 2)2021ISO/IEC MPEG可增强现有编解码器性能,降低升级到全新编解码器的复杂度,可能加速高质量视频部署非独立编解码器,增加了系统复杂性,其自身版税和效果依赖于基础层编解码器叠加在基础编解码器上 (有版税)
美国 (主导/开源)以 Google 及 AOMedia 联盟为代表,推动开放/免版税
VP82008On2 Tech / Google (开源)开放,Google 承诺免版税,WebM/WebRTC 集成效率普遍低于 H.264,曾面临专利挑战谷歌承诺免版税 (曾有争议)
VP92013Google (开源)开放,Google 承诺免版税,效率接近 HEVC,广泛部署于 YouTube/Chrome/Android解码复杂度高于 H.264,部分场景效率略逊于 HEVC谷歌承诺免版税
AV1 (AOMedia Video 1)2018Alliance for Open Media (AOMedia)完全免版税 (核心优势),效率优于 HEVC/VP9,获得主要科技公司支持,生态快速发展计算复杂度非常高 (尤其编码),硬件解码支持仍在普及中 (但进展快),编码器成熟度仍在提升免版税 (核心优势)
VC-1 (SMPTE 421M)2006Microsoft / SMPTE曾是蓝光标准之一,性能接近早期 H.264版权需要付费,采用率远低于 H.264,已基本退出主流需版税
中国 (自主标准)AVS 工作组制定,国家推动
AVS (第一代)2006AVS 工作组中国自主知识产权,国内版税政策优惠,性能接近 H.264国际认知度和应用范围有限,生态系统相对较小中国国内政策优惠
AVS+2012AVS 工作组AVS 增强版,提升了性能主要限于中国国内应用中国国内政策优惠
AVS22016AVS 工作组性能对标 HEVC,支持超高清,已被中国 4K 频道采用国际应用和硬件支持有限,生态系统主要在中国中国国内政策优惠
AVS32021/2022AVS 工作组性能对标 VVC/AV1,面向 8K+ 和未来应用仍处于早期推广阶段,国际影响力和生态系统待建中国国内政策优惠
其他组织特定机构或基金会
Theora2004Xiph.Org Foundation (基于 VP3)开源,免版税压缩效率较低,远不如 H.264 及之后标准,应用范围小免版税
Dirac / VC-2 (SMPTE 2042-1)2008BBC (英国) / SMPTE开源,免版税,采用不同技术路线 (小波变换)应用非常小众,主要限于 BBC 内部和特定专业领域免版税

视频编解码涉及到的主要技术及通俗解释

我们来用通俗易懂的方式详细解释一下视频编码中的这四大核心技术:预测、变换、量化和熵编码。

想象一下,你要把一部电影通过网络传给朋友,但文件太大了,传起来又慢又费流量。视频编码就像是给这部电影进行一次超级打包压缩,目标是让文件变得尽可能小,同时保证朋友收到后解开(解码)看到的画面质量尽可能好。这四大技术就是这个打包压缩过程中的关键步骤。

这些技术的核心在于它们都遵循相似的混合编码框架 (Hybrid Coding Framework),主要包括:预测 (Prediction)、变换 (Transform)、量化 (Quantization) 和熵编码 (Entropy Coding)。标准的演进主要体现在对这几个模块进行不断优化和引入更复杂的工具,以提高压缩效率。


1. 预测 (Prediction) - 减少“重复”信息

  • 核心思想: 视频画面中有很多内容是重复或者相似的。比如,相邻的两帧画面(时间上重复),或者同一帧画面内相邻的区域(空间上重复)。预测技术就是利用这种重复性,不去传输完整的信息,而是传输“变化”或“差异”的部分。
  • 怎么做?
    • 帧间预测 (Inter Prediction): 这是最主要的预测方式。想象一下电影里一个人物走路的场景,从第 1 秒到第 2 秒,大部分背景可能没变,人物也只是位置移动了一点。
      • 工作原理: 编码器会参考已经编码好的前一帧(或者后面的帧,甚至前后多帧),在参考帧里找到和当前要编码的图像块最相似的一个块。
      • 输出: 它不会传输当前块的所有像素信息,而是告诉解码器:“你去参考第 X 帧的 Y 位置,把那个块‘搬’过来,稍微调整一下(比如移动几个像素),这就是对当前块的预测了。” 这个“搬运指令”就是运动矢量 (Motion Vector),它记录了从参考块到当前块的位置差异(方向和距离)。
      • 效果: 对于运动不大的区域,预测块和实际块会非常像,它们之间的**差值(预测残差)**就会很小,甚至很多地方是零。需要传输的数据就从“整个图像块”变成了“一个运动矢量 + 很小的差值数据”,大大减少了数据量。
    • 帧内预测 (Intra Prediction): 这个主要用在没有合适参考帧(比如视频第一帧,或者场景切换后的第一帧)或者帧间预测效果不好的时候。它利用的是同一帧画面内部像素的相关性。
      • 工作原理: 编码器看当前要编码的块左边和上边(这些是已经编码好的邻居)的像素值,根据这些邻居像素来“猜测”当前块应该是什么样子。比如,如果左边的像素是一条横线延伸过来,它可能就预测当前块也是这条横线的一部分。有很多种预测模式(比如水平、垂直、对角线、平均值等),编码器会选一种预测效果最好的。
      • 输出: 同样,只传输“用哪种模式预测”的信息,以及预测块和实际块之间的差值(预测残差)
      • 效果: 对于纹理简单或者有明显方向性的区域,预测效果好,差值小,也能节省数据。
  • 通俗比喻:
    • 帧间预测就像玩“找不同”游戏,你不需要重新画两幅几乎一样的画,只需要圈出不同的地方就行了。运动矢量就是告诉你“不同之处”在哪里。
    • 帧内预测就像是你画画时,画到一个地方,会参考旁边已经画好的颜色和线条来继续画,而不是凭空想象。
  • 目标: 通过各种预测,得到一个“预测图像块”。原始图像块减去这个预测块,就得到了预测残差 (Residual)。这个残差通常包含了图像的细节和预测不准的部分,它的数据量比原始图像块小得多,能量也更分散。

2. 变换 (Transform) - 集中“能量”,方便处理

  • 核心思想: 预测残差虽然数据量少了,但还是像素值的形式,直接压缩效率不高。变换的作用是把这些残差数据从“空间域”(一个个像素点)变到“频域”(描述图像变化的快慢)。这样做的好处是能把残差中大部分的“能量”或者说信息集中到少数几个数值上。
  • 怎么做?
    • 工作原理: 最常用的变换是离散余弦变换 (DCT - Discrete Cosine Transform) 或其变种。你可以把它想象成一个数学魔术,它能把一个图像块(比如 8x8 的残差块)分解成一组“频率成分”。
      • 低频成分: 代表图像中平缓变化的部分(比如大面积的颜色)。这些成分通常包含了残差块的主要能量。变换后,它们对应的值会比较大。
      • 高频成分: 代表图像中剧烈变化的部分(比如边缘、细节、噪声)。这些成分通常能量较小。变换后,它们对应的值会比较小,很多甚至接近零。
    • 输出: 变换后得到的是一组变换系数 (Transform Coefficients),不再是像素值了。这个系数矩阵左上角的值(DC 系数)代表了整个块的平均能量或亮度,越往右下角的值代表的频率越高,数值通常越小。
  • 通俗比喻:
    • 就像声音可以用均衡器分解成低音、中音、高音一样。变换就是把图像残差也分解成“粗糙”部分(低频)和“细节”部分(高频)。通常,“粗糙”部分包含了大部分信息,“细节”部分信息量相对少。
    • 也像把一堆杂乱的沙子(残差像素)过筛子,筛出不同粗细的颗粒(频率成分)。大部分重量可能集中在少数几种粗颗粒上。
  • 目标: 能量集中。把原来分散在很多像素上的信息,集中到少数几个低频系数上。这样,接下来的量化步骤就可以“大刀阔斧”地处理那些不那么重要的高频系数了。

3. 量化 (Quantization) - “有损”压缩,丢弃不重要信息

  • 核心思想: 这是视频编码中主要造成信息损失 (Lossy) 的一步,也是实现高压缩率的关键。它的目标是进一步减少数据量,方法是降低变换系数的精度,把那些人眼不太敏感的信息(通常是高频细节)丢弃掉。
  • 怎么做?
    • 工作原理: 对每个变换系数,都用一个叫做量化步长 (Quantization Step Size) 的值去除它,然后取整(比如四舍五入)。
      • 量化步长: 这个值的大小可以控制压缩程度和质量。步长越大,除完再取整后,原来的系数变化就越大,丢失的信息越多,压缩率越高,但图像质量越差。步长越小,精度保留得越多,压缩率越低,图像质量越好。
      • 关键效果: 很多本来数值就小的系数(尤其是高频系数),经过除法和取整后,会直接变成 0!数值大的系数,其精度也会降低。
    • 输出: 得到一堆量化后的变换系数 (Quantized Coefficients)。这个矩阵里会有大量的零,非零的系数也都是整数,并且数值范围变小了。
  • 通俗比喻:
    • 就像用一把不太精确的尺子量身高。本来是 175.3 厘米,用厘米尺量就是 175 厘米;如果用分米尺量,可能就记作 1.8 米(假设四舍五入到分米)。精度降低了,但记录用的数字变少了。量化步长就是尺子的刻度大小。
    • 也像把一幅色彩丰富的画,减少使用的颜色种类。比如把相近的几种蓝色都统一成一种蓝色。细节丢失了,但描述这幅画需要的信息变少了。
  • 目标: 大幅减少需要编码的数据量,特别是通过产生大量的零系数。这是以牺牲部分图像细节和精度为代价的。质量和码率的平衡主要就是通过调整量化步长来实现的。

4. 熵编码 (Entropy Coding) - “无损”压缩,高效打包

  • 核心思想: 经过量化后,我们得到了一堆包含很多零的、数值范围较小的整数系数,还有之前预测产生的运动矢量、预测模式等信息。熵编码的任务是利用这些数据的统计特性,用尽可能少的比特数把它们无损地表示出来,打包成最终的比特流。
  • 怎么做?
    • 工作原理: 基于信息论的原理,给出现频率高的符号(比如量化系数中的 0,或者最常见的运动矢量差值)分配短的二进制码字,给出现频率低的符号分配长的码字。
    • 常用技术:
      • 行程编码 (Run-Length Encoding, RLE): 对连续出现的相同符号(尤其是 0)进行压缩。比如 0, 0, 0, 0, 0 可以表示成 (5, 0),意思是“5 个 0”。
      • 变长编码 (Variable-Length Coding, VLC): 如 Huffman 编码或 H.264 中的 CAVLC。为每个可能出现的符号(或符号组合)预先分配一个不等长的二进制码,常用符号码短,罕见符号码长。
      • 算术编码 (Arithmetic Coding): 如 H.264/H.265/H.266 中的 CABAC,或 AV1 中的编码方式。它把整个要编码的数据序列映射到 0 到 1 之间的一个小数区间,区间越小,表示这个序列需要的比特数越多。它通常比 VLC 效率更高,尤其是在处理概率分布不均匀或者符号之间有关联(上下文相关)的情况时。它会根据前面编码的符号来动态调整当前符号的概率预测,进一步提高压缩效率。
    • 输出: 最终的、压缩后的二进制比特流 (Bitstream)。这个比特流就可以通过网络传输或者存储了。
  • 通俗比喻:
    • 就像发电报用的摩尔斯电码,最常用的字母 E 只有一个点 .,而不太常用的字母 Q 是 --.-
    • 也像我们写文章时用“等”字代替列举很多类似的东西,或者用缩写代替长词一样。
  • 目标: 在不丢失任何信息的前提下(解码器可以完全恢复出量化后的系数、运动矢量等信息),用最紧凑的方式表示这些数据,完成压缩的最后一步。

总结一下流程:

  1. 预测: 猜图像块长什么样(利用时间和空间冗余),得到预测块。
  2. 计算残差: 原始块 - 预测块 = 预测残差 (差异)。
  3. 变换: 把残差从像素域转到频域,集中能量。
  4. 量化: 降低系数精度,丢弃不重要信息,产生大量零 (有损)。
  5. 熵编码: 高效地表示量化后的系数和预测信息,打包成最终比特流 (无损)。

解码过程就是这个流程的逆向操作:熵解码 -> 反量化 -> 反变换 -> 加上预测块 = 重建图像。

这四大技术协同工作,共同实现了视频数据的高效压缩。标准的不断发展,就是在这四个核心环节上引入更复杂、更精妙的算法,以在相同的码率下获得更好的图像质量,或者在相同的图像质量下使用更低的码率。

主流视频编码标准的实现方式

我们来详细解析 H.264, H.265, H.266, VP8, VP9, AV1, AVS, AVS+, AVS2, AVS3 这些视频编码标准背后的关键实现技术。


1. H.264 / AVC (Advanced Video Coding)

  • 目标: 相比 MPEG-2 提高约 50% 的压缩效率。
  • 关键技术:
    • 块划分 (Partitioning):
      • 宏块 (Macroblock): 基本处理单元为 16x16 像素。
      • 灵活的块大小: 宏块可进一步划分为 16x8, 8x16, 8x8 的子块进行帧间预测。8x8 子块还可再划分为 8x4, 4x8, 4x4,最小到 4x4 像素块进行运动补偿。这种灵活性更好地适应了不同区域的运动复杂度。
    • 预测 (Prediction):
      • 帧内预测 (Intra Prediction): 利用当前帧内已编码的相邻像素来预测当前块。提供多种预测模式(4x4 块有 9 种模式,16x16 块有 4 种模式),编码器选择最佳模式。
      • 帧间预测 (Inter Prediction / Motion Compensation):
        • 多参考帧 (Multiple Reference Frames): 预测当前块时,可从过去或未来的多帧(最多 16 帧)中选择参考块,提高了找到相似块的可能性。
        • 1/4 像素精度运动矢量 (Quarter-Pixel Motion Vectors): 通过对参考帧进行插值,实现更精细的运动补偿,减少预测残差。
        • B 帧 (Bi-predictive frames): 可以同时从过去和未来的帧进行预测,进一步提高效率。
    • 变换 (Transform):
      • 整数变换 (Integer Transform): 主要使用 4x4 整数离散余弦变换 (Integer DCT)。避免了浮点运算的精度问题,易于硬件实现。High Profile 中引入了 8x8 整数 DCT。还使用 4x4 哈达玛变换处理 16x16 宏块的 DC 系数。
    • 量化 (Quantization):
      • 标量量化 (Scalar Quantization): 对变换后的系数进行量化,去除不重要的信息。使用量化参数 (QP) 控制量化程度。
    • 环路滤波 (In-Loop Filtering):
      • 去块效应滤波器 (Deblocking Filter): 在编码环路内部(解码器端也会执行)对块边界进行平滑处理。这不仅改善了主观视觉质量,更重要的是提高了后续帧的预测精度。这是 H.264 的一个关键创新。
    • 熵编码 (Entropy Coding):
      • CAVLC (Context-Adaptive Variable-Length Coding): 复杂度较低,适用于基准配置。
      • CABAC (Context-Adaptive Binary Arithmetic Coding): 复杂度较高,但压缩效率比 CAVLC 提升约 10-15%。它根据已编码的语法元素的上下文来动态调整概率模型,进行算术编码。

2. H.265 / HEVC (High Efficiency Video Coding)

  • 目标: 相比 H.264 提高约 50% 的压缩效率,支持更高分辨率 (4K/8K) 和 HDR。
  • 关键技术 (在 H.264 基础上增强):
    • 块划分 (Partitioning):
      • 编码树单元 (Coding Tree Unit, CTU): 取代宏块,大小可配置 (如 64x64, 32x32, 16x16),通常比宏块大。
      • 递归四叉树结构 (Quadtree Structure): CTU 可以递归地划分为更小的编码单元 (Coding Units, CU)。CU 是进行预测和变换决策的基本单元。这种结构能更好地适应图像内容,大 CU 用于平坦区域,小 CU 用于细节区域。
      • 预测单元 (Prediction Unit, PU) 和变换单元 (Transform Unit, TU): CU 内部可以进一步划分为一个或多个 PU(进行预测)和 TU(进行变换)。PU 可以是方形或矩形 (包括非对称划分 AMP),TU 也是四叉树结构,大小可以独立于 PU。
    • 预测 (Prediction):
      • 帧内预测 (Intra Prediction): 模式增加到 35 种 (33 种角度模式 + DC + Planar),提供更精细的方向预测。
      • 帧间预测 (Inter Prediction):
        • 高级运动矢量预测 (Advanced Motion Vector Prediction, AMVP): 根据空域或时域相邻块的运动矢量生成候选列表,编码器只需传输索引和差值,减少 MV 比特。
        • 合并模式 (Merge Mode): 直接继承邻近块(空域或时域)的完整运动信息(包括参考帧索引和运动矢量),比特开销极低。
    • 变换 (Transform):
      • 多尺寸变换: TU 大小可变 (从 4x4 到 32x32),根据 TU 尺寸选择相应的整数 DCT/DST (离散正弦变换,用于某些帧内模式)。
    • 环路滤波 (In-Loop Filtering):
      • 去块效应滤波器 (Deblocking Filter): 类似 H.264,但适应 CTU 结构。
      • 样点自适应偏移 (Sample Adaptive Offset, SAO): 在去块效应滤波之后,对样点值进行分类,并应用偏移量来补偿原始信号与重建信号之间的均值偏差,进一步减少失真,特别是振铃等伪影。
    • 熵编码 (Entropy Coding):
      • CABAC: 仅使用 CABAC,并对其进行了优化。
    • 并行处理:
      • Tiles 和 WPP (Wavefront Parallel Processing): 将图像划分为矩形区域 (Tiles) 或行 (Slices),并设计了 WPP 机制,使得不同区域可以并行解码,适应多核处理器。

3. H.266 / VVC (Versatile Video Coding)

  • 目标: 相比 HEVC 再提高约 40-50% 的压缩效率,支持更广泛应用 (360°视频, 屏幕内容, HDR/WCG)。
  • 关键技术 (在 HEVC 基础上进一步增强):
    • 块划分 (Partitioning):
      • 四叉树加多类型树 (Quad-tree plus Multi-Type Tree, QT+MTT): 在 HEVC 的四叉树基础上,引入了更灵活的二叉树 (Binary Tree, BT) 和三叉树 (Ternary Tree, TT) 划分,允许水平或垂直方向的划分。最大 CTU 尺寸可达 128x128。极大增强了对各种纹理和边缘的适应性。
    • 预测 (Prediction):
      • 帧内预测 (Intra Prediction): 模式增加到 67 种 (65 种角度 + DC + Planar),引入宽角度帧内预测 (WAIP)、跨分量线性模型 (CCLM) 预测色度、基于矩阵的帧内预测 (MIP)。
      • 帧间预测 (Inter Prediction):
        • 仿射运动补偿 (Affine Motion Compensation): 使用仿射模型(4 或 6 参数)来描述更复杂的运动,如缩放和旋转。
        • 自适应运动矢量精度 (Adaptive Motion Vector Resolution, AMVR): 允许运动矢量精度在 1/4 像素和整数像素之间切换。
        • 合并模式增强 (Merge with Motion Vector Difference, MMVD): 在 Merge 模式基础上增加小的运动矢量差值。
        • 几何划分模式 (Geometric Partitioning Mode, GPM): 将块划分为两个区域,分别进行运动补偿。
        • 组合帧间帧内预测 (Combined Inter-Intra Prediction, CIIP): 结合帧间预测和帧内预测的结果。
        • 解码器端运动矢量优化 (Decoder-side Motion Vector Refinement, DMVR): 解码器根据双向预测的匹配程度微调运动矢量。
        • 双向光流法 (Bi-directional Optical Flow, BDOF): 基于光流模型修正预测信号。
    • 变换 (Transform):
      • 多变换核选择 (Multiple Transform Selection, MTS): 根据预测模式和块特性选择不同的变换核 (DCT-II, DST-VII, DCT-VIII, DST-I)。
      • 子块变换 (Sub-block Transform, SBT): 对大的预测残差块应用更小的变换。
      • 低频不可分变换 (Low Frequency Non-Separable Transform, LFNST): 对低频系数应用更小的非分离变换。
    • 环路滤波 (In-Loop Filtering):
      • 自适应环路滤波 (Adaptive Loop Filter, ALF): 在 Deblocking 和 SAO 之后,使用自适应的维纳滤波器或高斯滤波器进一步减少失真。
    • 其他:
      • 亮度映射与色度缩放 (Luma Mapping with Chroma Scaling, LMCS): 改善 HDR 内容的编码。
      • 屏幕内容编码 (Screen Content Coding, SCC) 工具: 如帧内块拷贝 (Intra Block Copy)、调色板模式 (Palette Mode) 等,高效编码计算机生成的内容。

4. VP8

  • 目标: 开源、免版税,作为 WebM 项目的一部分,与 H.264 基准配置竞争。
  • 关键技术:
    • 块划分: 16x16 宏块,可划分为 4x4 子块进行运动补偿。
    • 预测:
      • 帧内预测: 相对简单,4x4 块有 4 种模式,16x16 块有 1 种 (TM_PRED),色度有 4 种。
      • 帧间预测: 支持 P 帧,使用三个参考帧缓冲区 (Last, Golden, AltRef),1/4 像素精度运动补偿 (使用 6 抽头滤波器)。
    • 变换: 4x4 类 DCT 整数变换 (基于哈达玛变换),对 16x16 块的 DC 系数进行额外的 4x4 WHT 变换。
    • 量化: 标量量化。
    • 环路滤波: 包含一个比 H.264 简单的去块效应滤波器。
    • 熵编码: 基于布尔算术编码,具有上下文自适应性。

5. VP9

  • 目标: 开源、免版税,相比 VP8 提高约 50% 效率,与 H.265/HEVC 竞争。
  • 关键技术 (在 VP8 基础上增强):
    • 块划分:
      • 超块 (Superblock): 类似 HEVC 的 CTU,大小为 64x64,可递归四叉树划分为 4x4。
    • 预测:
      • 帧内预测: 10 种模式 (8 种方向 + DC + TM)。
      • 帧间预测:
        • 复合预测 (Compound Prediction): 可从两个参考帧进行平均预测。
        • 1/8 像素精度运动补偿。
        • 参考帧增强: 更多参考帧槽位 (8 个),每个块可引用 3 个参考帧。
    • 变换: 多尺寸变换: 支持 4x4, 8x8, 16x16, 32x32 的 DCT 和非对称 DST (ADST)。
    • 环路滤波: 去块效应滤波器,适应超块结构。
    • 熵编码: 优化的算术编码器,改进的上下文模型。
    • 并行处理: Tiles: 支持将图像划分为可独立解码的 Tile。

6. AV1 (AOMedia Video 1)

  • 目标: 开源、完全免版税,效率优于 VP9 和 HEVC (目标 ~30%+ 提升)。
  • 关键技术 (集成了 Google VPx, Mozilla Daala, Cisco Thor 的技术):
    • 块划分:
      • 超块 (Superblock): 支持 64x64 和 128x128,极其灵活的划分方式,包括递归四叉树、二叉树、三叉树以及 T 形划分等。
    • 预测:
      • 帧内预测: 极其丰富,包括 56 种方向模式、DC、Smooth、Paeth (预测器选择)、调色板模式 (Palette)、基于亮度的色度预测 (Chroma from Luma, CfL)。引入递归帧内预测。
      • 帧间预测:
        • 高级复合预测: 包括加权平均、掩码预测 (Wedge, Difference-based) 等。
        • 扭曲运动/仿射运动 (Warped Motion / Affine): 更好地处理缩放、旋转等复杂运动。
        • 重叠块运动补偿 (Overlapped Block Motion Compensation, OBMC): 平滑块边界,减少预测残差。
        • 全局运动模型 (Global Motion): 对摄像机运动进行建模。
        • 丰富的参考帧机制: 多达 7 个参考帧可用。
    • 变换:
      • 多尺寸 (最大 64x64)、多形状 (方形、矩形)、多类型 (DCT, ADST, Identity, WHT)。 支持递归变换。
    • 环路滤波:
      • 去块效应滤波器 (Deblocking Filter)。
      • 约束方向增强滤波器 (Constrained Directional Enhancement Filter, CDEF): 针对振铃等方向性伪影进行滤波。
      • 环路恢复滤波器 (Loop Restoration Filter): 使用自导向滤波器 (Self-Guided) 或维纳滤波器 (Wiener) 进一步恢复图像质量。
    • 熵编码: 高效的非二元算术编码 (ANS 变种),非常复杂的上下文模型。
    • 其他: 电影颗粒合成 (Film Grain Synthesis): 在解码端合成颗粒,以低码率还原电影质感。 Tiles 和 Frame Parallel 等并行处理机制。

7. AVS, AVS+, AVS2, AVS3 (中国标准)

这是一个系列标准,技术上通常对标同期的 H.26x 系列,但在具体实现和专利归属上有所不同。

  • AVS (第一代):
    • 目标: 对标 H.264/AVC。
    • 技术特点: 采用 16x16 宏块,但主要使用 8x8 整数 DCT 变换 (这是与 H.264 主配置的一个显著区别)。支持帧内预测 (模式数类似 H.264)、帧间预测 (1/4 像素精度,多参考帧,B 帧)、环路去块滤波。提供“基准档次”(Jizhun Profile),简化了部分功能 (如无 B 帧) 以降低复杂度。
  • AVS+:
    • 目标: AVS 的增强版,提升效率,主要用于广播。
    • 技术特点: 在 AVS 基础上进行优化,可能引入了 H.264 更高 Profile 中的一些技术,提升了压缩性能。具体技术细节公开信息相对较少。
  • AVS2:
    • 目标: 对标 H.265/HEVC,面向超高清 (4K) 应用。
    • 技术特点: 采用了类似 HEVC 的技术框架:
      • 更大的编码单元: 类似 HEVC 的 CU (如 64x64),支持四叉树划分。
      • 更多的帧内预测模式。
      • 高级运动矢量预测技术: 类似 AMVP 和 Merge 模式。
      • 环路滤波: 可能包含去块滤波和类似 SAO 的滤波机制。
    • 关键在于使用这些技术的同时,形成具有中国自主知识产权的专利组合。
  • AVS3:
    • 目标: 对标 H.266/VVC 和 AV1,面向 8K 及未来应用。
    • 技术特点: 采用了当前最先进的编码技术理念:
      • 更灵活的块划分: 很可能采用了类似 VVC 的 QT+MTT (四叉树+多类型树) 结构。
      • 更多的帧内和帧间预测工具: 可能包括仿射运动补偿、更复杂的帧内模式等。
      • 先进的环路滤波: 可能引入了类似 ALF 的滤波技术。
      • 针对特定内容的优化: 可能包含针对屏幕内容、监控视频等的工具。
    • 同样,目标是在技术性能上达到国际先进水平,并构建自主可控的专利体系。

总结:

视频编码标准的演进体现了在混合编码框架内不断追求极致压缩效率的过程。主要的手段包括:

  1. 更灵活、更精细的块划分: 从固定宏块到 CTU/Superblock,再到 QT+MTT 等复杂结构,更好地适应图像内容。
  2. 更精准、更多样的预测: 帧内预测模式越来越多,帧间预测引入更复杂的运动模型 (仿射、光流) 和更智能的运动矢量编码 (Merge, AMVP 等)。
  3. 更有效的变换: 从固定 4x4/8x8 DCT 到多尺寸、多类型变换核。
  4. 更强大的环路滤波: 从简单的去块滤波到 SAO、ALF、CDEF 等多级滤波,最大限度减少编码失真。
  5. 更高效的熵编码: 从 VCL 到 CABAC 再到非二元算术编码,不断逼近信息熵极限。
  6. 并行处理设计: 适应多核处理器,提高编解码速度。

这种演进也带来了计算复杂度的急剧增加,对硬件处理能力提出了更高的要求。同时,版税政策也成为影响标准采纳的重要因素,催生了像 AV1 这样的免版税标准。

相关文章:

视频编解码种类/技术/区别/优缺点汇总

视频编解码种类/技术/区别/优缺点汇总 按国家/机构划分的全球主要视频编码标准 (含优缺点)视频编解码涉及到的主要技术及通俗解释主流视频编码标准的实现方式 按国家/机构划分的全球主要视频编码标准 (含优缺点) 组织/国家分类标准名称 (常用名/别名)推出年份 (约)主要制定组织…...

【专题刷题】双指针(四):最接近的三数之和,接雨水

📝前言说明: 本专栏主要记录本人的基础算法学习以及LeetCode刷题记录,按专题划分每题主要记录:(1)本人解法 本人屎山代码;(2)优质解法 优质代码;&#xff…...

星露谷物语 7000+ 大型MOD整合包

衣服美化、家具美化、地图美化、人物肖像美化 全地图装修存档、人物美化、扩展包、环境美化、家具、动植物、通用前置包、新增NPC、功能、服装发饰妆 帽子发型农场小镇美化大型玩法拓展实用功能mod 动漫人物形象MOD 地点/动物/地图/功能/机械/家具/建筑/界面美化/扩展/农场/食谱…...

Vue自定义指令-防抖节流

Vue2版本 // 防抖 // <el-button v-debounce"[reset,click,300]" ></el-button> // <el-button v-debounce"[reset]" ></el-button> Vue.directive(debounce, { inserted: function (el, binding) { let [fn, event "cl…...

几款开源C#插件框架

有几个优秀的开源C#插件框架可供选择,它们提供了更完善的功能和更好的扩展性。以下是几个主流的开源C#插件框架: 1. MEF (Managed Extensibility Framework) 官方库:System.ComponentModel.Composition 特点: .NET官方提供的插件系统 基于特性(Attribute)的声明式组件注册…...

PHP使用pandoc把markdown文件转为word

文章目录 首先安装pandocPHP处理 服务器操作系统是Linux&#xff0c;centos 首先安装pandoc yum install -y pandoc安装完成后输入如下代码&#xff0c;检查安装是否成功 pandoc --versionPHP处理 我把markdown内容存到了数据库里&#xff0c;所以要从数据库读取内容。对内容…...

Vmware esxi 查看硬盘健康状况

起因 硬盘掉盘 - - 使用自带的命令esxcli 列出所有硬盘 esxcli storage core device list[rootlocalhost:~] esxcli storage core device list t10.NVMe____INTEL_MEMPEK1W016GAL____________________PHBT83660BYP016D____00000001Display Name: Local NVMe Disk (t10.NVMe…...

vue3中ref创建的变量使用`.value`(可以使用volar插件自动添加`.value)

1.安装volar插件 2.打开>设置 >扩展...

Docker中镜像、容器、仓库三者之间的关系

镜像: 定义&#xff1a; 镜像只是一个静态的、只读的模板&#xff0c;包括了创建容器所需的文件系统、依赖库、和配置。类似于操作系统之中的安装光盘或虚拟机的磁盘镜像。 特点和作用 特点: 分层存储&#xff1a;镜像由多个只读层(Layer)叠加而成&#xff0c;每一层代表一…...

【刷题Day19】HTTP的各个版本(浅)

HTTP 1.0 和 2.0 有什么区别&#xff1f; HTTP/1.0 版本主要增加以下几点&#xff1a; 增加了HEAD、POST等新方法。增加了响应状态码。引入了头部&#xff0c;即请求头和响应头在请求中加入了HTTP版本号引入了Content-Type&#xff0c;使得传输的数据不再限于文本。 HTTP/1.…...

浅析StringBuilder和StringBuffer的区别和联系?

区别 1. 线程安全性 StringBuilder&#xff1a;是非线程安全的。这意味着在多线程环境下&#xff0c;如果多个线程同时访问并修改同一个 StringBuilder 对象&#xff0c;可能会导致数据不一致或其他并发问题。不过&#xff0c;由于不需要考虑线程安全的额外开销&#xff0c;它…...

【数据融合实战手册·实战篇】二维赋能三维的5种高阶玩法:手把手教你用Mapmost打造智慧城市标杆案例

在当今数字化时代&#xff0c;二三维数据融合技术的重要性不言而喻。二三维数据融合通过整合二维数据的结构化优势与三维数据的直观性&#xff0c;打破了传统数据在表达和分析上的局限&#xff0c;为各行业提供了更全面、精准的数据分析手段。从智慧城市建设到工业智能制造&…...

Linux 系统编程 day5 进程管道

进程间通信&#xff08;IPC&#xff09; Linux环境下&#xff0c;进程地址空间相互独立&#xff0c;任何一个进程的全局变量在另一个进程中都看不到&#xff0c;所以进程和进程之间不能互相访问&#xff0c;要交换数据必须通过内核&#xff0c;在内核中开辟一块缓冲区&#xf…...

【项目管理】第19章 配置与变更管理-- 知识点整理

项目管理-相关文档,希望互相学习,共同进步 风123456789~-CSDN博客 (一)知识总览 项目管理知识域 知识点: (项目管理概论、立项管理、十大知识域、配置与变更管理、绩效域) 对应:第6章-第19章 第6章 项目管理概论 4分第13章 项目资源管理 3-4分第7章 项目…...

C语言---FILE结构体

一、FILE 结构体的本质与定义 基本概念 FILE 是 C 语言标准库中用于封装文件操作的结构体类型&#xff0c;定义于 <stdio.h> 中。它代表一个“文件流”&#xff0c;可以是磁盘文件、标准输入输出&#xff08;stdin/stdout/stderr&#xff09;或其他输入输出设备。 实现特…...

C# 高级编程:Lambda 表达式

在 C# 的高级编程中,Lambda 表达式是一个强大而灵活的工具,广泛应用于 LINQ 查询、委托、事件处理以及函数式编程等多个领域。它不仅使代码更简洁、表达更直接,而且在某些场景中能极大提高代码的可读性与可维护性。本文将从 Lambda 表达式的基本语法入手,深入探讨其原理、常…...

【Python语言基础】22、异常处理

文章目录 1. 异常1.1 简介1.2 为什么需要异常处理 2. 基本语法2.1 各部分详解 3. 异常处理流程3.1 执行try代码块3.2 异常发生检查3.3 异常捕获与匹配3.4 执行匹配的 except 代码块3.5 执行 else 代码块&#xff08;可选&#xff09;3.6 执行 finally 代码块&#xff08;可选&a…...

7、生命周期:魔法的呼吸节奏——React 19 新版钩子

一、魔法呼吸的本质 "每个组件都是活体魔法生物&#xff0c;呼吸节奏贯穿其生命始终&#xff0c;"邓布利多的冥想盆中浮现三维相位图&#xff0c;"React 19的呼吸式钩子&#xff0c;让组件能量流转如尼可勒梅的炼金术&#xff01;" ——以霍格沃茨魔法生理…...

Echart 地图放大缩小

在 ECharts 中&#xff0c;可以通过设置地图的 roam 属性以及相关事件监听来实现地图的放大、缩小功能。以下是实现地图放大缩小的常用方法&#xff1a; 1. 开启 roam 属性 roam 是 ECharts 地图组件中的一个重要属性&#xff0c;用于控制地图是否支持平移和缩放操作。 roam:…...

Django ORM 定义模型

提示&#xff1a;定义模型字段的类型 文章目录 一、字段类型二、字段属性三、元信息 一、字段类型 常用字段 字段名描述备注AutoFieldint 自增必填参数 primary_keyTrue&#xff0c;无该字段时&#xff0c;django自动创建一个 BigAutoField&#xff0c;一个model不能有两个Au…...

Linux和Ubuntu的驱动适配情况

旧 一、Linux Yocto3.0 二、Ubuntu 1.驱动 1.rtc正常 2.led正常 3.加密芯片正常 4.硬件看门狗不行&#xff0c;驱动已经适配好&#xff0c;等硬件修复后&#xff0c;直接使用脚本就可以 5.千兆网口可以&#xff0c;两个百兆网口不行 6.USB上面和下面都可以&#xff08;插u盘…...

JavaScript 性能优化实战

一、代码执行效率优化 1. 减少全局变量的使用 全局变量在 JavaScript 中会挂载在全局对象(浏览器环境下是window,Node.js 环境下是global)上,频繁访问全局变量会增加作用域链的查找时间。 // 反例:使用全局变量 var globalVar = example; function someFunction() {con…...

b站PC网页版视频播放页油猴小插件制作

文章目录 前言需求分析实施观察页面起始渲染编码效果展示 总结 前言 新手上路,欢迎指导 需求分析 想要一个简约干净的界面,需要去除推荐栏和广告部分. 想要自由调节视频播放速率,需要在视频控制栏加一个输入框控制视频倍速 实施 观察页面起始渲染 因为要使用MutationObse…...

C#获取当前方法的命名空间、类名称、方法名称以及方法的参数信息

C#获取当前方法的命名空间、类名称、方法名称以及方法的参数信息 输出示例模块示例 输出示例 获取信息&#xff1a;WindowsFormsApp1.Form1.button1_Click(System.Object sender,System.EventArgs e) 引发的异常:“System.IndexOutOfRangeException”(位于 WindowsFormsApp1.ex…...

git常用的命令

最近使用git进行团队开发遇到的一些分支的问题需要使用各种命令&#xff0c;整理一下方便日后使用 1.常用的Git命令 1.初始化仓库 git init //创建一个新的Git仓库2. 克隆仓库 git clone <repository-url> //克隆远程仓库到本地。3.查看当前的状态 git status …...

大语言模型的训练、微调及压缩技术

The rock can talk — not interesting. The rock can read — that’s interesting. &#xff08;石头能说话&#xff0c;不稀奇。稀奇的是石头能读懂。&#xff09; ----硅谷知名创业孵化器 YC 的总裁 Gar Tan 目录 1. 什么是大语言模型&#xff1f; 2. 语言建模&#xff…...

制作一个简单的操作系统2

Linux 一般都提供了需要的标准工具。使用nasm汇编器,gcc编写自己的os 开发环境截图: 创建一个文件,让 BIOS 将文件识别为一个可引导的磁盘 理论基础 计算机上电启动后,首先运行主板 BIOS 程序, BIOS 并不知道如何加载操作系统,所以 BIOS 把加载操作系统的任务交给引导…...

day31和day32图像处理OpenCV

文章目录 一、图像预处理10 图像添加水印11 图像噪点消除11.1 均值滤波11.2 方框滤波11.3 高斯滤波11.4 中值滤波11.5 双边滤波11.6 小结 12 图像梯度处理12.1 图像梯度12.2 垂直或水平边缘提取 一、图像预处理 10 图像添加水印 本实验中添加水印的概念其实可以理解为将一张图…...

火山引擎的生态怎么样

“火山引擎”是字节跳动旗下的**云计算服务平台**&#xff0c;主要为企业提供智能化的技术解决方案&#xff0c;涵盖云计算、大数据、人工智能、音视频处理等多个领域。其“生态”指的是火山引擎通过技术开放、合作伙伴计划、行业解决方案等构建的商业与技术协作网络。以下从多…...

AI 数字短视频系统AI数字人源码开发:开启短视频行业发展新维度​

在短视频行业蓬勃发展的背后&#xff0c;创作效率瓶颈、内容同质化等问题逐渐凸显。AI 数字短视频数字人源码开发的出现&#xff0c;以创新性的解决方案&#xff0c;为行业发展带来了全新机遇与多元价值。​ 打破创作壁垒&#xff0c;释放全民创作潜力​ 对于普通创作者而言&…...

FreeFileSync:文件同步对比工具

FreeFileSync 是一款开源、跨平台的文件同步与备份工具&#xff0c;支持 Windows、Linux 和 macOS 系统‌。其核心功能是通过智能对比源文件夹与目标文件夹的内容差异&#xff0c;仅同步修改部分&#xff0c;提升效率并节省存储空间‌。软件体积小巧&#xff08;约20MB&#xf…...

SimBody安装

SimBody安装 Simbody 是一个用于创建生物力学和机械系统仿真的多体动力学库。 SimBody安装 Windows安装&#xff1a; 下载地址&#xff1a;GitHub - simbody/simbody: High-performance C multibody dynamics/physics library for simulating articulated biomechanical and…...

刀片服务器的散热构造方式

刀片服务器的散热构造是其高密度、高性能设计的核心挑战之一。其散热系统需在有限空间内高效处理多个刀片模块产生的集中热量,同时兼顾能耗、噪音和可靠性。以下从模块化架构、核心散热技术、典型方案对比、厂商差异及未来趋势等方面展开分析: 一、模块化散热架构 刀片服务器…...

从数字化到智能化,百度 SRE 数智免疫系统的演进和实践

1. 为什么 SRE 需要数智免疫系统&#xff1f; 2022 年 10 月&#xff0c;在 Gartner 公布的 2023 年十大战略技术趋势中提到了「数字免疫系统」的概念&#xff0c;旨在通过结合数据驱动的一系列手段来提高系统的弹性和稳定性。 在过去 2 年的时间里&#xff0c;百度基于该…...

STM32F7安全库各版本发布内容的表格化中文总结

以下是STM32F7安全库各版本发布内容的中文总结&#xff1a; 英文原文&#xff1a; version V2.0.0 This document describes the STM32F7 Safety release V2.0.0 Main changes: Maintenance release with new STL lib Contents: the SW expansion package, delivery itse…...

使用dompurify修复XSS跨站脚本缺陷

1. 问题描述 漏洞扫描说有一个低危漏洞&#xff0c;容易被跨站脚本攻击XSS。 2. 使用dompurify修复 DOMPurify is a DOM-only, super-fast, uber-tolerant XSS sanitizer for HTML, MathML and SVG. 简单来说&#xff0c;我们可以使用 dompurify 处理xss跨站脚本攻击。 2.…...

下载electron 22.3.27 源码错误集锦

下载步骤同 electron源码下载及编译_electron源码编译-CSDN博客 问题1 从github 下载 dugite超时&#xff0c;原因没有找到 Validation failed. Expected 8ea2d0d3c9d9e4615069913207371ffe892dc10fb93975972f2f6e668f2e3b3a but got e3b0c44298fc1c149afbf4c8996fb92427ae41e…...

Java漏洞原理与实战

一、基本概念 1、序列化与反序列化 (1)序列化:将对象写入IO流中&#xff0c;ObjectOutputStream类的writeobject()方法可以实现序列化 (2)反序列化:从IO流中恢复对象&#xff0c;ObjectinputStream类的readObject()方法用于反序列化 (3)意义:序列化机制允许将实现序列化的J…...

查看matlab函数帮助文档的方法

方法一&#xff1a;在命令行窗口中使用help命令 方法二&#xff1a;在命令行窗口中使用doc命令 方法三&#xff1a;在帮助文档中搜索关键字...

string函数具体事例

输出所有字串出现的位置 输入两个字符串A和B&#xff0c;输出B在A中出现的位置 输入 两行 第一行是一个含有空格的字符串 第二行是要查询的字串 输出 字串的位置 样例输入 I love c c python 样例输出 -1 样例输入 I love c c c 样例输出 8 12 #include<iostream> #inclu…...

OpenCV 中的分水岭算法的原理及其应用---图像分割的利器

图像分割作为计算机视觉的基石领域&#xff0c;历经数十年的演进与革新&#xff0c;从传统的图像处理方法到如今蓬勃发展的深度学习技术&#xff0c;始终推动着计算机视觉应用的边界拓展。本系列文章将通过三篇深度技术博客&#xff0c;分别对三种极具代表性的图像分割技术展开…...

Python项目--基于机器学习的股票预测分析系统

1. 项目介绍 在当今数字化时代&#xff0c;金融市场的数据分析和预测已经成为投资决策的重要依据。本文将详细介绍一个基于Python的股票预测分析系统&#xff0c;该系统利用机器学习算法对历史股票数据进行分析&#xff0c;并预测未来股票价格走势&#xff0c;为投资者提供决策…...

第三阶段面试题

Nginx nginx常用模块以及其功能 proxy模块&#xff0c;进行代理功能 ssl模块&#xff0c;进行HTTPS协议的使用 gzip模块&#xff0c;进行传输数据的压缩 upstream模块&#xff0c;进行反向代理时使用 static模块&#xff0c;静态资源进行访问的模块 cache模块&#xff0…...

spring响应式编程系列:总体流程

目录 示例 程序流程 just subscribe new LambdaMonoSubscriber ​​​​​​​MonoJust.subscribe ​​​​​​​new Operators.ScalarSubscription ​​​​​​​onSubscribe ​​​​​​​request ​​​​​​​onNext 时序图 类图 数据发布者 MonoJust …...

基于PySide6与pyCATIA的圆柱体特征生成工具开发实战——NX建模之圆柱命令的参考与移植

引言 在机械设计领域&#xff0c;特征建模的自动化是提升设计效率的关键。本文基于PySide6与pycatia技术栈&#xff0c;深度解析圆柱特征自动化生成系统的开发实践&#xff0c;涵盖参数化建模、交互式元素选择、异常处理等核心模块&#xff0c;实现比传统手动操作提升3倍效率的…...

kafka jdbc connector适配kadb数据实时同步

测试结论 源端增量获取方式包括&#xff1a;bulk、incrementing、timestamp、incrementingtimestamp&#xff08;混合&#xff09;&#xff0c;各种方式说明如下&#xff1a; bulk: 一次同步整个表的数据 incrementing: 使用严格的自增列标识增量数据。不支持对旧数据的更新…...

pgsql中使用jsonb的mybatis-plus和jps的配置

在pgsql中使用jsonb类型的数据时&#xff0c;实体对象要对其进行一些相关的配置&#xff0c;而mybatis和jpa中使用各不相同。 在项目中经常会结合 MyBatis-Plus 和 JPA 进行开发&#xff0c;MyBatis_plus对于操作数据更灵活&#xff0c;jpa可以自动建表&#xff0c;两者各取其…...

4.17-4.18学习总结 多线程

并发与并行&#xff1a; 并发和并行是有可能都在发生的。 多线程的实现方式&#xff1a; 第一种&#xff1a;创建子类对象&#xff0c;调用start方法启动线程。 第二种&#xff1a; 第三种&#xff1a; 第一种和第二种不可以获取到多线程结果&#xff0c;但第三章种可以。 多…...

无人机在农业中的应用与挑战!

一、无人机在农业中的作用 1. 提升作业效率与降低成本 无人机在喷洒农药、播种、施肥、吊运等环节显著提升效率。例如&#xff0c;湖北秭归县使用大疆T100无人机吊运脐橙&#xff0c;单次85公斤的运输任务仅需2分钟&#xff0c;而人工需1小时&#xff0c;综合成本降低250元…...

无刷电机槽数相同、转子极数不同的核心区别

一、基础原理差异 无刷电机的核心参数: 槽数(定子槽数,记为 ( Z )):定子铁芯上的绕组槽数量,决定绕组布局。极数(转子磁极数,记为 ( 2p )):转子上的永磁体磁极对数(总极数为 ( 2p ),如 ( p=4 ) 表示 8 极)。核心关系:槽极配合(( Z/2p ))决定电机电磁结构,相同…...