H.264,H.265,H.266标准技术改进
关于H.264,H.265,H.266相关资料链接:
标准及中文资料链接
视频编码中的主要技术
视频编码的目标是在保证视频质量的前提下,尽可能减少数据量。以下是视频编码中的核心技术:
- 块划分(Block Partitioning)
- 将视频帧划分为小块,以便后续进行预测、变换和量化。
- 块的大小和形状直接影响编码效率。
- 帧内预测(Intra Prediction)
- 利用同一帧内相邻像素的相关性,预测当前块的像素值。
- 目的是减少空间冗余。
- 帧间预测(Inter Prediction)
- 利用时间上相邻帧的内容,通过运动估计和运动补偿预测当前块的像素值。
- 目的是减少时间冗余。
- 变换(Transform)
- 将预测残差(预测值与实际值的差值)从空间域转换到频率域,集中能量,便于压缩。
- 量化(Quantization)
- 对变换后的系数进行舍入处理,减少数据量。
- 量化步长决定了压缩率和视频质量的平衡。
- 熵编码(Entropy Coding)
- 对量化后的数据进行无损压缩,利用数据的统计特性进一步减少比特率。
- 环路滤波(In-loop Filtering)
- 在编码和解码过程中对重建图像进行滤波,减少压缩带来的伪影,提升质量。
H.264 (AVC)
H.264 是一个重要的视频编码标准,奠定了现代视频压缩的基础。
主要技术特点
- 块划分:使用 16x16 像素的宏块(macroblock),可细分为 8x8 或 4x4 的子块。
- 帧内预测:支持 9 种 4x4 块预测模式和 4 种 16x16 块预测模式。
- 帧间预测:支持 1/4 像素精度的运动向量。
- 变换:采用 4x4 和 8x8 的整数 DCT 变换。
- 熵编码:提供 CAVLC(基于变长编码)和 CABAC(基于上下文自适应的二进制算术编码)两种选择。
- 环路滤波:引入去块滤波器(deblocking filter),减少块效应伪影。
H.265 (HEVC) 相较于 H.264 的改进
H.265 在 H.264 的基础上大幅提升了压缩效率,尤其适用于高分辨率视频。
具体改进
- 块划分
- 改进:从固定的 16x16 宏块升级为编码树单元(CTU),最大支持 64x64,并采用四叉树结构,动态划分至 8x8。
- 优势:更灵活的块划分,能根据内容复杂度优化压缩效率。
- 帧内预测
- 改进:预测模式从 9/4 种增加到 35 种,支持更多预测方向。
- 优势:更精确的预测,减少空间残差。
- 帧间预测
- 改进:引入高级运动向量预测(AMVP)和合并模式(merge mode),优化运动信息编码。
- 优势:减少描述运动所需的比特,提升时间预测效率。
- 变换
- 改进:支持更大的变换尺寸,最高达 32x32。
- 优势:更好地捕捉大块区域的低频信息,减少残差数据量。
- 环路滤波
- 改进:在去块滤波器的基础上新增样本自适应偏移(SAO)滤波器。
- 优势:进一步减少伪影,提升视觉质量和预测精度。
- 熵编码
- 改进:CABAC 性能得到优化。
- 优势:提高无损压缩效率。
总体效果:在相同质量下,H.265 的比特率约为 H.264 的一半。
H.266 (VVC) 相较于 H.265 的改进
H.266 是最新的视频编码标准,进一步提升压缩效率并支持更多应用场景。
具体改进
- 块划分
- 改进:采用四叉树加二叉树(QTBT)结构,支持矩形块划分,最大尺寸仍为 64x64。
- 优势:更灵活的划分方式,能更好地适应复杂内容。
- 帧内预测
- 改进:预测模式从 35 种增加到 67 种,方向更精细。
- 优势:提升预测精度,进一步减少空间冗余。
- 帧间预测
- 改进:引入仿射运动补偿(affine motion compensation),支持旋转、缩放等复杂运动。
- 优势:更准确地模拟真实物体运动,提升时间预测效果。
- 变换
- 改进:支持多种变换选择(MTS,如 DCT 和 DST),变换尺寸扩展至 64x64。
- 优势:根据内容选择最优变换,减少残差数据量。
- 环路滤波
- 改进:新增自适应环路滤波器(ALF),与去块滤波器和 SAO 协同工作。
- 优势:自适应调整滤波策略,显著减少伪影。
- 熵编码
- 改进:进一步优化 CABAC 的上下文建模。
- 优势:提升无损压缩效率。
总体效果:在相同质量下,H.266 的比特率比 H.265 再降低 30-50%。
压缩效率与带宽需求
- H.264(1080p@30fps):
- 典型码率:4-8 Mbps
- 适用场景:普通网络直播、标清视频存储。
- H.265(4K@30fps):
- 典型码率:10-20 Mbps(比H.264节省50%带宽)
- 适用场景:4K流媒体(如Netflix)、超高清监控。
- H.266(8K@60fps):
- 典型码率:20-40 Mbps(比H.265节省50%带宽)
- 适用场景:8K广播电视、VR游戏串流。
示例:一部90分钟的4K电影:
- H.264:约50 GB
- H.265:约25 GB
- H.266:约12.5 GB
2. 计算复杂度与硬件需求
标准 | 编码复杂度(相对值) | 典型硬件支持 |
---|---|---|
H.264 | 1x | 手机SoC(2010年后)、低端摄像头 |
H.265 | 3-5x | 高端手机(如iPhone 12+)、4K电视芯片 |
H.266 | 8-10x | 最新GPU(NVIDIA RTX 40系列)、专用编码芯片 |
市场应用与竞争格局
1. H.264/H.265/H.266的当前应用
- H.264:仍占主流(约60%视频流量),尤其在监控摄像头、视频会议(Zoom默认编码)。
- H.265:4K流媒体(YouTube、Disney+)、苹果生态(iPhone录制的4K视频)。
- H.266:试验阶段,如日本8K电视台、Meta的VR直播。
2. 与AV1的竞争
- H.266优势:
- 压缩效率略高于AV1(约5-10%)。
- 硬件加速生态更成熟(华为海思、联发科芯片已支持)。
- AV1优势:
- 免专利费(由AOM联盟推动,谷歌/Netflix支持)。
- 已广泛应用于YouTube、TikTok等平台。
预测:未来5年,H.266将在超高清专业领域(广电、医疗影像)领先,而AV1主导消费级流媒体。
相关文章:
H.264,H.265,H.266标准技术改进
关于H.264,H.265,H.266相关资料链接: 标准及中文资料链接 视频编码中的主要技术 视频编码的目标是在保证视频质量的前提下,尽可能减少数据量。以下是视频编码中的核心技术: 块划分(Block Partitioning) 将视频帧划分…...
Crawl4AI: 赋能AI用户的开源智能网页爬虫与数据提取
Crawl4AI: 赋能AI用户的开源智能网页爬虫与数据提取 在当今人工智能时代,网络爬虫扮演着至关重要的角色。它们不仅是数据收集的强大工具,更是驱动机器学习、自然语言处理等技术发展的关键引擎。 然而,对于用户来说,在面对复杂多…...
C++ primer plus 第七节 函数探幽完结版
系列文章目录 C primer plus 第一节 步入C-CSDN博客 C primer plus 第二节 hello world刨析-CSDN博客 C primer plus 第三节 数据处理-CSDN博客 C primer plus 第四节 复合类型-CSDN博客 C primer plus 第五节 循环-CSDN博客 C primier plus 第七节 函数探幽第一部分-CSDN博客 …...
linux | Vim 命令快捷操作
注:本文为过去的 “vim 使用笔记”。 跳转命令 跳转命令 #:向前查找光标当前所在单词,并跳转到该单词的上一个出现位置。*:向后查找光标当前所在单词,并跳转到该单词的下一个出现位置。 行内跳转 0:跳转…...
RuleOS:区块链开发的“新引擎”,点燃Web3创新之火
RuleOS:区块链开发的“新引擎”,点燃Web3创新之火 在区块链技术的浪潮中,RuleOS宛如一台强劲的“新引擎”,为个人和企业开发去中心化应用(DApp)注入了前所未有的动力。它以独特的设计理念和强大的功能特性&…...
梯度本质论:从黎曼流形到神经网络的拓扑寻优
一、微分几何框架下的梯度再诠释 在标准数学分析中,梯度被定义为标量场 f : R n → R f:\mathbb{R}^n→\mathbb{R} f:Rn→R的导数张量 ∇ f ( ∂ f ∂ x 1 , . . . , ∂ f ∂ x n ) \nabla f(\frac{\partial f}{\partial x_1},...,\frac{\partial f}{\partial x_n…...
LVGL直接解码png图片的方法
通过把png文件解码为.C文件,再放到工程中的供使用,这种方式随时速度快(应为已经解码,代码中只要直接加载图片数据显示出来即可),但是不够灵活,适用于哪些简单又不经常需要更换UI的场景下使用。如…...
代码随想录算法营Day59 | 寻找存在的路径, 冗余连接,冗余连接II
寻找存在的路径 这题使用并查集即可。并查集加路径压缩。 #include <iostream> using namespace std; int find(int* father,int u){return father[u] u ? u : father[u] find(father,father[u]); }bool isSame(int* father,int u,int v){return find(father,u) fi…...
物联网智慧农业一体化解决方案-可继续扩展更多使用场景
在智慧农业中,从种子、施肥、灌溉、锄地、农具管理、日常照料到蔬菜档案管理,以及与客户、供应商、市场的对接,可以通过物联网(IoT)、大数据、人工智能(AI)、区块链和云计算等技术,构建一个从生产到销售的全流程数字化、智能化农业生态系统。以下是实现方案和技术路径的…...
第八节:基于Winform框架的串口助手小项目---完结优化《C#编程》
C# 实战串口助手完成! ----------------------------不竭余力,方能成长!-----------WHAPPY 源码:我会分享开源平台,可以艾特me!(2025/3/5)时间紧张任务中! 文章上所说的…...
Python已知后序遍历和中序遍历,求先序遍历
步骤一:树的构建 字典 def createTree(arr1,arr2,tree):if len(arr1)0 and len(arr2)0 :returnroot len(arr1)-1# print(arr1[root],root)flag arr2.index(arr1[root])# print(flag)len_right len(arr2)-flag-1len_left flagif len(arr2[:flag])>1:lchild …...
三维建模与视频融合(3D-Video Integration)技术初探。
三维建模与视频融合(3D-Video Integration)是一种将虚拟三维模型无缝嵌入实拍视频场景的技术,广泛应用于影视特效、增强现实(AR)、游戏开发、广告制作 、视频监控 等领域。 一、技术核心流程 三维建模与动画 使用工具…...
基于uniapp的蓝牙打印功能(佳博打印机已测试)
相关步骤 1.蓝牙打印与低功耗打印的区别2.蓝牙打印流程2.1 搜索蓝牙2.2 连接蓝牙 3.连接蓝牙设备4.获取服务5.写入命令源码gbk.jsglobalindex.ts 1.蓝牙打印与低功耗打印的区别 低功耗蓝牙是一种无线、低功耗个人局域网,运行在 2.4 GHz ISM 频段 1、低功耗蓝牙能够…...
基于Django的协同过滤算法养老新闻推荐系统的设计与实现
基于Django的协同过滤算法养老新闻推荐系统(可改成普通新闻推荐系统使用) 开发工具和实现技术 Pycharm,Python,Django框架,mysql8,navicat数据库管理工具,vue,spider爬虫࿰…...
PROFINET转PROFIBUS从案例剖析网关模块的协议转换功能
一、 案例背景 在当下追求高效协同的工业自动化生产体系里,设备间的无缝互联互通堪称关键要素。某企业的生产车间中,有一台性能稳定的变频器,其配备的是PROFIBUS接口。与此同时,操控整个生产线的核心大脑——西门子1500 PLC&…...
BZOJ2121 字符串游戏
想出来了一半,然后看了眼题解,果然还是和状压不熟导致的。 题目大意 给你一个字符串 L L L 和一个有 n n n 个字符串的集合 S S S,每次操作可以在 L L L 中选择一个子串,如果这个子串在集合 S S S 中,那么这个子…...
计算机组成原理:计算机系统的性能指标
文章目录 什么是计算机系统的性能指标硬件与计算机系统性能的关系软件与计算机系统性的关系计算机硬件的相关性能指标基本性能指标机器字长数据通路带宽主存容量吞吐量响应时间 与运算速度相关的性能指标CPU时钟频率和时钟周期CPICPU执行时间IPCMIPSMFLOPS 使用基准程序进行性能…...
特定领域软件架构DSSA
特定领域软件架构(Domain-Specific Software Architecture DSSA)是专用于解决某一特定类型任务(领域)的架构。它在该领域内提供了一套标准化的组合构建和软件架构,以满足独特需求和约束。DSSA通过结合特定问题领域的专…...
ubuntu22.04安装RAGFlow配合DeepSeek搭建本地知识库
一、简介 RAGFlow 是一个基于对文档的深入理解的开源 RAG(检索增强生成)引擎。当与 LLM 集成时,它能够提供真实的问答功能,并以来自各种复杂格式数据的有根据的引用为后盾。 二、安装 1.环境要求 CPU ≥ 4 核 (x86…...
Python爬虫实战:爬取财金网实时财经信息
注意:以下内容仅供技术研究,请遵守目标网站的robots.txt规定,控制请求频率避免对目标服务器造成过大压力! 一、引言 在当今数字化时代,互联网数据呈爆炸式增长,其中蕴含着巨大的商业价值、研究价值和社会价值。从金融市场动态分析到行业趋势研究,从舆情监测到学术信息收…...
【Python修仙编程】(二) Python3灵源初探(7)
字典的修炼——修仙者的法宝库 师傅玄天真人在他面前摊开一本泛黄的法典,上面写着:“字典是修仙者存储法宝的仓库,能让你快速找到需要的宝贝。” “师傅,字典是啥玩意儿?”林羽挠挠头,一脸懵逼。 “字典…...
Docker 学习(四)——Dockerfile 创建镜像
Dockerfile是一个文本格式的配置文件,其内包含了一条条的指令(Instruction),每一条指令构建一层,因此每一条指令的内容,就是描述该层应当如何构建。有了Dockerfile,当我们需要定制自己额外的需求时,只需在D…...
智慧校园总体方案
1. 智慧校园内涵与发展 智慧校园作为现代教育信息化的产物,其发展经历了从校园网建设到数字校园,再到智慧校园的转变。技术驱动与理念引领并重,以实现网络学习、校务治理、校园文化和校园生活的全面升级。教育部《教育信息化2.0行动计划》强…...
为什么js小数相加,会产生精度缺失的问题,怎么解决?
为什么js小数相加,会产生精度缺失的问题,怎么解决? 在 JavaScript 中,小数相加会产生精度缺失问题,主要是由 JavaScript 采用的 IEEE 754 双精度 64 位浮点数表示法所导致的,下面详细解释其中的原因&#…...
【JavaScript】DOM和BOM是什么?
作者 :Yuppie001 作者主页 : 传送 本文专栏 :JavaScript 🌟🌟🌟🌟🌟🌟🌟🌟 DOM和BOM: 一.什么是DOMDOM是如何工作 二.BOMÿ…...
虚拟系统配置案例
安全策略要求: 1、只存在一个公网IP地址,公司内网所有部门都需要借用同一个接口访问外网 2、财务部禁止访问Internet,研发部门只有部分员工可以访问Internet,行政部门全部可以访问互联网 3、为三个部门的虚拟系统分配相同的资源类…...
Easysearch 新功能: IK 字段级别词典
Easysearch 1.10 版本在 IK 词典部分增加了字段级别词典的功能。 字段级别词典的功能支持用户对不同的字段设置不同的分词词库,用户既可以完全使用自己的词库,也支持在 ik 默认的词库上增加自定义的词库内容。 在整体使用上,ik 自定义词库的…...
微信小程序接入deepseek
先上效果 话不多说,直接上代码(本人用的hbuilder Xuniapp) <template><view class"container"><!-- 聊天内容区域 --><scroll-view class"chat-list" scroll-y :scroll-top"scrollTop":…...
大白话react第十六章React 与 WebGL 结合的实战项目
大白话react第十六章React 与 WebGL 结合的实战项目 1. 项目简介 React 是一个构建用户界面的强大库,而 WebGL 则允许我们在网页上实现高性能的 3D 图形渲染。将它们结合起来,我们可以创建出炫酷的 3D 网页应用,比如 3D 产品展示、虚拟场景…...
DeepSeek-R1:引领AI领域革新,MLA技术助力模型迁移
摘要 DeepSeek的MLA技术实现了大型机器学习模型的轻松迁移,其突破性产品DeepSeek-R1凭借显著降低的训练和推理成本,吸引了业界广泛关注。MLA技术的核心在于创新性的低秩压缩键值缓存架构,使得推理成本大幅减少,仅为同等性能大型模…...
Nginx:从入门到实战使用教程
全方位解析Nginx:从入门到实战使用教程 Nginx安装、配置详细教程 文章目录 全方位解析Nginx:从入门到实战使用教程导语一、Nginx简介二、Nginx安装与配置 1. 在CentOS系统上安装Nginx:2. 在Ubuntu系统上安装Nginx:3. Nginx配置文…...
SyntaxError: Unexpected token ‘xxx‘
🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》、《前端求职突破计划》 🍚 蓝桥云课签约作者、…...
GaussDB安全配置指南:从认证到防御的全方面防护
一、引言 随着企业数据规模的扩大和云端化进程加速,数据库安全性成为运维的核心挑战之一。GaussDB作为一款高性能分布式数据库,提供了丰富的安全功能。本文将从 认证机制、权限控制、数据加密、审计日志 等维度,系统性地讲解如何加固 Ga…...
[项目]基于FreeRTOS的STM32四轴飞行器: 四.LED控制
基于FreeRTOS的STM32四轴飞行器: 四.LED控制 一.配置Com层二.编写驱动 一.配置Com层 先在Com_Config.h中定义灯位置的枚举类型: 之后定义Led的结构体: 定义飞行器状态: 在Com_Config.c中初始化四个灯: 在Com_Config.h外部声明…...
Python——计算机网络
一.ip 1.ip的定义 IP是“Internet Protocol”的缩写,即“互联网协议”。它是用于计算机网络通信的基础协议之一,属于TCP/IP协议族中的网络层协议。IP协议的主要功能是负责将数据包从源主机传输到目标主机,并确保数据能够在复杂的网络环境中正…...
【并发编程】聊聊定时任务ScheduledThreadPool的实现原理和源码解析
ScheduledThreadPoolExecutor 是在线程池的基础上 拓展的定时功能的线程池,主要有四种方式,具体可以看代码, 这里主要描述下 scheduleAtFixedRate : 除了第一次执行的时间,后面任务执行的时间 为 time MAX(任务执行时…...
nginx-静态资源部署
目录 静态资源概述 静态资源配置指令 listen指令 server_name指令 精确匹配 ?编辑 ?编辑 使用通配符匹配 使用正则表达式匹配 匹配执行顺序 default_server属性 location指令 root指令 alias指令 root与alisa指令的区别 index指令 error_page指令 直接使用…...
WebGPT: 基于浏览器辅助的问答系统,结合人类反馈优化答案质量
【摘要】 本论文介绍了WebGPT,这是一种通过浏览器辅助问答系统来使用人类反馈进行训练和优化的模型。具体来说,该系统通过与基于文本的网络浏览环境互动,使模型能够搜索和导航网络,从而提高其回答长文本问题的能力。通过将任务设计为人类可以完成的任务,研究人员能够利用…...
C# 异步任务队列封装
在 C# 中,可以使用 Task 和 ConcurrentQueue 来构建一个 异步任务队列,确保任务按照 FIFO(先进先出)顺序执行,并支持并发安全。 设计方案 任务队列 (ConcurrentQueue<Func>) 存储异步任务(每个任务都…...
安装并运行hadoop程序
1.在虚拟机上安装javaJDK (1)把javaJDK文件上传到服务器 在opt文件夹下新建一个software文件夹,将jdk拖入software (2)解压文件 在opt文件夹下新建一个module文件夹,确认上传成功之后,在softwa…...
第TR3周:Pytorch复现Transformer
🍨 本文为🔗365天深度学习训练营中的学习记录博客 🍖 原作者:K同学啊 Transformer通过自注意力机制,改变了序列建模的方式,成为AI领域的基础架构 编码器:理解输入,提取上下文特征…...
51c视觉~3D~合集2
我自己的原文哦~ https://blog.51cto.com/whaosoft/13422809 #中科大统一内外参估计和3DGS训练 这下真的不用相机标定了? 同时优化相机的内外参和无序图像数据 在给定一组来自3D场景的图像及其相应的相机内参和外参的情况下,3D高斯喷溅ÿ…...
dify在腾讯云服务器上部署
Dify 是一个开源的 LLM 应用开发平台。提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用,比 LangChain 更易用。 首先到dify官方网站上有详细介绍 https://docs.dify.ai/zh-hans/getting-started/ins…...
Redis——缓存穿透、击穿、雪崩
缓存穿透 什么是缓存穿透 缓存穿透说简单点就是大量请求的 key 根本不存在于缓存中,导致请求直接到了数据库上,根本没有经过缓存这一层。举个例子:某个黑客故意制造我们缓存中不存在的 key 发起大量请求,导致大量请求落到数据库…...
Java 并发编程:synchronized 与 Lock 的区别
精心整理了最新的面试资料和简历模板,有需要的可以自行获取 点击前往百度网盘获取 点击前往夸克网盘获取 Java 并发编程:synchronized 与 Lock 的深度对比 在 Java 多线程编程中,同步机制是保证线程安全的核心手段。synchronized 关键字和 …...
12组复古暖色调旅行电影摄影照片调色Lightroom预设 12 Warm Vintage Film Lightroom Presets
使用这 12 种暖色复古胶片 Lightroom 预设来转换您的照片,旨在将经典胶片的永恒精髓带入您的数字编辑中。每个预设都经过精心制作,以唤起丰富的色彩、微妙的颗粒和怀旧的色调。 这些预设非常适合寻求复古魅力和现代精度融合的摄影师,将毫不费…...
WebSocket:实现实时通信的利器
在现代Web应用中,实时通信变得越来越重要。无论是聊天应用、在线游戏,还是实时数据推送,传统的HTTP请求-响应模式已经无法满足需求。WebSocket作为一种全双工通信协议,应运而生,成为实现实时通信的利器。本文将深入探讨…...
小谈java内存马
基础知识 (代码功底不好,就找ai优化了一下) Java内存马是一种利用Java虚拟机(JVM)动态特性(如类加载机制、反射技术等)在内存中注入恶意代码的攻击手段。它不需要在磁盘上写入文件,…...
wordpress自定the_category的输出结构
通过WordPress的过滤器the_category来自定义输出内容。方法很简单,但是很实用。以下是一个示例代码: function custom_the_category($thelist, $separator , $parents ) {// 获取当前文章的所有分类$categories get_the_category();if (empty($categ…...
Flink深入浅出之01:应用场景、基本架构、部署模式
Flink 1️⃣ 一 、知识要点 📖 1. Flink简介 Apache Flink — Stateful Computations over Data StreamsApache Flink 是一个分布式大数据处理引擎,可对有界数据流和无界数据流进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以…...