libaom 码率控制实验:从理论到实践的深度探索
libaom 码率控制模式介绍
- 在 libaom 中定义了四种码率控制模式,分别是 VBR、CBR、CQ、Q;枚举类型会被用在编码器配置结构体 aom_codec_enc_cfg 中,通过 rc_end_usage 字段来设置编码器的码率控制策略。具体应用范围如下:
- AOM_VBR - 可变比特率模式
- 允许比特率根据视频内容复杂度动态变化
- 在简单场景使用较少比特,复杂场景使用更多比特
- 适合本地存储等对码率波动不敏感的场景
- AOM_CBR - 恒定比特率模式
- 强制编码器保持恒定的目标比特率
- 通过调整量化参数来实现
- 适合带宽受限的实时流媒体传输
- AOM_CQ - 受限质量模式
- 在保证一定质量水平的前提下尽量降低码率
- 质量与码率之间的折中方案
- AOM_Q - 恒定质量模式
- 完全以质量为目标,不考虑码率限制
- 适合对质量要求极高且不关心文件大小的场景
- AOM_VBR - 可变比特率模式
/*!\brief Rate control mode */
enum aom_rc_mode {AOM_VBR, /**< Variable Bit Rate (VBR) mode */AOM_CBR, /**< Constant Bit Rate (CBR) mode */AOM_CQ, /**< Constrained Quality (CQ) mode */AOM_Q, /**< Constant Quality (Q) mode */
};
libaom码率控制模式实验
- 编码命令行:
./aomenc -w 1920 -h 1080 --fps=25/1 --passes=1 --end-usage=vbr --target-bitrate=3000 --cpu-used=6 -o av1.ivf BasketballDrive_1920x1080_50.yuv
- 解码命令行:
ffmpeg -i av1.ivf vbr.yuv
- PSNR 计算命令行:
./ffmpeg -s <宽x高> -pix_fmt <像素格式> -i <受损YUV文件> -s <宽x高> -pix_fmt <像素格式> -i <原始YUV文件> -lavfi psnr=stats_file=psnr.log -f null -
- 视频序列示意图
- 实验数据
视频序列 | rc_end_usage | PSNR(dB) | 码率(b/s) | 耗时(fps) |
---|---|---|---|---|
BasketballDrive_1920x1080_50.yuv | vbr | y:37.538749 u:42.919160 v:43.573611 average:38.750767 | 3470625 | 2.49 |
cbr | y:36.732039 u:41.782326 v:42.060963 average:37.880549 | 2940500 | 2.78 | |
cq | y:37.546299 u:42.927692 v:43.576597 average:38.758129 | 3461625 | 2.47 | |
q | y:42.072283 u:45.036628 v:46.910359 average:43.011125 | 36345800 | 1.27 |
-
vbr模式前 50 帧 bit 示意图 和 psnr 数据
-
cbr 模式前 50 帧 bit 示意图和 psnr 数据
-
cq 模式下前 50 帧 bit 示意图 和 psnr 数据
-
q 模式前 50 帧 bit 示意图和 psnr 数据
-
用 Python 画出前 50 帧 psnr 的曲线图
# -*- coding: utf-8 -*-
# created by 码流怪侠
# 2025.4.15
import matplotlib.pyplot as plt# 提取前50帧的psnr_avg数据
# VBR
psnr_values_vbr = [41.90, 40.17, 40.18, 39.88, 40.13, 39.68, 39.84, 39.64, 39.71, 40.31,39.78, 39.92, 39.80, 40.14, 39.87, 40.01, 39.85, 39.94, 40.35, 40.32,40.39, 40.68, 40.38, 40.39, 40.97, 40.32, 40.23, 40.59, 40.11, 40.34,40.23, 40.69, 39.88, 39.86, 39.61, 39.84, 39.45, 39.54, 39.42, 39.93,39.33, 39.34, 39.13, 39.41, 38.96, 39.08, 38.99, 40.16, 38.93, 38.96
]
# CBR
psnr_values_cbr = [43.03, 38.69, 38.39, 38.16, 37.95, 38.08, 38.23, 38.41, 38.68, 38.89,39.16, 39.35, 39.54, 39.77, 39.88, 39.95, 39.96, 40.03, 40.03, 40.06,40.06, 40.04, 39.99, 39.96, 39.90, 39.80, 39.69, 39.56, 39.45, 39.36,39.40, 34.18, 39.36, 38.54, 38.79, 38.80, 38.76, 38.70, 38.64, 38.62,38.63, 38.55, 38.50, 38.32, 38.18, 38.01, 37.84, 37.73, 37.71, 37.72
]
# CQ
psnr_values_cq = [41.90, 40.17, 40.18, 39.89, 40.15, 39.71, 39.84, 39.64, 39.74, 40.38,39.83, 39.97, 39.85, 40.19, 39.92, 40.05, 39.92, 39.99, 40.43, 40.36,40.40, 40.74, 40.41, 40.43, 41.04, 40.37, 40.27, 40.66, 40.16, 40.38,40.30, 40.85, 39.95, 39.91, 39.65, 39.88, 39.47, 39.58, 39.43, 39.98,39.36, 39.37, 39.15, 39.46, 38.98, 39.11, 39.00, 40.24, 38.95, 38.99
]
# Q
psnr_values_q = [41.52, 42.63, 43.32, 42.58, 44.10, 42.57, 43.37, 42.77, 42.57, 44.15,42.54, 43.35, 42.55, 44.11, 42.58, 43.36, 42.80, 42.79, 42.65, 42.65,42.55, 43.88, 42.60, 42.54, 44.19, 42.60, 42.56, 42.58, 43.38, 42.30,42.56, 42.79, 42.85, 42.56, 43.44, 42.57, 42.55, 42.53, 42.66, 42.58,42.54, 42.86, 42.56, 43.50, 42.58, 42.46, 42.62, 44.46, 42.66, 43.01
]# 创建图表
plt.figure(figsize=(12, 6))
plt.plot(psnr_values_vbr, marker='o', linestyle='-', color='b', label='VBR', alpha=0.7)
plt.plot(psnr_values_cbr, marker='s', linestyle='--', color='r', label='CBR', alpha=0.7)
plt.plot(psnr_values_cq, marker='^', linestyle=':', color='g', label='CQ', alpha=0.7)
plt.plot(psnr_values_q, marker='D', linestyle='-.', color='m', label='Q', alpha=0.7) # 新增Q曲线plt.title('PSNR Comparison (VBR vs CBR vs CQ vs Q) for First 50 Frames') # 更新标题
plt.xlabel('Frame Number')
plt.ylabel('PSNR (dB)')
plt.grid(True)
plt.xticks(range(0, 50, 5))
plt.yticks(range(28, 46, 2)) # 调整Y轴范围
plt.ylim(28, 45) # 调整Y轴显示范围
plt.legend()# 显示图表
plt.tight_layout()
plt.savefig('/Users/admin/Documents/gitcode/libaom/psnr_comparison.png')
plt.show()
总结
- AOM_Q模式有点类似 x264、x265 中的 CQP 模式,与目标码率 target-bitrate 互斥关系;
- AOM_CBR 模式虽然控制的码率更符合目标码率,但整体视频质量把控的很差,且出现极低质量的情况;
- AOM_VBR 模式和 AOM_CQ 模式几乎有一样的编码效果和能力,AOM_CQ相对有更低一点的码率控,psnr 有略微优势,但二者整体差距微乎其微;
- AOM_CQ模式有点类似 x264、x265 中的 CRF,但不同点是AOM_CQ也收到目标码率 target-bitrate的限制。
相关文章:
libaom 码率控制实验:从理论到实践的深度探索
libaom 码率控制模式介绍 在 libaom 中定义了四种码率控制模式,分别是 VBR、CBR、CQ、Q;枚举类型会被用在编码器配置结构体 aom_codec_enc_cfg 中,通过 rc_end_usage 字段来设置编码器的码率控制策略。具体应用范围如下: AOM_VBR…...
golang的slice扩容过程
Go 语言中的切片扩容机制是 Go 运行时的一个关键部分,它确保切片在动态增加元素时能够高效地管理内存。这个机制是在 Go 运行时内部实现的,涉及了内存分配、数据拷贝和容量调整。扩容的实现主要体现在 runtime.growslice 函数中。下面我们将深入分析 Go …...
MCP 集合网站
分享个超全 MCP 网站,以后找资源不用愁,不谢。 MCPServers | Model Context Protocol Implementation | MCPServers.cnMCPServers - Model Context Protocol Servers for AI model serving. The official platform for MCP, MCPServer, and Model Contex…...
C++: Initialization and References to const 初始化和常引用
cpp primer 5e, P97. 理解 这是一段很容易被忽略、 但是又非常重要的内容。 In 2.3.1 (p. 51) we noted that there are two exceptions to the rule that the type of a reference must match the type of the object to which it refers. The first exception is that we …...
ES通过API操作索引库
1. 导入restClient依赖 <dependency><groupId>org.elasticsearch.client</groupId><artifactId>elasticsearch-rest-high-level-client</artifactId><version>7.12.1</version></dependency> 2. 了解ES核心客户端API 核心区别…...
MySQL:存储函数和存储过程
系列文章目录 1.MySQL编程基础 2.程序控制流语句 3.存储过程 4.游标 5.嵌入式SQL 文章目录 系列文章目录前言一、程序控制流语句:二、存储函数: 1.存储函数的特点:2.存储函数的定义:3.调用存储函数 三、存储过程:…...
visual studio安装字体
以下是在 Windows 系统中将 Visual Studio 字体更换为 JetBrains 字体(如 JetBrains Mono)的完整指南,涵盖从下载安装到高级优化的全流程: 一、下载并安装 JetBrains 字体 获取字体文件 访问 JetBrains Mono 官方下载页面&#x…...
网络安全·第四天·扫描工具Nmap的运用
今天我们要介绍网络安全中常用的一种扫描工具Nmap,它被设计用来快速扫描大型网络,主要功能包括主机探测、端口扫描以及版本检测,小编将在下文详细介绍Nmap相应的命令。 Nmap的下载安装地址为:Nmap: the Network Mapper - Free Se…...
SSM考研助手管理系统
🍅点赞收藏关注 → 添加文档最下方联系方式咨询本源代码、数据库🍅 本人在Java毕业设计领域有多年的经验,陆续会更新更多优质的Java实战项目希望你能有所收获,少走一些弯路。🍅关注我不迷路🍅 项目视频 03…...
通道注意力机制|Channel Attention Neural Network
一、通道注意力机制 论文:ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks 近年来,通道注意力机制在提高深度卷积神经网络CNN的性能方面显示出了巨大潜力。然而,大多数现有方法致力于开发更复杂的注意力模块…...
844. 比较含退格的字符串
给定 s 和 t 两个字符串,当它们分别被输入到空白的文本编辑器后,如果两者相等,返回 true 。# 代表退格字符。 注意:如果对空文本输入退格字符,文本继续为空。 示例 1: 输入:s "ab#c&quo…...
trl的安装与单GPU多GPU测试
文章目录 0 相关资料1 源码安装2 Qwen2.5-0.5B-Instruct 模型下载3 训练demo4 在多个 GPU/节点上进行训练总结 0 相关资料 https://github.com/huggingface/trl https://blog.csdn.net/weixin_42486623/article/details/134326187 TRL 是一个先进的库,专为训练后基…...
Java项目之基于ssm的学校小卖部收银系统(源码+文档)
项目简介 学校小卖部收银系统实现了以下功能: 学校小卖部收银系统的主要使用者分为: 管理员;管理员使用本系统涉到的功能主要有:主页,个人中心,用户管理,员工管理,商品分类管理&am…...
ES DSL 常用修改语句
字段值替换修改 修改sql update zyzkwjj set dhreplace(dh,"WS","WSS") where dh like %WS% update zyzkwjj set dh replace(dh, WS, DZ),ztm replace(ztm, WS, DZ),zrz replace(zrz, WS, DZ) where dh like %WS% or ztm like %WS% or zrz like %WS%…...
数据结构*集合框架顺序表-ArrayList
集合框架 常见的集合框架 什么是顺序表 顺序表是一种线性表数据结构,它借助一组连续的存储单元来依次存储线性表中的数据元素。一般情况下采用数组存储。 在数组上完成数据的增删查改。 自定义简易版的顺序表 代码展示: public interface IArray…...
(二)Graspnet在mujoco的仿真复现(操作记录)
目录 《复现的项目来源》 一、创建虚拟环境 二、下载manipulator_grasp项目 三、配置环境 1、基于graspnet-baseline项目进行开发 (1)下载 graspnet-baseline项目 (2)修改graspnet-baseline的requirements.txt,…...
黑马商城项目(一)MybatisPlus
一、快速入门 入门案例: 常见注解: 常见配置: 条件构造器(wrapper): 案例: Testvoid testUpdateByWrapper(){List<Long> ids List.of(1L,2L,3L);UpdateWrapper<User> userUpdateWrapper new UpdateWrapp…...
Linux系统编程 day2
系统调用 由操作系统实现并提供给外部应用程序的编程接口(API)。是应用程序同系统之间数据交换的桥梁。 文件IO 函数 open/close函数 头文件 #include<fcntl.h> #include<unistd.h>int open(const char*pathname , int flags) int open(const char*pathname , …...
告别繁琐,拥抱简洁:初识 Pytest 与环境搭建 (Pytest系列之一)
在 Python 自动化测试领域,Pytest以其简洁、灵活和强大的特性,越来越受到广大测试工程师和开发者的青睐。如果你还在为繁琐的测试框架而苦恼,或者希望提升你的 Python 测试效率,那么 Pytest 绝对值得你深入了解和使用。 本文将带…...
浏览器运行Pytorch无法启用显卡
注意 我启用高性能之后,结果蓝屏了。无语Thinkpad T14p!!! 仅供参考。 问题与方案 在浏览器里面用Jupyter编写python程序,进行网络模型训练。 里面导入了PyTorch,但是并没有启用显卡执行: 也…...
天元证券|8家汽车零部件上市公司一季度业绩预喜
近日,中国汽车工业协会发布的数据显示,今年一季度,我国汽车产量为756.1万辆,同比增长14.5%;汽车销量为747万辆,同比增长11.2%。 受益于前三个月汽车产、销量同比双增,上游产业链公司交出了一份可…...
C语言学习之sizeof函数和strlen函数
经过我们之前的学习,已经接触过很多次sizeof函数和strlen函数了,应用他们来求解数组大小等等。但是实际应用中两者的差别还是很大的,接下来我们就来了解一下吧。 sizeof函数 sizeof函数计算的是变量所占内存空间的大小的,单位是字…...
从 “经验养生” 到 “数据养生”:智慧养老如何终结 “伪科学”?
在养老养生领域,长期以来 “经验养生” 占据主导地位,各种未经科学验证的说法和做法流传甚广,其中不乏 “伪科学” 内容,给老年人的健康和生活带来诸多误导。 随着智慧养老的兴起,“数据养生” 模式逐渐崭露头角&…...
什么是跨域问题以及其解决方案
一、什么是跨域? 1.1. 什么是同源策略?1.2. 同源策略限制以下几种行为 二、常见的跨域场景三、9种跨域解决方案 1. JSONP跨域 1.1. 原生JS实现1.2. jquery Ajax实现1.3. Vue axios实现 2. CORS 跨域资源共享 (前端不需要做任何改变࿰…...
Go之Slice和数组:深入理解底层设计与最佳实践
在Go语言中,数组(Array)和切片(Slice)是两种看似相似却本质不同的数据结构。本文将深入剖析它们的底层实现机制,并结合实际代码示例,帮助开发者掌握核心差异和使用场景。 一、基础概念ÿ…...
快速部署大模型 Openwebui + Ollama + deepSeek-R1模型
背景 本文主要快速部署一个带有web可交互界面的大模型的应用,主要用于开发测试节点,其中涉及到的三个组件为 open-webui Ollama deepSeek开放平台 首先 Ollama 是一个开源的本地化大模型部署工具,提供与OpenAI兼容的Api接口,可以快速的运…...
RF connect SDK 修改蓝牙address的方法
目录 概述 1 静态设置蓝牙地址(编译时配置) 1.1 通过 prj.conf 文件设置 1.2 通过 overlay 文件设置 2 动态修改蓝牙地址(运行时修改) 2.1 使用 bt_addr_le_t 结构 2.2 使用 bt_set_id_addr(适用于 Public Add…...
MuJoCo(Multi-Joint Dynamics with Contact)机器人仿真器存在的问题
MuJoCo物理引擎计算接触力的核心思路,是通过数学优化的方式同时满足多个物理约束,而不是简单地为每个碰撞点单独计算作用力。它的工作流程可以理解为几个阶段的紧密配合。首先,仿真器会快速检测所有可能发生接触的物体表面,筛选出…...
IDEA远程Debug调试
最近开发一个功能,因为环境问题,本地无法正常将多个微服务都启动成功。 另外接手了一个新活, 逻辑比较复杂,需要去研究一下测试一下原来的功能逻辑。方便找到新任务功能点的切入点。这才了解到Idea远程debug调试的功能。 本文章…...
爱普生有源晶振SG2016VHN在网络服务器中的应用
在数字化浪潮席卷全球的当下,网络服务器作为数据存储、处理与传输的核心枢纽,其性能的稳定与高效直接关系到整个网络生态的正常运转。从企业内部的数据管理,到互联网服务提供商的大规模数据运算,网络服务器需要应对海量数据的高速…...
【差分隐私相关概念】瑞丽差分隐私(RDP)命题2
分步解析与答案 1. c-稳定变换的定义 c-稳定变换是一种将群体数据集(如数据库集合)的相邻性映射到个体数据集(如单条记录变化)的变换。具体来说,若变换 g : D ′ → D g: \mathcal{D} \to \mathcal{D} g:D′→D 是 …...
大前端基础学习
一、cs架构和bs架构 c:客户端, b:浏览器(无需安装,无需更新,可跨平台)√ s:server服务端,帮我们保 存信息,传递信息 二、 altshift向下键向下复制一行 …...
Spring Batch 专题系列(四):配置与调度 Spring Batch 作业
1. 引言 在上一篇文章中,我们详细探讨了 Spring Batch 的核心组件(Job、Step、Chunk、ItemReader、ItemProcessor、ItemWriter),并通过示例展示了它们的协作方式。掌握了这些组件后,接下来需要了解如何灵活配置 Spring Batch 作业,并通过调度机制控制作业的执行时机。本…...
Android 项目配置文件解释
Android 项目配置文件解释 目录 Android 项目配置文件解释1. `plugins` 块2. `android` 块3. `dependencies` 块为什么需要 JDK 和 Kotlin1. plugins 块 plugins {id com.android.applicationid org.jetbrains.kotlin.android }id com.android.application:应用 Android 应用…...
uniapp 自定义tabbar
v3 写法 <template><view class"" v-if"Data.imgurl"><view class"tabbars" ref"tabbars" id"tabbars"><view class"flex jsa"><view class"tabbarc_li" click"go(/p…...
C++高级2 智能指针
智能指针介绍 裸指针 int * p new int(10); *p 30; delete p; 必须要手动释放 智能指针 保证能做到资源的自动释放,利用栈上的对象出作用域自动析构的特征,来做到资源的自动释放的 实现一个简单的智能指针 class Cptr { public:Cptr(T* ptr …...
【FPGA】——DDS信号发生器设计
目录 一 、IP核的使用 (1)RAM IP核 (2)FIFO IP核 二、DDS信号发生器设计 (1)代码 (2)仿真波形 一 、IP核的使用 IP核:ASIC或FPGA中预先设计好具有某种功能的电路模块,参数可修改…...
mysql按条件三表并联查询
下面为你呈现一个 MySQL 按条件三表并联查询的示例。假定有三个表:students、courses 和 enrollments,它们的结构和关联如下: students 表:包含学生的基本信息,有 student_id 和 student_name 等字段。courses 表&…...
centos 7 docker创建的postgres数据库状态检查
一 、打开finalshell 连接主机 二、检查docker状态,以下信息表示数据库准备好连接了 注意:当finalshell可以访问主机,但没有准备信息时,重启centos系统试试 docker logs postgres 三、如果是传统安装 基于 systemd 的系统(如 CentOS 7 及以上、Ubuntu 16.04 及以…...
基于EasyX库开发的球球大作战游戏
目录 球球大作战 一、开发环境 二、流程图预览 三、代码逻辑 1、初始化时间 2、设置开始界面大小 3、设置开始界面 4、让玩家选择速度 5、设置玩家小球、人机小球、食物的属性 6、一次性把图绘制到界面里 7、进入死循环 8、移动玩家小球 9、移动人机 10、食物刷新…...
ES和MySQL概念对比
基本概念 ES和MySQL都属于数据库,不过各有各的特性,大致使用方法与MySQL类似并无区别。 MySQL:擅长事务持有ACID的特性,确保数据的一致性和安全。 ES:持有倒排索引,适合海量数据搜索和分析。 ES和MySQL如何…...
Kotlin 与 Jetpack Compose 参数设计完全指南
作为 Kotlin 和 Jetpack Compose 开发者,合理的参数设计能显著提升代码的可读性和易用性。本文将系统整理各类参数规则,帮助您编写更优雅的 API。 一、基础参数规则 1. 方法参数 // 基础定义 fun 方法名(必需参数: 类型, 可选参数: 类型 默认值): 返…...
dea如何使用git
在 IntelliJ IDEA 中使用 Git 的详细步骤如下,分为配置、基础操作和高级功能,适合新手快速上手: 一、配置 Git 安装 Git 下载并安装 Git,安装时勾选“Add to PATH”。验证安装:终端输入 git --version 显示版本…...
git -- 版本控制介绍(分布式系统),git介绍(对待数据的方式,本地执行,保证完整性,只添加数据,git文件/项目的三种状态,基本的工作流程)
目录 版本控制 介绍 分布式版本控制系统 git 介绍 与多个远程仓库协作 对待数据的方式 本地执行操作 保证完整性 只添加数据 三种状态 工作区 暂存区 Git 目录 基本的git工作流程 版本控制 介绍 一种记录一个或多个文件内容变化的系统,它可以让你在未来…...
嵌入式软件OTA升级,有哪几种Flash划分方式?
第一次接触嵌入式软件OTA升级的时候,我整个人也是懵的。Flash划分?什么鬼?不是直接把新程序烧进去就完事了吗? 结果一上手才发现,这玩意没那么简单,尤其是Flash怎么分,如果Flash划分没弄好&…...
游戏引擎学习第226天
引言,计划 我们目前的目标是开始构建“元游戏”结构。所谓元游戏,指的是不直接属于核心玩法本身,但又是游戏体验不可或缺的一部分,比如主菜单、标题画面、存档选择、选项设置、过场动画等。我们正在慢慢将这些系统结构搭建起来。…...
通过python实现bilibili缓存视频转为mp4格式
需要提前下好ffmpeg import os import fnmatch import subprocess Bilibili缓存的视频,*280.m4s结尾的是音频文件,*050.m4s结尾的是视频,删除16进制下前9个0,即为正常音/视频 使用os.walk模块,遍历每一个目录…...
Windows 图形显示驱动开发-WDDM 1.2功能—无显示器系统支持
一、架构设计与启动流程 1.1无显示器系统启动与全流程 graph TDA[UEFI固件] -->|FADT.VGA_NOT_PRESENT1| B[Windows Boot Manager]B -->|加载winload.efi| C[内核初始化]C -->|检测显示设备| D{存在GPU?}D -->|是| E[加载WDDM驱动]D -->|否| F[激活MSBDD虚拟…...
低代码 Web 组态
低代码配置式 Web 组态是一种用于创建 Web 应用程序界面的技术,它允许用户通过图形化界面和少量的代码或无需编写大量代码来配置和定制 Web 页面的布局、外观和交互功能。 一、特点 1、低代码或无代码开发:大大降低了开发门槛,无需专业的编程…...
解决7穴连接器的信号完整性问题
在汽车发动机的系统设计中,信号传输是不可或缺的。在信号传输中起着重要作用的一个关键组件是 7 穴连接器,它提供许多重要功能。 但是,这些连接器可能会遇到一些制造商需要解决的问题,知道如何解决 7 腔连接器中的信号完整性问题…...