基于FFmpeg命令行的实时图像处理与RTSP推流解决方案
前言
在一些项目开发过程中需要将实时处理的图像再实时的将结果展示出来,此时如果再使用一张一张图片显示的方式展示给开发者,那么图像窗口的反复开关将会出现窗口闪烁的问题,实际上无法体现出动态画面的效果。因此,需要使用码流的方式来展示图像处理后的效果。
FFmpeg是一款开源且广泛使用的码流开发工具,其支持通过调用C库来实现码流处理软件,同时还支持通过调用命令行的方式实现码流相关的功能。FFmpeg由法国天才程序员Fabrice Bellard在2000年时开发初版,后于2004年找到接手人Michael Niedermayer维护到至今。FFmpeg提供了多种多媒体格式的封装和解封装,包括多种音频视频编码、多种协议的流媒体、多种色彩格式转换、多种采样率转换、多种码率转换等。当FFmpeg经过编译后可以获得可执行程序ffmpeg用于码流处理、可执行程序ffplay用于播放各种媒体文件或流、可执行程序ffprobe用于分析媒体文件或媒体流。
使用FFmpeg C库开发的问题
由于多年的发展FFmpeg的C库API在2016年6月26日发布的6.1.6版本后,一些关键API被弃用和替换。比如,弃用初始化API:av_register_all;替换解码、编码API:avcodec_decode_video2,avcodec_encode_video2替换为avcodec_send_frame,avcodec_receive_packet,avcodec_send_frame,avcodec_receive_packet;数据包管理:av_init_packet替换为av_packet_alloc,av_packet_free;以及编解码器上下文管理:av_malloc替换为avcodec_alloc_context3,avcodec_free_context。在学习使用过程中由于网络上的教程或购买的书籍中的内容不一致很容易陷入开发学习错误的陷阱。
假设开发者通过一段时间的学习,将所有需要使用的API区分开来并能够熟练编程。此时,开发者如果没有足够的码流相关的知识,那么又会陷入报错不知是什么原因的另一个陷阱中。在多媒体开发时需要了解视频抽象层(Network Abstraction Layer,NAL)和编码层(Video Coding Layer,VCL),且主要了解NAL。如果没有足够的知识,那么在FFmpeg在实现逻辑上的报错时可能就会束手无策。由图1所示,提示了使用了弃用的像素格式,但是却没有提示可以使用哪些像素格式,且使用格式AV_PIX_FMT_YUV420P能在头文件pixfmt.h中找到,还需要额外的手册说明哪些格式可以使用,学习难度陡峭。
图1 av_make_error_string报错
使用FFmpeg命令行开发实现
由于FFmpeg经过编译之后可以获得ffmpeg、ffplay和ffprobe可执行文件,通过命令行的方式即可实现各种码流处理功能。其中ffmpeg命令行支持的常用选项如下:
选项 | 参数 | 功能 |
-re | 控制码流速度 | |
-i | - | stdin标准输入 |
-i | 多媒体文件 | 指定输入文件 |
-c:v和-c:a | 编码类型 | 修改视频音频编码 |
-f | 封装类型 | 修改封装 |
表1 ffmpeg命令行部分常用选项参数
当需要开发实时图像处理与推流经过处理后的图像为码流数据时,通过stdin的方式向ffmpeg的推流命令行进程中实时写入图像数据即可将码流推流至码流服务器(例用mediamtx作为RTSP码流服务器),如以下实现核心代码所示,在while(1)循环中持续读取图片文件写入ffmpeg进程的标准输入。
command_line = 'ffmpeg -loglevel error -re -framerate {} -i - -c:v libx264 -f rtsp {}'.format(1/frame_duration, RTSP_URL) command_list = shlex.split(command_line) process = subprocess.Popen(command_list, stdin=subprocess.PIPE, text=False) while(1) { with open(real_time_picture, 'rb') as f: process.stdin.write(f.read()) process.stdin.flush() process.stdin.write('q\n'.encode()) process.stdin.flush() } |
在上述实现中,退出process进程需要输入字符q。通过查看FFmpeg的源代码也可以得知,在输入字符q之后,ffmpeg进程需要结束一些处理,同时有必要(ffmpeg保存媒体文件等)时还需要写入文件尾来结束ffmpeg进程处理。
图2 键盘输入q后完整退出ffmpeg进程
命令行ffmpeg也支持通过文件名模式,如pic_name%d.jpg作为选项-i的参数持续读取文件夹中的图片并推流。但是这种方式在进程运行之后就只能遍历完匹配文件名的图片并停止,如果ffmpeg边读取图片,同时修改图片会导致进程异常退出。而且,在windows系统下默认不支持多个进程同时访问修改一个文件。
总结
在需要实时获取图像处理结果的需求中,可以直接只用ffmpeg命令行的方式将实时处理的图片进行推流,通过播放码流的方式查看图片处理结果,并大幅度加速需求的开发进度,减少由于在FFmpeg的API学习中的开发投入。同时,建议使用标准输入的方式将实时处理的图片送入ffmpeg命令行进程和RTSP推流的方式将码流推送至码流服务器,高效利用标准输入的灵活性避免其他问题的出现。
相关文章:
基于FFmpeg命令行的实时图像处理与RTSP推流解决方案
前言 在一些项目开发过程中需要将实时处理的图像再实时的将结果展示出来,此时如果再使用一张一张图片显示的方式展示给开发者,那么图像窗口的反复开关将会出现窗口闪烁的问题,实际上无法体现出动态画面的效果。因此,需要使用码流…...
神经网络笔记 - 感知机
一 感知机是什么 感知机(Perceptron)是一种接收输入信号并输出结果的算法。 它根据输入与权重的加权和是否超过某个阈值(threshold),来判断输出0还是1。 二.计算方式 感知机的基本公式如下: X1, X2 : …...
【双指针】专题:LeetCode 15题解——三数之和
三数之和 一、题目链接二、题目三、题目解析四、算法原理解法一:排序 暴力枚举 利用set去重解法二:排序 双指针处理细节问题1、去重越界问题 2、不漏 五、编写代码六、时间复杂度和空间复杂度 一、题目链接 三数之和 二、题目 三、题目解析 i ! j …...
如何创建一个导入模板?全流程图文解析
先去找到系统内可以上传东西的按钮 把你的模板上传上去,找到对应的fileName 图里的文字写错了,是复制粘贴"filePath"到URL才能下载...
JS自动化获取网站信息开发说明
一、自动获取信息的必要性 1. 提高效率与节省时间 批量处理:自动化可以快速抓取大量数据,比人工手动操作快得多。 24/7 运行:自动化工具可以全天候工作,不受时间限制。 减少重复劳动:避免人工反复执行相同的任务&am…...
Python爬虫-爬取汽车之家各品牌月销量榜数据
前言 本文是该专栏的第54篇,后面会持续分享python爬虫干货知识,记得关注。 在本文中,笔者已整理19篇汽车平台相关的爬虫项目案例。对此感兴趣的同学,可以直接翻阅查看。 而本文,笔者将以汽车之家平台为例子。基于Python爬虫,实现批量爬取“各品牌月销量榜”的数据。废话…...
WPF 调用 OpenCV 库
WPF 调用 OpenCV 库指南 OpenCV 是一个强大的计算机视觉库,WPF 是 Windows 平台的 UI 框架。将两者结合可以实现强大的图像处理和计算机视觉应用。本文将详细介绍如何在 WPF 应用程序中集成和使用 OpenCV 库。 一、准备工作 1. 安装 OpenCV 方法一:通过 NuGet 安装 在 Vi…...
LLM(大语言模型)技术的最新进展可总结
截至2025年4月26日,LLM(大语言模型)技术的最新进展可总结为以下关键方向: 1. 架构创新与性能突破 多模态能力深化:GPT-4o等模型通过统一架构支持文本、图像、音频和视频的跨模态推理,显著提升复杂场景下的…...
Fedora 43 计划移除所有 GNOME X11 相关软件包
Fedora 43 计划移除所有 GNOME X11 相关软件包,这是 Fedora 项目团队为全面拥抱 Wayland 所做的重要决策。以下是关于此计划的详细介绍: 提案内容:4 月 23 日,Neal Gompa 提交提案,建议从 Fedora 软件仓库中移除所有 G…...
解构与重构:“整体部分”视角下的软件开发思维范式
在软件开发的复杂图景中,整体与部分的关系始终是决定项目成败的关键命题。《人月神话》“整体部分”一章以深邃的洞察力,揭示了软件开发过程中系统设计与实现的内在逻辑,不仅探讨了规格说明、设计方法等技术层面的核心要素,更深入…...
NdrpConformantVaryingArrayUnmarshall函数分析--重要
第一部分: void NdrpConformantVaryingArrayUnmarshall( PMIDL_STUB_MESSAGE pStubMsg, uchar ** ppMemory, PFORMAT_STRING pFormat, uchar fMustCopy, uchar fMustAlloc ) { uchar * …...
ZYNQ笔记(十四):基于 BRAM 的 PS、PL 数据交互
版本:Vivado2020.2(Vitis) 实验任务: PS 将字符串数据写入BRAM,再将数据读取出来;PL 从 BRAM 中读取数据,bing。通过 ILA 来观察读出的数据,与前面串口打印的数据进行对照࿰…...
月之暗面开源 Kimi-Audio-7B-Instruct,同时支持语音识别和语音生成
我们向您介绍在音频理解、生成和对话方面表现出色的开源音频基础模型–Kimi-Audio。该资源库托管了 Kimi-Audio-7B-Instruct 的模型检查点。 Kimi-Audio 被设计为通用的音频基础模型,能够在单一的统一框架内处理各种音频处理任务。主要功能包括: 通用功…...
文件操作及读写-爪哇版
文章目录 前言 初识文件文件路径里的符号文件分类文件操作方法文件读写字节流输入输出输入输出 字符流输入输出输入输出 前言 Windows用户需知:“/”和“\”, 文件路径分隔符一般都用“/”,但Windows系统一直保留着“\”,这两种符…...
【matlab】绘制maxENT模型的ROC曲线和omission curve
文章目录 一、maxENT模型二、ROC曲线三、实操3.1 数据提取3.2 绘制ROC曲线3.3 绘制遗漏曲线3.4 多次训练的ROC和测试的ROC 一、maxENT模型 前面的文章已经详细讲过了。 maxENT软件运行后,会生成一个html报告,里面有ROC曲线,但我们往往需要自…...
个人电子白板(svg标签电子画板功能包含正方形、文本、橡皮 (颜色、尺寸、不透明度)、 撤销、取消撤销 等等功能,)
在Http开发中,svg标签电子画板功能包含正方形、文本、橡皮 (颜色、尺寸、不透明度)、 撤销、取消撤销 等等功能, 效果图 代码如下: <!DOCTYPE html> <html lang"en"> <!--<link href&qu…...
Pygame终极项目:从零开发一个完整2D游戏
Pygame终极项目:从零开发一个完整2D游戏 大家好!欢迎来到本期的Pygame教程。今天,我们将从零开始开发一个完整的2D游戏。通过这个项目,你将学习到如何使用Pygame库来创建游戏窗口、处理用户输入、绘制图形、管理游戏状态、实现碰撞检测和音效等。无论你是初学者还是有一定…...
在应用运维过程中,业务数据修改的证据留存和数据留存
在应用运维过程中,业务数据修改的证据留存和数据留存至关重要,以下是相关介绍: 一、证据留存 操作日志记录 : 详细记录每一次业务数据修改的操作日志,包括操作人员、操作时间、修改内容、修改前后数据的对比等。例如,某公司业务系统中,操作日志会精确记录员工小张在 2…...
JAVA JVM面试题
你的项目中遇到什么问题需要jvm调优,怎么调优的,堆的最小值和最大值设置为什么不设置成一样大? 在项目中,JVM调优通常源于以下典型问题及对应的调优思路,同时关于堆内存参数(-Xms/-Xmx)的设置逻…...
C盘爆红如何解决
deepseek来试用一下! 一、快速释放空间 1. 清理临时文件 - **Win R** 输入 %temp% → 删除文件夹内所有内容。 - **Win S** 搜索 “磁盘清理”** → 选择C盘 → 勾选“临时文件”“系统缓存”等 → 点击“清理系统文件”(可额外清理Windows…...
在 Ubuntu24.04 LTS 上 Docker 部署英文版 n8n 和 部署中文版 n8n-i18n-chinese
一、n8n 简介 n8n 是一个低代码(Low-Code)工作流自动化平台,可以帮助用户以非常简单的方式创建自动化流程,连接不同的应用程序和服务。n8n的设计理念是为了让复杂的工作流变得简单易用,同时也支持高度的自定义…...
软件设计案例分析学习笔记
1.软件设计师内容小考 一、单选题 1.(单选题,1.0 分) 下列内聚种类中,内聚程度最高的是 ( )。 A. 功能内聚 B. 逻辑内聚 C. 偶然内聚 D. 过程内聚 第 1 题: 答案:A 解析:功能内聚是指模块内所有元素共同完成一个功能&a…...
魔百盒CM311-3-YST代工-晨星MSO9385芯片-2+8G-免拆卡刷通刷固件包
魔百盒CM311-3-YST代工-晨星MSO9385芯片-28G-免拆卡刷通刷固件包 刷机前准备: 准备一个8G或一下容量的优盘将其格式化为fat32格式;(切记不要用做过电脑系统的优盘,不然刷机直接变砖); 优盘卡刷强刷刷机&am…...
nginx 504 (Gateway Time-out)
目录 1. 后端处理超时 2. Nginx 代理超时设置不足 3. 服务未响应或崩溃 4. 请求体过大 5. 重启nginx 原本代理服务器用的是微软的Kestrel ,今天给项目换用了nginx,然后有个接口请求报了 (504 Gateway Timeout) 请求发送到了…...
WPF 实现PLC数据采集
WPF 数据采集网关系统设计与实现 一、系统概述 本系统是一个基于 WPF 的数据采集网关,支持主流 PLC(可编程逻辑控制器)的数据采集,并将采集到的数据汇总存储到数据库中。系统采用模块化设计,具有良好的扩展性和可维护性。 二、系统架构 1. 整体架构 +---------------…...
llama factory怎么命令行推理图片
根据LLaMA-Factory多模态数据处理规范,配置图片输入需注意以下核心要点: --- **一、本地图片路径配置** 1. 绝对路径配置: json "images": ["/home/user/project/data/mllm_demo_data/1.jpg"] *适用场景*…...
计算机网络 | 应用层(1)--应用层协议原理
💓个人主页:mooridy 💓专栏地址:《计算机网络:自定向下方法》 大纲式阅读笔记 关注我🌹,和我一起学习更多计算机的知识 🔝🔝🔝 目录 1. 应用层协议原理 1.1 …...
刚体运动 (位置向量 - 旋转矩阵) 笔记 1.1~1.3 (台大机器人学-林沛群)
目录 1. 理解刚体的“自由度”(Degrees of Freedom, DOF) 1.1 平面运动 (2D) 1.2 空间运动 (3D) 2. 统一描述:引入“体坐标系”(Body Frame) 3. 从“状态”到“运动”:引入微分 3.1 补充:…...
MES系列-MOM(Manufacturing Operations Management,制造运营管理)
MES系列文章目录 ISA-95制造业中企业和控制系统的集成的国际标准-(1) ISA-95制造业中企业和控制系统的集成的国际标准-(2) ISA-95制造业中企业和控制系统的集成的国际标准-(3) ISA-95制造业中企业和控制系统的集成的国际标准-(4) ISA-95制造业中企业和控制系统的集成的国际标准…...
矩阵系统私信功能开发技术实践,支持OEM
在短视频矩阵系统中,私信功能是连接运营者与用户、用户与用户的重要桥梁。它不仅能提升用户粘性,还能为精准营销提供支持。本文将从需求分析、技术选型、核心功能实现到性能优化,全面解析矩阵系统私信功能的开发过程。 一、功能需求分析 &am…...
leetcode 26和80
leetcode 26. Remove Duplicates from Sorted Array 代码: class Solution { public:int removeDuplicates(vector<int>& nums) {int len nums.size();int slowIdx 1;for(int firstIdx 1; firstIdx < len;firstIdx){if(nums[firstIdx] ! nums[firs…...
微信小程序 template 模版详解
一、什么时候使用template ? 代码复用,维护方便,提高性能 二、模版的基本使用 三、模版样式的使用 四、使用模版 五、使用模版定义的样式,需要在引入的wxml 样式文件中导入样式 六、template模版...扩展符数据传递 可以根据自己…...
北斗导航 | 基于Transformer+LSTM+激光雷达的接收机自主完好性监测算法研究
基于Transformer+LSTM+激光雷达的接收机自主完好性监测算法研究 接收机自主完好性监测(RAIM)是保障全球导航卫星系统(GNSS)定位可靠性的核心技术。传统RAIM算法依赖最小二乘残差法,存在故障漏检、对复杂环境适应性差等问题。结合Transformer、LSTM与激光雷达的多模态融合…...
ASP.NET CORE部署IIS的三种方式
ASP.NET Core 部署方式对比 本文档对比了三种常见的 ASP.NET Core 应用(如你的 DingTalkApproval 项目)部署到 Windows 10 上 IIS 服务器的方式:dotnet publish(手动部署)、Web Deploy(直接发布到 IIS&…...
推荐三款GitHub上高星开源的音乐搜索平台
文章目录 一、Spottube 1. 展示 2. 功能 3. 安装 二、YesPlayMusic 1. 展示 2. 功能 2. 安装 三、Navidrome 1. 展示 2. 功能 3. 安装 一、Spottube 一个开源的跨平台 Spotify 客户端,兼容多个平台,利用 Spotify 的数据 API 和 YouTube、P…...
Linux基础指令【上】
Linux的基本操作 , 是通过指令来执行的! 小贴士:指令很多,但一定要摒弃那种看到知识点就全部死记硬背的坏习惯(因为就算背,也背不完) , 一定要以理解为主,练习为辅 &…...
GPT系列模型-20250426
文章目录 🧠 GPT-4o(Omni)🔬 GPT-4.5(研究预览)🧩 o3 模型系列(o3、o3-mini、o3-mini-high)🧠 o4-mini 和 o4-mini-high🧠 GPT-4o mini🧾 总结对比表🧠 GPT-4o(Omni) 特点:全能型模型,支持文本、图像、音频和视频输入输出,具备强大的多模态处理能力。…...
高精度运算(string函数)
高精度加法 #include<iostream> #include<string> #include<algorithm> using namespace std; string _add(string s1,string s2); int main() {string a,b;cin>>a>>b;cout<<_add(a,b);return 0; } string _add(string s1,string s2) {re…...
探索 AI 在文化遗产保护中的新使命:数字化修复与传承
文化遗产是人类文明的瑰宝,承载着历史的记忆与文化的灵魂。然而,随着时间的推移和自然环境的影响,许多珍贵的文化遗产正面临着损毁和消失的威胁。在这样的背景下,人工智能(AI)技术的出现为文化遗产的保护和…...
Python----深度学习(基于DNN的PM2.5预测)
一、目标 如何使用 PyTorch 实现一个简单的深度神经网络(DNN)模型,并用于回归任务。该模型通过训练数据集来预测PM2.5。代码通过读取数据集、数据处理、模型训练和模型评估等步骤,详细展示了整个实现过程。 二、数据集介绍 Data …...
Android12源码编译及刷机
由于google的AOSP源码拉取经常失败,编译还经常出现各种问题。这里根据香橙派Orange Pi 5 Plus(Android12电视镜像)源码进行编译演示。 RK芯片的开发板可玩性很高,这里以电视版本android系统为例子,学习的同时还可以当…...
TRO再添新案 TME再拿下一热门IP,涉及Paddington多个商标
4月2日和4月8日,TME律所代理Paddington & Company Ltd.对热门IP Paddington Bear帕丁顿熊的多类商标发起维权,覆盖文具、家居用品、毛绒玩具、纺织用品、游戏、电影、咖啡、填充玩具等领域。跨境卖家需立即排查店铺内的相关产品! 案件基…...
如何使用 Spring Boot 实现分页和排序:配置与实践指南
在现代 Web 应用开发中,分页和排序是处理大量数据时提升用户体验和系统性能的关键功能。Spring Boot 结合 Spring Data JPA 提供了简单而强大的工具,用于实现数据的分页查询和动态排序,广泛应用于 RESTful API、后台管理系统等场景。2025 年&…...
asammdf 库的信号处理和数据分析:深入挖掘测量数据
内容概要: 信号处理的基本操作数据分析和统计数据可视化和报告生成 正文: 信号处理的基本操作 asammdf 提供了对信号的基本操作,包括读取、筛选和转换。 读取信号 with asammdf.MDF(nameexample.mf4) as mdf:engine_speed …...
在springboot项目中,如何进行excel表格的导入导出功能?
以下是使用 Apache POI 和 EasyExcel 实现 Excel 表格导入导出功能的具体代码示例。 1. 使用 Apache POI 实现 Excel 导入导出 添加依赖 在 pom.xml 中添加 Apache POI 的依赖: <dependency><groupId>org.apache.poi</groupId><artifactId…...
【C++11】右值引用和移动语义:万字总结
📝前言: 这篇文章我们来讲讲右值引用和移动语义 🎬个人简介:努力学习ing 📋个人专栏:C学习笔记 🎀CSDN主页 愚润求学 🌄其他专栏:C语言入门基础,python入门基…...
29、简要描述三层架构开发模式以及三层架构有哪些好处?
三层架构开发模式概述 三层架构(3-Tier Architecture)是一种将软件系统按功能模块垂直拆分为三个独立逻辑层的经典设计模式,自20世纪90年代提出以来,已成为企业级应用开发的主流范式。其核心思想是通过职责分离和松耦合设计&…...
PotPlayer,强大的高清视频播放器
PotPlayer 是一款强大的的高清视频播放器,兼容多种音频和视频格式,支持多种硬件加速解码,包括DXVA、CUDA、QuickSync等。支持立体视频播放技术、字幕支持、截屏工具以及视频录制等多种功能。文末获取! 1.鼠标右键【PotPlayer】压…...
AI数字人:未来职业的重塑(9/10)
摘要:AI 数字人凭借计算机视觉、自然语言处理与深度学习技术,从虚拟形象进化为智能交互个体,广泛渗透金融、教育、电商等多领域,重构职业生态。其通过降本提效、场景拓展与体验升级机制,替代重复岗位工作,催…...
Qt开发:如何加载样式文件
文章目录 一、加载图片资源二、QSS的使用介绍三、QSS的应用步骤与示例 一、加载图片资源 右键项目->选择"Add New…“之后,会弹出如下界面: 选择Qt->Qt Resource File即可。 点击下一步 点击上图中的LoadImageDemo.qrc文件,右…...