当前位置: 首页 > news >正文

深入学习OpenCV:第一章简介

本专栏为零基础开发者打造,聚焦OpenCV在Python中的高效应用,用100%代码实践带你玩转图像处理!

从 环境配置到实战项目,内容涵盖:

1️⃣ 基础篇:图像读写、阈值处理、色彩空间转换

2️⃣ 进阶篇:轮廓检测、特征匹配、视频流分析

3️⃣ 高级应用:人脸识别、AR增强现实、文档OCR

4️⃣ 工业实战:缺陷检测、运动追踪、医学影像处理

每日解锁一个新技能,通过 20+应用场景案例 如停车位检测、证件照换背景等,深入剖析深度学习与传统CV结合的技巧。专栏强调 工业级代码规范,提供GPU加速优化方案,让OpenCV4.11.0与Python3.11的组合迸发生产力,助你快速构建可落地的视觉系统,开启智能图像处理的全栈之路!

专栏修改履历

专栏的修改内容会在这里进行记录

修改内容修改日期
第一章:简介2025-04-13
第二章:OpenCV Python GUI 模块功能介绍2025-04-14
第三章OpenCV 核心模块介绍(上)2025-04-15
第四章OpenCV 核心模块介绍(中)2025-04-16
第五章OpenCV 核心模块介绍(下)2025-04-17

OpenCV简单介绍


OpenCV(开放源代码计算机视觉库) 是一个基于 Apache 2.0 许可的跨平台计算机视觉库,1999 年由 Intel 研究院发起,核心目标是通过开源技术降低机器视觉开发门槛。它以 C++ 编写,但支持 Python、Java、C# 等接口,尤其在 Python 中因简洁的 API 广受开发者欢迎。

核心功能涵盖

  • 图像处理(滤波、边缘检测、几何变换)
  • 视频分析(运动追踪、背景分割)
  • 物体检测(人脸、车牌识别)
  • 机器学习集成(KNN、SVM、深度学习模型部署)

应用场景:自动驾驶感知、医学影像分析、工业质检、AR特效开发等。支持实时处理,兼容 OpenVINO 和 CUDA 加速,适用于移动端至云端部署。其开源社区活跃,提供 2500+ 优化算法和详细文档,是计算机视觉领域的“瑞士军刀”。


OpenCV Python 环境搭建全攻略:Windows / Linux / Fedora 详细指南

专栏中所有的代码都是基于下面的环境进行测试通过的
环境安装(相关conda的知识请自行学习)

conda create --name opencv python=3.11
conda activate opencv
pip install opencv-python

验证环境安装成功

python -c "import cv2; print(cv2.__version__)"

目录

  1. 安装前的准备工作
  2. Windows 系统安装配置
  3. Ubuntu 系统安装配置
  4. Fedora 系统安装配置
  5. 验证安装与快速测试
  6. 故障排除与常见问题

1. 安装前的准备工作

必要工具与环境

  • Python 版本:推荐 Python 3.8+(OpenCV 对 Python 3.x 支持更完善)
  • 包管理工具
    • pip:Python 默认包管理器
    • 系统级依赖项管理:如 apt(Ubuntu)、dnf(Fedora)、或手动安装(Windows)
  • 虚拟环境(推荐)
    使用 venvconda 隔离项目环境,避免依赖冲突。
# 创建并激活虚拟环境(示例)
python -m venv opencv_env
source opencv_env/bin/activate    # Linux/Mac
opencv_env\Scripts\activate       # Windows

选择合适的 OpenCV 包

包名功能差异推荐场景
opencv-python仅包含基础模块轻量级开发、快速安装
opencv-contrib-python包含完整模块(包括扩展功能)需要 SIFT、深度学习等功能
源码编译安装自定义编译选项,支持 CUDA 加速高性能需求、高级用户

2. Windows 系统安装指南

快速安装(推荐)

# 在虚拟环境中执行(以下三选一)
pip install opencv-python           # 基础版
pip install opencv-contrib-python   # 完整版(支持扩展功能)
pip install opencv-python-headless  # 无 GUI 支持(适用于服务器环境)

手动编译安装(高级用户)

  1. 安装依赖工具
    • Visual Studio(勾选 C++ 开发工具
    • CMake
  2. 克隆 OpenCV 源码
    git clone https://github.com/opencv/opencv.git
    git clone https://github.com/opencv/opencv_contrib.git  # 扩展模块
    
  3. CMake 编译
    使用 GUI 工具配置源码路径(勾选 OPENCV_ENABLE_NONFREE 以启用专利算法)。

3. Ubuntu 系统安装指南

一键安装(APT 仓库)

# 安装系统依赖
sudo apt update
sudo apt install python3-opencv  # 安装预编译包# 验证是否成功
python3 -c "import cv2; print(cv2.__version__)"

使用 pip 安装(推荐最新版)

# 安装通用依赖
sudo apt install python3-pip libgl1-mesa-glx libatlas-base-dev# 通过 pip 安装 OpenCV
pip install opencv-contrib-python

4. Fedora 系统安装指南

DNF 包管理器安装

# 安装 OpenCV
sudo dnf install opencv-python3# 验证安装
python3 -c "import cv2; print(cv2.__version__)"

Pip 安装(定制版本)

# 安装开发工具
sudo dnf install python3-devel gcc-c++# 安装 OpenCV(包含扩展)
pip install opencv-contrib-python

5. 验证安装与快速测试

基础功能测试代码

import cv2# 打印版本信息
print("OpenCV Version:", cv2.__version__)# 读取并显示图像
img = cv2.imread('test_image.jpg')
if img is not None:cv2.imshow('Test Image', img)cv2.waitKey(0)cv2.destroyAllWindows()
else:print("Error: Image not loaded.")

视频捕获测试

cap = cv2.VideoCapture(0)  # 打开默认摄像头
while True:ret, frame = cap.read()if not ret: breakcv2.imshow('Webcam', frame)if cv2.waitKey(1) == ord('q'):break
cap.release()
cv2.destroyAllWindows()

6. 故障排除与常见问题

安装后导入 cv2 报错

错误信息解决方案
ModuleNotFoundError: No module named 'cv2'检查 Python 环境路径,确认虚拟环境是否激活
ImportError: libGL.so.1: cannot open shared object file安装缺失的系统依赖:Ubuntu 下执行 sudo apt install libgl1

视频功能无法使用

  • 问题:无法打开摄像头或读取视频文件
    解决:安装 FFmpeg 支持(Ubuntu/Fedora: sudo apt/dnf install ffmpeg

性能优化建议

  • 启用硬件加速:编译时启用 CUDA 或 OpenCL(需 NVIDIA 显卡驱动)
  • 使用轻量级环境:针对嵌入式设备可选用 opencv-python-headless 减少资源占用

平台对比与总结

操作系统推荐安装方式优势注意事项
Windowspip 直接安装快速便捷,适合新手避免路径包含中文或空格
Ubuntuaptpip 安装依赖管理完善,社区支持强大注意 Python 2/3 版本切换问题
Fedoradnfpip 安装软件包更新快,适合开发者需手动处理部分依赖项

除非不支持,否则都基于windows环境进行学习。

相关文章:

深入学习OpenCV:第一章简介

本专栏为零基础开发者打造,聚焦OpenCV在Python中的高效应用,用100%代码实践带你玩转图像处理! 从 环境配置到实战项目,内容涵盖: 1️⃣ 基础篇:图像读写、阈值处理、色彩空间转换 2️⃣ 进阶篇&#xff…...

汉诺塔问题——用贪心算法解决

目录 一:起源 二:问题描述 三:规律 三:解决方案 递归算法 四:代码实现 复杂度分析 一:起源 汉诺塔(Tower of Hanoi)问题起源于一个印度的古老传说。在世界中心贝拿勒斯&#…...

【双指针】专题:LeetCode 283题解——移动零

移动零 一、题目链接二、题目三、题目解析四、算法原理两个指针的作用以及三个区间总结 五、与快速排序的联系六、编写代码七、时间复杂度、空间复杂度 一、题目链接 移动零 二、题目 三、题目解析 “保持非零元素的相对顺序”,比如,示例1中非零元素1…...

2025-4-12-C++ 学习 XOR 三元组 异或 急转弯问题

C的学习必须更加精进一些,对于好多的函数和库的了解必须深入一些。 文章目录 3513. 不同 XOR 三元组的数目 I题解代码 3514. 不同 XOR 三元组的数目 II题解代码 晚上,10点半,参加了LC的竞赛,ok了一道,哈哈~   第二道…...

[MySQL] 索引

索引 1.为什么有索引?2.MySQL的存储(MySQL与磁盘交互的基本单位)3.小总结4.索引的进一步理解4.1测试案例4.2 理解单个page4.3 理解多个page页目录单页情况多页情况 4.4 B树 VS B树4.5 聚簇索引 VS 非聚簇索引1.非聚簇索引2.聚簇索引 5.索引操…...

软考高级--案例分析

架构风格 重点 交互方式数据结构控制结构扩展方法 分类 管道-过滤器风格 数据流 数据仓储风格 星型结构以数据为中心,其他构件围绕数据进行交互 企业服务总线esb 定义 以一个服务总线充当中间件的角色,把各方服务对接起来,所有服务…...

Go - 内存逃逸

概念 每个函数都有自己的内存区域来存放自己的局部变量、返回地址等,这个内存区域在栈中进行分配。当函数结束时,这段内存区域会进行释放。 但有些变量,我们想在函数结束后仍然使用它,那么就要把这个变量在堆上分配,这…...

【数字电路】第四章 组合逻辑电路

一、组合逻辑电路的概述 1.逻辑电路的分类 2.逻辑功能的描述 二、组合逻辑电路的分析方法 根据输出可以粗略判断输入的数值的大小。 三、组合逻辑电路的基本设计方法 1.进行逻辑抽象 2.写出逻辑函数式 3.逻辑函数的化简或变换 4.画出逻辑电路图 5.设计验证与工艺设计 转换为…...

提权实战!

就是提升权限,当我们拿到一个shell权限较低,当满足MySQL提权的要求时,就可以进行这个提权。 MySQL数据库提权(Privilege Escalation)是指攻击者通过技术手段,从低权限的数据库用户提升到更高权限&#xff…...

单双线程的理解 和 lua基础语法

1.什么是单进程 ,什么是多进程 当一个程序开始运行时,它就是一个进程,进程包括运行中的程序和程序所使用到的内存和系统资源。而一个进程又是由单个或多个线程所组成的。 1.1 像apache nginx 这类 服务器中间件就是多进程的软件 &#xff0…...

深度学习(对抗)

数据预处理:像素标记与归一化 在 GAN 里,图像的确会被分解成一个个像素点来处理。在你的代码里,transform transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))]) 这部分对图像进行了预处理: tra…...

【NLP】 18. Tokenlisation 分词 BPE, WordPiece, Unigram/SentencePiece

1. 翻译系统性能评价方法 在机器翻译系统性能评估中,通常既有人工评价也有自动评价方法: 1.1 人工评价 人工评价主要关注以下几点: 流利度(Fluency): 判断翻译结果是否符合目标语言的语法和习惯。充分性…...

详解MYSQL表空间

目录 表空间文件 表空间文件结构 行格式 Compact 行格式 变长字段列表 NULL值列表 记录头信息 列数据 溢出页 数据页 当我们使用MYSQL存储数据时,数据是如何被组织起来的?索引又是如何组织的?在本文我们将会解答这些问题。 表空间文…...

lwip移植基于freertos(w5500以太网芯片)

目录 一、背景二、lwip移植基于w5500(MACPHY,数据链路层和物理层)1.移植需要的相关文件2、协议栈层级调用3、w5500关键初始化说明 三、附录 一、背景 1.OSI七层模型 图片来自网络 lwip协议栈工作在应用层、传输层、网络层; 网卡…...

【TI MSPM0】IQMath库学习

一、与DSP库的区别 二、IQMath库详解 RTS是靠纯软件实现的,而MathACL是靠硬件加速,速度更快 三、工程详解 1.导入工程 2.样例详解 使用一系列的运算来展示IQMath库,使用的是MathACL实现版本的IQMath库 编译加载运行,结果变量叫…...

51单片机 光敏电阻5506与ADC0832驱动程序

电路图 5506光敏电阻光强增加电阻值减小 以上电路实测无光时电压1.5v 有光且较亮时电压2.7v。 转换程序和ADC0832程序如下 // ADC0832引脚定义 sbit ADC_CS P1^2; // 片选信号 sbit ADC_CLK P1^0; // 时钟信号 sbit ADC_DIO P1^1; // 数据线// 获取电压值 - 返回c…...

【Linux】进程创建、进程终止、进程等待

Linux 1.进程创建1.fork 函数2.写时拷贝3.为什么要有写时拷贝? 2.进程终止1.进程退出场景2.退出码3.进程常见退出方法1.main函数return2.exit库函数3._exit系统调用 3.进程等待1.概念2.必要性3.方法1.wait2.waitpid3.参数status4.参数option5.非阻塞轮询 1.进程创建…...

ReliefF 的原理

🌟 ReliefF 是什么? ReliefF 是一种“基于邻居差异”的特征选择方法,用来评估每个特征对分类任务的贡献大小。 它的核心问题是: “我怎么知道某个特征是不是重要?是不是有能力把不同类别的数据区分开?” 而…...

C++ 数据结构之图:从理论到实践

一、图的基本概念 1.1 图的定义与组成 图(Graph)由顶点(Vertex)和边(Edge)组成,形式化定义为: G (V, E) 顶点集合 V:表示实体(如城市、用户) …...

机器学习(5)——支持向量机

1. 支持向量机(SVM)是什么? 支持向量机(SVM,Support Vector Machine)是一种监督学习算法,广泛应用于分类和回归问题,尤其适用于高维数据的分类。其核心思想是寻找最优分类超平面&am…...

C++学习之使用OPENSSL加解密

目录 1.知识点概述 2.哈希的特点和常用哈希算法散列值长度 3.Linux下openss相关的安装问题 4.md5 api 5.其他哈希算法使用 6.sha1测试 7.哈希值的封装 8.非对称加密特点和应用场景 9.生成密钥对-rsa 10.在内存中生成rsa密钥对-代码 11.将密钥对写入磁盘 12.使用bio方…...

markdown导出PDF,PDF生成目录

1、vscode中安装markdown插件,将编辑的文件导出PDF。 2、安装PDF Guru Anki软件 百度网盘:通过网盘分享的文件:PDFGuruAnki 链接: https://pan.baidu.com/s/1nU6avM7NUowhEn1FNZQKkA 提取码: aues PDF中不同的标题需要通过矩形框标注差异&a…...

Node.js中Stream模块详解

Node.js 中 Stream 模块全部 API 详解 一、Stream 基础概念 const { Stream } require(stream);// 1. Stream 类型 // - Readable: 可读流 // - Writable: 可写流 // - Duplex: 双工流 // - Transform: 转换流// 2. Stream 事件 // - data: 数据可读时触发 // - end: 数据读…...

Swift的学习笔记(一)

Swift的学习笔记(一) 文章目录 Swift的学习笔记(一)元组基本语法1. **创建元组**2. **访问元组的值**3. **命名的元组**4. **解构元组**5. **忽略某些值** 可选值类型定义 OptionalOptional 的基本使用1. **给 Optional 赋值和取值…...

3.4 函数单调性与曲线的凹凸性

1.函数单调性的定义 1.1.判别法 2.函数凹凸性 2.1 判别法...

随机森林优化 —— 理论、案例与交互式 GUI 实现

目录 随机森林优化 —— 理论、案例与交互式 GUI 实现一、引言二、随机森林基本原理与超参数介绍2.1 随机森林概述2.2 随机森林中的关键超参数 三、随机森林优化的必要性与挑战3.1 优化的重要性3.2 调优方法的挑战 四、常见的随机森林优化策略4.1 网格搜索(Grid Sea…...

Pytorch深度学习框架60天进阶学习计划 - 第41天:生成对抗网络进阶(一)

Pytorch深度学习框架60天进阶学习计划 - 第41天:生成对抗网络进阶(一) 今天我们将深入探讨生成对抗网络(GAN)的进阶内容,特别是Wasserstein GAN(WGAN)的梯度惩罚机制,以及条件生成与无监督生成…...

62. 不同路径

前言 本篇文章来自leedcode,是博主的学习算法的笔记心得。 如果觉得对你有帮助,可以点点关注,点点赞,谢谢你! 题目链接 62. 不同路径 - 力扣(LeetCode) 题目描述 思路 1.如果m1或者n1就只…...

使用Apache POI实现Java操作Office文件:从Excel、Word到PPT模板写入

在企业级开发中,自动化处理Office文件(如Excel报表生成、Word文档模板填充、PPT批量制作)是常见需求。Apache POI作为Java领域最成熟的Office文件操作库,提供了一套完整的解决方案。本文将通过实战代码,详细讲解如何使…...

基于 RabbitMQ 优先级队列的订阅推送服务详细设计方案

基于 RabbitMQ 优先级队列的订阅推送服务详细设计方案 一、架构设计 分层架构: 订阅管理层(Spring Boot)消息分发层(RabbitMQ Cluster)推送执行层(Spring Cloud Stream)数据存储层(Redis + MySQL)核心组件: +-------------------+ +-------------------+ …...

设计模式(8)——SOLID原则之依赖倒置原则

设计模式(7)——SOLID原则之依赖倒置原则 概念使用示例 概念 高层次的类不应该依赖于低层次的类。两者都应该依赖于抽象接口。抽象接口不应依赖于具体实现。具体实现应该依赖于抽象接口。 底层次类:实现基础操作的类(如磁盘操作…...

oracle COUNT(1) 和 COUNT(*)

在 Oracle 数据库中,COUNT(1) 和 COUNT(*) 都用于统计表中的行数,但它们的语义和性能表现存在一些细微区别。 1. 语义区别 COUNT(*) 统计表中所有行的数量,包括所有列值为 NULL 的行。它直接针对表的行进行计数,不关心具体列的值…...

理想汽车MindVLA自动驾驶架构核心技术梳理

理想汽车于2025年3月发布的MindVLA自动驾驶架构,通过整合视觉、语言与行为智能,重新定义了自动驾驶系统的技术范式。以下是其核心技术实现的详细梳理: 一、架构设计:三位一体的智能融合 VLA统一模型架构 MindVLA并非简单的端到端模…...

基于FPGA的智能垃圾桶设计-超声波测距模块-人体感应模块-舵机模块 仿真通过

基于FPGA的智能垃圾桶设计 前言一、整体方案二、仿真波形总结 前言 在FPGA开发平台中搭建完整的硬件控制系统,集成超声波测距模块、人体感应电路、舵机驱动模块及报警单元。在感知层配置阶段,优化超声波回波信号调理电路与人体感应防误触逻辑&#xff0…...

[极客大挑战 2019]Upload

<script language"php">eval($_POST[shell]);</script>​ ​ <script language"php">#这里写PHP代码哟&#xff01; </script>​ ​ BM <script language"php">eval($_POST[shell]);</script>GIF89a <…...

操作系统基础:05 系统调用实现

一、系统调用概述 上节课讲解了系统调用的概念&#xff0c;系统调用是操作系统给上层应用提供的接口&#xff0c;表现为一些函数&#xff0c;如open、read、write 等。上层应用程序通过调用这些函数进入操作系统&#xff0c;使用操作系统功能&#xff0c;就像插座一样&#xf…...

“堆积木”式话云原生微服务架构(第一回)

模块1&#xff1a;文章目录 目录 1. 云原生架构核心概念 2. Java微服务技术选型 3. Kubernetes与服务网格实战 4. 全链路监控与日志体系 5. 安全防护与性能优化 6. 行业案例与未来演进 7. 学习路径与资源指引 8. 下期预告与扩展阅读 模块2&#xff1a;云原生架构核心概念 核…...

Java 性能优化:从原理到实践的全面指南

性能优化是 Java 开发中不可或缺的一环&#xff0c;尤其在高并发、大数据和分布式系统场景下&#xff0c;优化直接影响系统响应速度、资源利用率和用户体验。Java 作为一门成熟的语言&#xff0c;提供了丰富的工具和机制支持性能调优&#xff0c;但优化需要深入理解 JVM、并发模…...

基于ssm网络游戏推荐系统(源码+lw+部署文档+讲解),源码可白嫖!

摘要 当今社会进入了科技进步、经济社会快速发展的新时代。国际信息和学术交流也不断加强&#xff0c;计算机技术对经济社会发展和人民生活改善的影响也日益突出&#xff0c;人类的生存和思考方式也产生了变化。传统网络游戏管理采取了人工的管理方法&#xff0c;但这种管理方…...

HTTP:五.WEB服务器

web服务器 定义:实现提供资源或应答的提供者都可以谓之为服务器!web服务器工作内容 接受建立连接请求 接受请求 处理请求 访问报文中指定的资源 构建响应 发送响应 记录事务处理过程 Web应用开发用到的一般技术元素 静态元素:html, img,js,Css,SWF,MP4 动态元素:PHP,…...

synchronized轻量级锁的自旋之谜:Java为何在临界区“空转“等待?

从餐厅等位理解自旋锁的智慧 想象两家不同的餐厅&#xff1a; 传统餐厅&#xff1a;没座位时顾客去逛街&#xff08;线程挂起&#xff0c;上下文切换&#xff09;网红餐厅&#xff1a;没座位时顾客在门口短时间徘徊&#xff08;线程自旋&#xff0c;避免切换&#xff09; Ja…...

基于redis 实现我的收藏功能优化详细设计方案

基于redis 实现我的收藏功能优化详细设计方案 一、架构设计 +---------------------+ +---------------------+ | 客户端请求 | | 数据存储层 | | (收藏列表查询) | | (Redis Cluster) | +-------------------…...

【深度学习与大模型基础】第10章-期望、方差和协方差

一、期望 ——————————————————————————————————————————— 1. 期望是什么&#xff1f; 期望&#xff08;Expectation&#xff09;可以理解为“长期的平均值”。比如&#xff1a; 掷骰子&#xff1a;一个6面骰子的点数是1~6&#x…...

JavaScript 性能优化实战:深入探讨 JavaScript 性能瓶颈,分享优化技巧与最佳实践

在当今 Web 应用日益复杂的时代&#xff0c;JavaScript 性能对于用户体验起着决定性作用。缓慢的脚本执行会导致页面加载延迟、交互卡顿&#xff0c;严重影响用户留存率。本文将深入剖析 JavaScript 性能瓶颈&#xff0c;并分享一系列实用的优化技巧与最佳实践&#xff0c;助你…...

上篇:《排序算法的奇妙世界:如何让数据井然有序?》

个人主页&#xff1a;strive-debug 排序算法精讲&#xff1a;从理论到实践 一、排序概念及应用 1.1 基本概念 **排序**&#xff1a;将一组记录按照特定关键字&#xff08;如数值大小&#xff09;进行递增或递减排列的操作。 1.2 常见排序算法分类 - **简单低效型**&#xff…...

目前状况下,计算机和人工智能是什么关系?

目录 一、计算机和人工智能的关系 &#xff08;一&#xff09;从学科发展角度看 计算机是基础 人工智能是计算机的延伸和拓展 &#xff08;二&#xff09;从技术应用角度看 二、计算机系学生对人工智能的了解程度 &#xff08;一&#xff09;基础层面的了解 必备知识 …...

【复旦微FM33 MCU 底层开发指南】高级定时器ATIM

0 前言 本系列基于复旦微FM33LC0系列MCU的DataSheet编写&#xff0c;提供基于寄存器开发指南、应用技巧、注意事项等 本文章及本系列其他文章将持续更新&#xff0c;本系列其它文章请跳转↓↓↓ 【复旦微FM33 MCU 寄存器开发指南】总集篇 本文章最后更新日期&#xff1a;2025…...

vdso概念及原理,vdso_fault缺页异常,vdso符号的获取

一、背景 vdso的全称是Virtual Dynamic Shared Object&#xff0c;它是一个特殊的共享库&#xff0c;是在编译内核时生成&#xff0c;并在内核镜像里某一段地址段作为该共享库的内容。vdso的前身是vsyscall&#xff0c;为了兼容一些旧的程序&#xff0c;x86上还是默认加载了vs…...

4.13学习总结

学习完异常和文件的基本知识 完成45. 跳跃游戏 II - 力扣&#xff08;LeetCode&#xff09;的算法题&#xff0c;对于我来说&#xff0c;用贪心的思路去写该题是很难理解的&#xff0c;很难想到&#xff0c;理解了许久&#xff0c;也卡了很久。...

Day14:关于MySQL的索引——创、查、删

前言&#xff1a;先创建一个练习的数据库和数据 1.创建数据库并创建数据表的基本结构 -- 创建练习数据库 CREATE DATABASE index_practice; USE index_practice;-- 创建基础表&#xff08;包含CREATE TABLE时创建索引&#xff09; CREATE TABLE products (id INT PRIMARY KEY…...