图像挖掘课程笔记-第一章:了解机器视觉
一、什么是图像挖掘(Image Mining)?
图像挖掘是一种从大量图像中自动提取有用信息、知识或模式的技术,它融合了图像处理、机器学习、数据库、人工智能、数据挖掘等多个领域的内容。
🧠 图像挖掘与图像处理的区别
-
图像处理:对图像本身进行操作,如滤波、去噪、增强、变换、压缩等,更侧重于图像的改善和变化。
-
图像挖掘:在处理图像基础上进一步提取高层次的信息,识别其中的模式、结构和语义,关注图像背后的知识。
🔍 应用场景举例
-
医学图像分析
-
CT、MRI、X光片中识别病变区域(如肿瘤检测)
-
自动辅助医生做出诊断
-
-
交通监控系统
-
自动识别车牌、车辆违章行为
-
智能交通流量控制
-
-
遥感图像分析
-
卫星图像监测土地使用、森林变化、城市扩张
-
-
电商图像推荐系统
-
根据用户浏览的商品图像推送相似款(如衣服、鞋子)
-
-
人脸识别与安防监控
-
门禁系统通过人脸识别身份
-
监控系统中识别特定人物行为
-
-
社交媒体图像分析
-
情绪识别、图像内容过滤、标签推荐等
-
二、什么是数字图像?
数字图像是把现实世界中的连续图像通过**采样(Sampling)和量化(Quantization)**过程转为离散形式。
-
采样:将连续图像空间划分为有限数量的像素点(如每英寸多少像素)
-
量化:将每个像素的颜色或灰度值转换为固定的数字值(如8位表示256种灰度)
数字图像实际上就是一个二维矩阵,每个矩阵单元(像素)记录颜色或灰度值。
三、图像的基础属性
1️⃣ 分辨率(Resolution)
-
表示图像的像素维度,常用“宽 × 高”表示,例如 1920×1080 表示宽1920像素,高1080像素。
-
总像素数 = 宽 × 高
-
决定图像显示时的精细程度。
📱 示例:手机拍照时标注的 12MP(1200万像素),可能对应的是图像分辨率为 4000×3000。
💡 分辨率越高 → 图像更细腻 → 文件体积更大。
2️⃣ 图像深度(Bit Depth)
-
描述图像中每个像素所能表示颜色的种类。
-
表示每个像素需要用多少位(bit)表示:
-
1位:2种颜色(黑/白)
-
8位:256级灰度
-
24位:RGB各占8位,共2^24 ≈ 1677万色
-
🔢 深度越大,图像颜色越丰富,细节越平滑,但文件体积也越大。
3️⃣ 图像通道(Channel)
-
通道表示图像中独立记录颜色或灰度信息的维度。
-
灰度图:1 个通道(亮度)
-
彩色图(RGB):3 个通道
-
带透明度(RGBA):4 个通道,A 是透明通道
-
📌 每个通道都是一张灰度图,用于存储颜色中某一部分的信息。
4️⃣ 灰度值(Grayscale Value)
-
灰度图中像素的亮度强度:
-
范围通常为 0~255
-
0 = 黑,255 = 白,中间值表示不同程度的灰色
-
🧠 灰度图常用于边缘检测、图像分割等场景中,因为颜色信息对结构识别不是必须的。
四、图像内存大小的计算方式
位图图像在未压缩状态下,占用内存计算如下:
图像大小(比特) = 宽度 × 高度 × 像素深度(每像素位数)
图像大小(字节) = 上式 ÷ 8
图像大小(KB) = 字节 ÷ 1024
图像大小(MB) = KB ÷ 1024
📌 示例:一张 1920×1080 的 24 位彩色图
-
位数 = 1920 × 1080 × 24 = 49,766,400 bits
-
字节 = 6,220,800 Bytes
-
大约是 5.93 MB(未压缩)
💡 图像压缩(如JPG、PNG)会大幅降低文件体积。
五、图像按颜色类型的分类
-
二值图像(Binary Image)
-
每像素1位(0或1),表示黑或白
-
应用:OCR识别、轮廓提取、图像掩模
-
-
灰度图像(Grayscale Image)
-
每像素用8位表示灰度,共256阶灰度
-
应用广泛于图像分析和模式识别中
-
-
彩色图像(Color Image)
-
每像素有多个颜色通道(一般为RGB)
-
每通道8位,共24位色彩 → 可表示1677万种颜色
-
应用于人眼可视的图像场景,如照片、视频
-
六、常见问题通俗解释
❓ 分辨率决定了什么?
就像画布被分成多少小格子,每个格子一个颜色。格子越小越多,细节越丰富。
❓ 图像深度是啥?
是每个格子可装颜色的"颜色盒"大小,深度越高,能放的颜色种类越多。
❓ 灰度值的意义?
灰度值就是黑白图中像素的明暗程度,0是最黑,255是最白。
❓ 分辨率越大内存占得越多?
是的,每个像素都需要储存颜色信息,像素越多,占用的空间就越大。
❓ 压缩是不是就是降分辨率?
部分压缩方式会降低分辨率,也有的通过色彩编码、无损压缩(如PNG)来减小空间。
❓ 图像可以放大变清晰吗?
可以放大,但清晰度不会提升。除非使用超分辨率技术(如AI模型)进行推断填补细节,否则只是"模糊拉伸"。
七、图像挖掘的基本流程
-
图像采集:从相机、传感器或数据库获取图像;
-
图像预处理:去噪、增强、缩放、标准化等;
-
特征提取:提取颜色、纹理、形状、边缘等特征;
-
特征选择/降维:选出最有代表性的特征;
-
建模与分析:使用机器学习/深度学习模型进行训练;
-
知识发现与应用:输出分类、检测结果、标签或推荐等。
八、图像挖掘中的机器学习简介
图像挖掘离不开机器学习,它为图像中的模式识别和分类提供了强大的工具。
📌 什么是机器学习?
机器学习是一种通过数据自动构建模型并进行预测或分类的技术,不需要显式地编程规则。
🔑 在图像挖掘中的作用:
-
图像分类(如猫狗识别、人脸识别)
-
图像目标检测(找到图中物体位置)
-
图像分割(将图像划分成不同区域)
-
特征降维(如主成分分析PCA)
📚 常用的机器学习方法:
-
监督学习:如KNN、SVM、决策树、随机森林、逻辑回归等
-
无监督学习:如K均值聚类、主成分分析(PCA)等
-
深度学习:基于神经网络(CNN)进行端到端学习,适用于大规模图像数据
💬 机器学习的模型训练,核心在于“数据 + 特征 + 算法”。
✅ 总结
图像挖掘是一门融合技术,需要掌握数字图像的基本知识。理解分辨率、图像深度、灰度、通道这些基础属性,有助于后续学习图像预处理、特征提取、分类与识别等更高级的图像挖掘任务。
同时,借助机器学习算法,图像中的隐藏知识才能真正被“挖掘”出来。
后续学习图像挖掘,就是在学习如何将机器学习的算法和思想,应用到图像数据上,解决各种视觉分析任务。具体来说,就是把机器学习里的模型(比如 SVM、KNN、神经网络等),用于图像的分类、识别、检测、分割等操作
相关文章:
图像挖掘课程笔记-第一章:了解机器视觉
一、什么是图像挖掘(Image Mining)? 图像挖掘是一种从大量图像中自动提取有用信息、知识或模式的技术,它融合了图像处理、机器学习、数据库、人工智能、数据挖掘等多个领域的内容。 🧠 图像挖掘与图像处理的区别 图像…...
Spring集合注入Bean
Spring框架中实现Bean集合注入的详细方法 1. 基础自动注入方式1.1 使用Autowired注入List1.2 使用Autowired注入Map 2. 更精细的控制方式2.1 使用Qualifier进行筛选2.2 使用自定义注解筛选 3. Java配置类方式4. 排序注入的Bean集合4.1 使用Order注解4.2 实现Ordered接口 5. 条件…...
实验一 进程控制实验
一、实验目的 1、掌握进程的概念,理解进程和程序的区别。 2、认识和了解并发执行的实质。 3、学习使用系统调用fork()创建新的子进程方法,理解进程树的概念。 4、学习使用系统调用wait()或waitpid()实现父子进程同步。 5、学习使用getpid()和getppi…...
[预备知识]4. 概率基础
概率基础 本章节介绍深度学习中的概率基础知识,包括基本概念、概率分布和统计推断。 1. 概率基础 1.1 基本概念 随机变量:可以取不同值的变量,其值由随机试验的结果决定概率分布:描述随机变量取值的可能性分布条件概率&#x…...
第33周JavaSpringCloud微服务 电商进阶开发
一、课程介绍 1. 定时任务 课程主题 :Spring Cloud 电商进阶开发定时任务定义 :学习什么是定时任务。定时任务学习内容 :定时任务实现方法、cron 表达式。定时任务实践 :在 Spring 中使用 schedule 注解,定期关闭过期…...
基于cubeMX的hal库STM32实现硬件IIC通信控制OLED屏
1、通常的方法是使用软件模拟IIC来实现OLED屏的显示控制,这里用STM32单片机的硬件IIC来实现OLED屏的显示,主控芯片为STM32F103RCT6,正点原子mini开发板。 2、cubemx配置过程 (1)配置时钟和下载 (2&#x…...
游戏工作室为何要更换IP进行多开?工作室使用代理IP要注意什么?
在当今的游戏产业中,游戏工作室为了提升效率、规避风险或突破平台限制,常常需要通过更换IP进行多开操作。这一现象背后涉及技术、商业规则和网络安全等多重因素,而代理IP的选择与使用也成为工作室运营中的关键环节。以下是关于游戏工作室为何…...
postgreSQL 如何使用 dblink
SELECT b.id, flow_name, user_id,u.name FROM bpm_form_info b JOIN vrms_user u on b.user_idu.id dblink SELECT b.id, flow_name, user_id,u.name FROM bpm_form_info b – vrms_user u on b.user_idu.id JOIN dblink( ‘dbnameuser_db userpostgres passwordWs199612’,…...
121.在 Vue3 中使用 OpenLayers 实现去掉鼠标右键默认菜单并显示 Feature 信息
🎯 实现效果 👇 本文最终实现的效果如下: ✅ 地图初始化时绘制一个多边形; ✅ 鼠标 右键点击地图任意位置; ✅ 若命中 Feature,则弹出该图形的详细信息; ✅ 移除浏览器默认的右键菜单,保留地图交互的完整控制。 💡 整个功能基于 Vue3 + OpenLayers 完成,采用 Com…...
复盘20250422
深度分析及个股推荐 1. 行业前景与个股逻辑梳理 从提供的股票信息来看,主要涉及以下行业:合成尼古丁(电子烟)、化工、跨境支付、跨境电商、农药、食品饮料、光刻机、电子商务、造纸等。需结合行业景气度、政策支持、公司核心竞争…...
MQ底层原理
RabbitMQ 概述 RabbitMQ 是⼀个开源的⾼性能、可扩展、消息中间件(Message Broker),实现了 Advanced Message Queuing Protocol(AMQP)协议,可以帮助不同应⽤程序之间进⾏通信和数据交换。RabbitMQ 是由 E…...
30分钟编写十大排序算法完成
import java.util.ArrayList; import java.util.Arrays; import java.util.Collections; import java.util.List;//排序算法 public class test_04_22 {public static void swap(int[] nums, int i, int j){int temp nums[i];nums[i] nums[j];nums[j] temp;}//冒泡排序-稳定…...
为什么家电主板采用GND走线而不是整面铺GND铜
不管什么接地方式,本质是为了使得电流的回流路径最短。只要电流的回流路径最短,怎么都可以! 如下图的芯片的一个信号的回流路径,是一个很糟糕的接地!!!!!!&a…...
NVIDIA 自动驾驶技术见解
前言 参与 NVIDIA自动驾驶开发者实验室 活动,以及解读了 NVIDIA 安全报告 自动驾驶 白皮书,本文是我的一些思考和见解。自动驾驶技术的目标是为了改善道理安全、减少交通堵塞,重塑更安全、高效、包容的交通生态。在这一领域,NVI…...
真我推出首款 AI 翻译耳机,支持 32 种语言翻译
2025 年 4 月 22 日,真我手机官微宣布,其首款 AI 翻译耳机 Buds Air7 Pro 将于 4 月 23 日 16 时正式上市1。这款耳机接入了讯飞星火认知大模型 4.0 Ultra,支持中文与 32 种语言面对面翻译,以及同声传译功能。 除了 AI 翻译功能&a…...
如何简化复杂流程提升执行效率
简化复杂流程、提升执行效率的关键在于:聚焦核心目标、减少冗余环节、推动系统自动化、赋能一线决策、流程分级设计。其中,聚焦核心目标 是流程优化的第一步。流程不该为了“流程而流程”,而应服务于业务目标。Gartner在《数字化运营报告》中…...
动态规划算法:完全背包类问题
前言 现在我们考虑下面的问题: (1)小明有一个背包,背包容积为v,有m种物品,其中第i种物品的价值为val[i],体积为t[i],每样物品有无限个,请问背包内物品总价值最大为多少?…...
数据存储方式补码原码反码
1. 关于数据存储(补码、原码、反码) 有符号类型(Signed Types) 存储方式:现代计算机普遍采用 补码(Two’s Complement) 存储有符号整数。 原码:最高位为符号位(0正&…...
【AAudio】A2dp sink创建音频轨道的源码流程分析
一、AAudio概述 AAudio 是 Android 8.0(API 级别 26)引入的 C/C++ 原生音频 API,专为需要低延迟、高性能音频处理的应用设计,尤其适用于实时音频应用(如音频合成器、音乐制作工具、游戏音效等)。 1.1 主要特点 低延迟:通过减少音频数据在内核与用户空间之间的拷贝,直…...
黑马点评之Feed流技术实现关注推送与滚动分页查询
Feed流 关注推送也叫做Feed流,直译为“投喂”。为用户持续的提供“沉浸式体验”,通过无限下拉刷新获取新的信息。 Feed流(信息流)是一种常见的内容分发形式,通过动态更新的内容列表向用户展示个性化或实时信息。典型应…...
vue3+canvas裁剪框样式【前端】
目录 canvas绘制裁剪框:拖拽改变框的大小:圆圈样式:方块样式: canvas绘制裁剪框: // 绘制裁剪框 const drawCropRect (ctx: CanvasRenderingContext2D): void > {if (cropRect.value.width > 0 && crop…...
Python 设计模式:模板模式
1. 什么是模板模式? 模板模式是一种行为设计模式,它定义了一个操作的算法的骨架,而将一些步骤延迟到子类中。模板模式允许子类在不改变算法结构的情况下,重新定义算法的某些特定步骤。 模板模式的核心思想是将算法的固定部分提取…...
usb2.0的硬件知识(一)
一、USB2.0的硬件知识 1.1 USB2.0速率 USB 2.0协议支持3种速率:低速(Low Speed,1.5Mbps)、全速(Full Speed, 12Mbps)、高速(High Speed, 480Mbps);USB Hub、USB设备,也分为低速、全速、高速三种类型。 1.2 USB2.0硬件线序组成 U…...
LangGraph(二)——QuickStart样例中的第二步
目录 1. 添加依赖2. 官网QuickStart——第二步:用工具增强聊天机器人2.1 Tavily Search2.2 简单测试Tavily Search2.3 添加带工具的ChatBot node2.4 添加tool node2.5 添加条件边2.6 可视化StateGraph2.7 构建聊天循环 参考 1. 添加依赖 LangGraph(一)——QuickStar…...
机器学习第二篇 多变量线性回归
数据集:世界幸福指数数据集中的变量有幸福指数排名、国家/地区、幸福指数得分、人均国内生产总值、健康预期寿命、自由权、社会支持、慷慨程度、清廉指数。我们选择GDP per Capita和Freedom,来预测幸福指数得分。 文件一:linear,…...
【MCP Node.js SDK 全栈进阶指南】中级篇(3):MCP高级资源设计
前言 在MCP TypeScript-SDK的初级篇中,我们介绍了资源开发的基础知识,包括静态资源与动态资源的创建、资源模板设计与参数提取,以及基本的资源列表与发现机制。随着应用规模的扩大和复杂性的提高,我们需要更加高级的资源设计方案来应对各种挑战。 本文作为中级篇的第三篇…...
PostgreSQL 常用日志
PostgreSQL 常用日志详解 PostgreSQL 提供了多种日志类型,用于监控数据库活动、排查问题和优化性能。以下是 PostgreSQL 中最常用的日志类型及其配置和使用方法。 一、主要日志类型 日志类型文件位置主要内容用途服务器日志postgresql-<日期>.log服务器运行…...
PostgreSQL认证培训推荐机构
首先来看一张2025年4月份db-engines上的数据库排行情况,前三名是雷打不动的Oracle、MySQL、Microsoft SQL Server,排名第四的就是我们今天的主角 - PostgreSQL数据库,从这张图上可以看出,PostgreSQL数据库的上升超非常明显&#x…...
2025年NISP一级题库试题
NISP一级考试只考50道单选题,难度不算大,话不多说,直接上硬菜! 1、物理销毁的方式不包括() .消磁 B.焚化炉烧毀 C.反复覆写数据 D.机器硏磨粉碎 2、信息安全应该建立贯穿信息系统的整个生命周期…...
pip install pymysql报错
python安装pymysql报错解决 【现象】 很多时候会出现安装pip包报错的问题,看过很多网上教程以及ai都是如下说法: 镜像问题pip版本问题ssh证书问题网络问题… 在遇见这些情况时,上述的各种解决方法都一一实验过但最后都是ERROR。 【解决办…...
达梦官方管理工具 SQLark 更新--不仅支持达梦、Oracle、MySQL,还新增 PostgreSQL 数据库!
SQLark 是一款面向信创应用开发者的数据库开发和管理工具,用于快速查询、创建和管理不同类型的数据库系统,已支持达梦、Oracle、MySQL数据库;在最新的 V3.4 版本中,SQLark 新增了对 PostgreSQL 的支持,兼容 PostgreSQL…...
Windows 同步-互锁变量访问
互锁变量访问 应用程序必须同步对多个线程共享的变量的访问。 应用程序还必须确保对这些变量的作以原子方式执行(完全或根本不执行)。 对正确对齐的 32 位变量的简单读取和写入是原子作。 换句话说,你最终不会只更新变量的一部分;所有位都以…...
前端学习笔记
文章目录 前端主要内容基于脚手架创建前端工程vue的基本使用axios 路由Vue-Router路由组成嵌套路由 状态管理 vuex心得 前端主要内容 HTML、CSS JavaScript axios Vue基础语法(router、vuex、typescript) Element UI 基于脚手架创建前端工程 node.js …...
2025-04-22| Docker: --privileged参数详解
在 Docker 中,--privileged 是一个运行容器时的标志,它赋予容器特权模式,大幅提升容器对宿主机资源的访问权限。以下是 --privileged 的作用和相关细节: 作用 完全访问宿主机的设备: 容器可以访问宿主机的所有设备&am…...
Java八股 深入理解Spring的AOP 面向切面编程 底层 保姆级教程 手写例子
目录 概念 AOP 术语 1. 连接点(Jointpoint): 2. 切入点(Pointcut): 3. 通知(Advice): 4. 方面/切面(Aspect): 5. 引入ÿ…...
macOS安全隐私最佳实践分析
1. 引言 随着数字世界的不断扩展,个人和组织面临的安全与隐私威胁也日益增加。作为专业的安全合规与隐私保护研究团队,Kaamel 对 macOS 系统的安全隐私现状进行了全面分析,并提出了一系列最佳实践建议,旨在帮助用户更好地保护自己…...
WeakSet:JavaScript 中容易被忽视的“弱集合”
目录 WeakSet 详解 基本概念 创建 WeakSet WeakSet 的主要方法 WeakSet 的特性 WeakSet 的使用场景 1. 避免内存泄漏(DOM 元素管理) 2. 临时缓存系统 3. 私有属性模拟 4. 防止循环引用 与其他数据结构的对比 1. WeakSet 没有实例属性 2. We…...
Discuz!+DeepSeek:传统论坛的智能化蜕变之路
在数字化浪潮中,社区论坛作为互联网早期的产物,面临着功能单一、用户体验滞后的发展瓶颈。虎跃办公(https://www.huyueapp.com)通过Discuz!搭建的网址导航网站,在集成DeepSeek的AI能力后,成功实现了从工具导…...
vs2017中,将CMake构建目录设置在项目目录下
修改CMake构建目录位置 在Visual Studio 2017中,可以通过以下方法将CMake构建目录设置在项目目录下: 修改CMakeSettings.json文件: 在VS中生成CMakeSettings.json文件(通过点击编译平台按钮如x64-Debug或x64-Release…...
跨平台.NET 版本 使用率排名
截至2025年4月,跨平台.NET版本的安装使用率排名主要基于版本支持状态、性能优化和企业迁移趋势。以下是结合微软官方政策、行业动态及开发者行为分析的综合结论: 1. .NET 8 (LTS) 占据主导地位 支持周期:作为2023年11月发布的长期支持&…...
基于无障碍跳过广告-基于节点跳过广告
2025-04-22 一些广告的关闭是叉图标,获取到的信息也没什么特征,这种广告怎么跳过 用autojs无障碍的节点定位ui控件位置,点击...
STM32提高篇: WIFI通讯
STM32提高篇: WIFI通讯 一.WIFI通讯介绍1.WiFi的频段5G和2.4G2.WiFi的信道二.ESP32固件烧录及驱动1.一个AT指令响应的完成2.测试其他指令三.Wifi功能初始化和TCP通讯四.volatile关键字一.WIFI通讯介绍 Wi-Fi,又称“无线网路”,是Wi-Fi联盟的商标,一个基于IEEE 802.11标准的…...
资本怪兽贝莱德投资数据分析报告-独家
贝莱德概述 贝莱德集团是全球最大的资产管理公司,其管理的资产规模达到了11.6万亿美元(约合人民币84.18万亿元),这个数字相当于中国2024年GDP的62%。贝莱德通过收购李嘉诚旗下的43个全球港口资产,将在全球运营约100个港口。此外,…...
操作系统-用户级-内核级线程
一、先明确几个基本概念: 用户级线程(ULT): 完全由用户空间的线程库(如 pthread 或 green threads)管理。 操作系统内核对此一无所知。 切换线程时,不需要进入内核,效率高…...
【深度学习】LoRA:低秩适应性微调技术详解
LoRA:低秩适应性微调技术详解 文章目录 LoRA:低秩适应性微调技术详解1. 引言2. LoRA原理解析2.1 核心思想2.2 数学表达 3. LoRA实现细节3.1 适用层选择3.2 缩放因子3.3 初始化策略 4. 代码实现示例5. LoRA在实际应用中的优势5.1 内存效率5.2 训练速度5.3…...
研发效率破局之道阅读总结(3)工程优化
研发效率破局之道阅读总结(3)工程优化 Author: Once Day Date: 2025年4月22日 一位热衷于Linux学习和开发的菜鸟,试图谱写一场冒险之旅,也许终点只是一场白日梦… 漫漫长路,有人对你微笑过嘛… 全系列文章可参考专栏: 程序的艺术_Once-Day…...
树莓派超全系列教程文档--(40)树莓派config.txt旧版GPIO控制、超频及条件过滤器
树莓派config.txt旧版GPIO控制、超频及条件过滤器 传统GPIO控制enable_jtag_gpio 传统超频选项超频never_over_voltagedisable_auto_turbo 遗留条件过滤器The [HDMI:*] 过滤器 文章来源: http://raspberry.dns8844.cn/documentation 原文网址 传统GPIO控制 &…...
网络基础概念(下)
网络基础概念(上)https://blog.csdn.net/Small_entreprene/article/details/147261091?sharetypeblogdetail&sharerId147261091&sharereferPC&sharesourceSmall_entreprene&sharefrommp_from_link 网络传输的基本流程 局域网网络传输流…...
DES、3DES、SM4 加密算法简介
1. DES(Data Encryption Standard) 设计时间:1975 年(IBM 开发,1977 年被 NIST 采纳为美国联邦标准)。 密钥长度:64 位(实际有效 56 位 8 位校验)。 分组长度…...
如何在 Ansys Icepak AEDT 中设置多个流程以加快仿真速度?
您将学习如何进行正确的设置,以通过增加进程数量来加快仿真速度。 Ansys Icepak AEDT 需要与 Icepak Classic 不同的设置。 要设置要在 Ansys Icepak AEDT 中使用的进程数,您需要按照以下步骤作: 首先,转到“工具 - >选项 - …...