图像管理与人脸识别工具深度解析
这篇Python应用程序代码实现了一个功能丰富的图像管理和人脸识别工具,它集成了多种实用功能,包括人脸检测与裁剪、屏幕截图以及生成PDF等核心功能。我将深入分析这个应用程序的架构、功能和实现方式,帮助读者理解其设计思路和关键技术点。
C:\pythoncode\new\DetectFaceToJpegInFolder.py
应用概述
这款基于wxPython的桌面应用主要提供以下功能:
- 人脸检测与裁剪:自动从照片中识别并裁剪出人脸
- 屏幕截图工具:支持选区截屏并保存
- 图像管理:浏览、选择和删除已裁剪的图像
- PDF生成:将选定的图像整合到PDF文档中
技术栈分析
应用使用了多种流行的Python库:
- wxPython:构建图形用户界面
- OpenCV:提供人脸检测算法
- PIL (Pillow):处理图像操作
- ReportLab:生成PDF文档
- PyAutoGUI:实现屏幕截图功能
- NumPy:处理图像数据
应用架构解析
整个应用基于一个名为ImageManagerFrame
的主窗口类,它继承自wxPython的wx.Frame
类。界面通过多个功能区域组织,包括人脸识别区域、屏幕截图区域和图像管理区域,每个区域都有相应的控件和事件处理函数。
1. 用户界面布局
程序界面划分为三个主要功能区块:
# --- 人脸识别和裁剪部分 ---
face_sizer = wx.StaticBoxSizer(wx.StaticBox(panel, label="人脸识别和裁剪"), wx.VERTICAL)
# ...# --- 截图功能部分 ---
screenshot_sizer = wx.StaticBoxSizer(wx.StaticBox(panel, label="屏幕截图"), wx.VERTICAL)
# ...# --- 头像显示和管理部分 ---
management_sizer = wx.StaticBoxSizer(wx.StaticBox(panel, label="已裁剪头像管理"), wx.VERTICAL)
# ...
每个区块都有自己的控件集合和事件处理逻辑,界面采用wxBoxSizer
和wxGridSizer
进行布局管理,确保界面元素能够适应窗口大小变化。
2. 人脸检测与裁剪实现
人脸检测功能利用OpenCV的级联分类器(Haar Cascades)实现:
def process_faces(self, source_dir, output_dir):face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')# 处理每个图像文件for filename in os.listdir(source_dir):# ...faces = face_cascade.detectMultiScale(gray, scaleFactor=1.1, minNeighbors=5, minSize=(30, 30))# 为每个检测到的人脸添加padding并保存for i, (x, y, w, h) in enumerate(faces):padding = int(min(w, h) * 0.2) # 20% 的填充# ...face_roi = img[y1:y2, x1:x2]cv2.imwrite(output_path, face_roi)
这段代码展示了如何使用OpenCV进行人脸检测并加入适当的填充,确保裁剪出的人脸区域不会过于紧凑。
3. 缩略图显示与交互
应用通过网格布局展示图像缩略图,并支持选择操作:
def populate_image_grid(self):self.clear_image_grid()for i, filename in enumerate(self.image_files):# ...# 创建空白图像作为底图,保持正方形thumb = Image.new("RGBA", thumb_size, (240, 240, 240, 255))# 缩放原图保持比例img.thumbnail((thumb_size[0]-10, thumb_size[1]-10), Image.Resampling.LANCZOS)# 将缩放后的图像粘贴到正方形底图中央offset = ((thumb_size[0] - img.width) // 2, (thumb_size[1] - img.height) // 2)thumb.paste(img, offset, img)# ...button = wx.BitmapButton(self.image_panel, id=i, bitmap=wx_bitmap, size=thumb_size)button.Bind(wx.EVT_BUTTON, self.on_image_clicked)
这部分设计巧妙地使用PIL创建固定尺寸的正方形缩略图,并将原图按比例缩放后居中放置,保证界面美观一致。
4. 屏幕截图功能
截屏功能结合PyAutoGUI和wxPython实现:
def capture_screen_and_select(self):# 截取整个屏幕screenshot = pyautogui.screenshot()# ...# 创建全屏选择框架self.capture_panel = wx.Frame(None, style=wx.FRAME_NO_TASKBAR | wx.STAY_ON_TOP)# ...self.capture_panel.ShowFullScreen(True)
用户可以在全屏模式下拖拽选择截图区域,实现了类似系统自带截图工具的体验。
5. PDF生成功能
使用ReportLab库将选定的图像生成为PDF文档:
def on_generate_pdf(self, event):# ...c = canvas.Canvas(pdf_path, pagesize=letter)x_offset = 50y_offset = 750for filename in self.selected_images:# ...img = ImageReader(filepath)# ...c.drawImage(img, x_offset, y_offset - draw_height, width=draw_width, height=draw_height)# ...c.save()
这段代码通过计算位置,将多个图像排列在PDF页面上,并在需要时自动添加新页面。
技术亮点
1. 图像处理的细节优化
代码中包含多处图像处理的优化细节:
- 人脸检测时添加适当填充,确保裁剪结果更美观
- 缩略图生成时保持原始图像比例,并居中放置
- 选中图像时添加半透明红色覆盖层,提升视觉反馈
def draw_border(self, filename, selected):# ...if selected:# 绘制更明显的红色边框border_width = 4 # 增加边框宽度for i in range(border_width):draw.rectangle([(i, i), (width-1-i, height-1-i)], outline=(255, 0, 0), width=1)# 添加半透明红色覆盖层以突出显示选择状态overlay = Image.new('RGBA', processed_thumb.size, (255, 0, 0, 0))draw_overlay = ImageDraw.Draw(overlay)draw_overlay.rectangle([(0, 0), (width-1, height-1)], fill=(255, 0, 0, 30))processed_thumb = Image.alpha_composite(processed_thumb, overlay)
2. 用户体验设计
应用注重用户体验,提供了多种定制选项:
- 缩略图尺寸可调(100×100、120×120、150×150)
- 显示列数可选(4列、5列、6列)
- 操作前的确认对话框保护用户数据安全
def on_delete_button(self, event):# ...dlg = wx.MessageDialog(self, f"确定要删除选定的 {len(self.selected_images)} 个头像吗?","确认删除", wx.YES_NO | wx.ICON_WARNING)if dlg.ShowModal() == wx.ID_YES:# 执行删除操作
3. 错误处理
代码中实现了完善的错误处理机制,确保程序稳定运行:
try:# 执行可能出错的操作
except Exception as e:wx.MessageBox(f"错误信息: {e}", "错误", wx.OK | wx.ICON_ERROR)
这种模式在多处使用,保证即使在处理不同格式的图像文件时也能优雅地处理异常情况。
4、运行结果
相关文章:
图像管理与人脸识别工具深度解析
这篇Python应用程序代码实现了一个功能丰富的图像管理和人脸识别工具,它集成了多种实用功能,包括人脸检测与裁剪、屏幕截图以及生成PDF等核心功能。我将深入分析这个应用程序的架构、功能和实现方式,帮助读者理解其设计思路和关键技术点。 C…...
【图片合并PDF】一次性将多个文件夹里的图片批量按文件夹为单位合并PDF,多个文件夹图片合并PDF,基于WPF的实现方案
设计行业:设计师需要将项目设计稿按文件夹整理并合并为PDF交付客户 摄影行业:摄影师按主题分类的照片需要合并为PDF存档或分享 企业文档管理:市场调研部门需要将分散在不同文件夹的调研图片合并为PDF报告 教育领域:教师需要将学生的作业图片按班…...
Matlab 数控车床进给系统的建模与仿真
1、内容简介 Matlab217-数控车床进给系统的建模与仿真 可以交流、咨询、答疑 2、内容说明 略 摘 要:为提高数控车床的加工精度,对数控 车床进给系统中影响加工精度的主要因素进行了仿真分析研 动系统的数学模型,利用MATLAB软件中的动态仿真工具 究:依据机械动力学原理建立了…...
HOW - 在 Mac 上的 Chrome 浏览器中调试 Windows 场景下的前端页面
文章目录 为什么需要模拟 Windows 环境?一、修改 User-Agent 模拟 Windows 浏览器方法 1:通过 Chrome 开发者工具修改 UA方法 2:使用浏览器插件 二、模拟 Windows 的字体和滚动条样式1. 模拟 Windows 字体2. 强制显示滚动条(模拟 …...
微信小程序执行C语言库的详细方案
以下是微信小程序中执行C语言库的详细技术方案,分为环境准备、开发流程、优化技巧三个部分: 一、环境准备阶段 1. 工具链安装 # 安装Emscripten核心工具链 git clone https://github.com/emscripten-core/emsdk.git cd emsdk ./emsdk install latest .…...
如何用分布式防御抵扣大规模DDoS攻击?
DDoS攻击是当前最严峻的网络安全威胁之一,其通过海量请求耗尽目标资源,导致服务瘫痪。面对攻击规模的指数级增长,传统的单点防御已难以应对。本文将结合最新技术趋势,探讨分布式防御体系在抵御大规模DDoS攻击中的核心策略与实践。…...
【MySQL】存储引擎 - MyISAM详解
📢博客主页:https://blog.csdn.net/2301_779549673 📢博客仓库:https://gitee.com/JohnKingW/linux_test/tree/master/lesson 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! &…...
如何在Jmeter中调用C程序?
在JMeter中调用C语言程序可以通过以下几种方式实现: 方法一:使用OS Process Sampler JMeter的“OS Process Sampler”可以用来调用外部程序,包括C语言编写的可执行文件。 步骤: 准备C语言程序: 编写C语言代码并编译…...
PyTorch 版本、torchvision 版本和 Python 版本的对应关系
PyTorch 版本、torchvision 版本和 Python 版本的对应关系 在深度学习领域,PyTorch 及其配套库 torchvision 的使用极为广泛。但不同版本的 PyTorch、torchvision 与 Python 之间存在严格的对应关系,若版本搭配不当,会导致代码运行出错…...
构建高可维护、易测试的异步任务系统:基于 Celery + Redis + Eventlet 的模块化架构实践
引言:为什么我们需要一个结构清晰的异步任务系统? 在现代软件开发中,异步任务已经成为提升响应性能、解耦业务逻辑、支持高并发的重要手段。尤其对于测试工程师而言,异步任务往往意味着: 任务执行不可控状态追踪困难…...
《智能网联汽车 自动驾驶功能场地试验方法及要求》 GB/T 41798-2022——解读
目录 1. 适用范围与核心目标 2. 试验核心要求 2.1 试验场地与环境 2.2 试验设备与数据采集 2.3 试验车辆要求 3. 试验过程与通过条件 4. 关键试验场景与方法 4.1 交通信号识别及响应 4.2 基础设施与障碍物识别 4.3 行人及非机动车场景 4.4 紧急避险与风险策略 5. 特…...
删除链表倒数第N个节点
Leetcode(19): 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 分析: 首要目标就是找到第N个节点的前一个节点,因为只有通过这个节点(cur)才可进行对…...
创建型模式:抽象工厂(Abstract Factory)模式
一、概念与核心思想 抽象工厂(Abstract Factory)模式是创建型设计模式的重要成员,它提供一个创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类。该模式将对象的创建逻辑封装在抽象工厂及其具体实现类中,客户端通过抽象工厂接口获取所需的对象族,实现对象创…...
预训练模型实战手册:用BERT/GPT-2微调实现10倍效率提升,Hugging Face生态下的迁移学习全链路实践
更多AI大模型应用开发学习内容,尽在聚客AI学院。 一. 预训练模型(PTM)核心概念 1.1 什么是预训练模型? 预训练模型(Pre-trained Model, PTM)是在大规模通用数据上预先训练的模型,通过自监督学…...
基于Flink的用户画像 OLAP 实时数仓统计分析
1.基于Flink的用户画像 OLAP 实时数仓统计分析 数据源是来自业务系统的T日数据,利用kakfa进行同步 拼接多个事实表形成大宽表,优化多流Join方式,抽取主键和外键形成主外键前置层,抽取外键和其余内容形成融合层,将4次事…...
php java go python面向对象的设计原则和常用设计模式
一、面向对象设计原则(OOP Design Principles) 是写出高内聚、低耦合、可维护系统的基础,重点是 SOLID 五大原则 其他补充原则。 📌 SOLID 五大设计原则: 原则名称全称核心思想示例关键词S 单一职责原则Single Respo…...
第十三节:图像形态学操作-腐蚀与膨胀
引言 图像形态学是数字图像处理领域中的一个重要分支,它主要研究图像中物体的形状和结构。作为形态学操作的基础,腐蚀(Erosion)和膨胀(Dilation)是两种最核心的操作,广泛应用于图像预处理、特征提取、目标检测等多个领域。OpenCV作为最流行的…...
数据结构 - 9( 位图 布隆过滤器 并查集 LRUCache 6000 字详解 )
一:位图 位图是一种高效的数据结构,它通过比特来表示某个值的存在与否,通常以连续的二进制位数组存储。每个比特位对应一个特定的状态,这种表示方式在内存效率和操作速度上具有显著优势,尤其适用于海量数据、整数以及…...
在Hugging Face网站像Github一样克隆repository到本地的具体步骤
首先我们找到自己想要的仓库,在搜索栏进行搜索 之后我们可以看到这里有三个点,鼠标点击,选择Clone repository 最后按照上面的步骤进行复制粘贴到电脑上执行就行,我们可以看到有两种选择HTTPS和SSH,如果HTTPS不行就选择…...
如何使用Java从PDF文件中提取图像(教程)
Java本身不直接支持PDF文件操作,因此需要使用外部Java PDF库。本教程将向您展示如何通过5个简单步骤,使用JPedal Java PDF库从PDF文件中提取图像。 使用Java从PDF中提取图像 • 将JPedal库添加到您的类路径或模块路径(下载试用版jar文件&…...
通过混合机器学习和 TOPSIS 实现智能手机身份验证的稳健行为生物识别框架
1. 简介 随着日常工作、个人生活和金融操作对智能手机的依赖性不断增强,对弹性安全身份验证系统的需求也日益增长。尽管 PIN 码、密码和静态生物识别等传统身份验证方法仍可为系统提供一定的安全级别,但事实证明,它们容易受到多种威胁,包括敏感数据泄露、网络钓鱼、盗窃和…...
day010
文章目录 1. 在Ubuntu中使用visudo2. 别名 alias2.1 查看已配置的别名2.2 配置grep别名2.3 配置rm别名2.4 临时使用配置别名的命令 3. 系统校验检查3.1 md5校验3.2 aide 高级入侵检测环境3.2.1 安装aide3.2.2 修改aide配置文件3.2.3 根据配置文件生成初始的指纹信息库3.2.4 使用…...
Coco AI 开源应用程序 - 搜索、连接、协作、您的个人 AI 搜索和助手,都在一个空间中。
一、软件介绍 文末提供程序和源码下载 Coco AI 是一个统一的搜索平台,可将您的所有企业应用程序和数据(Google Workspace、Dropbox、Confluent Wiki、GitHub 等)连接到一个功能强大的搜索界面中。此存储库包含为桌面和移动设备构建的 Coco 应…...
MySQL 8.0 OCP(1Z0-908)英文题库(11-20)
目录 第11题题目分析正确答案 第12题题目分析正确答案 第13题题目分析正确答案 第14题题目分析正确答案 第15题题目分析正确答案 第16题题目分析正确答案 第17题题目分析正确答案: 第18题题目分析正确答案 第19题题目分析正确答案 第20题题目分析正确答案 第11题 W…...
国标GB28181软件EasyGBS雪亮工程打造智能高效的视频监控新体系
一、背景 雪亮工程是构建公共安全视频监控联网应用的系统工程,旨在通过整合各类视频监控资源,实现城乡视频监控一体化,提升社会治安防控能力。随着城市化进程的加快和社会治理需求的不断提高,雪亮工程的建设规模不断扩大…...
视频添加字幕脚本分享
脚本简介 这是一个给视频添加字幕的脚本,可以方便的在指定的位置给视频添加不同大小、字体、颜色的文本字幕,添加方式可以直接修改脚本中的文本信息,或者可以提前编辑好.srt字幕文件。脚本执行环境:windowsmingwffmpeg。本方法仅…...
springCloud/Alibaba常用中间件之GateWay网关
文章目录 SpringCloud:依赖版本补充GateWay:网关三大核心之Router:路由1、导入基础依赖2、进行服务注册3、路由映射4、测试访问GateWay的端口是否可以访问 三大核心之Predicate:断言配置文件自定义Predicate(断言) 三大核心之Filter:过滤配置文件自定义全…...
ABP vNext + Dapr 实现云原生微服务治理
ABP vNext Dapr 实现云原生微服务治理 🚀 前言 📝 随着云原生与微服务架构的快速发展,相关工具和框架也在不断演进。ABP vNext 是一套成熟而现代的 .NET 应用开发框架,在模块化、领域驱动设计等方面提供强大支持。而 Dapr 作为…...
【报错】view size is not compatible with input tensor‘s size and stride
完整报错 Traceback (most recent call last): File "D:\360MoveData\Users\HONOR\whu\TwoStageTraining.py", line 590, in <module> criterionseg_criterion, save_dir./models, writerwriter_first_stage) File "D:\360MoveData\Users\HONOR\whu\TwoS…...
maven如何搭建自己的私服(windows版)?
环境准备 安装 JDK :确保系统已安装 JDK 8 或更高版本。可以通过以下步骤安装 JDK: 下载 JDK 安装包,可以从Oracle 官方网站下载适用于 Windows 的 JDK 安装程序。 运行安装程序,按照提示完成安装。安装过程中可以指定安装路径&a…...
CDGP|数据全生命周期的“收数、治数、用数、保数”体系详解
在数据成为重要资产的今天,如何高效地管理和利用数据已成为企业和组织的核心竞争力之一。数据全生命周期管理涵盖了从数据收集、治理、应用到保护的各个环节,形成了一个闭环体系。本文将重点介绍数据全生命周期中的“收数、治数、用数、保数”四个关键环…...
在UI原型设计中,低、高保真原型图有什么区别?
在数字产品开发中,原型(Prototype) 是连接创意与落地的桥梁。它通过可视化的方式验证功能、交互与用户体验,避免开发资源浪费。而低保真(Lo-Fi)与高保真(Hi-Fi)原型,则是…...
万物互联时代:ONVIF协议如何重构安防监控系统架构
前言 一、ONVIF协议是什么 ONVIF(Open Network Video Interface Forum,开放式网络视频接口论坛)是一种全球性的开放行业标准,由安讯士(AXIS)、博世(BOSCH)和索尼(SONY&…...
初识Linux · 传输层协议TCP · 上
目录 前言: TCP结构体 首部长度 确认应答机制 捎带应答机制 超时重传机制 连接管理机制 三次握手 SYN_SENT SYN_RCVD ESTABLISHED TCP为什么是三次握手 四次挥手 什么是四次挥手 状态理解 CLOSE_WAIT LAST_ACK TIME_WAIT 前言: 前文有…...
基于SpringBoot的校园周边美食探索及分享平台的设计与实现
资源详情: 私信我或点击链接获取: 基于SpringBoot的校园周边美食探索及分享平台的设计与实现资源-CSDN文库 摘要 美食一直是与人们日常生活息息相关的产业。传统的电话订餐或者到店消费已经不能适应市场发展的需求。随着网络的迅速崛起,互联…...
系统架构设计-真题2024下半年总结
系统架构设计-真题2024下半年总结 综合知识(选择题)考点分布选择题详细解释ABSD方法简介 选项分析生活化例子概念讲解系统的质量目标系统的商业目标系统开发人员的商业目标 简单记法总结基于内容推荐的优点选项分析正确答案总结 综合知识(选择…...
《React Native性能优化:从卡顿到丝滑的蜕变之旅》
《React Native性能优化:从卡顿到丝滑的蜕变之旅》 前言:当你的React Native应用开始"便秘"… “这破应用怎么又卡了?!”——如果你也曾在测试自己的React Native应用时发出这样的呐喊,那么你不是一个人在怒吼。想象一下这样的场景:你精心打造的APP在低端安卓…...
flutter build apk出现的一些奇怪的编译错误
我换了新电脑后重新编译基于livekit 的 flutter livekit工程,然后编译的时候一直报flutter_webrtc的 0.11.7 版本的dart代码有一个接口未实现,我比较了所以环境和版本实现找不到问题,根本不正常哪里导致的问题 ,以前的电脑的环境一…...
枚举 · 例8扩展-校门外的树:hard
登录—专业IT笔试面试备考平台_牛客网 代码区: #include<algorithm> #include<iostream> #include<vector>using namespace std; struct TREE{int left,right; }; bool compare(const TREE&a,const TREE& b ){if(a.left!b.left){return…...
监控系统进阶方案:OpenObserve的Docker部署与远程访问配置指南
文章目录 前言1. 安装Docker2. 创建并启动OpenObserve容器3. 本地访问测试4. 公网访问本地部署的OpenObserve4.1 内网穿透工具安装4.2 创建公网地址 5. 配置固定公网地址 前言 今天,我想分享一个在云原生可观测性领域备受关注的开源项目——OpenObserve。在复杂的云…...
如何通过grep 排除“INTEGER: 1”
在 Linux/Unix 系统中,使用 grep 过滤数据并 取反(排除匹配内容) 的核心选项是 -v(反向匹配)。以下是具体用法和场景示例: 1. 基础用法:排除包含指定关键词的行 # 语法 grep -v "pattern&…...
基于Qt开发的http/https客户端
成果展示: 使用Qt开发HTTP客户端主要依赖QNetworkAccessManager、QNetworkRequest和QNetworkReply三大核心类。以下是具体实现要点及最佳实践: 一、核心类与基础流程 1.QNetworkAccessManager 作为HTTP请求的管理者,负责异步处理…...
微程序控制器的详细工作过程
1. 基本组成结构 微程序控制器主要由以下部件构成: 控制存储器(Control Store, CS):存储微程序(微指令集合),通常使用ROM或EPROM。 微地址寄存器(μAR):存放…...
PostgreSQL 的 pg_current_logfile 函数
PostgreSQL 的 pg_current_logfile 函数 pg_current_logfile() 是 PostgreSQL 9.6 版本引入的一个系统管理函数,用于获取当前正在使用的日志文件路径。 一 基本用法 1 函数定义 pg_current_logfile([text]) → text2 简单查询 -- 获取当前日志文件路径 SELECT …...
实时云渲染——比像素流送节省80%精力的UE程序推流技术
UE5引擎除了适合开发3A游戏,同样适用于开发大场景高精度的数字孪生可视化场景,自带的Nanite 虚拟微多边形几何体技术、Lumen 全动态全局光照技术、高度可扩展的架构、强大的地形和植被系统以及高效的流媒体技术,使UE5在数字孪生领域的技术占有…...
如何解决 Linux 系统文件描述符耗尽的问题
在Linux系统中,文件描述符(File Descriptor, FD)是操作系统管理打开文件、套接字、管道等资源的抽象标识。当进程或系统耗尽文件描述符时,会导致服务崩溃、连接失败等严重问题。以下是详细的排查和解决方案: --- ###…...
存储器:DDR和HBM的区别
本文简要介绍DDR(Double Data Rate SDRAM)和HBM(High Bandwidth Memory)的主要区别: 1. 架构与设计 DDR:传统的主流动态随机存取存储器(DRAM),采用并行总线架构&#x…...
【计算机网络】Cookie、Session、Token之间有什么区别?
大家在日常使用浏览器时可能会遇到:是否清理Cookie?这个问题。 那么什么是Cookie呢?与此相关的还有Session、Token这些。这两个又是什么呢? 本文将对这三个进行讲解区分,如果对小伙伴有帮助的话,也请点赞、…...
每日学习:DAY24
日常开发与学习记录 前言 怎么感觉自己越来越懒了。 日程 忘记写了,大概是早上做了 SQL 表单,晚上写了 DispatcherController。 学习记录 操作系统 页面分配置换策略 学习内容 省流 SQL 表单构建关于嵌套注解的生效机制DispatcherController 统…...
grpo原理
图解deepseek的grpo原理、以debug形式阅读grpo的源码 练习两天半,从零实现DeepSeek-R1(基于Qwen2.5-0.5B和规则奖励模型,GRPO),从原理讲解到代码实现,解开DeepSeek-R1的神秘面纱 第一个视频 GRPO讲解 mod…...