Python(16)Python文件操作终极指南:安全读写与高效处理实践
目录
- 背景介绍
- 一、文件操作基础架构
- 1. 文件打开模式详解
- 二、文件读取全攻略
- 1. 基础读取方法
- 2. 大文件处理方案
- 3. 定位与截断
- 三、文件写入进阶技巧
- 1. 基础写入操作
- 2. 缓冲控制与实时写入
- 四、with上下文原理剖析
- 1. 上下文管理协议
- 2. 多文件同时操作
- 五、综合实战案例
- 1. 加密文件拷贝
- 2. 日志分析系统
- 六、性能与安全指南
- 1. 性能优化:
- 2. 安全规范:
- 3. 异常处理模板:
- 七、总结与最佳实践
- 1. 核心原则:
- 2. 模式选择决策树:
- 3. 扩展工具推荐:
- Python相关文章(推荐)
背景介绍
在Python开发中,文件操作是数据处理的核心环节。根据StackOverflow调查显示:
- 78%的Python应用需要文件交互
- 43%的文件操作Bug由资源泄漏导致
- 62%的开发者曾遭遇文件编码问题
本文将从底层原理到实战应用,深入解析:
- 6种文件模式差异对比
- 大文件处理性能优化
- with上下文管理机制
- 二进制与文本文件操作区别
- 异常处理与安全规范
一、文件操作基础架构
1. 文件打开模式详解
模式字符 | 全称 | 可读 | 可写 | 覆盖 | 指针位置 | 文件存在要求 |
---|---|---|---|---|---|---|
r | read | ✓ | ✗ | ✗ | 开头 | 必须存在 |
w | write | ✗ | ✓ | ✓ | 开头 | 创建新文件 |
a | append | ✗ | ✓ | ✗ | 末尾 | 自动创建 |
r+ | read+write | ✓ | ✓ | ✗ | 开头 | 必须存在 |
w+ | write+read | ✓ | ✓ | ✓ | 开头 | 创建新文件 |
a+ | append+read | ✓ | ✓ | ✗ | 末尾 | 自动创建 |
二进制模式:在模式字符后加b(如rb, wb+)
二、文件读取全攻略
1. 基础读取方法
# 传统方式(存在资源泄漏风险)
file = open('data.txt', 'r', encoding='utf-8')
content = file.read() # 读取全部内容
file.close()# 安全方式(推荐)
with open('data.txt', 'r', encoding='utf-8') as f:lines = f.readlines() # 读取为列表
2. 大文件处理方案
# 逐行读取(内存友好)
with open('large.log', 'r') as f:while True:line = f.readline()if not line:breakprocess_line(line)# 块读取优化
CHUNK_SIZE = 1024 * 1024 # 1MB
with open('huge.bin', 'rb') as f:while chunk := f.read(CHUNK_SIZE):process_chunk(chunk)
3. 定位与截断
with open('data.txt', 'r+') as f:f.seek(10) # 移动指针到第10字节partial = f.read(5) # 读取5个字符f.truncate(20) # 截断文件到20字节
三、文件写入进阶技巧
1. 基础写入操作
# 覆盖写入
with open('output.txt', 'w') as f:f.write('Hello World\n')f.writelines(['Line1\n', 'Line2\n'])# 追加写入
with open('log.txt', 'a') as f:f.write(f"{datetime.now()} - 事件记录\n")
2. 缓冲控制与实时写入
# 禁用缓冲(实时写入)
with open('realtime.csv', 'w', buffering=1) as f: # 行缓冲for data in sensor_data:f.write(f"{data}\n")# 二进制精确写入
with open('image.png', 'wb') as f:f.write(b'\x89PNG\r\n\x1a\n') # PNG文件头
四、with上下文原理剖析
1. 上下文管理协议
class SafeFileOpener:def __init__(self, filename, mode):self.filename = filenameself.mode = modedef __enter__(self):self.file = open(self.filename, self.mode)return self.filedef __exit__(self, exc_type, exc_val, exc_tb):self.file.close()if exc_type is not None:print(f"操作异常: {exc_val}")# 自定义上下文使用
with SafeFileOpener('data.txt', 'r') as f:print(f.read())
2. 多文件同时操作
with open('source.txt', 'r') as src, \open('dest.txt', 'w') as dest:dest.write(src.read().upper())
五、综合实战案例
1. 加密文件拷贝
def encrypt_file(src_path, dest_path, key):with open(src_path, 'rb') as src, \open(dest_path, 'wb') as dest:while chunk := src.read(1024):encrypted = bytes([b ^ key for b in chunk])dest.write(encrypted)# 使用示例
encrypt_file('secret.doc', 'secret.enc', 0x55)
2. 日志分析系统
def analyze_logs(log_path):error_count = 0with open(log_path, 'r', buffering=1) as log:for line in log:if 'ERROR' in line:error_count += 1send_alert(line.strip())process_line(line)generate_report(error_count)
六、性能与安全指南
1. 性能优化:
大文件优先使用buffering=1024*1024设置缓冲
二进制操作比文本模式快30%以上
mmap模块处理超大型文件(GB级)
2. 安全规范:
# 危险操作检测
import os
def safe_open(path):if '../' in path:raise ValueError("禁止目录穿越")if not os.path.exists(path):raise FileNotFoundErrorreturn open(path, 'r')
3. 异常处理模板:
try:with open('data.txt', 'r') as f:content = f.read()
except FileNotFoundError:print("文件不存在")
except UnicodeDecodeError:print("编码错误,尝试指定encoding='latin1'")
except IOError as e:print(f"IO错误: {str(e)}")
七、总结与最佳实践
1. 核心原则:
- Always Use With:始终使用with语句
- Explicit Encoding:明确指定文件编码
- Lazy Loading:大文件采用流式处理
2. 模式选择决策树:
需要写文件吗?
├─ 是 → 需要追加吗?
│ ├─ 是 → 使用'a'
│ └─ 否 → 使用'w'
└─ 否 → 需要修改吗?├─ 是 → 使用'r+'└─ 否 → 使用'r'
3. 扩展工具推荐:
- pathlib:面向对象路径操作
- tempfile:安全创建临时文件
- shutil:高级文件操作
掌握Python文件操作不仅是基础功力的体现,更是构建可靠系统的关键。建议开发者在实际项目中实践本文技巧,并通过性能测试找到最适合业务场景的解决方案。
Python相关文章(推荐)
Python全方位指南 | Python(1)Python全方位指南:定义、应用与零基础入门实战 |
Python基础数据类型详解 | Python(2)Python基础数据类型详解:从底层原理到实战应用 |
Python循环 | Python(3)掌握Python循环:从基础到实战的完整指南 |
Python列表推导式 | Python(3.1)Python列表推导式深度解析:从基础到工程级的最佳实践 |
Python生成器 | Python(3.2)Python生成器深度全景解读:从yield底层原理到万亿级数据处理工程实践 |
Python函数编程性能优化 | Python(4)Python函数编程性能优化全指南:从基础语法到并发调优 |
Python数据清洗 | Python(5)Python数据清洗指南:无效数据处理与实战案例解析(附完整代码) |
Python邮件自动化 | Python(6)Python邮件自动化终极指南:从零搭建企业级邮件系统(附完整源码) |
Python通配符基础 | Python(7)Python通配符完全指南:从基础到高阶模式匹配实战(附场景化代码) |
Python通配符高阶 | Python(7 升级)Python通配符高阶实战:从模式匹配到百万级文件处理优化(附完整解决方案) |
Python操作系统接口 | Python(8)Python操作系统接口完全指南:os模块核心功能与实战案例解析 |
Python代码计算全方位指南 | Python(9)Python代码计算全方位指南:从数学运算到性能优化的10大实战技巧 |
Python数据类型 | Python(10)Python数据类型完全解析:从入门到实战应用 |
Python判断语句 | Python(11)Python判断语句全面解析:从基础到高级模式匹配 |
Python参数传递 | Python(12)深入解析Python参数传递:从底层机制到高级应用实践 |
Python面向对象编程 | Python(13)Python面向对象编程入门指南:从新手到类与对象(那个她)的华丽蜕变 |
Python内置函数 | Python(14)Python内置函数完全指南:从基础使用到高阶技巧 |
Python参数传递与拷贝机制 | Python(15)Python参数传递与拷贝机制完全解析:从值传递到深拷贝实战 |
相关文章:
Python(16)Python文件操作终极指南:安全读写与高效处理实践
目录 背景介绍一、文件操作基础架构1. 文件打开模式详解 二、文件读取全攻略1. 基础读取方法2. 大文件处理方案3. 定位与截断 三、文件写入进阶技巧1. 基础写入操作2. 缓冲控制与实时写入 四、with上下文原理剖析1. 上下文管理协议2. 多文件同时操作 五、综合实战案例1. 加密文…...
Maven相关名词及相关配置
1、相关名词 1 Project: 任何你想build的事物,maven都可以认为他们是工程,这些工程被定义为工程对象模型(POM:Project Object Model)一个工程可以依赖其他的工程,一个工程也可以有多个子工程构成。 2 POM: 就是xml文件…...
【自动化测试】如何获取cookie,跳过登录的简单操作
前言 🌟🌟本期讲解关于自动化测试函数相关知识介绍~~~ 🌈感兴趣的小伙伴看一看小编主页:GGBondlctrl-CSDN博客 🔥 你的点赞就是小编不断更新的最大动力 🎆那么废话…...
登录校验:保障系统安全访问的关键技术解析
摘要:本文围绕Tlias智能学习辅助系统的登录校验功能展开,深入剖析了实现登录校验的必要性,介绍了会话技术和统一拦截技术等关键实现思路,并对Cookie、Session和令牌技术三种会话跟踪方案进行了详细对比,旨在为系统的安…...
数据库案例1--视图和索引
以下是一个关于数据库视图和索引的高级使用教程,结合实际案例进行讲解。我们将使用一个电商系统的数据库作为示例,展示如何创建和优化视图,以及如何通过索引提高查询性能。 案例背景 假设我们有一个电商系统,包含以下表…...
load_summarize_chain ,load_qa_chain 是什么
load_summarize_chain ,load_qa_chain 是什么 目录 load_summarize_chain ,load_qa_chain 是什么`load_summarize_chain``load_qa_chain`其他构建链的方式SequentialChain, TransformChainload_summarize_chain 和 load_qa_chain 都是 LangChain 库中的实用工具函数,用于快速构…...
SQL2API 核心理念:如何重构数据服务交付范式
在企业数据治理的漫长链条中,"数据服务交付" 始终是决定数据价值转化效率的关键一环。传统数据接口开发需经历需求沟通、SQL 编写、后端编码、接口测试、权限配置等多个环节,平均开发周期长达 7-10 天,且技术门槛高,导致…...
Proteus 仿真51单片机-串口收发小窥
51单片机 51单片机是一种经典的8位微控制器,广泛应用于各种嵌入式系统开发中。它具有结构简单、可靠性高、价格低廉等特点,深受工程师和电子爱好者的喜爱。 51单片机的核心是一个8位的CPU,能够执行多种指令,完成数据处理和逻辑运…...
信号与系统期中复习(第一章)
1、连续信号叠加的周期 2、离散信号的周期判定 离散信号只有当周期为整数的时候,才是周期信号 3、信号的时间变换 4、取样性质相关计算 5、系统的描述 6、线性系统的性质 7、信号的时间变换 8、基本概念 判断时不变系统的方法: 若f(t&#…...
bash的特性-常用的通配符
在Linux或Unix系统中,Bash作为最常用的命令行解释器之一,提供了多种通配符(wildcards)来帮助用户更高效地进行文件操作。这些通配符可以用来匹配多个文件名或路径名,极大地简化了批量处理任务。本文将详细介绍Bash中常…...
Android12 自定义系统服务
在Android中可以通过两种方式创建系统服务: 由SystemServer启动的系统服务,使用SystemServer线程资源,适合轻量级的服务,比如各种XMS服务;占用独立进程,在系统启动时,由init进程拉起,比如SurfaceFlinger;本文采用的是第一种方式。 自定义AssistantManagerService 参…...
安防监控视频管理平台EasyCVR助力建筑工地施工4G/5G远程视频监管方案
一、项目背景 随着城市建设的快速发展,房地产建筑工地的数量、规模与施工复杂性都在增加,高空作业、机械操作频繁,人员流动大,交叉作业多,安全风险剧增。施工企业和政府管理部门在施工现场管理上都面临难题。政府部门…...
如何针对游戏、金融行业定制CC攻击防护规则?
针对游戏和金融行业的高并发、实时交互及高价值特性,CC攻击防护需结合业务场景定制规则。以下是分行业的定制化防护方案: 一、游戏行业CC攻击防护规则 1. 核心防护目标 保障低延迟(毫秒级响应)防止作弊工具伪造…...
【redis】初识redis
初识redis Redis 是一种基于键值对(key-value) 的 NoSQL 的数据库,它与很多键值数据库不同, Redis 中的值可以是 string(字符串) 、hash(哈希)、list(链表)、…...
MJ PDF汉化版:功能强大,阅读无忧
在数字化时代,PDF 文件已成为我们日常生活和工作中不可或缺的一部分。无论是学习资料、工作报告还是电子书,PDF 格式因其兼容性和稳定性而被广泛使用。然而,对于许多中文用户来说,使用英文界面的 PDF 阅读器可能会带来不便。 今天…...
线代第二章矩阵第二课:矩阵的加法、减法、数乘
一、矩阵的加法、减法 加法 减法 二、矩阵的数乘 规律: (1)K(AB)KAKB (2)(KL)AKALA (3)k(LA)(kL)AL(kA) (4)1*A A ; (-1)*A -A 观看笔记来源: 《线性代数…...
Python实例题:Python自动获取海量IP工具
目录 Python实例题 题目 实现思路 代码实现 代码解释 get_proxy_list 函数: check_proxy_validity 函数: save_valid_ips 函数: 主程序: 运行思路 注意事项 Python实例题 题目 Python自动获取海量IP工具 实现思路 …...
Vue el-from的el-form-item v-for循环表单如何校验rules(一)
实际业务需求场景: 新增或编辑页面(基础信息表单,一个数据列表的表单),数据列表里面的表单数是动态添加的。数据可新增、可删除,在表单保存前,常常需要做表单必填项的校验,校验通过以…...
AI 边缘计算盒子:开启智能物联新时代
一、什么是 AI 边缘计算盒子 AI 边缘计算盒子是一种集成了高性能芯片、AI 算法和数据处理能力的硬件设备。它部署在数据源的边缘侧,如工厂、商场、交通路口等,能够在本地进行数据采集、预处理、分析和决策,而无需将所有数据上传到云端。这种…...
【AGI】MCP生态的“飞轮效应”
【AGI】MCP生态的“飞轮效应” (一)打通AI代理外部交互的“最后一公里”1. AI代理的核心挑战:可靠的外部服务交互2. MCP的解决方案:结构化交互协议3. 案例对比:Figma设计修改任务4. 行业影响:从实验性技术到…...
【无标题】win7和win11双系统共存
一、背景: .本人自有戴尔E6440型老款笔记本电脑一台。500g固态硬盘,12g内存,硬盘共分了两个分区。由于本人想实现Win11系统和win七双系统共存,和可以分别加载,今晚上折腾了几个小时终于搞定了!现把经验总结…...
国内开源医疗模型研究报告
引言 随着人工智能技术的快速发展,医疗AI领域正经历前所未有的变革。开源医疗模型作为这一领域的核心技术基础设施,不仅推动了医疗智能化进程,也为医疗工作者提供了强大的辅助工具。本报告将深入探讨国内优秀的开源医疗模型,分析…...
【工具变量】1907年大清邮政舆图数据集(高清图+PDF)
大清邮政舆图是清朝时期为邮政管理而制作的一部详细地图,主要用于邮政线路的规划与管理。该舆图不仅标示了全国各地的邮政线路,还包括了各地的地理位置、行政区划和重要的交通枢纽。大清邮政舆图在中国历史上具有重要的地理和邮政历史价值,是…...
leetcode 121. Best Time to Buy and Sell Stock
题目描述 本题属于动态规划类问题。 dp数组的含义 dp[i][0]表示从第0天到第i天为止,处于持有股票的状态下,账户里的最大金额。 dp[i][1]表示从第0天到第i天为止,处于不持有股票的状态下,账户里的最大金额。 按照这个定义dp[n-…...
UWB定位技术面临的主要挑战
UWB定位技术面临的主要挑战(品铂科技视角) 一、复杂工业场景下的信号稳定性挑战 品铂科技QM35825芯片虽通过4天线射频架构和接收分集技术将金属密集环境下的多径误差降低至传统方案的1/8,但在多层混凝土厂房或动态金属设备场景…...
获取 arm-none-eabi-ld 默认使用的链接脚本
使用如下命令 ./arm-none-eabi-ld --verbose > "arm-none-eabi-ld-default.ld"将输出重定向到一个 .ld 文件中。得到的文件内容如下 GNU ld (Arm GNU Toolchain 14.2.Rel1 (Build arm-14.52)) 2.43.1.20241119Supported emulations:armelf using internal linke…...
无人机设备遥控器之多控一机技术篇
无人设备遥控器的多控一机技术,是指通过多个遥控器或控制端协同实现对同一台无人设备的精准控制。该技术融合了通信技术、信号处理与协同控制算法,其核心在于多源信号的融合处理与动态控制权分配。 一、技术原理 多源信号融合 通过接收多个遥控器发送的…...
python自动化浏览器标签页的切换
#获取全部标签页的句柄返回句柄的列表 handleswebdriver.window_handles#获取全部标签页的句柄返回句柄的列表 print(len(handles)) 切换标签页 handleswebdriver.window_handles webdriver.switch_to.window(handles[index])#切换到第几个标签页就写几 关闭标签页 关闭标…...
一个异步架构设计:批量消费RabbitMQ,批量写入Elasticsearch(golang实现)
在数仓团队,异步任务设计非常常见,主要原因就是数据量太大,不适合做成同步,在自动驾驶这个业务上,数据大到什么程度呢,单模块每天标签的上报数量就能达到5000W,如果算上车端挖掘、云端挖掘、标注…...
加固笔记本:无人机领域智能作业的可靠算力中枢
在无人机技术快速发展的今天,行业应用场景日益复杂化——从高空电力巡检到极地环境监测,从军事侦察到农业植保,无人机的智能化作业对计算设备的稳定性、环境适应性和数据处理能力提出了更高要求。鲁成伟业深耕工业计算领域十余年,…...
非参数 Spearman 相关在多组学分析中的力量及AI拓展
在大数据生物学时代,多组学分析为理解复杂的生物系统提供了前所未有的洞察力。然而,解读这些数据集内部错综复杂的关系需要强大且通用的分析工具。其中,非参数 Spearman 相关性作为一种揭示隐藏关联的有力方法脱颖而出。 AI拓展 多组学数据…...
大模型面经 | 请你介绍一下ReAct(Reasoning and Acting)?
大家好,我是皮先生!! 今天给大家分享一些关于大模型面试常见的面试题,希望对大家的面试有所帮助。 往期回顾: 大模型面经 | 春招、秋招算法面试常考八股文附答案(RAG专题一) 大模型面经 | 春招、秋招算法面试常考八股文附答案(RAG专题二) 大模型面经 | 春招、秋招算法…...
如何高效使用 Text to SQL 提升数据分析效率?四个关键应用场景解析
数据分析师和业务人员常常面临这样的困境:有大量数据等待分析,但 SQL 编写却成为效率瓶颈。即使对于经验丰富的数据分析师来说,编写复杂 SQL 查询也需要耗费大量时间;而对于不具备 SQL 专业知识的业务人员,数据分析则更…...
Python对ppt进行文本替换、插入图片、生成表格
目录 1. 安装pptx2. 文本替换和插入图片3. 生成表格 1. 安装pptx pip install python-pptx2. 文本替换和插入图片 文本通过占位符例如{{$xxx}}进行标记,然后进行替换;图片通过ppt中的图形和图片中的占位符进行标记ppt如下 具体实现 from pptx import …...
OpenResty与Nginx的功能对比分析
OpenResty 和 Nginx 都是高性能的 Web 服务器和反向代理服务器,但它们在设计目标和功能上有显著区别。以下是它们的主要差异: 1. 核心定位 Nginx 是一个轻量级、高性能的 HTTP 服务器和反向代理,专注于静态内容服务、负载均衡和 HTTP 请求处…...
React 在组件间共享状态
在组件间共享状态 有时候,你希望两个组件的状态始终同步更改。要实现这一点,可以将相关 state 从这两个组件上移除,并把 state 放到它们的公共父级,再通过 props 将 state 传递给这两个组件。这被称为“状态提升”,这…...
1.Framer Motion 中 motion/react 和 motion/react-client 的用法和区别
背景知识:服务器端渲染 (SSR) 和客户端渲染 (CSR) 在理解这两个模块的区别之前,我们需要了解 React 应用的两种主要渲染方式: 服务器端渲染 (SSR): React 组件在服务器上被渲染成 HTML 字符串,然后发送给浏览器。浏览器接收到的…...
在 Redis 中存储对象类型的数据时,选择hash还是string?
在 Redis 中存储对象类型的数据时,选择 String(存储 JSON)还是其他数据结构(如 Hash),需根据业务场景、性能需求和数据操作模式综合权衡。以下是详细分析: 1. 使用 String 类型存储 JSON 适用场景 整体读写为主:频繁存取整个对象,如用户信息、配置信息。跨语言兼容性…...
使用Python+xml+shutil修改目标检测图片和对应xml标注文件
使用Pythonxmlshutil修改目标检测图片文件名和对应xml标注文件: import os import glob import xml.etree.ElementTree as et import shutildef change_labels(source_dir):name_id 18001file_list glob.glob(os.path.join(source_dir, "*.xml"))print…...
基于STM32、HAL库的PCA9557 I/O扩展器驱动程序设计
一、简介: PCA9557是NXP公司生产的一款8位IC总线I/O扩展芯片,主要特性包括: 工作电压:2.3V至5.5V 低待机电流消耗 8个通用输入/输出引脚 极性反转寄存器 内部上电复位 3个硬件地址引脚,最多可连接8个器件 400kHz快速IC总线 中断输出引脚 二、硬件接口: PCA9557 <-&g…...
【Qt】Qt 信号与槽机制全解析
🍑个人主页:Jupiter. 🚀 所属专栏:QT 欢迎大家点赞收藏评论😊 目录 一.信号和槽概述信号的本质槽的本质 信号和槽的使⽤连接信号和槽查看内置信号和槽通过 Qt Creator ⽣成信号槽代码⾃定义信号和槽带参数的信号和槽信…...
【QT】 QT定时器的使用
QT定时器的使用 1. QTimer介绍(1)QTimer的使用方法步骤示例代码1:定时器的启动和关闭现象:示例代码2:定时器每隔1s在标签上切换图片现象: (2)实际开发的作用 2.日期 QDate(1)主要方法 3.时间 QTime(1)主要方…...
golang使用stdio与子进程进行通信
在使用Cline调用本地MCP Server的时候,使用的是STDIO模式,也就是Cline启动一个子进程来运行MCP Server,然后通过STDIO来进行通信。这种方式即高效又安全。 import ("bufio""fmt""io""os/exec""…...
无服务器架构(Serverless)在Web开发与云原生中的应用研究
无服务器架构(Serverless)在Web开发与云原生中的应用研究 摘要 无服务器架构(Serverless Architecture)作为一种新兴的云计算范式,通过抽象化服务器管理,使开发者能够专注于业务逻辑的实现,而无需关注底层基础设施的运维。本文从研究学者的角度,探讨了无服务器架构的核…...
第IV部分有效应用程序的设计模式
第IV部分有效应用程序的设计模式 第IV部分有效应用程序的设计模式第23章:应用程序用户界面的架构设计23.1设计考量23.2示例1:用于非分布式有界上下文的一个基于HTMLAF的、服务器端的UI23.3示例2:用于分布式有界上下文的一个基于数据API的客户…...
java开发中的设计模式之单例模式
Java开发中的设计模式之单例模式 在软件开发中,设计模式是解决常见问题的最佳实践,单例模式(Singleton Pattern)作为一种创建型设计模式,能够确保一个类在整个应用程序中只有一个实例,并提供一个全局访问点…...
Vue 高级技巧深度解析
Vue 高级技巧深度解析 mindmaproot(Vue2高级技巧)组件通信EventBusprovide/inject$attrs/$listeners性能优化虚拟DOM优化函数式组件按需加载状态管理Vuex模块化持久化存储严格模式高级指令自定义指令动态组件异步组件渲染控制作用域插槽渲染函数JSX支持一、组件通信的进阶之道 …...
JVM:JVM与Java体系结构
一、JVM 基础概念 虚拟机可分为两类 一类是系统虚拟机,用于模拟计算机系统,常见的软件有 Virtual Box、VMware 等。它们能创建虚拟的计算机系统,就如同在我们的计算机中又安装了一台计算机另一类是程序虚拟机,例如 JVM࿰…...
大模型预标注和自动化标注在OCR标注场景的应用
OCR,即光学字符识别,简单来说就是利用光学设备去捕获图像并识别文字,最终将图片中的文字转换为可编辑和可搜索的文本。在数字化时代,OCR(光学字符识别)技术作为处理图像中文字信息的关键手段,其…...
JVM 垃圾回收
垃圾回收 在 C/C 没有自动垃圾回收机制的语言中,一个对象如果不再被使用,则需要手动释放,否则就会出现内存泄漏(不再使用的对象未被系统回收而导致内存溢出)。 Java 为了简化对象释放的操作,降低编程的复杂度,引入的…...