Python学习之jieba
Python学习之jieba
- jieba是优秀的中文分词第三方库,由于中文文本之间每个汉字都是连续书写的,我们需要通过特定的手段来获得其中的每个词组,这种手段叫做分词,我们可以通过jieba库来完成这个过程。
- jieba库的分词原理:利用一个中文词库,确定汉字之间的关联频率,汉字向概率大的组成词组,形成分词结果,除了分词,用户还可以添加自定义的词语[这一点很有趣enjoy]
- jieba分词的四种模式:精确模式、全模式、搜索引擎模式、paddle模式
- jieba.lcut(s) 精确模式:把文本精确的切分开,不存在冗余单词,适合文本分析[最常用]
- jieba.lcut(s,cut_all=True) 全模式:把文本中所有可能的词语都扫描出来,有冗余,但是不能解决歧义
- jieba.lcut_for_search(s) 搜索引擎模式:在精确模式基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词
- pallde模式是指使用飞桨(PaddlePaddle)深度学习框架加速分词的一种模式,相对于传统的分词算法,paddle模式采用了深度学习模型,可以获得更高的分词准确度和更快的速度
- 算法原理:
- 基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)
- 采用了动态规划(DP)查找中最大概率路径,找出基于词频的最大切分组合
- 对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法
import jieba# jieba.cut
# 功能:对输入文本进行分词,返回一个生成器(generator)
# 特点:生成器是惰性计算的,适合处理大文本时节省内存,需要手动将生成器转换未列表或其他数据结构
# jieba.lcut
# 功能:对输入文本进行分词,返回一个了,列表(list)
# 特点:直接返回列表,方便直接使用,适合处理小文本或需要立即使用分词结果的场景
# # 一 精确模式
seg_list = jieba.cut('我的梦想是当太空人', cut_all=False)
# 如果直接print(seg_list)是不行的 因为jieba.cut() 返回的是一个生成器(generator),而不是直接存储分词结果的列表
# 生成器是惰性计算(lazy evaluation)的,它不会一次性生成所有结果,而是按需逐个产生元素(节省内存)。
# 有三种方法提取生成器中的内容
# 1.使用join()函数迭代
# join()将一个可迭代对象(如列表、元组、生成器)中的多个字符串元素,用当前字符串作为“连接符”拼接成一个新字符串。
# 基础语法:"连接符".join(可迭代对象)
print("default node:"+"/".join(seg_list)) #default node:是前缀 结果用"/"连接起来 形成一个可读的字符串# 2.将返回结果强制转换为列表list
seg_list1 = list(jieba.cut('我的梦想是当太空人', cut_all=False)) #默认是False
print(seg_list1)# 3.使用jieba.lcout()函数
seg_list2 = jieba.lcut('我的梦想是当太空人', cut_all=False)
print(seg_list2)
# 精确模式结果:['我', '的', '梦想', '是', '当', '太空', '人']
#########################################################################################
# 二 全模式
seg_list = jieba.lcut('我的梦想是当太空人', cut_all=True) #全模式
print(seg_list)
# 全模式结果:['我', '的', '梦想', '是', '当', '太空', '太空人']
#########################################################################################
# 三 搜索引擎模式
seg_list = jieba.cut_for_search('我本科毕业于北京大学,后再清华大学深造') #搜索引擎模式
print("/".join(seg_list))
# 搜索引擎模式结果:我/本科/毕业/本科毕业/于/北京/大学/北京大学/,/后/再/清华/华大/大学/清华大学/深造
#########################################################################################
# 四 Viterbi算法
# 对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法
seg_list = jieba.cut('小明来到了网易杭硕大厦') #默认是精确模式,Viterbi算法自动识别词典中未登录的词
print("/".join(seg_list))
# 结果:小明/来到/了/网易/杭硕/大厦
#########################################################################################
# 五 自定义词典
# 在jieba自定义字典方面,目前常见的应用环境是各网络平台对违禁词的查询搜素处理,以及网站对用户个人信息的处理,对购物方面评价信息的处理,文本分析等等
# 因此,我们使用jupyter notebook尝试自定义词典的使用,可以使用下列格式创建text文本文件:
# 保罗萨摩塞特 100 n
# 小程序开发 100 n
# Python技术 100 n
# Java技术 100 n
# 格式说明:
# 每行定义一个词语,格式为: 词语 [词频] [词性]
# 词频(可选):数值越大,该词被优先分出的概率越高(默认词频为0)
# 词性(可选):如名词n 动词v等(jieba默认不强制使用词性)
# 待分词的句子
sentence = "保罗萨摩塞特想要进行小程序开发,他需要学习Python技术和Java技术"# 未使用自定义分词的分词结果
default_result = jieba.cut(sentence, HMM=False) #关闭HMM以突出词典作用
print("默认分词:"+"/".join(default_result))# 加载自定义词典
jieba.load_userdict("user_dict.txt") # 文件路径正确# 使用自定义词典的分词结果(需重新加载或重启解释器)
custom_result = jieba.cut(sentence)
print("自定义词典分词:"+"/".join(custom_result))
# 默认分词:保罗/萨摩/塞特/想要/进行/小/程序开发/,/他/需要/学习/Python/技术/和/Java/技术
# 自定义词典分词:保罗萨摩塞特/想要/进行/小程序开发/,/他/需要/学习/Python技术/和/Java技术
# 对词组的基本操作
# 添加
str = "你好呀,我叫李明!多多关照!"
print(jieba.lcut(str))
jieba.add_word("我叫") #会让"我叫"成为一个独立词汇
print(jieba.lcut(str))
# 结果:['你好', '呀', ',', '我', '叫', '李明', '!', '多多关照', '!']
# 结果:['你好', '呀', ',', '我叫', '李明', '!', '多多关照', '!']# 删除
str = "你好呀,我叫李明!多多关照!"
jieba.del_word("李明") #会删除"李明"这个独立词汇
print(jieba.lcut(str))
# 结果:['你好', '呀', ',', '我', '叫', '李', '明', '!', '多多关照', '!']# 调整词出现的频率
str = "你好呀,我叫李明!多多关照!"
# segment:需要调整词频的词组,可以是一个字符串或者一个词元元组
# True:表示调整词频 False:表示恢复默认词频
jieba.suggest_freq(("李", "明"), True)
print(jieba.lcut(str))
# 结果:['你好', '呀', ',', '我', '叫', '李', '明', '!', '多多关照', '!']
import jieba.analyse # 导入jieba 的关键词提取模块
# TF-IDF算法
# TF(词频):一个词在文本中出现的频率。
# IDF(逆文档频率):衡量一个词的普遍重要性。如果一个词在多篇文档中频繁出现(如“的”),它的 IDF 值会很低;反之,罕见词的 IDF 值高。
# TF-IDF = TF × IDF:用于评估一个词在文本中的重要性(既考虑局部频率,又考虑全局罕见性)。# 作用:初始化 TF-IDF 模型,用于后续关键词提取。
# 参数 idf_path=None:
# idf_path 是 IDF(逆文档频率)文件的路径。
# 如果为 None,则使用 jieba 默认的 IDF 语料库(内置的中文 IDF 频率表)。
# 如果你想自定义 IDF 数据(例如针对特定领域的文本),可以传入自己的 IDF 文件路径。
jieba.analyse.TFIDF(idf_path=None)text = "我喜欢学习Python,Python是一门非常有趣的编程语言"
keywords = jieba.analyse.extract_tags(text,# 待分析的文本topK = 3,# 提取前 3 个最重要的关键词,如果不写默认为20withWeight=True,# 是否返回关键词的权重(TF-IDF 值),默认为假allowPOS=()# 允许的词性(空表示不过滤词性),此处无过滤词,可以选择['ns', 'n', 'v', 'nr']
)
print(keywords)sentence = "我喜欢学习Python,Python是一门非常有趣的编程语言,Python的应用广泛,很多人都在学习它."
keywords = jieba.analyse.textrank(sentence,topK=5,withWeight=False,allowPOS=('ns', 'n', 'vn', 'v', 'nr')
)
print(keywords)# 创建自定义 TextRank实例
textrank = jieba.analyse.TextRank()# 使用自定义实例提取关键词
sentence = "我喜欢学习Python,Python是一门非常有趣的编程语言,Python的应用广泛,很多人都在学习它."
keywords = textrank.extract_tags(sentence,topK=5,withWeight=True
)
print(keywords)
# 结果:[('学习', 1.0), ('编程语言', 1.0), ('喜欢', 0.994132857417495), ('应用', #0.994132857417495)]
# 词性标注
import jieba.posseg
str = "你好哎呀,我叫李华!多多关照!"
pt = jieba.posseg.POSTokenizer()
print(pt.lcut(str)) #得到pair键值对,使用遍历取值
# print(jieba.posseg.cut(str))作用一样
for i,k in pt.lcut(str):print(i, k)
# 结果如下
[pair('你好', 'l'), pair('哎呀', 'e'), pair(',', 'x'), pair('我', 'r'), pair('叫', 'v'), pair('李华', 'nr'), pair('!', 'x'), pair('多多关照', 'l'), pair('!', 'x')]
你好 l
哎呀 e
, x
我 r
叫 v
李华 nr
! x
多多关照 l
! x
相关文章:
Python学习之jieba
Python学习之jieba jieba是优秀的中文分词第三方库,由于中文文本之间每个汉字都是连续书写的,我们需要通过特定的手段来获得其中的每个词组,这种手段叫做分词,我们可以通过jieba库来完成这个过程。jieba库的分词原理:利用一个中文词库,确定汉字之间的关联频率,汉字向概率大的组…...
快速幂fast_pow
快速幂算法讲解 快速幂算法是一种高效计算幂运算的算法,其核心思想是利用指数的二进制分解,把幂运算的时间复杂度从 O(p) 降低到 O(logp)。 原理 假设要计算 an,将 n 表示成二进制形式:n2k12k2⋯2km,那么 ana…...
Go并发背后的双引擎:CSP通信模型与GMP调度|Go语言进阶(4)
为什么需要理解CSP与GMP? 当我们启动一个Go程序时,可能会创建成千上万个goroutine,它们是如何被调度到有限的CPU核心上的?为什么Go能够如此轻松地处理高并发场景?为什么有时候我们的并发程序会出现奇怪的性能瓶颈&…...
42、JavaEE高级主题:WebSocket详解
WebSocket 一、WebSocket协议与实现 WebSocket是一种基于TCP协议的全双工通信协议,能够在客户端和服务器之间建立实时、双向的通信通道。通过WebSocket,客户端和服务器可以在任何时候发送数据,并立即接收到对方的响应。 1.1 WebSocket协议…...
UGUI源代码之Text—实现自定义的字间距属性
以下内容是根据Unity 2020.1.01f版本进行编写的 UGUI源代码之Text—实现自定义的字间距属性 1、目的2、参考3、代码阅读4、准备修改UGUI源代码5、实现自定义Text组件,增加字间距属性6、最终效果 1、目的 很多时候,美术在设计的时候是想要使用文本的字间…...
【AI】MCP概念
一文讲透 MCP(附 Apifox MCP Server 内测邀请) 7分钟讲清楚MCP是什么?统一Function calling规范,工作量锐减至1/6,人人手搓Manus!? | 一键链接千台服务器,几行代码接入海量外部工具…...
HarmonyOS:使用geoLocationManager (位置服务)获取位置信息
一、简介 位置服务提供GNSS定位、网络定位(蜂窝基站、WLAN、蓝牙定位技术)、地理编码、逆地理编码、国家码和地理围栏等基本功能。 使用位置服务时请打开设备“位置”开关。如果“位置”开关关闭并且代码未设置捕获异常,可能导致应用异常。 …...
深入解析原生鸿蒙中的 RN 日志系统:从入门到精通!
全文目录: 开篇语📖 目录🎯 前言:鸿蒙日志系统究竟有多重要?🛠️ 鸿蒙 RN 日志系统的基础结构📜 1. 日志的作用⚙️ 2. 日志分类 🔧 如何在鸿蒙 RN 中使用日志系统🖋️ 1…...
【前端】【Nuxt3】Nuxt3中usefetch,useAsyncData,$fetch使用与区别
一、Nuxt3 中不同数据获取方式的请求行为对比 (一)总结:请求行为一览 useFetch 和 useAsyncData 是 Nuxt 推荐的数据获取 API,自动集成 SSR 与客户端导航流程。$fetch 是更底层的请求方法,不具备自动触发、缓存等集成…...
【Linux系统】Linux基础指令
l i n u x linux linux 命令是对 L i n u x Linux Linux 系统进行管理的命令。对于 L i n u x Linux Linux 系统来说,无论是中央处理器、内存、磁盘驱动器、键盘、鼠标,还是用户等都是文件, L i n u x Linux Linux 系统管理的命令是它正常运…...
Android中Jetpack设计理念、核心组件 和 实际价值
一、Jetpack 的定义与定位(基础必答) Jetpack 是 Google 推出的 Android 开发组件集合,旨在: 加速开发:提供标准化、开箱即用的组件 消除样板代码:解决传统开发中的重复劳动问题 兼容性保障:…...
flutter开发音乐APP(前提准备)
1、项目的一些环境: 2、接口文档: 酷狗音乐 NodeJS 版 API 3、接口数据结构化 Instantly parse JSON in any language | quicktype UI样式借鉴参考: Coffee-Expert/Apple-Music-New-UI: Apple Music Clone on Flutter, with redesigned UI…...
网络协议学习
最近在适配ESP32的网络驱动,借此机会先学习一下网络通信协议。 以太网帧、IP包及TCP与UDP的报文格式 提问腾讯元宝提示词: TCP窗口是干什么的拥塞窗口是什么的...
示波器直流耦合与交流耦合:何时使用哪种?
直流耦合和交流耦合的基本区别应该在于它们如何处理信号的直流分量和交流分量。直流分量是指信号中的固定电压部分,而交流分量则是信号中变化的电压部分。 例如,一个5V的直流电压叠加了一个1V的正弦波交流信号,整个信号会在4V到6V之间波动。如…...
js解除禁止复制、禁止鼠标右键效果
有的网页会禁止复制,甚至禁止鼠标右键,如何解决 按F12进入检查模式,在控制台输入下面的js代码 1.解除禁止复制 document.addEventListener(copy,function(event){event.stopImmediatePropagation();},true); 2.解除禁止鼠标右键 document…...
如何把未量化的 70B 大模型加载到笔记本电脑上运行?
并行运行 70B 大模型 我们已经看到,量化已经成为在低端 GPU(比如 Colab、Kaggle 等)上加载大型语言模型(LLMs)的最常见方法了,但这会降低准确性并增加幻觉现象。 那如果你和你的朋友们把一个大型语言模型分…...
xwiki的权限-页面特殊设置>用户权限>组权限
官方文档https://www.xwiki.org/xwiki/bin/view/Documentation/AdminGuide/Access%20Rights/ 他有组权限、用户权限、页面及子页面特别设置。 页面特殊设置 > 用户权限 > 组权限 XWiki提供了设置wiki范围内权限、细粒度页面级权限的能力,以及在需要更多控制的…...
Go语言比较递归和循环执行效率
一、概念 1.递归 递归是指一个函数在其定义中直接或间接调用自身的编程方法 。简单来说,就是函数自己调用自己。递归主要用于将复杂的问题分解为较小的、相同类型的子问题,通过不断缩小问题的规模,直到遇到一个最简单、最基础的情况&#x…...
Windows 图形显示驱动开发-WDDM 2.0功能_供应和回收更改
供应和回收更改 对于 Windows 显示驱动程序模型 (WDDM) v2,有关 套餐 和 回收 的要求正在放宽。 用户模式驱动程序不再需要在内部分配上使用套餐和回收。 空闲/挂起的应用程序将使用 Microsoft DirectX 11.1 中引入的 TrimAPI 删除驱动程序内部资源。 API 级别将继…...
MongoDB 新手笔记
MongoDB 新手笔记 1. MongoDB 1.1 概述 MongoDB 是一种 文档型数据库(NoSQL),数据以类似 JSON 的 BSON 格式存储,适合处理非结构化或半结构化数据。 对比 MySQL: MySQL 是关系型数据库,数据以表格形式存…...
Pytorch查看神经网络结构和参数量
基本方法 print(model) print(type(model))# 模型参数 numEl_list [p.numel() for p in model.parameters()] total_params_mb sum(numEl_list) / 1e6print(fTotal parameters: {total_params_mb:.2f} MB) # sum(numEl_list), numEl_list print(sum(numEl_list)) print(numE…...
Pytorch Dataset问题解决:数据集读取报错DatasetGenerationError或OSError
问题描述 在huggingface上下载很大的数据集,用多个parquet文件的格式下载到本地。使用load_dataset加载的时候,进度条加载到一半会报错DatasetGenerationError: An error occurred while generating the dataset;如果加载为IterableDataset&…...
学习OpenCV C++版
OpenCV C 1 数据载入、显示与保存1.1 概念1.2 Mat 类构造与赋值1.3 Mat 类的赋值1.4 Mat 类支持的运算1.5 图像的读取与显示1.6 视频加载与摄像头调用1.7 数据保存 参考:《OpenCV4快速入门》作者冯 振 郭延宁 吕跃勇 1 数据载入、显示与保存 1.1 概念 Mat 类 : Ma…...
特权FPGA之PS/2键盘解码
0 故事背景 见过这种接口的朋友们,大概都已经成家立业了吧。不过今天我们不讨论这种接口的历史,只讲讲这种接口的设计。(如果还没有成家的朋友也别生气,做自己想做的事情就对了!) 1 时序分析 数据帧格式如图…...
SpringBoot 接口限流Lua脚本接合Redis 服务熔断 自定义注解 接口保护
介绍 Spring Boot 接口限流是防止接口被频繁请求而导致服务器负载过重或服务崩溃的一种策略。通过限流,我们可以控制单位时间内允许的请求次数,确保系统的稳定性。限流可以帮助防止恶意请求、保护系统资源,并优化 API 的可用性,避…...
FPAG_BUFFER学习
在FPGA设计中,缓冲器(Buffer)是信号传输和管理的核心组件,用于处理输入/输出信号、时钟分配以及信号完整性。以下是FPGA中常见缓冲器的详细介绍,分类说明其功能、应用场景和设计注意事项: --- ### **1. 输…...
《认知觉醒》下篇·第六章第一节“清晰:一个观念,重构你的行动力” 总结
《认知觉醒》下篇第六章第一节“清晰:一个观念,重构你的行动力”的核心内容总结: 1. 清晰的力量:行动力的第一性原理 定义 清晰是对目标、路径和结果的明确认知,是破除拖延与内耗的核心前提。 模糊的代价: …...
idea手动创建resources文件夹
有时maven没有构建成功可能造成,resources文件夹不创建的现象 此时我们可以手动创建 手动创建...
Scala相关知识学习总结6
1、集合计算高级函数说明 - 过滤:遍历集合,提取满足特定条件的元素组成新集合。 - 转化/映射(map):将集合里的每个元素应用到指定函数进行转换。 - 扁平化:文档未详细阐述其具体含义和操作。 - 扁平化映射&…...
IDEA 调用 Generate 生成 Getter/Setter 快捷键
快捷键不会用? 快捷键:AltInsert 全选键:CtrlA IDEA 调用 Generate 生成 Getter/Setter 快捷键 - 爱吃西瓜的番茄酱 - 博客园...
【SpringCloud】从入门到精通(下)
网关与路由 什么是网关?顾明思议,网关就是网络的关口。数据在网络间传输,从一个网络传输到另一网络时就需要经过网关来做数据的路由和转发以及数据安全的校验。 现在前端不能请求各个微服务地址,只能去请求网关 网关可以做安全控…...
深入探索 C++23:特性测试与编译器支持
文章目录 一、C23 新特性概览(一)语言特性(二)标准库特性 二、特性测试程序三、主流编译器支持情况(一)GCC(二)Clang(三)MSVC 四、开发者建议(一&…...
Electron 应用太重?试试 PakePlus 轻装上阵
Electron 作为将 Web 技术带入桌面应用领域的先驱框架,让无数开发者能够使用熟悉的 HTML、CSS 和 JavaScript 构建跨平台应用。然而,随着应用规模的扩大,Electron 应用的性能问题逐渐显现——内存占用高、启动速度慢、安装包体积庞大…...
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接
驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接 原因描述 项目中有使用到 SQL Server 数据库, 在启动项目时, 出现报错信息: 【驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“The server selected protocol version…...
Java 设计模式:原型模式详解
Java 设计模式:原型模式详解 原型模式(Prototype Pattern)是一种创建型设计模式,它通过复制现有对象来创建新对象,而无需依赖其具体类。这种模式特别适合创建复杂对象或需要频繁创建相似对象的场景。本文将详细介绍原…...
NLP高频面试题(三十七)——大模型训练和推理的显存估计
在训练和推理大型语言模型时,显存(GPU 内存)的需求是一个关键考虑因素。准确估计这些需求有助于选择合适的硬件配置,确保模型高效运行。 推理阶段的显存需求 在推理过程中,显存主要用于存储模型权重和中间激活值。模型权重的显存需求可以通过以下公式估算: 模型权重…...
PHP 阿里云oss 使用指南
1.介绍 把图片放到阿里云上的空间上,可以使用cdn加速。 可以在程序里直接调用 要使用阿里云 oss sdk ,请先到阿里云下载 或用 copmposer 安装 相关链接: 安装OSS PHP SDK_对象存储(OSS)-阿里云帮助中心 composer require aliyuncs/oss…...
leetcode_面试题 02.07. 链表相交_java
面试题 02.07. 链表相交https://leetcode.cn/problems/intersection-of-two-linked-lists-lcci/ 1、题目 给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表没有交点,返回 null 。 图示两个链表在节点 c…...
LeetCode 3375.使数组的值全部为 K 的最少操作次数:O(1)空间——排序+一次遍历
【LetMeFly】3375.使数组的值全部为 K 的最少操作次数:O(1)空间——排序一次遍历 力扣题目链接:https://leetcode.cn/problems/minimum-operations-to-make-array-values-equal-to-k/ 给你一个整数数组 nums 和一个整数 k 。 如果一个数组中所有 严格…...
紫光展锐5G SoC T8300:影像升级,「定格」美好世界
影像能力已成为当今衡量智能手机性能的重要标尺之一。随着消费者对手机摄影需求日益提升,手机厂商纷纷在影像硬件和算法上展开激烈竞争,力求为用户带来更加出色的拍摄体验。 紫光展锐专为全球主流用户打造的畅享影音和游戏体验的5G SoC——T8300&#x…...
java基础 关键字static
static static使用简介static结合类的生命周期1.加载2.链接(1) 验证(Verification)(2) 准备(Preparation)(3) 解析(Resolution) 3. 初始化4.使用5.卸载总结 staic作用总结静态变量静态代码块静态方法静态内…...
大数据学习(105)-大数据组件分析
🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一…...
Spark运行
一文读懂Spark:从核心概念到实战编程 在大数据处理领域,Spark凭借其高效的计算能力和灵活的架构脱颖而出。今天,就来和大家深入聊聊Spark,帮助初学者快速入门。Spark采用经典的master - slave结构。Driver如同master,…...
在macOS的docker中如何安装及运行ROS2
1、macOS环境及版本 2、docker for macos版本 3、拉取ROS2镜像 docker pull ros:iron 4、查看容器 docker images 5、启动 ROS2 容器 docker run -it --rm ros:iron -it :以交互模式运行容器。 --rm :退出时自动删除容器(测试时推荐&am…...
FFmpeg安装和使用
1. 安装与环境配置 Windows # 方法1:官网下载预编译二进制包 https://ffmpeg.org/download.html#build-windows 解压后添加bin目录到系统PATH# 方法2:通过Chocolatey安装 choco install ffmpegmacOS # 使用Homebrew安装 brew install ffmpegLinux # …...
基于多模态大模型的ATM全周期诊疗技术方案
基于多模态大模型的ATM全周期诊疗技术方案 1. 数据预处理模块 算法1:多模态数据融合伪代码 def multimodal_fusion(data_dict):# 输入:包含MRI、EEG、实验室指标的字典# 输出:对齐后的张量序列# 模态对齐aligned_data = temporal_alignment(data_dict,sampling_rate...
写时复制Copy-on-Write(COW)
简单理解写时复制 读的时候,直接访问原对象。 写的时候,对复制原对象,对副本进行写操作,最后将副本替换原对象。 写时复制多用于读多写少的场景,因为写操作是用悲观锁进行的,如果写的场景多,…...
S7-1200 PLC热电偶和热电阻模拟量模块
热电偶和热电阻模拟量模块 S7-1200 PLC有专用用于对温度进行采集的热电偶模块SM1231 TC和SM 1231RTD。热电偶模块有4AI和8AI两种,下面以SM1231 TC 4AI为例看一下接线图。 该模块一共有4个通道,每个通道有两个接线端子,比如0,0-。…...
ffmpeg函数简介(封装格式相关)
文章目录 🌟 前置说明:FFmpeg 中 AVFormatContext 是什么?🧩 1. avformat_alloc_context功能:场景: 🧩 2. avformat_open_input功能:说明:返回值: ǹ…...
操作数组的工具类
Arrays 它里面的每一个方法基本上都是static静态修饰的,如果想要调用里面的方法,不需要创建对象,直接用类名.就可以了 操作数组的工具类 方法: public static String toString(数组) 把数组拼接成…...