人工智能通识速览(Part4. 评估指标)
四、评估指标
1.回归模型
均方误差(MSE)
- 优点:数学性质良好,计算简单,对误差的惩罚力度较大,能很好地反映模型预测值与真实值之间的平均差异程度,便于比较不同模型的性能。
- 缺点:由于对误差进行了平方运算,使得 MSE 的量纲与数据的原始量纲不同,不便于直观理解误差的实际大小。而且,它对异常值较为敏感,一个较大的异常值可能会使 MSE 大幅增大,从而影响对模型整体性能的评估。
平均绝对误差(MAE)
- 优点:量纲与数据的原始量纲相同,易于理解和解释,能直观地展示模型预测结果的平均误差大小。对异常值的敏感度相对较低,能更稳健地反映模型的一般性能。
- 缺点:在数学处理上相对 MSE 不够方便,例如在求导等运算时不如 MSE 简洁。而且,由于对所有误差同等对待,可能无法像 MSE 那样突出较大误差的影响,对于一些需要重点关注较大误差的场景,可能不太适用。
决定系数(R^2)
- 优点:能够直观地反映模型解释数据变异的能力,是一个相对值,不受数据量纲和取值范围的影响,便于在不同数据集和模型之间进行比较。可以帮助判断模型是否过拟合,如果\(R^2\)很高但模型在新数据上表现不佳,可能存在过拟合问题。
- 缺点:当增加自变量时,即使这些自变量对因变量没有实际的预测能力,\(R^2\)也可能会增大,导致对模型性能的高估。因此,在自变量个数不同的模型之间比较时,\(R^2\)可能会产生误导。此外,\(R^2\)只能反映模型对数据的拟合程度,不能完全说明模型的预测能力和泛化能力。
均方根误差(RMSE)
- 优点:量纲与原始数据一致,便于理解和解释模型预测误差的实际大小,在比较不同模型对同一数据集的预测效果时,RMSE 能更直观地反映出模型的优劣。与 MSE 相比,它对较大误差的惩罚仍然存在,但相对 MSE 来说,对异常值的敏感度有所降低,不过仍能在一定程度上体现模型对数据整体的拟合精度。
- 缺点:计算过程中涉及平方和开方运算,相对 MAE 等指标计算复杂度略高。虽然对异常值敏感度低于 MSE,但仍然会受到较大误差的影响,如果数据集中存在少量极端异常值,可能会使 RMSE 的值明显增大,从而影响对模型性能的准确评估。
平均绝对百分比误差(MAPE)
- 优点:是一个相对指标,不受数据量纲的影响,能直观地展示模型预测结果在相对意义上的准确性,对于不同规模和量级的数据集,MAPE 可以提供一个统一的衡量标准,方便比较不同模型的性能。在实际应用中,特别是在一些对预测精度有明确百分比要求的场景,如经济预测、销售预测等领域,MAPE 能直接反映模型是否满足业务需求。
调整后的决定系数(Adjusted \(R^2\))
- 优点:能够更准确地评估模型的拟合优度,尤其是在比较不同自变量个数的回归模型时,Adjusted (R^2^)可以避免(R^2^)因自变量增加而虚增的问题,从而更真实地反映模型的实际解释能力。它可以帮助选择最合适的自变量组合,避免过度拟合数据,使模型具有更好的泛化能力。
- 缺点:Adjusted \(R^2\)仍然依赖于\(R^2\),如果数据本身存在问题或模型设定不合理,Adjusted \(R^2\)也可能会给出错误的指示。而且,它只是一个相对指标,只能说明模型在当前数据和自变量选择下的相对优劣,并不能完全确定模型的绝对性能和预测能力。此外,在样本量较小或自变量个数接近样本量时,Adjusted \(R^2\)可能会出现不稳定甚至不合理的值。
2.分类模型
准确率(Accuracy)
- 优点:计算简单直观,能快速了解模型在整体上的分类性能,是最常用的评估指标之一,容易理解和解释,对于平衡数据集,准确率能较好地反映模型的优劣。
- 缺点:当数据集不平衡时,即正负样本比例差异较大,准确率可能会产生误导。例如,在一个正负样本比例为 9:1 的数据集上,即使模型将所有样本都预测为多数类(正例),也能获得 90% 的准确率,但实际上模型对少数类(反例)的预测能力很差。
精确率(Precision)
- 优点:对于那些需要确保预测为正例的结果尽可能准确的场景非常重要,比如在垃圾邮件过滤中,希望将被标记为垃圾邮件的邮件确实是垃圾邮件,减少误判为垃圾邮件的正常邮件数量。
- 缺点:单独使用精确率可能会忽略对正例的全面覆盖。例如,一个模型只预测了少量样本为正例且这些样本都预测正确,精确率会很高,但可能遗漏了很多实际的正例,即召回率可能很低。
召回率(Recall)
- 优点:在一些需要尽可能找出所有正例的场景中至关重要,如疾病检测,希望尽可能检测出所有患病的个体,避免漏诊。
- 缺点:与精确率类似,单独使用召回率可能会导致模型为了提高召回率而过度预测正例,从而降低精确率。例如,将大量负例预测为正例,虽然召回率可能很高,但精确率会很低,模型的实际效果可能并不理想。
F1 值
- 原理:F1 值是精确率和召回率的调和平均数,公式为\(F1 = 2\times\frac{Precision\times Recall}{Precision + Recall}\)。它综合了精确率和召回率的信息,能够更全面地评估模型在正例分类上的性能。
- 优点:当精确率和召回率都较高时,F1 值才会高,因此能较好地平衡精确率和召回率,避免了单独使用精确率或召回率可能带来的片面性,更全面地反映了模型的分类效果。
- 缺点:对于多分类问题,F1 值的计算和解释相对复杂一些。而且,如果数据分布发生变化,精确率和召回率的重要性可能会改变,此时 F1 值可能不能准确反映模型的实际价值。
受试者工作特征曲线(ROC 曲线)与曲线下面积(AUC)
- 优点:ROC 曲线和 AUC 对数据集中正负样本的分布不敏感,适用于不平衡数据集。它们能够提供关于模型分类性能的整体信息,而不仅仅是在某个特定阈值下的性能,有助于选择最佳的分类阈值。
- 缺点:ROC 曲线和 AUC 不能直接给出具体的分类准确率、精确率等指标,对于一些需要明确具体数值来评估模型性能的场景,可能不够直观。而且,AUC 只是一个总体的评估指标,无法详细了解模型在不同类别或不同数据子集上的表现。
混淆矩阵(Confusion Matrix)
- 原理:混淆矩阵是一个用于展示分类模型预测结果的矩阵,它以表格形式直观地呈现了真实类别与预测类别之间的关系。对于二分类问题,混淆矩阵是一个\(2\times2\)的矩阵,行表示真实类别,列表示预测类别,四个元素分别为TP、TN、FP、FN。对于多分类问题,矩阵的行数和列数等于类别数,矩阵中的元素\(C_{ij}\)表示真实类别为i但被预测为类别j的样本数量。通过混淆矩阵,可以清晰地看到模型在各个类别上的分类情况,以及不同类别之间的混淆程度。
- 优点:混淆矩阵提供了详细的分类结果信息,能够帮助用户全面了解模型的性能,不仅可以计算出准确率、精确率、召回率等常见指标,还能直观地发现模型容易混淆的类别,有助于进一步分析模型的错误原因,从而有针对性地改进模型。
- 缺点:对于大型的多分类问题,混淆矩阵可能会变得非常庞大,难以直观地理解和分析。而且,它本身只是一个数据展示工具,需要结合其他指标来综合评估模型性能,不能直接给出一个简洁的数值来概括模型的好坏。
PR曲线
PR 曲线是 Precision - Recall 曲线的简称,它是用于评估分类模型性能的一种可视化工具。以下是关于 PR 曲线的详细介绍:
定义与原理
-
PR 曲线以精确率(Precision)为纵坐标,召回率(Recall)为横坐标。在不同的分类阈值下,模型会产生不同的精确率和召回率,将这些点连接起来就形成了 PR 曲线。精确率是指预测为正例的样本中真正正例的比例,召回率是指真实正例中被预测为正例的比例。PR 曲线展示了模型在精确率和召回率之间的权衡关系,曲线上的每个点代表了模型在某个特定阈值下的性能表现。
绘制方法
-
首先,使用分类模型对测试数据集进行预测,得到每个样本属于正类的概率得分。
-
然后,选择一系列不同的阈值,将概率得分转换为类别预测。例如,当阈值为 0.5 时,概率得分大于 0.5 的样本被预测为正类,小于等于 0.5 的样本被预测为负类。
-
对于每个阈值,计算相应的精确率和召回率。
-
最后,将这些精确率和召回率的值绘制成曲线,横坐标为召回率,纵坐标为精确率。
评估模型性能
-
曲线形状:PR 曲线越靠近右上角,说明模型的性能越好。理想情况下,完美的分类模型的 PR 曲线应该是从点 (0, 1) 开始,即召回率为 0 时精确率为 1,然后一直保持精确率为 1 直到召回率为 1,形成一个直角折线。实际的模型曲线通常是一条从左到右下降的曲线,曲线下的面积越大,代表模型性能越好。
-
AUC - PR 值:与 ROC 曲线下面积(AUC - ROC)类似,PR 曲线下的面积(AUC - PR)也可以作为一个数值指标来衡量模型性能。AUC - PR 的取值范围在 0 到 1 之间,值越高表示模型在精确率和召回率的权衡上表现越优。例如,AUC - PR 为 1 表示模型在所有阈值下都能完美地平衡精确率和召回率,而 AUC - PR 为 0.5 则表示模型的性能与随机猜测相当。
优缺点
-
优点:在正负样本不均衡的情况下,尤其是正样本比例较低时,PR 曲线能更准确地评估模型对正样本的分类性能。因为精确率和召回率在这种情况下更能反映模型对于正例的预测能力,而 PR 曲线直接展示了这两个指标的关系,有助于更全面地了解模型在正例识别上的表现。
-
缺点:PR 曲线不能直接反映模型在不同类别上的具体表现,对于多分类问题,需要为每个类别分别绘制 PR 曲线,增加了分析的复杂性。此外,PR 曲线受数据分布影响较大,不同的数据分布可能导致 PR 曲线的形状和 AUC - PR 值有较大差异,从而影响对模型性能的评估和比较。
MAP
在信息检索和机器学习领域,MAP 通常指平均准确率均值(Mean Average Precision),是一种用于评估排序模型性能的指标,以下是其原理及优缺点:
原理
-
MAP 是在多个查询或样本上计算平均准确率(Average Precision,AP)的均值。对于每个查询,AP 是通过计算在不同召回率水平下的准确率的平均值得到的。具体来说,首先根据模型对相关文档或正例的预测得分进行排序,然后从排序结果的顶部开始,依次计算每个位置的准确率,并根据该位置是否为真正例来决定是否将该准确率纳入平均计算。
-
例如,对于一个查询,模型返回了一系列文档,我们按照模型给出的相关性得分从高到低对文档进行排序。然后从第一个文档开始,计算当前位置的准确率(即当前已检索到的真正例数量除以当前已检索到的文档总数)。如果当前文档是真正例,则将该准确率纳入 AP 的计算;如果是假正例,则不纳入。通过这种方式,遍历整个排序结果,计算出该查询的 AP 值。最后,对所有查询的 AP 值求平均,得到 MAP。
优点
-
综合评估排序性能:MAP 考虑了模型对所有相关文档的排序能力,不仅仅关注是否能够找到相关文档,还关注这些相关文档在排序结果中的位置。因此,它能够全面地评估排序模型在不同召回率水平下的准确率,对于需要对结果进行排序的任务,如信息检索、推荐系统等,是一个非常有效的评估指标。
-
对不均衡数据不敏感:与一些基于分类准确率的指标不同,MAP 在处理正负样本不均衡的数据时表现较好。因为它主要关注的是相关文档的排序,而不是简单地判断类别,所以不会受到正负样本比例的影响,能够更准确地反映模型在实际应用中的性能。
缺点
-
计算复杂度较高:计算 MAP 需要对每个查询的排序结果进行详细的分析和计算,涉及到对每个位置的准确率的统计,因此计算量较大。在处理大规模数据集和大量查询时,计算 MAP 可能会比较耗时,这在一定程度上限制了它在一些实时性要求较高的场景中的应用。
-
难以直观理解:相比于一些简单直观的指标,如准确率、召回率等,MAP 的计算过程较为复杂,不太容易直观地理解和解释。对于非专业人员来说,可能需要一定的时间和知识储备才能理解 MAP 所代表的含义以及如何根据它来评估模型的性能。
3.聚类模型
相关文章:
人工智能通识速览(Part4. 评估指标)
四、评估指标 1.回归模型 均方误差(MSE) 优点:数学性质良好,计算简单,对误差的惩罚力度较大,能很好地反映模型预测值与真实值之间的平均差异程度,便于比较不同模型的性能。缺点:由…...
IT运维服务方案
一、服务目标 IT 运维服务致力于构建稳固、高效且智能的信息系统生态,为客户的业务运营筑牢数字化根基。凭借前沿的主动式维护策略,运用大数据分析、智能监控等技术手段,提前洞察系统隐患,在萌芽阶段化解潜在故障。同时࿰…...
【简历全景认知2】电子化时代对简历形式的降维打击:从A4纸到ATS的生存游戏
一、当简历遇上数字洪流:传统形式的式微 在1990年代,一份排版精美的纸质简历还能让HR眼前一亮;但今天,超过75%的 Fortune 500 企业使用ATS(Applicant Tracking System)进行初筛,未优化的简历可能在5秒内就会沦为数字废土。这种变迁本质上符合「技术接纳生命周期」理论—…...
LLM面试题七
NLP算法工程师面试题8道|含解析 分类场景下bert和gptprompt的方式哪种会有更好效果,为什么? 在分类场景下,BERT比GPT更适合用于建模,因为BERT的结构中包含了双向的Transformer编码器,而GPT的结构中只包含单向的Transf…...
Semaphore
关于作者: CSDN内容合伙人、技术专家, 从零开始做日活千万级APP,带领团队单日营收超千万。 专注于分享各领域原创系列文章 ,擅长java后端、移动开发、商业化变现、人工智能等,希望大家多多支持。 目录 一、导读二、概览…...
视频插帧EMAVFI:extracting motion and appearance via inter-frame attention for video
文章目录 EMAVFI:extracting motion and appearance via inter-frame attention for efficient video frame interpolation1.核心概述2.帧间注意力机制为什么可以表示运动信息3.网络架构4.dataset类5.demo推理和训练代码6.总结 EMAVFI:extracting motion and appearance via in…...
⑨数据中心-M-LAG技术配置
华三数据中心网络是指华三提供的专门设计用于数据中心环境的网络解决方案。这种网络通常具有高性能、可扩展性和可靠性,旨在支持大规模数据中心的需求。华三数据中心网络解决方案通常包括以下特点: 1. 高带宽:支持高密度数据中心环境中大量网…...
永磁同步电机无速度算法--基于HOPLL的滑模观测器
一、原理介绍 传统PLL算法为二阶系统,其实现是基于转速变化变化缓慢的假设,因此在转速频繁出现动态变化时会导致动态性能不佳。为改善系统动态性能,将转速微分量引入PLL中,作为附加状态变量,与电角速度及转速共同构成…...
【Linux网络】网络套接字socket
🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm1010.2135.3001.5343 🔥 系列专栏:https://blog.csdn.net/qinjh_/category_12891150.html 目录 Socket 编程预备 理解源 IP 地址和目的 IP 地址 认识端口号 端口号范围划分…...
ubuntu wifi配置(命令行版本)
1、查询当前设备环境的wifi列表 nmcli dev wifi list2、连接wifi nmcli dev wifi connect "MiFi-SSID" password "Password" #其中MiFi-SSID是wifi的密码,Password是wifi的密码3、查看连接情况 nmcli dev status...
配环境的经验
pip install -e . 该命令用于以“编辑模式”(也称为开发模式)安装当前目录下的 Python 包,比如包含有 setup.py、setup.cfg 或 pyproject.toml 文件的项目-e 是 --editable 的简写。以编辑模式安装时,pip 会在你的 Python 环境中创…...
STM32cubmax配置STM32407VET6,实现网络通信
文章目录 一、开发准备1、硬件准备2、软件准备 二、STM32CubeMX工程配置步骤1、创建新工程 三、外设配置步骤1)调试接口(SWD)配置2)时钟配置3)串口(USART)配置4)IO口配置(…...
LeetCode 热题 100_完全平方数(84_279_中等_C++)(动态规划(完全背包))
LeetCode 热题 100_完全平方数(84_279) 题目描述:输入输出样例:题解:解题思路:思路一(动态规划(完全背包)): 代码实现代码实现(思路一…...
【C++】vector的底层封装和实现
目录 目录前言基本框架迭代器容量第一个测试,野指针异常第二轮测试,浅拷贝的问题 元素访问修改操作push_backinsert迭代器失效问题 erase 默认成员函数构造函数双重构造引发调用歧义 拷贝构造赋值重载析构函数 源码end 目录 前言 废话不多说࿰…...
AI前端组件库Ant DesIgn X
Ant Design X AI:体验新秩序 Ant Design 团队精心打造 RICH 设计范式,为 AI 界面提供卓越解决方案,引领智能交互新体验。 设计语言与理论 官网: Ant Design X - 轻松打造 AI 驱动的界面。 AI 设计范式 —— RICH 是我们在蚂蚁…...
BGP路由协议之解决 IBGP 水平分割带来的问题
主要有以下 3 种方案: 全互联 :配置量大、耗费资源联邦: 配置量大、邻居会重建、中断时间较长RR 路由反射器:目前主流使用、简单、好用 联邦 IBGP 水平分割问题用与防止 AS 内部产生环路,在很大程度上杜绝了 IBGP 路…...
基于Java的人脸识别在线考试系统(jsp+springboot+mysql8.x)
基于Java的人脸识别在线考试系统(jspspringbootmysql8.x) 在线考试系统提供全面的考试管理和用户管理功能。登录界面支持管理员、教师和学生三种身份验证,确保不同用户访问相应的功能模块。系统自动组卷功能允许管理员根据不同科目和题型,如单选题、多选…...
如何对LLM大型语言模型进行评估与基准测试
基础概念 这几年,随着生成式 AI 和大型语言模型(LLMs)的兴起,AI 领域整体迎来了一波大爆发。 随着各种基于 LLM 的应用程序在企业里落地,人们开始需要评估不同推理部署方案的性价比。 LLM 应用的部署成本,…...
C语言内存函数和数据在内存的存储
一、内存操作函数深度解析 函数名原型核心特性典型应用场景注意事项memcpyvoid* memcpy(void* dest, const void* src, size_t num)内存块无重叠复制,性能高数组拷贝、结构体复制1. 必须确保目标空间足够 2. 不支持重叠内存(用memmove替代) …...
ChatGPT之智能驾驶问题讨论
ChatGPT之智能驾驶问题讨论 1. 源由2. 问题:2.1 智能驾驶级别定义🚗 L2(部分自动化,Partial Automation)🤖 L3(有条件自动化,Conditional Automation)🛸 L4&a…...
【PalladiumZ2 使用专栏 1 -- 波形 trigger 抓取详细介绍】
文章目录 Palladium Z2 OverviewPalladium 波形抓取Palladium 波形存放文件创建Palladium Trigger 断点设置Palladium 加探针并 dumpPalladium 波形查看 Palladium Z2 Overview Cadence Palladium Z2 是 Cadence 推出的企业级硬件仿真加速平台,旨在应对复杂 SoC 设…...
elasticsearch 8设置验证登录查询
最近总是困扰于9200网络勒索,老是在捣乱,动不动给我清理了index,实在是费劲,今天研究了下config配置,设置ca验证。 以下是完整的步骤和配置,确保生成的证书文件与elasticsearch.yml的配置一致: 1. 生成CA证书 运行以下命令生成CA证书:让输入账号或密码请直接回车。 …...
为什么使用了CDN源服务器需要关闭防火墙?
在网站运营过程中,不少站长会遇到这样的困惑:当使用 CDN 源服务器时,好像就得关闭源服务器的防火墙,不然就状况百出。这背后究竟是什么原因呢? 当你在浏览网页时,要是看到 “502 - 服务暂时不可用” 的提…...
Android 学习之 Navigation导航
1. Navigation 介绍 Navigation 组件 是 Android Jetpack 的一部分,用于简化应用内导航逻辑,支持 Fragment、Activity 和 Compose 之间的跳转。核心优势: 单 Activity 架构:减少 Activity 冗余,通过 Fragment 或 Com…...
初识 Three.js:开启你的 Web 3D 世界 ✨
3D 技术已经不再是游戏引擎的专属,随着浏览器技术的发展,我们完全可以在网页上实现令人惊艳的 3D 效果。而 Three.js,作为 WebGL 的封装库,让 Web 3D 的大门向更多开发者敞开了。 这是我开启这个 Three.js 专栏的第一篇文章&…...
PyTorch 笔记
简介与安装 PyTorch 是一个开源的 Python 机器学习库,基于 Torch 库,底层由C实现,应用于人工智能领域,如计算机视觉和自然语言处理。 PyTorch 最初由 Meta Platforms 的人工智能研究团队开发,现在属 于Linux 基金会的…...
day24学习Pandas库
文章目录 三、Pandas库4.函数计算3遍历3.1.遍历Series对象3.2.遍历DataFrame对象 4排序4.1 sort_index4.2 sort_values 5.去重drop_duplicates6.先分组在计算6.1 groupby6.2 filter过滤 7.合并未完待续.. 三、Pandas库 4.函数计算 3遍历 3.1.遍历Series对象 在讲解Series部…...
AI日报 - 2025年4月8日
AI日报 - 2025年4月8日 🌟 今日概览(60秒速览) ▎🤖 模型进展 | Llama 4发布引爆讨论 (性能、应用、部署、训练争议),OpenAI保持高速迭代,香港大学推Dream 7B扩散模型。 Meta Llama 4 Scout & Maveric…...
Linux学习笔记(2) 命令基础:从概念到实践(期末,期中复习笔记全)
前言 一、认识命令行与命令 二、Linux 命令的基础格式 三、命令示例解析 (1)ls -l /home/itheima (2)cp -r test1 test2 四结语 前言 在 Linux 系统的世界里,命令行是与系统交互的重要方式。熟练掌握 Linux 命令…...
langgraph简单Demo4(checkpoint检查点)
在 langgraph 里,检查点(checkpoint)是一项重要的功能,它能够记录工作流在执行过程中的中间状态。当工作流因某些原因中断时,可以从检查点恢复继续执行,避免从头开始,提升效率。 示例ÿ…...
【题解】AtCoder AT_abc400_c 2^a b^2
题目大意 我们定义满足下面条件的整数 X X X 为“好整数”: 存在一个 正整数 对 ( a , b ) (a,b) (a,b) 使得 X 2 a ⋅ b 2 X2^a\cdot b^2 X2a⋅b2。 给定一个正整数 N N N( 1 ≤ N ≤ 1 0 18 1\le N\le 10^{18} 1≤N≤1018)ÿ…...
七种驱动器综合对比——《器件手册--驱动器》
目录 九、驱动器 概述 定义 功能 分类 1. 按负载类型分类 2. 按功能特性分类 工作原理 优势 应用领域 详尽阐述 1 隔离式栅极驱动器 定义 工作原理 应用场景 优势 2 变压器驱动器 定义 工作原理 应用场景 优势 设计注意事项 3 LED驱动 定义 功能与作用 应用场景 设计…...
GStreamer开发笔记(一):GStreamer介绍,在windows平台部署安装,打开usb摄像头对比测试
若该文为原创文章,转载请注明原文出处 本文章博客地址:https://blog.csdn.net/qq21497936/article/details/147049923 长沙红胖子Qt(长沙创微智科)博文大全:开发技术集合(包含Qt实用技术、树莓派、三维、O…...
西湖大学团队开源SaProt等多款蛋白质语言模型,覆盖结构功能预测/跨模态信息搜索/氨基酸序列设计等
2025 年 3 月 22—23 日,上海交通大学「AI 蛋白质设计峰会」正式举行。 本次峰会汇聚了来自清华大学、北京大学、复旦大学、浙江大学、厦门大学等知名高校的 300 多位专家学者,以及 200 余位行业领军企业代表和技术研发人员,深入探讨了 AI 在…...
ansible+docker+docker-compose快速部署4节点高可用minio集群
目录 github项目地址 示例服务器列表 安装前 修改变量文件group_vars/all.yml 修改ansible主机清单 修改setup.sh安装脚本 用法演示 安装后验证 github项目地址 https://github.com/sulibao/ansible_minio_cluster.git 示例服务器列表 安装前 修改变量文件group_var…...
说话人分离中的聚类方法:深入解析Agglomerative聚类、KMeans聚类和Oracle聚类
说话人分离(Speaker Diarization)是将音频流根据说话人身份划分为同质片段的过程。这一过程中的关键步骤是聚类,即将说话人嵌入(embeddings)分组为不同的簇,每个簇代表一个独特的说话人。在pyannote.audio管…...
蓝桥杯真题——前缀总分、遗迹
蓝桥杯2024年第十五届省赛真题-前缀总分 题目描述 给定 n 个由小写英文字母组成的字符串 s1, s2, , sn ,定义前缀总分为V ∑i<j P(si, sj) ,其中 P(si, sj) 表示 si, sj 的最长公共前缀的长度。 小蓝可以选择其中一个字符串,并修改其…...
性能比拼: MySQL vs PostgreSQL
本内容是对知名性能评测博主 Anton Putra MySQL vs PostgreSQL Performance Benchmark (Latency - Throughput - Saturation) 内容的翻译与整理, 有适当删减, 相关指标和结论以原作为准 MySQL vs PostgreSQL 数据库性能对比** 在本内容中,我们将对比 MySQL 和 Pos…...
TypeScript 中的 infer 关键字用途
infer 是 TypeScript 中的高级类型关键字,主要用于条件类型中推断类型。它允许我们在条件类型的 extends 子句中声明一个类型变量,然后在该条件类型的 true 分支中使用这个推断出的类型。 1. 基本语法 type SomeType<T> T extends infer U ? U…...
关于Spring MVC中@RequestParam注解的详细说明,用于在前后端参数名称不一致时实现参数映射。包含代码示例和总结表格
以下是关于Spring MVC中RequestParam注解的详细说明,用于在前后端参数名称不一致时实现参数映射。包含代码示例和总结表格: 1. 核心作用 RequestParam用于显式绑定HTTP请求参数到方法参数,支持以下场景: 参数名不一致࿱…...
Spring Boot中Spring MVC相关配置的详细描述及表格总结
以下是Spring Boot中Spring MVC相关配置的详细描述及表格总结: Spring MVC 配置项详解 1. 异步请求配置 spring.mvc.async.request-timeout 描述:设置异步请求的超时时间(单位:毫秒)。默认值:未设置&…...
Shell脚本编程之正则表达式
一、概念 在 Shell 脚本中,正则表达式是一种强大且常用的文本处理工具,它可以用来匹配、搜索、替换和截取字符串。 正则表达式是由一些字符去描述规则,在正则表达式中有两类字符 (1)元字符(Meta Character):Shell 环境中具有特殊含…...
spring-ai-openai调用Xinference1.4.1报错
1、Xinference 报错logs 此处是调用 /v1/chat/completions 接口 2025-04-06 15:48:51 xinference | return await dependant.call(**values) 2025-04-06 15:48:51 xinference | File "/usr/local/lib/python3.10/dist-packages/xinference/api/restful_api.py", …...
XC7K160T-2FFG676I Kintex‑7系列 Xilinx 赛灵思 FPGA 详细技术规格
XC7K160T-1FFG676I XC7K160T-1FFG676C XC7K160T-2FFG676C 1. 基本概述 XC7K160T-2FFG676I 属于 Xilinx Kintex‑7 系列 FPGA,该系列芯片采用 28nm (HKMG)工艺制造,旨在提供高性能与低功耗的平衡。该芯片主要面向对高速数据处理、…...
C++学习之udp通信
1.UDP特点 c /* udp 传输层协议, 和tcp是一样的 特点: 面向无连接的, 不安全的, 报式传输协议 1. 无连接: udp通信的时候不需要connect 1). 通信不需要建立连接 2). 如果想给对方发送数据, 只需要指定对方的IP和端口 2. udp会丢包 1). 数…...
2020年-全国大学生数学建模竞赛(CUMCM)试题速浏、分类及浅析
2020年-全国大学生数学建模竞赛(CUMCM)试题速浏、分类及浅析 全国大学生数学建模竞赛(China Undergraduate Mathematical Contest in Modeling)是国家教委高教司和中国工业与应用数学学会共同主办的面向全国大学生的群众性科技活动,目的在于激励学生学习数学的积极性,提高学…...
【数据标准】数据标准化实施流程与方法-保障机制篇
导读:1、数据标准化保障机制(组织架构、协作流程)是战略落地的基石,确保责权分明与资源协同;2、数据标准化制度建设(政策、标准、工具)构建了统一治理框架,规范数据…...
ZLMediaKit部署与配置
ZLMediaKit编译 # 安装编译器 sudo apt install build-essential cmake# 其它依赖库 sudo apt-get install libssl-dev libsdl-dev libavcodec-dev libavutil-dev ffmpeg git cd /usr/local/srcgit clone --depth 1 https://gitee.com/xia-chu/ZLMediaKit.git cd ZLMediaKit# …...
38、web前端开发之Vue3保姆教程(二)
三、Vue3语法详解 1、组件 1 什么是组件? 组件是 Vue.js 中最重要的概念之一。它是一种可复用的 Vue 实例,允许我们将 UI 拆分为独立的、可复用的部分。组件可以提高代码的组织性和可维护性。 2 创建组件 在 Vue 3 中,组件通常使用单文件组件(SFC)编写,其包含三个主…...
知识中台如何重构企业信息生态?关键要素解析
在信息化快速发展的时代,企业面临着如何高效整合和管理知识资源的挑战。知识中台作为企业信息管理的核心工具,正在帮助企业提升运营效率和创新力。本文将探讨知识中台如何重构企业信息生态,并解析其关键要素。 一、什么是知识中台?…...