5.第五章:数据分类的方法论
文章目录
- 5.1 传统分类方法
- 5.1.1 基于规则的分类方法
- 5.1.2 基于统计的分类方法
- 5.1.3 传统分类方法的局限性
- 5.2 现代分类技术
- 5.2.1 神经网络分类模型
- 5.2.2 深度学习分类方法
- 5.2.3 现代分类技术的优势
- 5.3 创新分类方法
- 5.3.1 小样本学习方法
- 5.3.2 零样本学习方法
- 5.3.3 主动学习方法
- 5.4 方法选择与组合
- 5.4.1 分类需求分析
- 5.4.2 数据质量评估
- 5.4.3 场景驱动的方法选择
- 5.4.4 多模型集成学习
- 小结
- 术语表
相关专栏:数据分类的艺术
数据分类是数据治理中一个重要的模块,其目的是根据数据的内容、属性、应用场景等特征,将海量杂乱无章的原始数据划分到预先定义的若干个类别中,从而便于后续的数据管理、分析和应用。一个优秀的数据分类方法不仅能够提高数据管理的效率,还能发掘数据的内在联系和价值。本章将系统介绍数据分类的各种方法,从传统技术到前沿创新,力求为读者提供一个全面的视角。
5.1 传统分类方法
传统的数据分类方法主要包括基于规则的方法和基于统计的方法两大类。
5.1.1 基于规则的分类方法
这类方法需要领域专家根据经验预先定义一系列规则,然后用这些规则去匹配数据,进行分类。常见的规则包括:
- 关键词匹配: 在数据中搜索预定义的关键词,根据关键词出现与否决定数据类别。比如对于文本型数据,出现"申请表""简历"等词可能是求职信函。
- 正则表达式匹配: 用正则表达式描述数据特征,对数据进行模式匹配。比如形如
\d{3}-\d{8}|\d{4}-\d{7}
的字符串很可能是电话号码。
基于规则的分类方法实现简单直观,但对领域知识要求较高,且缺乏灵活性,难以应对未知情况。
5.1.2 基于统计的分类方法
统计学习是机器学习的重要分支。常见的统计学习分类算法有:
- 朴素贝叶斯分类(Naive Bayes Classifier):基于贝叶斯定理和特征独立性假设,通过先验概率和数据似然估计后验概率,从而得到数据最可能的类别。
- 决策树分类(Decision Tree):通过信息熵、信息增益等指标选取最优划分特征,递归地生成一棵树,从根节点到叶节点的每条路径对应一个分类规则。
- 支持向量机分类(Support Vector Machine):在高维空间寻找最大间隔超平面将不同类别的数据分开。当数据线性不可分时,引入核函数将其映射到高维空间。
以上方法都是有监督学习,需要人工标注的训练数据。它们通过特征工程将原始数据转化为结构化的特征向量,再基于训练数据学习分类模型。这些方法数学基础扎实,具有一定的普适性,被广泛应用于文本分类、垃圾邮件识别等任务中。
一些常用的统计学习工具包括:
- Python: Scikit-learn提供了全面的机器学习算法库
- R: 拥有丰富的统计分析和建模包,如e1071, rpart等
- Weka: 一个基于Java的开源机器学习平台,集成了数据预处理、分类、聚类、关联规则等功能
- SPSS: 一款强大的统计分析软件,提供多种分类算法的实现,并带有可视化界面
5.1.3 传统分类方法的局限性
尽管在许多场景下应用广泛,传统的机器学习分类方法仍存在一些局限:
- 特征工程复杂:需要大量人力分析数据,提取结构化特征,很难做到自动化。特征质量直接决定分类效果。
- 分类效果一般:特征维度受限,难以全面刻画复杂数据。类别越多,准确率越难提升。
- 泛化能力不足:模型依赖训练数据分布,对未知数据识别能力弱。每个场景需要重新训练。
因此,传统分类技术虽经典好用,但在大数据时代已捉襟见肘,亟需革新。
5.2 现代分类技术
得益于深度学习的发展,近年来涌现出许多强大的现代分类技术,极大拓展了分类任务的边界。
5.2.1 神经网络分类模型
神经网络(Neural Networks)模仿人脑的结构,由大量节点(神经元)组成,根据信号的传递和转换进行计算。按网络的连接方式,可分为:
- 前馈神经网络(Feedforward Neural Network):各层节点间只有前向连接。输入数据经过隐藏层层层转换,最后输出预测类别。
- 卷积神经网络(Convolutional Neural Network):引入卷积、池化等操作,能自动提取局部特征,擅长处理网格型数据如图像。
- 循环神经网络(Recurrent Neural Network):节点间存在环形连接,能记忆历史信息。适合处理时序数据如语音、文本。
神经网络能自动学习数据中的多层次特征表示,克服了人工特征的局限。但其参数众多,训练需要海量标注数据和算力。
5.2.2 深度学习分类方法
在神经网络的基础上,一系列深度学习模型不断刷新着分类任务的性能上限。比较典型的有:
- BERT语言模型:通过自注意力机制和双向训练,学习单词和句子的上下文表示,可端到端用于文本分类。
- XLNet语言模型:采用排列语言建模,结合自回归和非自回归的优点,对长文本建模效果更优。
- 迁移学习方法:用在大规模数据上预训练的通用模型,在小规模任务数据上微调,能显著提升新领域的分类效果。
这些方法借助强大的语言表示能力,使文本分类任务取得了重大突破。类似地,视觉、语音等领域的分类问题也因深度学习获得了长足进展。一些流行的深度学习框架包括:
- TensorFlow: 由Google开发,提供低级API灵活组建模型,以及高级API快速搭建应用
- PyTorch: 由Facebook开发,采用动态计算图,接口简洁,深受研究者青睐
- Keras: 对TensorFlow等框架做了高层封装,用户能以最少代码实现想法
5.2.3 现代分类技术的优势
相比传统方法,现代分类技术具有以下优势:
- 特征自动提取:端到端学习数据表示,避免了复杂的人工特征工程,使建模过程自动化。
- 分类精度高:超大规模参数和深层网络结构,使模型能够拟合高维复杂函数,大幅提升分类准确率。
- 模型泛化能力强:得益于海量训练数据和深度特征表示,模型对新领域、长尾数据的适应性大为改善。
当然,现代方法对算力、数据和专业知识也提出了更高要求。如何因地制宜,发挥传统和现代技术各自所长,是一个值得权衡的问题。
5.3 创新分类方法
尽管已取得巨大进展,但在一些实际场景中,如小样本、无训练、复杂非结构化数据等,现有分类方法仍难以满足日益增长的需求。创新方法应运而生。
5.3.1 小样本学习方法
在许多垂直领域,大规模人工标注数据代价高昂。小样本学习(Few-Shot Learning)希望只用很少的标注样本,就能训练出良好的分类器。代表性方法有:
- 原型网络(Prototypical Network):学习类别在特征空间的原型表示,通过计算查询样本和各原型的距离进行分类。
- 匹配网络(Matching Network):用注意力机制对支持集样本进行加权,预测查询样本的类别分布。
- 关系网络(Relation Network):用联合嵌入对来建模样本对之间的关系得分矩阵,通过非线性变换来进行比较和分类。
这些方法巧妙利用了任务内和任务间的知识转移,大大降低了分类器对标注数据的依赖。
5.3.2 零样本学习方法
在一些开放场景下,测试阶段可能出现全新的类别,此时连少量样本都无法获得。零样本学习(Zero-Shot Learning)致力于利用先验知识,实现对未知类别的分类。常见方法包括:
- 属性分类方法:通过属性标签将可见类别和未知类别统一描述到属性空间,根据属性分类器和类别-属性矩阵得到未知类别分类结果。
- 知识图谱推理方法:利用外部知识图谱揭示类别间的语义关联,通过图推理预测未知类别。
零样本学习扩展了机器学习的外延,让机器像人一样举一反三地认知世界。但目前效果还不够理想,有赖于知识获取、表示和推理技术的进一步突破。
5.3.3 主动学习方法
有时候,我们虽然拥有大量数据,但受限于标注成本只能利用一小部分。主动学习(Active Learning)允许模型主动挑选最有价值的数据让人工标注,从而用最少的标注代价获得最大的性能提升。常用的样本选择策略有:
- 不确定性采样(Uncertainty Sampling):挑选模型预测最不确定的样本,如置信度最低的样本。
- 基于委员会的采样(Query-by-committee):训练多个模型,挑选预测分歧最大的样本。
主动学习使机器学习告别"小白",成为一个善于提问、主动思考的"学生"。如何平衡探索和利用,避免样本偏差,是该领域进一步研究的重点。
5.4 方法选择与组合
面对纷繁复杂的数据分类场景和技术,如何选择和组合适当的方法,是一个富有挑战性的问题。以下是一些思路:
5.4.1 分类需求分析
首先要全面分析分类任务的特点,包括:
- 分类任务复杂度:类别数量、层次结构、类间界限、语义模糊度等
- 可用数据资源:数据规模、分布、标注情况、领域相关知识等
- 业务理解程度:分类目标明确程度、业务规则复杂度、对结果可解释性要求等
需求分析是选择分类技术的重要依据。
5.4.2 数据质量评估
针对待分类数据,还要评估其质量,如:
- 数据冗余度:重复、近似数据比例
- 数据一致性:逻辑矛盾、标注错误比例
- 数据完整性:缺失、噪声数据比例
数据质量直接决定分类效果上限,影响着技术选型。
5.4.3 场景驱动的方法选择
根据任务场景和数据特点,初步选取合适的分类技术:
- 小样本场景优先考虑Few-Shot方法:任务内或跨任务的迁移学习
- 知识驱动场景考虑零样本方法:基于属性或外部知识库的分类推理
- 数据质量较差可考虑主动学习:主动筛选有效样本提升性能
当然要因地制宜,并非一成不变。
5.4.4 多模型集成学习
实践中,单一模型往往难以应对错综复杂的分类问题。集成学习通过组合多个基分类器的预测结果,能显著提高分类系统的泛化性能。常见的集成策略有:
- 投票法(Voting):收集各分类器的预测标签,少数服从多数
- 加权平均法(Weighted Averaging):基于验证集性能对分类器加权,线性组合概率输出
- Stacking方法:将各分类器预测结果"叠"为新特征,训练元分类器做最终判断
集成学习思想博采众长,既能发挥不同分类器各自所长,又能避免单一分类器的局限性。如何选择互补的基分类器,设计有效的结合机制,是成功应用的关键。
总之,数据分类方法论涉及方方面面的考量,没有放之四海而皆准的灵丹妙药。关键是要在全面、系统的视角下,立足需求,选用恰当的技术,辩证看待方法的优劣,在实践中不断优化和创新。
小结
本章从传统到现代、从成熟到探索,系统梳理了数据分类领域的各类方法。传统的基于规则和统计的方法简单实用,但在大数据、非结构化数据面前力不从心。深度学习让分类技术如虎添翼,端到端学习高阶特征,大幅刷新了性能上限。但受限于标注数据,在一些实际场景难以施展拳脚。创新方法如小样本、零样本、主动学习等,为分类任务拓展了新的疆域。每种方法都有其适用场景和局限性,关键要因地制宜,扬长避短。多模型集成学习思想为进一步提升分类系统性能提供了一条可行之路。
展望未来,数据分类技术仍大有可为:
-
多模态分类有待深入。现实世界的数据呈现多源异构特点,亟需打通图文语音等模态,实现信息的融合与互补。
-
分类模型可解释性亟待加强。传统方法规则清晰但性能不足,而深度模型强大但不透明。赋予黑盒模型以可解释性,是人机互信的必由之路。
-
分类系统的鲁棒性有待提高。面对对抗样本、数据漂移等干扰,分类器的稳定性和适应性仍显不足,需要在算法和机制上进行创新。
-
知识驱动的分类大有可为。知识的引入使得分类不再是浅层的模式匹配,而是一个理解、认知的过程。如何高效获取和表征知识,将是重要突破口。
数据分类似一个古老而前沿的课题,传统智慧与现代技术在此交相辉映。作为数据治理的重要一环,分类是数据价值变现的基石。未来,随着人工智能、大数据、云计算等新一代信息技术的深入发展,数据分类技术必将在理论和应用上不断迈上新台阶,为数字时代的数据价值释放插上翅膀。
术语表
- 标注(Labeling):给数据样本手工分配类别标签的过程
- 泛化(Generalization):学习到的模型在新数据上的适用能力
- 特征工程(Feature Engineering):人工设计并提取数据特征的过程
- 机器学习(Machine Learning):无需明确编程,让计算机系统从数据中自动学习的方法
- 深度学习(Deep Learning):模拟大脑神经网络,进行多层次特征学习的机器学习分支
- 贝叶斯定理(Bayes’ Theorem):描述事件发生概率与其先验概率和数据似然的关系,是朴素贝叶斯分类的理论基础
- 信息熵(Information Entropy):描述信号不确定性的物理量,在决策树中用于度量属性的纯度
- 核函数(Kernel Function):将低维线性不可分数据映射到高维空间,使其线性可分,是支持向量机的重要组成
- 前向传播(Forward Propagation):将输入信号经网络逐层处理最终得到输出的过程
- 反向传播(Backward Propagation):将损失函数对网络参数的梯度反向逐层计算,指导参数更新的过程
- 过拟合(Overfitting):模型过度拟合训练数据的细节,导致泛化能力降低的现象
- 迁移学习(Transfer Learning):将已学习的知识迁移到新任务上,实现知识的重用
- 主动学习(Active Learning):从未标注数据中主动选择对模型提升最大的样本让人工标注,从而减少标注成本
希望这一章对你有所启发!数据分类之路道阻且长,你我携手共进。
相关文章:
5.第五章:数据分类的方法论
文章目录 5.1 传统分类方法5.1.1 基于规则的分类方法5.1.2 基于统计的分类方法5.1.3 传统分类方法的局限性 5.2 现代分类技术5.2.1 神经网络分类模型5.2.2 深度学习分类方法5.2.3 现代分类技术的优势 5.3 创新分类方法5.3.1 小样本学习方法5.3.2 零样本学习方法5.3.3 主动学习方…...
如何在 Unity 中导入 gltf /glb 文件
遗憾的是,默认情况下,Unity 无法导入 gltf 文件。 我们有 个好消息要告诉你 gltf,有一种方法可以将 glb 文件格式导入 Unity! 看完这篇文章后,让我们将 “gltf, glb” 文件放入 Unity 中,并将其…...
Docker部署一款开源的极简服务器监控工具Ward内网穿透远程使用
文章目录 前言1.关于Ward2.Docker部署3.简单使用ward4.安装cpolar内网穿透5. 配置ward公网地址6. 配置固定公网地址总结 前言 各位小伙伴们,你们是不是也遇到过这样的情况:每次打开服务器管理界面,密密麻麻的数据和图表看得你眼花缭乱&#…...
Day11(回溯法)——LeetCode79.单词搜索
1 前言 今天主要刷了一道热题榜中回溯法的题,现在的计划是先刷热题榜专题吧,感觉还是这样见效比较快。因此本文主要介绍LeetCode79。 2 LeetCode79.单词搜索(LeetCode79) OK题目描述及相关示例如下: 2.1 题目分析解决及优化 感觉回溯的方…...
数据结构-图
一、图的定义与基本术语 图(Graph)是一种非线性数据结构,由顶点(Vertex)和边(Edge)组成。它包含以下基本术语: 顶点(Vertex) :是图中的数据元素。…...
数据结构-选择排序(Python)
目录 选择排序算法思想 选择排序算法步骤 选择排序代码实现 选择排序算法分析 选择排序算法思想 选择排序(Selection Sort)基本思想: 将数组分为两个区间:左侧为已排序区间,右侧为未排序区间。每趟从未排序区间中…...
[特殊字符] 分布式定时任务调度实战:XXL-JOB工作原理与路由策略详解
在微服务架构中,定时任务往往面临多实例重复执行、任务冲突等挑战。为了解决这一问题,企业级调度框架 XXL-JOB 提供了强大的任务统一调度与执行机制,特别适合在分布式系统中使用。 本文将从 XXL-JOB 的核心架构入手,详细讲解其调…...
【前端】基于 Promise 的 HTTP 客户端工具Axios 详解
Axios 详解 1. 简介 定义:Axios 是一个基于 Promise 的 HTTP 客户端,用于浏览器和 Node.js 环境,简化 HTTP 请求的发送和处理。核心特点: 支持 Promise API,可链式调用。自动转换 JSON 数据。支持请求/响应拦截。可取…...
React Native 安卓端 android Image 播放gif webp 动态图
React Native 安卓端 android Image 播放gif webp 动态图 RN项目是0.78.2 React是19.0 基本介绍 Image 是 React Native 中用于显示各种类型图片的核心组件,支持显示网络图片、静态资源、本地图片以及 base64 编码的图片。在 Android 端,Image 组件还可…...
【mysql】windows mysql命令
终端配置环境变量,找到mysql地址放入环境变量-系统变量中 例如: C:\Program Files\MySQL\MySQL Server 8.0\bin win键R输入 sysdm.cpl 快速打开电脑变量-高级-环境变量 连接命令 mysql -u root -p 查看所有数据库 show databases; 选中数据库 …...
uniappx 打包配置32位64位x86安装包
{"app": {"distribute": {"android": {"abiFilters": ["armeabi-v7a","arm64-v8a","x86","x86_64"]}}} }...
【C++ 类和数据抽象】static 类成员
目录 一、static 类成员的基本概念 1.1 静态成员的定义 1.2 静态数据成员 1.3 静态成员函数 1.4 内存布局 1.5 访问控制 1.6 性能分析 1.7 C标准演进 二、static 类成员的特点 2.1 共享性 2.2 不依赖于对象 2.3 无 this 指针 三、静态成员的初始化规则 3.1 初始化…...
深入了解递归、堆与栈:C#中的内存管理与函数调用
在编程中,理解如何有效地管理内存以及如何控制程序的执行流程是每个开发者必须掌握的基本概念。C#作为一种高级编程语言,其内存管理和函数调用机制包括递归、堆与栈。本文将详细讲解这三者的工作原理、用途以及它们在C#中的实现和应用。 1. 递归 (Recur…...
声音分离人声和配乐-从头设计数字生命第5课, demucs——仙盟创梦IDE
demucs 伴奏提取人声分离技术具有多方面的重大意义,主要体现在以下几个领域: 音乐创作与制作 创作便利性提升:创作者能轻易获取无伴奏的人声轨道,便于对人声进行单独处理,如调整音准、音色、添加特效等,…...
基于PHP+Uniapp的互联网医院源码:电子处方功能落地方案
随着“互联网医疗”政策红利持续释放,互联网医院已成为推动医疗数字化转型的重要方向。在这一趋势下,电子处方功能模块作为核心环节,不仅直接关系到线上问诊闭环的实现,也成为系统开发中技术难度较高、业务逻辑最为复杂的一部分。…...
Linux 基础命令入门指南
在 Linux 系统中,命令行是高效操作和管理系统的核心方式。掌握一些基础命令,能够让我们更便捷地完成文件操作、系统监控、文本处理等任务。本文将为大家介绍常用的 Linux 基础命令,帮助新手快速入门。 一、文件和目录操作命令 1. ls&#x…...
(done) 吴恩达版提示词工程 3. 迭代 (控制输出长度、提取特定细节、输出 HTML 格式)
url: https://www.bilibili.com/video/BV1Z14y1Z7LJ?spm_id_from333.788.videopod.episodes&vd_source7a1a0bc74158c6993c7355c5490fc600&p3 别人的笔记 url: https://zhuanlan.zhihu.com/p/626966526 3. 迭代(Iterative) 当我使用大语言模型…...
学员答题pk知识竞赛小程序怎么做
制作学员答题PK知识竞赛小程序,主要有以下步骤: 一、规划设计 明确需求:确定小程序的使用场景是校园知识竞赛、培训机构考核还是企业内部培训等。答题功能,规定答题的具体规则,包括题目类型(单选、多选、…...
P1217 [USACO1.5] 回文质数 Prime Palindromes【python】
P1217 [USACO1.5] 回文质数 Prime Palindromes 题目描述 因为 151 151 151 既是一个质数又是一个回文数(从左到右和从右到左是看一样的),所以 151 151 151 是回文质数。 写一个程序来找出范围 [ a , b ] ( 5 ≤ a < b ≤ 100 , 000 …...
搭建私人网站
第一章 阿里云服务器选购与配置 1.1 注册与实名认证 注册账号 访问阿里云官网,点击右上角"免费注册",填写邮箱/手机号,完成人机验证后获取验证码。 注意:企业用户需选择"企业实名认证",个人用…...
Nacos简介—1.Nacos使用简介
大纲 1.Nacos的在服务注册中心 配置中心中的应用 2.Nacos 2.x最新版本下载与目录结构 3.Nacos 2.x的数据库存储与日志存储 4.Nacos 2.x服务端的startup.sh启动脚本 5.Dubbo Nacos微服务RPC调用开发示例 6.Nacos对临时与持久化服务实例的健康检查机制 7.Nacos保护阈值机…...
【工具】使用 MCP Inspector 调试服务的完全指南
Model Context Protocol (MCP) Inspector 是一个交互式开发工具,专为测试和调试 MCP 服务器而设计。本文将详细介绍如何使用 Inspector 工具有效地调试和测试 MCP 服务。 1. MCP Inspector 简介 MCP Inspector 提供了直观的界面,让开发者能够ÿ…...
架构-项目管理
一、盈亏平衡分析 核心知识点: 基本公式 正常情况:销售额 固定成本 可变成本 税费 利润盈亏平衡时:销售额 固定成本 可变成本 税费(利润为0,即不赚不亏的临界点) 公式推导:利润 销售额…...
域控重命名导致无法登录
问题描述:公司新买了一个服务器用于替换旧服务器,旧服务器名称为server3为域控,降级后新装的服务器升级为了新域控。然后旧服务器更名为server5,新服务器server6更名为server3.重启新服务器后服务器无法登录。但是服务器相关功能都…...
C++内存管理那些事
一、C/C内存分布 【说明】: 栈又叫堆栈,是非静态局部变量、函数参数、返回值存放的区域,栈向下增长内存映射段是高效的IO映射方式,用于装载一个共享的动态内存库。用户可以使用系统接口创建共享内存,做进程间的通信堆…...
C++多态(实现部分)(一)
目录 1.多态的概念 1.1运行时多态 1.2 编译时多态 2.多态的定义以及实现 2.1 多态构成的条件 2.2 虚函数 2.3 虚函数的重写/覆盖 2.3.1 虚函数重写的两个例外 1.协变 2.析构函数的重写 2.4 override 和final关键字 2.5 重载/重写/隐藏的对比 编辑 3. 抽象类 和…...
HOW - Code Review 流程自动化
文章目录 前言流程自动化落地一、自动发起 MR(Merge Request)macOS 安装 glab方式一:使用 Homebrew(推荐) 其他平台安装方法Linux (apt)Windows(scoop 或 chocolatey) 使用示例:自动…...
自动化标注软件解析
关于PyQt5信号槽机制的解析 信号槽机制是 Qt 框架中用于对象间通信的核心机制,它基于发布-订阅模式,能够实现松耦合的组件交互。 1. 信号槽机制的基本概念 信号(Signal) 信号是对象发出的一种通知,表示某个事件发生…...
机器人结构认知与安装
机器人结构认知与安装 1. ES机器人系统结构与硬件组成 核心组件: OPPO ES5机器人系统由机器人本体、控制手柄、48V电源和OPPO Studio终端构成。一体化底座:包含控制主板、安全接口板、监测保护电路单元,支持外接急停开关,采用光耦…...
SQLMesh 模型选择指南:优化大型项目的模型更新
在处理大型 SQLMesh 项目时,模型之间的依赖关系可能会变得非常复杂。为了更有效地管理这些项目,SQLMesh 提供了一种模型选择机制,允许用户有针对性地选择需要更新的模型。本文将详细介绍如何使用 SQLMesh 的模型选择功能来优化项目更新过程。…...
linux:启动后,ubuntu屏幕变成红色了
屏幕启动后变成 红色背景 通常说明 显卡驱动出了问题,或者是 图形界面加载失败 使用了 fallback 模式。这种现象在 NVIDIA 驱动安装失败或显卡与驱动不兼容时常见。 🎯 先给你几个快速修复选项 ✅ 1. 进入 TTY 命令行界面 按下:Ctrl Alt …...
抖音的逆向工程获取弹幕(websocket和protobuf解析)
目录 声明前言第一节 获取room_id和ttwid值第二节 signture值逆向python 实现signature第三节 Websocket实现长链接请求protubuf反序列化pushFrame反序列化Response解压和反序列化消息体Message解析应答ack参考博客声明 本文章中所有内容仅供学习交流使用,不用于其他任何目的…...
2194出差-节点开销Bellman-ford/图论
题目网址: 蓝桥账户中心 我先用Floyd跑了一遍,不出所料TLE了 n,mmap(int,input().split())clist(map(int,input().split()))INFfloat(inf) ma[[INF]*n for i in range(n)]for i in range(m):u,v,wmap(int,input().split())ma[u-1][v-1]wma[v-1][u-1]w#“…...
【hexo主题自定义】
主题下载安装 进入命令行,下载 NexT 主题,输入: git clone https://github.com/theme-next/hexo-theme-next themes/next 修改站点配置文件_config.yml,找到如下代码: ## Themes: https://hexo.io/themes/ theme: l…...
前后端部署
#在学习JavaWeb之后,进行了苍穹外卖的学习。在进行苍穹外卖的部署的时候,作者遇到了下面的问题# 1.前端工程nginx无法启动: 当我双击已经部署好的nginx工程中nginx.exe文件的时候,在服务中,并没有找到ngnix成功运行。…...
1.jdk+idea安装+HelloWorld项目创建
1.jdk1.8idea安装项目创建 jdk1.8安装配置环境变量 到华为镜像下载jdk,因为Oracle官网需要注册才可以下载jdk https://repo.huaweicloud.com/java/jdk/8u202-b08/ 直接下一步安装,配置环境变量 重启,执行java -version 和 javac idea下载 版本20…...
Puter部署指南:基于Docker的多功能个人云平台掌控自己的数据
前言:嗨,小伙伴们!每次开机是不是都要像参加点击大赛一样不停地敲击各种网盘和应用的登录按钮?更让人抓狂的是,这些科技巨头会不会偷偷翻阅我们的隐私数据呢?别担心,今天给大家安利一个超炫酷的…...
动态渲染页面智能嗅探:机器学习判定AJAX加载触发条件
本文提出了一种基于机器学习的智能嗅探机制,革新性地应用于自动判定动态渲染页面中AJAX加载的最佳触发时机。系统架构采用先进模块化拆解设计,由请求分析模块、机器学习判定模块、数据采集模块和文件存储模块四大核心部分构成。在核心代码示例中…...
探索 CameraCtrl模型:视频生成中的精确摄像机控制技术
在当今的视频生成领域,精确控制摄像机轨迹一直是一个具有挑战性的目标。许多现有的模型在处理摄像机姿态时往往忽略了精准控制的重要性,导致生成的视频在摄像机运动方面不够理想。为了解决这一问题,一种名为 CameraCtrl 的创新文本到视频模型…...
理解欧拉公式
1. 欧拉公式中的符号 欧拉公式 e i x cos x i sin x e^{ix}\cos xi\sin x eixcosxisinx当 x π x \pi xπ时 e i π 1 0 / / 欧拉恒等式 e^{i\:\pi}10 //欧拉恒等式 eiπ10//欧拉恒等式 e e e:自然对数的底 i i i:虚数, i 2 − 1 i^2 -1 i2−1 cos…...
7.9 Python+Click实战:5步打造高效的GitHub监控CLI工具
Python+Click实战:5步打造高效的GitHub监控CLI工具 GitHub Sentinel Agent 命令行界面开发实战 关键词:CLI 开发实践、Click 框架、API 集成、命令行参数解析、错误处理机制 1. 命令行界面技术选型与架构设计 GitHub Sentinel 采用 Click + Requests 技术栈构建 CLI 工具,…...
leetcode28. 找出字符串中第一个匹配项的下标_简单KMP
28. 找出字符串中第一个匹配项的下标 - 力扣(LeetCode) 模仿:algorithm-journey/src/class100/Code01_KMP.java at main algorithmzuo/algorithm-journey GitHub #include <stdio.h> #include <stdlib.h> #include <strin…...
代码随想录算法训练营第二十六天
LeetCode题目: 452. 用最少数量的箭引爆气球435. 无重叠区间763. 划分字母区间2799. 统计完全子数组的数目(每日一题) 其他: 今日总结 往期打卡 452. 用最少数量的箭引爆气球 跳转: 452. 用最少数量的箭引爆气球 学习: 代码随想录公开讲解 问题: 有一些球形气球贴在一堵用 X…...
精益数据分析(20/126):解析经典数据分析框架,助力创业增长
精益数据分析(20/126):解析经典数据分析框架,助力创业增长 在创业和数据分析的学习道路上,每一次深入探索都可能为我们带来新的启发。今天,依旧带着和大家共同进步的想法,我们一起深入研读《精…...
基于Django的权限管理平台
目录 单元一:项目准备 任务一:创建项目 1.1配置 DRF 模型 任务二:设置CSRF令牌 2.1创建app包 2.2检查浏览器Cookies权限 2.3获取cookies 单元二:用户平台 任务一:用户数据模型搭建 1.1创建user模块 1.2生成…...
深度解析 LangChain、ReAct、ReROO 架构及其在 AI Agent 中的应用
一、LangChain 架构:模块化智能代理的核心框架 1. 架构特性与设计原理 LangChain 是构建智能代理的模块化框架,其核心通过 Chains(任务链)、Agents(代理)、Memory(记忆) 和 Tools&a…...
数据库day-07
一、实验名称和性质 子查询 验证 设计 二、实验目的 1.掌握子查询的嵌套查询; 2.掌握集合操作 3.了解EXISTS嵌套查询方法; 三、实验的软硬件环境要求 硬件环境要求: PC机(单机) 使用的软件名称、版本号以及模块…...
使用Tauri 2.3.1+Leptos 0.7.8开发桌面小程序汇总
近期断断续续学习了Rust编程,使用Tauri 2.3.1Leptos 0.7.8开发了一个自用的桌面小程序。Win10操作系统,使用VS Code及rust analyzer插件搭建的开发环境,后期开始使用Roo Code绑定DeepSeek API 辅助编程,对我这个初学者编程帮助很大…...
计算机视觉——速度与精度的完美结合的实时目标检测算法RF-DETR详解
概述 目标检测已经取得了长足的发展,尤其是随着基于 Transformer 的模型的兴起。RF-DETR,由 Roboflow 开发,就是这样一种模型,它兼顾了速度和精度。使用 Roboflow 的工具可以让整个过程变得更加轻松。他们的平台涵盖了从上传和标…...
JS 应用算法逆向三重断点调试调用堆栈BP 插件发包安全结合
# 前置知识 1 、作用域:(本地 & 全局) 简单来说就是运行后相关的数据值 2 、调用堆栈:(由下到上) 简单来说就是代码的执行逻辑顺序 3 、常见分析调试: - 代码全局搜索 - 文件流程断点…...