模式识别的基本概念与理论体系
前面在讨论专家系统时曾经说过,为了使计算机具有自动获取知识的能力,除了应使它具有学习能力外,还应使它具有能识别诸如文字、图形、图象、声音等的能力,计算机的这种识别能力是模式识别研究的主要内容。当然,模式识别的研究并不仅仅只是为了实现知识的自动获取,这只是它的应用之一。模式识别作为人工智能的一个重要研究领域,其研究的最终目标在于实现人类识别能力在计算机上的模拟,使计算机具有视、听、触等感知外部世界的能力。就目前而言,主要是开展机器视觉及机器听觉的研究,逐步提高计算机的识别能力。模式识别的研究涉及到数学、图象处理等多个学科,同时它又正处于发展之中,新的研究不断充实着它的内容,本文先只对其基本概念及主要的实现技术进行讨论。
全文需要线性代数基础,可以看我文章:人工智能中的线性代数基础详解-CSDN博客
一、什么是模式识别
从字面上就可以看出,模式识别(pattern recognition)是研究如何对模式进行识别的一门学科。下面首先讨论模式、模式类的有关概念,然后再给出模式识别的一般描述。
(一)模式(Pattern)
1. 基本思想与定义
物都具有不同的特征,包括物理特征及结构特征。由此使人们想到,如果能把事物的关键特征抽取出来,以不同的特征组合代表不同的事物,并且用适当的形式表示出来,这样就有可能使计算机具有识别能力,使它能区分不同的事物。像这样用事物的特征所构成的数据结构就称为相应事物的模式,或者说模式是对事物定量的或结构的描述。
基本思想:模式是对客观事物特征的结构化描述,其核心在于通过可观测的特征集合刻画事物的本质属性。模式识别的核心问题是如何从复杂数据中提取具有区分性的模式,并利用这些模式实现对未知样本的分类或描述。
定义(基于王永庆《人工智能原理与方法》拓展):设 X 为样本空间, 为单个样本,其中
为第 i 个特征。模式是一个映射
,将样本映射到特征空间P中的一个结构化表示,满足:
其中为特征提取函数,m 为特征维度。模式的本质是通过特征变换实现数据降维与语义抽象。
2. 模式分类
从不同角度进行划分,模式可有不同的分类方法。例如,可根据其特征值是数值型数据还是非数值型数据,把模式分为数值式的模式及非数值式的模式;可根据其特征值是否为精确表示,把模式分为精确表示的模式与不精确表示的模式(对于用非数值量表示的特征值,在进行识别时可进行适当的变换,例如对“高”、“甜”等这些模糊概念可用模糊集把它们表示出来);可根据相应事物是简单的还是复杂的,把模式分为简单模式与复杂模式。所谓简单模式,是指它所对应的事物可被作为一个整体看待,无须对其作进一步的细分就可根据其特征对它进行识别,对于这样的模式,一般用上述的特征向量就可对它进行表示。所谓复杂模式,是指它所对应的事物是由若干部分组成的,各部分间存在确定的结构关系。当然,简单与复杂是相对的,两者之间并不存在一个明确的界限,在确定一个模式是简单模式或复杂模式时,一方面可根据相应事物的属性,另一方面还可根据应用的实际需要以及应用时所采用的处理方法。
另外,若按事物的性质划分,模式又可分为具体模式和抽象模式这两类。文字、图象、声音等都是具体的事物,它们通过对人们的感觉器官的刺激而被识别,相应的模式称为具体模式;思想、观念、观点等是抽象的事物,相应的模式称为抽象模式。模式识别主要是研究对具体模式的识别,关于抽象模式的研究被归人哲学、心理学等的范畴。就具体模式而言,按其获取的途径不同又可分为以下几类:
(1)视觉模式。这是通过视觉器官及视觉系统获得的模式,主要有图象(指二维映象,如
图片等)、图形(指由线条构成的视觉形象,如三角形、圆等几何图形)、物景(指三维视觉对象,如房子、树木等)。
(2)听觉模式。这是通过听觉器官及听觉系统获得的模式,主要有语音模式(主要指人类
的自然语言)、音响模式(指由乐器、车辆、机器发出的音响等)。
(3)触觉模式。这是通过触觉器官所获得的感觉模式,如形体、光滑度等。
其它还有味觉、嗅觉等感觉模式。由于条件的限制,目前它们还未被作为研究对象。鉴于人们对外部信息主要是通过视觉器官及听觉器官获得的,所以当前模式识别主要是开展对视觉模式及听觉模式识别的研究。
3. 表示形式与实现过程
模式的表示形式于识别方法有关。
表示形式:
(1)向量表示:最常见形式,如,适用于统计模式识别(如图像灰度向量)。
(2)结构化表示:树、图等(如句法模式识别中的符号串 表示正则语言)。
(3)张量表示:高维数据(如图像立方体)。
实现过程(以图像模式为例):
(1)数据采集:获取图像像素矩阵。
(2)特征提取:
1)统计特征:灰度均值,方差
。
2)结构特征:边缘检测(如Sobel算子)得到边缘图 E。
(3)模式构建:将特征级联为向量,其中vec(·) 表示矩阵向量化。
4. 算法描述
模式构建的核心算法可分为两类:统计模式算法和结构模式算法。
统计模式算法:通过概率分布建模特征空间。
示例:主成分分析(PCA)
输入:样本矩阵(n 个样本,d 维特征)
(1)标准化:,其中
。
(2)计算协方差矩阵:。
(3)特征分解:,取前 m 个主成分 U_m。
(4)模式变换:。
结构模式算法:通过形式语言理论建模模式结构。
示例:正则文法模式生成
文法,其中
,起始符 S,规则
。生成模式集合为
。
5. 具体示例:手写数字 “5” 的模式表示
流程说明:
(1)图像输入:28×28像素灰度图I。
(2)预处理:二值化(阈值τ=128)得到 。
(3)特征提取:
1)统计特征:前景像素占比。
2)几何特征:重心坐标。
3)方向特征:边缘方向直方图(8 个方向)。
(4)模式向量:。
(二)模式类(Pattern Class)
1.定义:
具有相同本质属性的模式集合,记为 ω_k,其中 k=1,2,...,K 为类别标号。数学上,模式类是特征空间P 的一个划分:
例如:“桌子”就是有方桌、圆桌、课桌、办公桌等这些具体模式所构成的模式类。
2.分类依据:
(1)统计相似性:同类模式在特征空间中服从相近的概率分布。
(2)结构等价性:同类模式满足相同的句法规则(如正则语言中的等价类)。
3.示例:手写数字分类的模式类
ω_0: 所有表示“0”的模式集合,特征空间中表现为中心空洞、环形结构。
ω_5: 所有表示“5”的模式集合,特征空间中表现为上半部分折线、右下弯勾。
(三)模式识别(Pattern Recognition)
1.定义:
通过对已知模式类的学习,构建分类器或描述器,实现对未知模式的类别判定或结构分析。形式化表示为映射,满足:
其中 为后验概率(统计方法),或 h(p) = 符合句法规则的类别(结构方法)。
2.核心任务:
(1)分类(Classification):离散类别判定(如垃圾邮件分类)。
(2)回归(Regression):连续值预测(如语音信号参数估计,广义模式识别)。
(3)聚类(Clustering):无监督模式类发现(如用户行为分群)。
3.衡量模式识别的主要性能指标
衡量模式识别的主要性能指标是正确识别率和识别速度。从实用角度考虑,还有系统的复杂性、可靠性等。但是,要使这几方面都达到最优是非常困难的。这是因为世界上的事物是很复杂的,种类繁多,结构千变万化,再加上各种因素的干扰、影响,就使得正确的识别十分困难。另外,人们对模式识别的研究虽已有较长的历史,但至今仍没有能够全面地适用于分析和描述各种模式的严谨理论。某些技术可能在某些情况下识别效果较好,但在其它情况下就不一定能够达到同样的效果,而且一个识别效果好的方法往往是以较高的复杂性及较大的时间、空间开销为代价的。
由于各种随机干扰、噪声等造成的观察特征的随机性及不确定性,以及事物本身所具有的模糊性等,致使模式类别与模式特征之间的对应关系经常具有某种程度的不确定性。因此,模式识别通常都是在一定误差的条件下实现的,我们的任务是尽可能地减小这种误差,使其满足一定的阈值条件,但很难完全消除它。
二、模式识别的一般过程
(一)模式信息采集
1.定义:
通过传感器获取目标对象的原始数据,形成观测空间X。
2.技术手段:
(1)视觉采集:摄像头(图像 )、3D 扫描仪(点云
)。
(2)听觉采集:麦克风(语音信号)。
(3)多模态融合:同时采集图像、语音、惯性数据(如自动驾驶传感器组)。
3.数学模型:
设传感器响应函数为,其中Ω为物理世界观测对象,采集过程可表示为:
,这里n 为噪声向量,满足
(高斯噪声假设)。
4.示例:人脸识别的图像采集
摄像头接收人脸反射光,生成 RGB 图像。
同步采集深度信息(如有),形成点云C。
(二)预处理(Preprocessing)
目标:改善数据质量,消除噪声和无关变异,形成标准化特征空间。
1. 降噪处理
(1)均值滤波:,其中
为 M×N 邻域窗口。
(2)中值滤波:
2. 归一化
(1)尺度归一化:
(2)标准化(Z-score):
3. 几何校正(图像为例)
(1)旋转校正:通过霍夫变换检测直线,计算旋转角度θ,应用仿射变换:
4.示例:手写数字预处理流程
(1)二值化: 若
,否则 0。
(2)尺寸归一化:将任意大小图像缩放至固定尺寸(如28×28)。
(3)重心对齐:平移图像使重心位于中心 (14,14)。
(三)特征或基元抽取(Feature/Primitive Extraction)
1. 特征抽取(统计模式)
定义:从预处理后的数据中提取最具区分性的特征子集,形成特征空间F。
(1)特征选择(Feature Selection)
从 d 维原始特征中选择 m ≪ d 维子集,常用方法:
1)过滤法(Filter):基于统计指标(如信息增益):
其中 H(C) 为类别熵,为条件熵。
2)包裹法(Wrapper):以分类器性能(如准确率)为评价指标,搜索最优子集。
(2)特征提取(Feature Extraction)
通过变换生成新特征:
1)线性变换:主成分分析(PCA), Fisher 线性判别(FLD):
最大化类间散度,
最小化类内散度,
最优变换矩阵。
2)非线性变换:核主成分分析(KPCA),通过核函数将数据映射到高维特征空间。
2. 基元抽取(结构模式)
定义:将复杂模式分解为最小组件(基元,Primitive),如句法模式识别中的符号(a, b, ...)或图像中的边缘段(→, ↑, ↙)。
基元定义流程:
(1)边缘检测:Canny算子生成边缘图E。
(2)基元分类:根据边缘方向(0°, 45°, 90°, 135°)定义4种基元 {e_1, e_2, e_3, e_4}。
(3)基元编码:将每个边缘段映射到对应基元符号,形成符号串 e_2 e_1 e_4 e_3 ...。
示例:字符“A”的基元表示
基元集合:{水平线段, 左斜线, 右斜线},结构规则:右斜线在左斜线右侧,水平线段连接两斜线顶端。
(四)模式分类(Pattern Classification)
目标:利用训练数据构建分类器,实现对测试样本的类别判定。
1. 分类器设计范式
(1)统计分类器
贝叶斯分类器:
1)基于贝叶斯定理:
若假设特征独立(朴素贝叶斯):
2)支持向量机(SVM):寻找最大间隔超平面,满足:
为类别标签。
(2)结构分类器
句法模式识别:
通过文法推断构建自动机,如有限状态机(FSM),输入基元符号串,若被FSM接受则属于某类。
示例:正则语言分类器 识别符号串是否符合 (ab)*:
1)状态:q_0(初始), q_1(接收 a), q_2(接收 b)
2)转移:(错误状态)
3)终止状态:q_0(空串有效), q_2(无效)
2. 分类流程示例:基于SVM的手写数字分类
训练阶段:
(1)数据准备:MNIST数据集,60000个训练样本,每个样本784维特征(28×28像素灰度值)。
(2)特征预处理:标准化至 [0,1]。
(3)模型训练:
1)核函数选择:径向基函数(RBF)
2)超参数优化:网格搜索γ 和惩罚因子 C。
(4)决策函数:
测试阶段:
(1)输入未知数字图像,预处理为784维向量x。
(2)计算与支持向量的RBF核值,代入决策函数。
(3)输出类别标签(0-9)。
三、理论拓展:模式识别的数学基础
1. 特征空间的度量理论
设,常用度量:
(1)欧氏距离:
(2)马氏距离:,考虑特征相关性。
2. 分类错误率的理论下限
贝叶斯错误率,满足:
其中 P_e(h) 为任意分类器 h 的错误率。
3. 结构模式的形式语言理论
乔姆斯基文法层次中,模式识别常用:
(1)3 型文法(正则文法):对应有限状态机,处理符号串模式(如DNA序列分类)。
(2)2 型文法(上下文无关文法):对应下推自动机,处理树形结构(如蛋白质二级结构分析)。
四、应用与挑战
1. 典型应用
(1)计算机视觉:目标检测(YOLO模型,结合统计特征与深度学习)。
(2)自然语言处理:句法分析(结构模式识别,依存树解析)。
(3)生物医学工程:心电图分类(特征提取结合隐马尔可夫模型)。
2. 核心挑战
(1)小样本学习:如何在少量训练数据下构建鲁棒分类器(元学习、迁移学习)。
(2)可解释性:深度学习模型(如神经网络)的“黑箱”问题,需结合结构模式的符号解释。
(3)抗干扰性:对抗样本攻击下的模式识别鲁棒性(对抗训练、防御性蒸馏)。
五、总结
模式识别作为人工智能的核心技术,通过“信息采集 - 预处理 - 特征抽取 - 分类”的标准流程,实现从数据到知识的转化。统计方法与结构方法的结合、传统算法与深度学习的融合,正推动模式识别在复杂场景中的应用。未来研究需聚焦于鲁棒性、可解释性和小样本学习,以应对现实世界的多样化挑战。
相关文章:
模式识别的基本概念与理论体系
前面在讨论专家系统时曾经说过,为了使计算机具有自动获取知识的能力,除了应使它具有学习能力外,还应使它具有能识别诸如文字、图形、图象、声音等的能力,计算机的这种识别能力是模式识别研究的主要内容。当然,模式识别…...
机器学习,深度学习
定义(非正式):不进行明确编程的情况下,提供大量数据让计算机进行自我学习分类:监督(supervised)学习,无监督(unsupervised)学习监督学习:提供的数据中包含了问题到正确答案(x到y)的映射…...
smolagents - Guided tour
https://colab.research.google.com/github/huggingface/notebooks/blob/main/smolagents_doc/en/pytorch/guided_tour.ipynbhttps://colab.research.google.com/github/huggingface/notebooks/blob/main/smolagents_doc/en/pytorch/guided_tour.ipynb...
【keil使用】无法打开keil工程,只有空白界面的解决方法
【keil使用】无法打开keil工程,只有空白界面的解决方法 一、最常见的原因 在我们新建keil工程或下载其他大佬的keil工程的时候可能会出现工程无法正常打开的情况,如图所示: 其中最常见的一个原因就是keil工程的目录路径太长了,W…...
openEuler 22.03 安装 Nginx,支持离线安装
目录 一、环境检查1.1 必要环境检查1.2 在线安装(有网络)1.3 离线安装(无网络) 二、下载Nginx2.1 在线下载2.2 离线下载 三、安装Nginx四、开机自启服务五、开放防火墙端口六、常用命令 一、环境检查 1.1 必要环境检查 # 查看 g…...
Excel 数组功能及应用示例
Excel表格中的数组(Array)是一个可以同时存储和操作多个数据的结构。数组可以是单行、单列(一维数组)或多行多列(二维数组)。在Excel中,数组公式或动态数组功能可以一次性处理多个值,…...
C++后端服务器开发:侵入式与非侵入式程序结构解析
在C后端服务器开发中,架构设计是决定系统性能、可扩展性和可维护性的关键因素之一。尽管不同的业务需求会导致服务器架构的多样化,但网络通信模块作为所有服务的通用部分,为我们提供了一个抽象和讨论的基础。基于此,我们可以将服务…...
「Mac畅玩AIGC与多模态09」开发篇05 - 使用自定义天气查询插件开发智能体应用
一、概述 本篇介绍如何在 macOS 环境下,通过编写自定义 OpenAPI Schema,将天气查询服务接入 Dify 平台,并开发基于实时天气信息的智能体应用。本案例培养路径参数与查询参数结合的插件开发技巧,实现智能体和外部实时数据的动态联动。 二、环境准备 1. 确认本地开发环境 …...
Maven插件学习(五)—— 将项目构建生成的 OSGi Bundles(或 Features)发布到一个 P2 仓库
发布OSGi Bundles到一个 P2 仓库 读取项目中properties文件中的属性 <plugin><groupId>org.codehaus.mojo</groupId><artifactId>properties-maven-plugin</artifactId><version>1.0-alpha-2</version><executions><exec…...
欧拉计划 Project Euler61(循环的多边形数)题解
欧拉计划 Project Euler 61 题解 题干思路code 题干 思路 先生成所有四位数的多边形数集合分类保存,然后dfs找即可 code // 2512 1281 8128 2882 8256 5625 // 28684 #include <bits/stdc.h>using namespace std;using ll long long;typedef vector<i…...
C语言与Unix的传奇起源
C语言与Unix的传奇起源 背景:Multics项目的困境 这段历史要从20世纪60年代中叶的美国说起。当时,三大技术巨头——麻省理工学院(MIT)、AT&T贝尔实验室和通用电气(GE)——联手为GE-645大型机开发一个名…...
C#扩展方法与Lambda表达式基本用法
C# 扩展方法与 Lambda 表达式详解 一、扩展方法详解 1. 基本概念 扩展方法允许为现有类型"添加"方法,而无需修改原始类型或创建派生类型。 定义条件: 必须在静态类中定义方法本身必须是静态的第一个参数使用this修饰符指…...
C#规避内存泄漏的编码方法
C#规避内存泄漏的编码方法 内存泄漏是C#开发中常见的问题,尽管.NET有垃圾回收机制(GC),但不当的编码实践仍可能导致内存无法被及时回收。以下是系统性的规避内存泄漏的方法: 一、理解内存泄漏的常见原因 未释放的事件订阅静态…...
ARM 指令集(ubuntu环境学习) 第一章:ARM 指令集概述
1.1 ARM 架构简介 ARM(Advanced RISC Machine)是一种精简指令集计算机(RISC)架构,最初由英国的 ARM Holdings 公司设计。与复杂指令集计算机(CISC)不同,RISC 架构通过使用简单且高效的指令集,使得处理器能够以更高的速度和更低的功耗执行任务。ARM 架构被广泛应用于各…...
OpenCV实战教程:从零开始的计算机视觉之旅
第一部分:基础入门 OpenCV简介 什么是OpenCV及其应用领域开发环境搭建(Windows/MacOS/Linux)安装配置和第一个程序"Hello OpenCV" 图像基础 图像的数字表示方式色彩空间(RGB、HSV、灰度图)图像读取、显示与…...
零基础做自动驾驶集成测试(仿真)
图 1:使用 GPUDrive 进行极快的多代理模拟。上图:GPUDrive 中 Waymo Open Motion Dataset 场景的鸟瞰图,方框表示受控智能体,圆圈表示其目标。底部:相应的代理视图,以一个代理为中心。可以根据用户的目标轻…...
阿里云dns服务器不可用怎么办?dns可以随便改吗?
阿里云DNS服务器不可用怎么办?dns可以随便改吗? 当DNS服务器不可用时,可能导致无法访问网站或网络服务。以下是常见的解决方法: 1. 检查网络连接 确保设备已连接到互联网(如Wi-Fi或有线网络)。 尝试访问其他网站或服务&#x…...
神经网络用于地震数据时空均匀插值的方法与开源资料
神经网络用于地震数据时空均匀插值的方法与开源资料 地震数据的不均匀采样是一个常见问题,神经网络提供了一种有效的解决方案。以下是关于如何使用神经网络进行地震数据时空均匀插值的概述和可用资源。 主要方法 1. 基于深度学习的插值方法 卷积神经网络(CNN)&a…...
线性微分方程与非线性微分方程
方程一 d x d t x \frac{dx}{dt} x dtdxx 这是一个一阶线性常微分方程,可以直接分离变量求解。 将变量分离: d x x d t \frac{dx}{x} dt xdxdt 两边积分: ∫ 1 x d x ∫ 1 d t ⇒ ln ∣ x ∣ t C \int \frac{1}{x} \, dx \…...
Windows查看和修改IP,IP互相ping通
Windows系统 查看IP地址 winr 输入cmd 打开终端使用 ipconfig 或 ipconfig -all 命令查看当前网络 IPV4地址 Windows系统 修改IP地址 自动获取IP(DHCP): 打开 控制面板,点击 网络和Internet。点击 网络和共享中心。选择 更改适配…...
ESP32开发之freeRTOS的信号量
什么是信号量信号量能干啥信号量的函数实例举例总结什么是信号量 简而言之,就是发出通知,接收通知的任务获得通知后去干啥啥。通知有多有少。自定义通知数量的,叫计数型信号量;只有有无(即“0”,“1”)通知的,叫二进制信号量。 信号量能干啥 资源管理:控制多个任务对…...
CRMEB-PRO系统定时任务扩展开发指南
适用场景 当系统内置定时任务类型无法满足业务需求时,开发者可通过本教程快速掌握自定义定时任务的扩展方法。本指南以"定时检测服务"为例,演示完整开发流程。 我想添加一个定时任务 ,而这里没有我需要的,我怎么来添加 比如我想添加一个定时检…...
单片机不同通信方式的适用场景
一、串口通信 UART 通信双方约定好波特率,每次发送一个字节(8位数据) 这种通信方式一共有2根线,且互相独立不受影响。 串口通信的缺点 二、RS232和RS485 优点是能够远距离传输信号 RS232达到30m RS485达到1000m 同时RS485还具有一对多的功能 三、S…...
【神经网络与深度学习】探索全连接网络如何学习数据的复杂模式,提取高层次特征
引言 全连接网络(Fully Connected Network,FCN)是深度学习中的重要架构,广泛用于模式识别、分类和回归任务。其强大的特征提取能力使其能够自动学习输入数据中的复杂模式,并逐步形成高层次特征。这种能力主要依赖于参…...
股指期货贴水对对冲的影响大吗?
如果你持有股票,又担心股市下跌,可能会想到用股指期货来“对冲风险”——比如买入股票的同时,卖出股指期货合约。但如果股指期货处于贴水状态(期货价格低于现货价格),对冲效果会受影响吗? 一、…...
浙江大学 | DeepSeek系列公开课 | 当艺术遇见AI:科艺融合的前沿探索
今天要给大家分享一份由浙江大学出品的DeepSeek系列公开课第三季第一期,公开课的主题是当艺术遇见AI,科艺融合的新探索。本报告系统展示了浙江大学在艺术与人工智能融合领域的研究成果,涵盖古画修复流程、色彩复原技术、诗画融合模型、图像召…...
(Go Gin)Gin学习笔记(三)数据解析和绑定:结构体分析,包括JSON解析、form解析、URL解析,区分绑定的Bind方法
1. 数据解析和绑定 bind或bindXXX函数(后文中我们统一都叫bind函数)的作用就是将请求体中的参数值绑定到对应的结构体上,以方便后续业务逻辑的处理 1.1 JSON数据解析和绑定 客户端传参,后端接收并解析到结构体 package mainim…...
【JavaEE】网络原理之初识(1.0)
目录 编辑 局域网与广域网 IP地址和端口号 实现简单的服务器客户端交互 简单理解socket TCP和UDP的差别(初识) socket面对udp DatagramSocket API DatagramSocket 构造方法 DatagramSocket 方法: DatagramPacket API Data…...
Go与Cpp的本质区别
这个问题是我们经常听到的问题 常见的观点有 Go 与 C 的差异主要体现在设计哲学、内存管理、并发模型、语法特性及应用场景等方面,以下从多个维度进行详细对比: 一、内存管理机制 C:需手动管理内存(如 new/delete、智能…...
Vulkan 学习(16)---- 使用 VertexBuffer
Vertex Buffer 创建一个 VertexBuffer 存储 Vertex data,代替之前在 Shader 中使用固定顶点值的做法 Vertex Shader 修改 GLSL 的 VertexShader 如下: 注意这里指定了 input Vertex data 的 location 和 格式 #version 450 layout(location 0) in vec2 inPosit…...
论文阅读 2024 arxiv Comprehensive Assessment of Jailbreak Attacks Against LLMs
总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 Comprehensive Assessment of Jailbreak Attacks Against LLMs https://arxiv.org/pdf/2402.05668 https://www.doubao.com/chat/4015423571416834 速览 这篇论文是关于大…...
SIFT特征点检测
刚看完了SIFT特征点检测的原理,阅读的是两篇csdn博客,一个全面和一个最全面,不得不说,你俩写的都很全面,这么用心奉献知识的博主是全人类的财富。 现在用我这张笨拙的嘴先说一下我理解的流程 首先先将图像扩大一倍&a…...
开源模型应用落地-qwen模型小试-Qwen3-8B-快速体验-pipeline方式(二)
一、前言 阿里云最新推出的 Qwen3-8B 大语言模型,作为国内首个集成“快思考”与“慢思考”能力的混合推理模型,凭借其 80 亿参数规模及 128K 超长上下文支持,正在重塑 AI 应用边界。该模型既可通过轻量化“快思考”实现低算力秒级响应,也能在复杂任务中激活深度推理模式,以…...
Python os.path.join()路径拼接异常
问题 在使用os.path.join()对两个路径进行拼接,如:/University/School/和/Department/Class/进行拼接,最终的结果为/Department/Class/,而/University/School/却不知所踪。 import osos.path.join(“/University/School/”, “/…...
Flink之DataStream
Apache Flink 的 DataStream API 是用于 处理无限(流)或有限(批)数据流的核心编程模型,适用于事件驱动、实时分析、ETL 等场景。相比 Flink Table API,DataStream API 提供了更强的灵活性和底层控制能力。 …...
WHAT - Tailwind CSS + Antd = MetisUI组件库
文章目录 Tailwind 和 Antd 组件库MetisUI 组件库 Tailwind 和 Antd 组件库 在 WHAT - Tailwind 样式方案(不写任何自定义样式) 中我们介绍了 Tailwind,至于 Antd 组件库,我们应该都耳熟能详,官网地址:htt…...
【LLM】MOE混合专家大模型综述(重要模块原理)
note 当前的 MoE 架构就是一个用显存换训练时长/推理延迟的架构MoE 目前的架构基本集中在于将原先 GPT 每层的 FFN 复制多份作为 n 个 expert,并增加一个 router,用来计算每个 token 对应到哪个 FFN(一般采用每个 token 固定指派 n 个 exper…...
量子机器学习中的GPU加速实践:基于CUDA Quantum的混合编程模型探索
引言:量子机器学习的新范式 在量子计算与经典机器学习交叉融合的前沿领域,量子机器学习(Quantum Machine Learning, QML)正经历着革命性突破。然而,随着量子比特规模的增长和算法复杂度的提升,传统计算架构…...
CentOS Linux 环境二进制方式安装 MySQL 5.7.32
文章目录 安装依赖包新建用户解压初始化配置文件启动服务登录MySQL修改密码停止数据库 安装依赖包 yum -y install libaio perl perl-devel libncurses* autoconf numactl新建用户 useradd mysql解压 tar xf mysql-5.7.32-linux-glibc2.12-x86_64.tar.gz mv mysql-5.7.32-l…...
数学:拉马努金如何想出计算圆周率的公式?
拉马努金(Srinivasa Ramanujan)提出的圆周率(π)计算公式,源于他对数学模式的超凡直觉、对无穷级数和模形式的深刻洞察,以及独特的非传统数学思维方式。尽管他的思考过程带有强烈的个人色彩,甚至…...
Java 未来技术栈:从云原生到 AI 融合的企业级技术演进路线
一、云原生架构:重构 Java 应用的运行范式 1.1 微服务架构的深度进化 Java 在微服务领域的实践正从 Spring Cloud 向服务网格(Service Mesh)演进。以 Istio 为代表的服务网格技术,通过 Sidecar 模式实现服务间通信的透明化管理&…...
mid360驱动安装以及联合相机标定
1 mid360 安装 1.1 安装 一定要使用 SDK2和 ROS2驱动(livox_ros_driver2) 先安装SDK2,再安装livox_ros_driver2 GitHub - Livox-SDK/Livox-SDK2: Drivers for receiving LiDAR data and controlling lidar, support Lidar HAP and Mid-360. GitHub - Livox-SDK/l…...
LeetCode —— 572. 另一棵树的子树
572. 另一棵树的子树 题目:给你两棵二叉树 root 和 subRoot 。检验 root 中是否包含和 subRoot 具有相同结构和节点值的子树。如果存在,返回 true ;否则,返回 false 。 二叉树 tree 的一棵子树包括 tree 的某个节点和这个节点的所…...
模型部署技巧(一)
模型部署技巧(一) 以下内容是参考CUDA与TensorRT模型部署内容第六章,主要针对图像的前/后处理中的trick。 参考: 1.部署分类器-int8-calibration 2. cudnn安装地址 3. 如何查找Tensor版本,与cuda 和 cudnn匹配 4. ti…...
PostgreSQL中的SSL
PGSQL数据库的默认隔离级别是读提交,并且同时支持可重复读和序列化模式。但是在9.1之前的版本中,序列化模式等价于快照隔离,并非是真正的序列化模式。 这样的话就会存在一个问题,那就是写偏序(Write Skew)…...
使用 Spring Data Redis 实现 Redis 数据存储详解
使用 Spring Data Redis 实现 Redis 数据存储详解 Spring Data Redis 是 Spring 生态中操作 Redis 的核心模块,它封装了 Redis 客户端的底层细节(如 Jedis 或 Lettuce),提供了统一的 API 来操作 Redis 的数据结构。以下是详细实现…...
短视频矩阵系统贴牌开发实战:批量剪辑文件夹功能设计与实现
摘要:在短视频矩阵系统的开发中,批量处理功能是提升运营效率的关键。本文将深入探讨如何实现基于文件夹的短视频批量剪辑功能,涵盖技术选型、核心功能实现及代码示例。 一、需求背景与场景价值 在短视频矩阵运营场景中,运营者常面…...
2025年消防设施操作员考试题库及答案
一、判断题 25.防火门顺序器使用半个月后,需检查所有的螺钉,对固定螺钉进行加固拧紧,后续每月进行一次。() 答案:错误 解析:本题考查的是防火门顺序器的保养。防火门顺序器使用一周后&#x…...
ASP.NET MVC后端控制器用模型 接收前端ajax数据为空
1、前端js代码 如下: const formData {DeptName: D001,Phone: 12345678900 };$.ajax({url: "/Phone/SavePhone1",type: "POST",contentType: "application/json",data: JSON.stringify(formData), //必须要JSON.stringifysuccess:…...
ES基本使用方式
ES基本使用 文章目录 ES基本使用1.es的访问使用URL访问 2.mapping的理解Dynamic Mappingkeyword 与 text的区别基础定义与核心差异主字段,子字段 创建mapping 3.创建索引4.查看索引列表5.删除索引6.添加数据7.查询数据 重置es密码,初始用户elastic el…...