当前位置: 首页 > news >正文

【数据挖掘】--算法

【数据挖掘】--算法

  • 目录:
  • 1. 缺失值和数值属性处理
    • 1缺失值处理:
  • 2. 用于文档分类的朴素贝叶斯
  • 3. 分治法:建立决策树
  • 4. 覆盖算法建立规则
  • 5. 挖掘关联规则
  • 6. 线性模型
    • 有效寻找最近邻
      • 暴力搜索(Brute-Force Search)
      • kd树(k-dimensional Tree)
      • 局部敏感哈希(Locality Sensitive Hashing,LSH)
      • 球树(Ball Tree)
      • 局部敏感哈希(Locality Sensitive Hashing,LSH)
  • 7. 基于实例的学习
  • 8. 聚类
  • 9. Weka

目录:

1. 缺失值和数值属性处理

1缺失值处理:

删除法:当缺失值比例较小时,可删除包含缺失值的样本。但这种方法会损失数据,可能影响模型准确性。例如在一个客户信息表中,若少数客户的某个不关键属性有缺失值,可删除这些记录。
- 填补法
- 均值/中位数填补:对于数值属性,用该属性的均值或中位数填补缺失值。比如在学生成绩数据中,用平均成绩填补缺失的成绩值。
- 模型预测填补:利用其他属性和机器学习模型预测缺失值。如使用线性回归模型,基于学生的平时表现、作业成绩等属性预测缺失的考试成绩。

  • 数值属性处理
    • 归一化:将数值属性的值映射到[0, 1]或[-1, 1]区间,消除量纲影响。常见方法有最小 - 最大归一化: x n e w = x − x m i n x m a x − x m i n x_{new}=\frac{x - x_{min}}{x_{max}-x_{min}} xnew=xmaxxminxxmin。例如在处理不同单位的身高和体重数据时,归一化可使它们在同一尺度上。
    • 标准化使数据具有零均值和单位方差,公式为 z = x − μ σ z=\frac{x - \mu}{\sigma} z=σxμ,其中 μ \mu μ是均值, σ \sigma σ是标准差。这在许多基于距离的算法中很重要,如K近邻算法。

2. 用于文档分类的朴素贝叶斯

朴素贝叶斯基于贝叶斯定理和特征条件独立假设。==假设文档$d$由特征向量$x=(x_1,x_2,\cdots,x_n)$表示,类别为$C$==。贝叶斯定理为$P(C|x)=\frac{P(x|C)P(C)}{P(x)}$。由于特征条件独立假设,$P(x|C)=\prod_{i = 1}^{n}P(x_i|C)$。

例如在垃圾邮件分类中, C C C表示“垃圾邮件”和“非垃圾邮件”类别, x i x_i xi可以是邮件中出现的单词。通过训练数据计算 P ( C ) P(C) P(C)(先验概率)和 P ( x i ∣ C ) P(x_i|C) P(xiC)(似然概率),进而对新邮件进行分类。

3. 分治法:建立决策树

  • 计算信息量:信息熵是衡量数据不确定性的指标,
  • **公式为$H(X)=-\sum_{i = 1}^{n}p(x_i)\log_2p(x_i)$
  • 其中 p ( x i ) p(x_i) p(xi)是事件 x i x_i xi发生的概率。在决策树构建中,通过计算信息增益来选择分支属性。****
  • 信息增益 $IG(X,Y)=H(X)-H(X|Y)$,$H(X)$是数据集$X$的熵 H ( X ∣ Y ) H(X|Y) H(XY)是在属性 Y Y Y给定条件下 X X X的条件熵
  • 高度分支属性通常选择信息增益最大的属性作为分支属性,这样能使决策树在每一步划分后,数据的不确定性减少最多。例如在根据天气属性(晴天、多云、雨天等)和温度属性划分是否适合户外运动的数据集时,计算每个属性的信息增益,选择信息增益大的属性优先进行分支。
    在这里插入图片描述

4. 覆盖算法建立规则

  • 一个简单的覆盖方法:从整个数据集开始,找到一条能覆盖尽可能多正例且少覆盖反例的规则。然后从数据集中移除该规则覆盖的正例,重复上述过程,直到所有正例都被覆盖。例如在一个二分类任务中,先找到一条规则“如果年龄
    在这里插入图片描述

30 且收入 > 50000,那么类别为 A”,移除符合该规则的正例后继续寻找下一条规则。

  • 规则与决策列表决策列表是由一系列规则组成,按顺序应用这些规则进行分类。挖掘决策列表时,每次选择最优规则添加到列表中,并更新数据集,直到数据集分类完成

在这里插入图片描述

5. 挖掘关联规则

  • 项集:项集是一组项的集合。例如在超市购物篮数据中,{牛奶, 面包}就是一个项集。频繁项集是指出现次数达到一定阈值的项集。
  • 关联规则形如 A ⇒ B A \Rightarrow B AB,表示如果项集 A A A出现,那么项集 B B B也可能出现。例如“购买啤酒的顾客也倾向于购买尿布”。
  • 有效的生成规则:常用Apriori算法,它基于“频繁项集的所有非空子集也一定是频繁的”这一先验性质,通过逐层搜索生成频繁项集,进而生成关联规则。首先找到频繁1 - 项集,然后生成候选2 - 项集,剪枝得到频繁2 - 项集,以此类推。

6. 线性模型

  • 数值预测:线性回归:假设因变量 y y y与自变量$x_1,x_2,\cdots,x_n$之间存在线性关系 加粗样式 y = β 0 + β 1 x 1 + β 2 x 2 + ⋯ + β n x n + ϵ 加粗样式y=\beta_0+\beta_1x_1+\beta_2x_2+\cdots+\beta_nx_n+\epsilon 加粗样式y=β0+β1x1+β2x2++βnxn+ϵ

  • 其中 β i \beta_i βi是系数, ϵ \epsilon ϵ是误差项。通过最小化损失函数(如均方误差 M S E = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 MSE=\frac{1}{n}\sum_{i = 1}^{n}(y_i - \hat{y}_i)^2 MSE=n1i=1n(yiy^i)2

  • y i y_i yi是真实值, y ^ i \hat{y}_i y^i是预测值)来确定系数 β i \beta_i βi。例如预测房价, y y y是房价, x 1 x_1 x1是房屋面积, x 2 x_2 x2 是房间数量等。

  • 线性分类:Logistic回归:用于二分类问题,通过将线性函数的输出经过Sigmoid函数 σ ( z ) = 1 1 + e − z \sigma(z)=\frac{1}{1 + e^{-z}} σ(z)=1+ez1
    在这里插入图片描述

  • 将结果映射到[0, 1]区间,表示样本属于正类的概率。损失函数通常使用对数似然损失,通过梯度下降等方法优化参数。

  • 使用感知机的线性分类:感知机是一种简单的线性分类模型,通过权重向量 w w w和偏置 b b b对输入特征向量 x x x进行线性组合 y = sign ( w T x + b ) y = \text{sign}(w^Tx + b) y=sign(wTx+b),其中 sign \text{sign} sign是符号函数。感知机通过不断调整 w w w b b b,使误分类样本数量减少。

  • 使用Winnow的线性分类Winnow是一种用于在线学习的线性分类算法,它通过对权重进行指数式更新来处理二分类问题,对不同特征赋予不同的权重,更关注重要特征

有效寻找最近邻

暴力搜索(Brute-Force Search)

  • 原理:对于给定的查询点,计算它与数据集中所有点的距离,然后找出距离最小的点,即最近邻。
  • 示例:假设有一个包含多个二维点的数据集{(1,2), (3,4), (5,6), (7,8)},要查找点(2,3)的最近邻。通过计算(2,3)与数据集中每个点的欧氏距离,如与(1,2)的距离为 ( 2 − 1 ) 2 + ( 3 − 2 ) 2 = 2 \sqrt{(2 - 1)^2+(3 - 2)^2}=\sqrt{2} (21)2+(32)2 =2 ,与(3,4)的距离为 ( 2 − 3 ) 2 + ( 3 − 4 ) 2 = 2 \sqrt{(2 - 3)^2+(3 - 4)^2}=\sqrt{2} (23)2+(34)2 =2 等,比较后发现(1,2)(3,4)都是(2,3)的最近邻。
  • 优缺点:优点是实现简单,在数据集较小时效果较好;缺点是当数据集规模较大时,计算量呈指数增长,效率低下。

kd树(k-dimensional Tree)

  • 原理:将数据点按照k维空间进行划分,构建树形结构。在搜索最近邻时,利用树的结构快速排除不可能是最近邻的区域,从而减少计算量。

  • 示例:对于二维数据集,kd树可能会按照x轴或y轴交替划分数据空间。比如有数据点(1,1), (2,3), (4,2), (3,5),可能先按照x轴将空间分为两部分,左边包含(1,1),右边包含(2,3), (4,2), (3,5),然后在右半部分再按照y轴划分等。在查找最近邻时,从根节点开始,根据查询点与节点的位置关系决定搜索路径。

  • 优缺点适用于低维数据,能显著提高搜索效率;但在高维数据下,性能可能下降,存在“维数灾难”问题

  • 原理:将数据点划分到一系列嵌套的球中,每个节点对应一个球,球内包含若干数据点。搜索时,通过判断查询点与球的位置关系,快速确定是否需要在该球内继续搜索。

  • 示例:假设有一组三维数据点,球树会将这些点划分到不同的球中,比如一个球内包含(1,1,1), (2,2,2), (3,3,3)等点,另一个球内包含(4,4,4), (5,5,5)等点。在查找最近邻时,先判断查询点位于哪些球附近,再进一步在这些球内搜索。

  • 优缺点:相比kd树,在高维数据下可能有更好的性能;但构建球树的时间和空间复杂度较高。

在这里插入图片描述

在这里插入图片描述

局部敏感哈希(Locality Sensitive Hashing,LSH)

  • 原理利用哈希函数将数据点映射到哈希桶中,使得相似的数据点有较高概率被映射到同一个哈希桶或相邻的哈希桶中。在搜索时,只需在查询点所在的哈希桶及相邻哈希桶中查找最近邻。
  • 示例:对于文本数据,可以根据文本的特征构建哈希函数。例如,将文本中出现的单词组合作为特征,通过哈希函数将文本映射到不同的哈希桶。如果两个文本相似,它们包含的单词组合相似,就可能被映射到同一个或相邻的哈希桶中。
  • 优缺点能快速处理大规模数据,在高维数据和近似最近邻搜索中表现出色;但可能会有一定的误报率,即找到的不一定是真正的最近邻,而是近似最近邻。

球树(Ball Tree)

  • 原理:将数据点划分到一系列嵌套的球中,每个节点对应一个球,球内包含若干数据点。搜索时,通过判断查询点与球的位置关系,快速确定是否需要在该球内继续搜索。
  • 示例:假设有一组三维数据点,球树会将这些点划分到不同的球中,比如一个球内包含(1,1,1), (2,2,2), (3,3,3)等点,另一个球内包含(4,4,4), (5,5,5)等点。在查找最近邻时,先判断查询点位于哪些球附近,再进一步在这些球内搜索。
  • 优缺点:相比kd树,在高维数据下可能有更好的性能;但构建球树的时间和空间复杂度较高。

局部敏感哈希(Locality Sensitive Hashing,LSH)

  • 原理:利用哈希函数将数据点映射到哈希桶中,使得相似的数据点有较高概率被映射到同一个哈希桶或相邻的哈希桶中。在搜索时,只需在查询点所在的哈希桶及相邻哈希桶中查找最近邻。
  • 示例:对于文本数据,可以根据文本的特征构建哈希函数。例如,将文本中出现的单词组合作为特征,通过哈希函数将文本映射到不同的哈希桶。如果两个文本相似,它们包含的单词组合相似,就可能被映射到同一个或相邻的哈希桶中。
  • 优缺点:能快速处理大规模数据,在高维数据和近似最近邻搜索中表现出色;但可能会有一定的误报率,即找到的不一定是真正的最近邻,而是近似最近邻。
    ht-aligned 文本居右 |

7. 基于实例的学习

**- 距离函数:用于衡量实例之间的相似性,常见的有欧几里得距离 d ( x , y ) = ∑ i = 1 n ( x i − y i ) 2 d(x,y)=\sqrt{\sum_{i = 1}^{n}(x_i - y_i)^2} d(x,y)=i=1n(xiyi)2 ,曼哈顿距离 d ( x , y ) = ∑ i = 1 n ∣ x i − y i ∣ d(x,y)=\sum_{i = 1}^{n}|x_i - y_i| d(x,y)=i=1nxiyi。例如在二维空间中,计算两个点之间的距离。

  • 有效寻找最近邻:可以使用KD - 树等数据结构加速最近邻搜索。KD - 树将数据空间递归划分,通过比较当前节点的分割轴坐标,快速定位可能包含最近邻的子空间。**

8. 聚类

  • 基于距离的迭代聚类:如K - Means算法,首先随机选择 k k k个质心,然后将每个样本分配到距离最近的质心所在的簇,接着重新计算每个簇的质心,重复上述过程直到质心不再变化或达到最大迭代次数。目标函数是最小化每个样本到其所属簇质心的距离平方和

J = ∑ i = 1 k ∑ x j ∈ C i ∥ x j − μ i ∥ 2 J=\sum_{i = 1}^{k}\sum_{x_j \in C_i}\left \| x_j - \mu_i \right \|^2 J=i=1kxjCixjμi2,其中 k k k是簇的数量, C i C_i Ci是第 i i i个簇, μ i \mu_i μi是第 i i i个簇的质心, x j x_j xj

数据点。

  • 快速距离计算:对于大规模数据集,可以采用一些近似算法或利用数据结构加速距离计算,如使用三角不等式等性质减少不必要的距离计算。

  • 多实例学习:与传统单实例学习不同,多实例学习中每个样本由多个实例组成一个包(bag),标签作用于包而不是单个实例。例如在图像分类中,一张图像可能包含多个物体,图像(包)被标记为包含某种物体(正例)或不包含(反例),但不知道具体哪个物体实例对应标签。

  • 聚集输入:将多个输入实例组合成一个更复杂的输入表示,例如将多个时间序列数据聚合为一个特征矩阵,以捕捉数据的全局特征。

  • 聚集输出:将多个模型的输出进行聚合,如在集成学习中,将多个分类器的预测结果通过投票、平均等方式聚合,得到最终的预测结果。
    在这里插入图片描述

9. Weka

Weka是一个基于Java的开源机器学习软件,包含了大量的机器学习算法和工具。它提供了图形界面(如Explorer、Experimenter等)和命令行界面,方便用户进行数据预处理、模型训练、评估等操作。例如,在Weka的Explorer界面中,可以直接加载ARFF格式数据,选择不同的分类算法(如朴素贝叶斯、决策树等)进行训练和测试,并查看模型性能指标。

相关文章:

【数据挖掘】--算法

【数据挖掘】--算法 目录:1. 缺失值和数值属性处理1缺失值处理: 2. 用于文档分类的朴素贝叶斯3. 分治法:建立决策树4. 覆盖算法建立规则5. 挖掘关联规则6. 线性模型有效寻找最近邻暴力搜索(Brute-Force Search)kd树&am…...

C++初阶——简单实现vector

目录 1、前言 2、Vector.h 3、Test.cpp 1、前言 简单实现std::vector类模板。 相较于前面的string,vector要注意: 深拷贝,因为vector的元素可能是类类型,类类型元素可以通过赋值重载,自己实现深拷贝。 迭代器失效…...

三、Three.js模型对象、材质

一、三维向量Vector3与模型位置 点模型Points、线模型Line、网格网格模型Mesh等模型对象的父类都是Object3D,如果想对这些模型进行旋转、缩放、平移等操作,如何实现,可以查询Threejs文档Object3D对相关属性和方法的介绍 1、三维向量Vector3 …...

C# 背景 透明 抗锯齿 (效果完美)

主要是通过 P/Invoke 技术调用 Windows API 函数 gdi32.dll/user32.dll,同时定义了一些结构体来配合这些 API 函数的使用,常用于处理图形绘制、窗口显示等操作。 运行查看效果 局部放大,抗锯齿效果很不错,尾巴毛毛清晰可见。 using System; u…...

Ubuntu 22.04 一键部署MinerU1.1.0

MinerU MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。 MinerU诞生于书生-浦语的预训练过程中,我们将会集中精力解决科技文献中的符号转化问题,希望在大模型时代为科技发…...

10、k8s对外服务之ingress

service和ingress的作用 service的作用 NodePort:会在每个节点开放一个端口,端口号30000-32767。 也是只能用于内网访问,四层转发。实现负载均衡。不能基于域名进行访问。 clusterip:service的默认类型,只能在集群…...

mysql面试题

一、基础概念 什么是主键(Primary Key)? 答案: 唯一标识表中每行数据的字段或字段组合,不允许 NULL 值,确保数据唯一性。 外键(Foreign Key)的作用是什么? 答案&#xf…...

什么是关系型数据库?什么是非关系型数据库?

关系型数据库:关系型数据库是基于关系模型的数据库,它将数据组织成二维表格的形式,每个表格称为一个表(Table),表中的每一行称为一条记录(Record)或元组(Tuple&#xff0…...

科技云报到:科技普惠潮流渐起,“开源”将带我们走向何方?

科技云报到原创。 开源决定软件未来,已成为全球技术和产业创新的主导模式之一。“开源”思想的诞生,可以说是计算机发展史中极具理想主义和浪漫主义色彩的一页,是科技自由与技术极客思想的延伸。 数字化浪潮奔涌,从软件开发的底…...

校园网架构设计与部署实战

一、学习目标 掌握校园网分层架构设计原则 理解多业务VLAN规划方法 学会部署认证计费系统 实现基础网络安全防护 二、典型校园网场景 需求分析:某中学需建设新型校园网络 覆盖教学楼/宿舍/图书馆三区域 区分教师/学生/访客网络权限 满足2000终端并发接入 …...

【含开题报告+文档+PPT+源码】基于Springboot的乡村老龄居民信息管理系统

开题报告 本文介绍了一个基于Spring Boot框架的乡村老龄居民信息管理系统。该系统旨在通过信息化手段,提高乡村老龄居民的生活质量,并为相关部门提供便捷的数据管理和服务支持。系统主要实现了用户注册登录、个人信息查看、健康数据录入、健康建议查询、…...

前端插件使用xlsx-populate,花样配置excel内容,根据坐添加标替换excel内容,修改颜色,合并单元格...。

需求要求:业务人员有个非常复杂得excel表格,各种表头等,但是模板是固定得。当然也可以实现在excel上搞出各种表格,但是不如直接用已有模板替换其中要动态得内容方便,这里我们用到CSDN得 xlsx-populate 插件。 实列中我…...

Mac m1 连接公司内网

1、创建VPN 1、在系统偏好设置 2、选择网络 3、进行添加 2、添加设置 1、选择VPN 2、类型选择L2TP/IPSec 3、填写服务器IP和账号 4、点击认证设置-填写密码 。然后应用 3、进行特殊配置 网上说苹果系统的问题。 1、创建命令 sudo vim /etc/ppp/options 2、添加内容-主要别…...

Jenkins 部署在 Mac 并在局域网内通过 ip 访问

Jenkins 部署在 Mac 并在局域网内通过 ip 访问 一、修改配置文件 打开文件 ~/Library/LaunchAgents/homebrew.mxcl.jenkins.plist 打开文件 /usr/local/opt/jenkins/homebrew.mxcl.jenkins.plist 两个文件目录不同&#xff0c;内容一样 <?xml version"1.0" e…...

臻识相机,华夏相机,芊熠车牌识别相机加密解密

臻识&#xff0c;华夏&#xff0c;芊熠这三种车牌识别相机解密我都试过了&#xff0c;可以正常解密成功&#xff0c;其它品牌我暂时没有测试。超级简单&#xff0c;免费的&#xff0c;白嫖无敌&#xff01; 流程&#xff1a; ①&#xff1a;先导出配置文件&#xff0c;例如我以…...

【Python 专题】数据结构 树

LeetCode 题目104. 二叉树的最大深度(gif 图解)方法一:后序遍历(DFS)方法二:层序遍历(BFS)872. 叶子相似的树(DFS 遍历)1448. 统计二叉树中好节点的数目(DFS 遍历)437. 路径总和 III(前缀和 + DFS 回溯)1372. 二叉树中的最长交错路径(DFS)236. 二叉树的最近公共…...

【飞行器原理学习】——1. 机翼及机翼参数

飞行器原理学习——1.机翼 一、 概述 飞机的各种机翼是飞机的控制面 通过铰链、钢索、液压等方式连接在机身上 操纵面运动时&#xff0c;会改变机翼的弧度和形状&#xff0c;使流经的空气发生偏转&#xff0c;从而影响空气动力的大小。使飞机围绕着3轴运动 二、机翼的操纵面…...

css之display:grid布局改块级元素布局

1.问题&#xff1a; div是块级元素&#xff0c;一个div元素占一行&#xff0c;但是&#xff0c;今天测试样式时&#xff0c;总是会有两个div并占一行&#xff0c;很困惑&#xff0c;结果发现是app这个样式 在main.css里 #app样式布局在main.ts里被应用 2.原因以及样式分析 im…...

如何组织和管理JavaScript文件:最佳实践与策略

在现代Web开发中&#xff0c;JavaScript已经成为不可或缺的一部分。随着项目规模的扩大&#xff0c;JavaScript代码的复杂性也随之增加。如何有效地组织和管理这些文件&#xff0c;不仅影响开发效率&#xff0c;还直接关系到项目的可维护性和可扩展性。本文将深入探讨如何组织和…...

Vue 中组件通信的方式有哪些,如何实现父子组件和非父子组件之间的通信?

一、父子组件通信&#xff08;垂直通信&#xff09; 1. Props 传值&#xff08;父 → 子&#xff09; 实现方案&#xff1a; <!-- Parent.vue --> <template><Child :user"userData" /> </template><script setup> import { ref } …...

伯克利 CS61A 课堂笔记 11 —— Mutability

本系列为加州伯克利大学著名 Python 基础课程 CS61A 的课堂笔记整理&#xff0c;全英文内容&#xff0c;文末附词汇解释。 目录 01 Objects 02 Example: Strings Ⅰ Representing Strings: the ASCII Standard Ⅱ Representing Strings: the Unicode Standard 03 Mutatio…...

MacOS安装Emacs

个人博客地址&#xff1a;MacOS安装Emacs | 一张假钞的真实世界 在MacOS X上可以使用Homebrew 安装Emacs&#xff1a; $ brew install emacs --with-cocoa 或者用MacPorts&#xff1a; $ sudo port install emacs-app OSX Emacs 网站提供了通用的二进制包。 前两种方法安装…...

基于海思soc的智能产品开发(图像处理的几种需求)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 对于一个嵌入式设备来说&#xff0c;如果上面有一个camera&#xff0c;那么就可以有很多的用途。简单的用途就是拍照&#xff0c;比拍照更多一点的…...

百度智能云AI收入增3倍,2025开源引流打赢生态战

免费、开源。在DeepSeek重塑产业价值观念后&#xff0c;百度、OpenAI等AI时代的“领航员”纷纷采取行动。 随着开源以雷霆万钧之势袭来&#xff0c;百度下定决心求变。而其底气&#xff0c;就藏在这份财报中。根据财报&#xff0c;2024年&#xff0c;百度集团总收入为1331亿元…...

[数据结构]顺序表详解

目录 一.线性表 二.顺序表 2.1概念及结构 1. 静态顺序表&#xff1a;使用定长数组存储元素。 2. 动态顺序表&#xff1a;使用动态开辟的数组存储。 2.1按需申请 2.2 接口实现&#xff1a;增删查改 SeqList.h: SeqList.c: test.c 一.线性表 线性表 &#xff08; line…...

力扣hot100 ——搜索二维矩阵 || m+n复杂度优化解法

编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性&#xff1a; 每行的元素从左到右升序排列。每列的元素从上到下升序排列。 解题思路&#xff1a; 借助行和列有序特性&#xff0c;不断按行或者列缩小范围&#xff1b;途中数字表示每…...

VirtualBox 中使用 桥接网卡 并设置 MAC 地址

在 VirtualBox 中使用 桥接网卡 并设置 MAC 地址&#xff0c;可以按照以下步骤操作&#xff1a; 步骤 1&#xff1a;设置桥接网卡 打开 VirtualBox&#xff0c;选择你的虚拟机&#xff0c;点击 “设置” (Settings)。进入 “网络” (Network) 选项卡。在 “适配器 1” (Adapt…...

ETL工具: Kettle入门(示例从oracle到oracle的数据导入)

kettle介绍 ETL工具,用于对数据的抽取&#xff08;Extract), 转换(Transform),加载 (Load&#xff09; Kettle 是一种ETL工具, 现称为 Pentaho Data Integration (PDI) 特点:纯JAVA语言编写 官方学习文档 网站: https://docs.hitachivantara.com/r/en-us/pentaho-data-int…...

未来AI方向落地场景:小语言模型,super_private_agent

未来AI方向落地场景:小语言模型,super_private_agent 目录 未来AI方向落地场景:小语言模型,super_private_agent小语言模型super - private - agent(注重隐私的智能代理)碳基生命和硅基生命交互界面面向agent的专用交互协议和数据接口从web平台经济到网络平台举例说明社交…...

Oracle RAC数据库单节点轮流重启

0、sqlplus / as sysdba 备份参数文件 create pfile/home/oracle/pfile.ora from spfile; 备份控制文件 Alter database backup controlfile to trace; 1、关闭两节点的监听&#xff1b; 2、操作系统层面kill掉所有LOCALNO的所有进程&#xff0c;即&#xff1a;连接会话。 p…...

渲染101对Blender的支持与硬件配置详解

一、Blender版本与渲染器支持 渲染101全面支持 Blender全版本&#xff08;包括Blender 4.0及早期版本&#xff09;&#xff0c;并适配其内置的 Eevee、Cycles、Workbench 三大渲染器 。此外&#xff0c;平台还兼容 Aces、Realflow、Anima 等40插件&#xff0c;覆盖建模、动画…...

安卓burp抓包,bypass ssl pinning

好久好久没有发东西了。主要是懒。。。 这几天在搞apk渗透&#xff0c;遇到了burp无法抓包问题&#xff0c;觉得可以写下来。 问题描述 1. 一台安卓手机&#xff0c;装了面具&#xff0c;可以拿到root 2. 电脑上有burp&#xff0c;设置代理 3.手机和电脑连同一个网段&…...

植物大战僵尸杂交版v3.2.1最新版本(附下载链接)

B站游戏作者潜艇伟伟迷于12月21日更新了植物大战僵尸杂交版3.2.1版本&#xff01;&#xff01;&#xff01;&#xff0c;有b站账户的记得要给作者三连关注一下呀&#xff01; 不多废话下载链接放上&#xff1a; 夸克网盘链接&#xff1a;&#xff1a;https://pan.quark.cn/s/e5…...

【SQL】多表查询案例

&#x1f4e2;本章节主要学习使用SQL多表查询的案例,多表查询基础概念 请点击此处。 &#x1f384;数据准备 首先我们创建一个新的表也就是薪资等级表&#xff0c;其余两个表(员工表和薪资表)在多表查询章节中已经创建。然后我么根据这三个表完成下面的12个需求。 create tab…...

使用Python结合`stable-baselines3`库(包含PPO和TD3算法)以及`gym`库来实现分层强化学习的示例代码

以下是一个使用Python结合stable-baselines3库&#xff08;包含PPO和TD3算法&#xff09;以及gym库来实现分层强化学习的示例代码。该代码将环境中的动作元组分别提供给高层处理器PPO和低层处理器TD3进行训练&#xff0c;并实现单独训练和共同训练的功能。 代码实现 import g…...

解锁机器学习核心算法|神经网络:AI 领域的 “超级引擎”

一、神经网络&#xff1a;AI 领域的 “超级引擎” 在机器学习的庞大算法体系中&#xff0c;有十种算法被广泛认为是最具代表性和实用性的&#xff0c;它们犹如机器学习领域的 “十大神器”&#xff0c;各自发挥着独特的作用。这十大算法包括线性回归、逻辑回归、决策树、随机森…...

一周学会Flask3 Python Web开发-redirect重定向

锋哥原创的Flask3 Python Web开发 Flask3视频教程&#xff1a; 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili 前面我们学过渲染到模板页面&#xff0c;这个其实是一种内部的转发&#xff0c;浏览器地址栏地址没有变化。如果我们想重定向…...

FFmpeg 源码编译安装

参考&#xff1a; https://trac.ffmpeg.org/wiki/CompilationGuide/Ubuntu Linux (Ubuntu) 下载 FFmpeg 源码&#xff0c;并将其解压&#xff0c;这里我将它放在 ~/ffmpeg_source 目录下&#xff1b; cd ~/ffmpeg_sources wget -O ffmpeg-snapshot.tar.bz2 https://ffmpeg.org…...

3.Docker常用命令

1.Docker启动类命令 1.启动Docker systemctl start docker 2.停止Docker systemctl stop docker 3.重启Docker systemctl restart docker 4.查看Docker状态 systemctl status docker 5.设置开机自启(执行此命令后每次Linux重启后将自启动Docker) systemctl enable do…...

vue3面试题进阶版

覆盖 Vue3 的核心知识点、高频考点及实战场景 一、基础与核心概念 MVVM 与 MVC 的区别 MVC&#xff1a;Model&#xff08;数据&#xff09;、View&#xff08;视图&#xff09;、Controller&#xff08;控制器&#xff09;&#xff0c;视图更新需手动操作 DOM。MVVM&#xff1…...

深入理解指针

例题1 int main() {int a[5][5];int(*p)[4];p a;printf("%p, %d\n", &p[4][2] - &a[4][2], &p[4][2] - &a[4][2]);return 0; }由图知第二个打印的是-4 因为%p是直接将内存中的值当作地址打印 而-4在内存中存放的是其二进制的补码,打印以16进制形式…...

微信小程序实现拉卡拉支付

功能需求&#xff1a;拉卡拉支付&#xff08;通过跳转拉卡拉平台进行支付&#xff09;&#xff0c;他人支付&#xff08;通过链接进行平台跳转支付&#xff09; 1.支付操作 //支付 const onCanStartPay async (obj) > {uni.showLoading({mask: true})// 支付接口获取需要传…...

conda简单命令

查看当前环境已经安装的库 conda list 查看conda已经创建的环境 conda env list切换conda环境 conda activate 环境名称删除环境 conda remove --name 环境名称 --all安装库 conda install 库名卸载库 conda remove 库名导出&#xff08;导入&#xff09;环境 保存某个…...

Linux应用之构建命令行解释器(bash进程)

目录 1.分析 2.打印输入提示符 3.读取并且处理输入字符串 4.创建子进程并切换 5.bash内部指令 6.完整代码 1.分析 当我们登录服务器的时候&#xff0c;命令行解释器就会自动加载出来。接下来我们就。在命令行中输入指令来达到我们想要的目的。 我们在命令行上输入的…...

什么是3D可视化?有哪些优势和应用领域?

3D可视化服务是一种基于大数据、物联网、云计算等技术构建的三维可视化系统服务&#xff0c;它提供直观的三维软件应用服务&#xff0c;帮助用户更好地理解和分析数据。以下是对3D可视化服务的详细介绍&#xff1a; 一、3D可视化服务的原理 3D可视化服务的原理主要包括数据采…...

在PyCharm中运行Jupyter Notebook的.ipynb文件及其pycharm软件的基础使用

&#xff08;注意需使用PyCharm专业版&#xff0c;学生、教师可以申请免费使用&#xff1a;https://www.jetbrains.com/shop/eform/students&#xff09; 1. pycharm2024版汉化 https://blog.csdn.net/m0_74103046/article/details/144560999 2. pycharm中的python控制台和J…...

解锁C#自定义属性:从0到1的深度实践指南

一、开篇&#xff1a;自定义属性的奇妙世界 在 C# 的编程宇宙中&#xff0c;自定义属性是一个强大且迷人的存在&#xff0c;它就像是代码世界里的魔法标记&#xff0c;为我们的程序赋予了丰富的元数据&#xff0c;让代码变得更加智能和富有表现力。 想象一下&#xff0c;你正…...

Ubuntu 安装 OpenCV (C++)

版本详情&#xff1a; Ubuntu: 22.04 5.15.0-133-generic gcc: 11.4.0 g: 11.4.0 OpenCV: 4.7.0 1. 卸载 OpenCV 进入原先编译 opencv 的 build 目录&#xff0c;在该目录下打开终端&#xff0c;执行以下代码&#xff08;如果 build 已经删除了&#xff0c;可以重新编译一…...

deepseek清华大学第二版 如何获取 DeepSeek如何赋能职场应用 PDF文档 电子档(附下载)

deepseek清华大学第二版 DeepSeek如何赋能职场 pdf文件完整版下载 https://pan.baidu.com/s/1aQcNS8UleMldcoH0Jc6C6A?pwd1234 提取码: 1234 或 https://pan.quark.cn/s/3ee62050a2ac...

kill -9 结束某个用户所有进程的方式-linux019

1. 使用 pkill 命令 pkill 命令可以通过用户名直接终止该用户的所有进程。加上 -9 参数&#xff0c;表示强制结束进程。 pkill -9 -u XXXX 说明&#xff1a;这个命令会使用 SIGKILL 信号&#xff08;即 kill -9&#xff09;强制终止 ttlsa 用户的所有进程。 2. 使用 killal…...