协方差与皮尔逊相关系数:从定义到应用的全面解析
目录
- 一、协方差与皮尔逊相关系数的定义
- 1.1 协方差(Covariance)
- 1.2 皮尔逊相关系数(Pearson Correlation Coefficient)
- 二、协方差的定义与推导逻辑
- 2.1 核心目标:衡量变量的“协同变化”
- 2.2 数学表达的直观性
- 2.3 从线性关系的最小误差出发
- 2.4 从概率论的期望角度推导
- 三、协方差的几何解释与局限性
- 3.1 向量视角:内积与投影
- 3.2 散点图视角:面积的正负
- 3.3 局限性与改进
- (1)单位依赖性
- (2)仅反映线性相关性
- 四、协方差与皮尔逊相关系数的关系
- 4.1 数学上的联系
- 4.2 几何视角
- 五、计算示例
- 5.1 协方差计算示例
- 5.2 皮尔逊相关系数计算
- 六、应用场景
- 6.1 协方差的应用
- 6.2 皮尔逊相关系数的应用
- 七、优缺点与注意事项
- 7.1 协方差的局限性
- 7.2 皮尔逊相关系数的局限性
- 7.3 实际应用建议
- 八、扩展:协方差矩阵与多元分析
- 8.1 协方差矩阵
- 8.2 皮尔逊相关系数的扩展
- 九、总结
一、协方差与皮尔逊相关系数的定义
1.1 协方差(Covariance)
协方差是衡量两个随机变量 X X X 和 Y Y Y 共同变化趋势的统计量,其定义为:
Cov ( X , Y ) = ∑ ( x i − x ˉ ) ( y i − y ˉ ) n − 1 \text{Cov}(X,Y) = \frac{\sum (x_i - \bar{x})(y_i - \bar{y})}{n-1} Cov(X,Y)=n−1∑(xi−xˉ)(yi−yˉ)
其中:
- x i , y i x_i, y_i xi,yi 是样本数据点;
- x ˉ , y ˉ \bar{x}, \bar{y} xˉ,yˉ 是样本均值;
- n n n 是样本容量。
意义:
- 正值: X X X 和 Y Y Y 趋于同向变化(正相关);
- 负值: X X X 和 Y Y Y 趋于反向变化(负相关);
- 零:无线性相关性。
1.2 皮尔逊相关系数(Pearson Correlation Coefficient)
皮尔逊相关系数是协方差的标准化版本,用于量化两个变量之间的线性相关程度,定义为:
r x y = Cov ( X , Y ) σ x σ y r_{xy} = \frac{\text{Cov}(X,Y)}{\sigma_x \sigma_y} rxy=σxσyCov(X,Y)
其中:
- σ x , σ y \sigma_x, \sigma_y σx,σy 是 X X X 和 Y Y Y 的标准差;
- r r r 的取值范围为 [ − 1 , 1 ] [-1, 1] [−1,1]。
意义:
- r = 1 r = 1 r=1:完全正相关;
- r = − 1 r = -1 r=−1:完全负相关;
- r = 0 r = 0 r=0:无线性相关性。
二、协方差的定义与推导逻辑
2.1 核心目标:衡量变量的“协同变化”
协方差的核心思想是量化两个变量是否倾向于同时偏离各自的均值。
- 同向偏离均值:若 X X X 和 Y Y Y 的值经常同时高于或低于各自均值,则协方差为正;
- 反向偏离均值:若 X X X 高于均值时 Y Y Y 低于均值,则协方差为负。
2.2 数学表达的直观性
协方差的公式:
Cov ( X , Y ) = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] \text{Cov}(X,Y) = \mathbb{E}[(X - \mathbb{E}[X])(Y - \mathbb{E}[Y])] Cov(X,Y)=E[(X−E[X])(Y−E[Y])]
或样本形式:
Cov ( X , Y ) = ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) n − 1 \text{Cov}(X,Y) = \frac{\sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y})}{n-1} Cov(X,Y)=n−1∑i=1n(xi−xˉ)(yi−yˉ)
- 分子 ( x i − x ˉ ) ( y i − y ˉ ) (x_i - \bar{x})(y_i - \bar{y}) (xi−xˉ)(yi−yˉ) 的意义:
- 当 x i x_i xi 和 y i y_i yi 同时高于或低于均值时,
乘积为正,表明变量“协同变化”
; - 当 x i x_i xi 和 y i y_i yi 偏离方向相反时,
乘积为负,表明变量“反向变化”
。
- 当 x i x_i xi 和 y i y_i yi 同时高于或低于均值时,
- 分母 n − 1 n-1 n−1 的意义:
- 对样本协方差进行无偏估计的修正(即 Bessel’s correction),确保样本协方差是总体协方差的无偏估计量。
2.3 从线性关系的最小误差出发
假设变量间存在线性关系 Y = a X + b Y = aX + b Y=aX+b,目标是通过最小化误差平方和 S = ∑ ( y i − a x i − b ) 2 S = \sum (y_i - a x_i - b)^2 S=∑(yi−axi−b)2 来求解最优参数 a a a 和 b b b。
- 通过求导并解方程,可得:
a = Cov ( X , Y ) Var ( X ) , b = y ˉ − a x ˉ a = \frac{\text{Cov}(X,Y)}{\text{Var}(X)}, \quad b = \bar{y} - a \bar{x} a=Var(X)Cov(X,Y),b=yˉ−axˉ - 这表明协方差是最小化线性误差的关键量,其值越大,线性关系越强。
2.4 从概率论的期望角度推导
协方差的期望形式:
Cov ( X , Y ) = E [ X Y ] − E [ X ] E [ Y ] \text{Cov}(X,Y) = \mathbb{E}[XY] - \mathbb{E}[X]\mathbb{E}[Y] Cov(X,Y)=E[XY]−E[X]E[Y]
推导过程:
E [ ( X − μ X ) ( Y − μ Y ) ] = E [ X Y − μ Y X − μ X Y + μ X μ Y ] = E [ X Y ] − μ Y E [ X ] − μ X E [ Y ] + μ X μ Y = E [ X Y ] − μ X μ Y \begin{aligned} \mathbb{E}[(X - \mu_X)(Y - \mu_Y)] &= \mathbb{E}[XY - \mu_Y X - \mu_X Y + \mu_X \mu_Y] \\ &= \mathbb{E}[XY] - \mu_Y \mathbb{E}[X] - \mu_X \mathbb{E}[Y] + \mu_X \mu_Y \\ &= \mathbb{E}[XY] - \mu_X \mu_Y \end{aligned} E[(X−μX)(Y−μY)]=E[XY−μYX−μXY+μXμY]=E[XY]−μYE[X]−μXE[Y]+μXμY=E[XY]−μXμY
这表明协方差是联合期望 E [ X Y ] \mathbb{E}[XY] E[XY] 与均值乘积 μ X μ Y \mu_X \mu_Y μXμY 的差值,反映了变量间偏离独立性的程度。
三、协方差的几何解释与局限性
3.1 向量视角:内积与投影
将变量 X X X 和 Y Y Y 看作向量,则协方差可以视为它们的内积(点积):
Cov ( X , Y ) = 1 n − 1 ∑ i = 1 n ( x i − x ˉ ) ( y i − y ˉ ) \text{Cov}(X,Y) = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})(y_i - \bar{y}) Cov(X,Y)=n−11i=1∑n(xi−xˉ)(yi−yˉ)
- 内积的符号和大小直接反映两个向量的方向一致性和夹角大小。
3.2 散点图视角:面积的正负
在二维散点图中,每个点 ( x i , y i ) (x_i, y_i) (xi,yi) 与其均值点 ( x ˉ , y ˉ ) (\bar{x}, \bar{y}) (xˉ,yˉ) 形成的矩形面积为 ( x i − x ˉ ) ( y i − y ˉ ) (x_i - \bar{x})(y_i - \bar{y}) (xi−xˉ)(yi−yˉ):
- 红色区域(第一、第三象限):面积为正,表示正相关;
- 蓝色区域(第二、第四象限):面积为负,表示负相关。
- 协方差是所有矩形面积的总和,正负值直接反映整体趋势。
3.3 局限性与改进
(1)单位依赖性
- 协方差的值受变量单位的影响。例如:
- 若 X X X 的单位是“小时”, Y Y Y 的单位是“分”,协方差值会因单位不同而无法比较。
- 改进方案:引入皮尔逊相关系数,
通过除以标准差消除单位影响
。
(2)仅反映线性相关性
- 协方差只能衡量线性关系,无法捕捉非线性相关性(如抛物线关系)。
- 改进方案:使用Spearman相关系数(基于排序)或距离相关系数(适用于非线性关系)。
四、协方差与皮尔逊相关系数的关系
4.1 数学上的联系
皮尔逊相关系数是通过标准化协方差得到的:
r x y = Cov ( X , Y ) σ x σ y r_{xy} = \frac{\text{Cov}(X,Y)}{\sigma_x \sigma_y} rxy=σxσyCov(X,Y)
- 协方差受变量单位影响,无法直接比较不同数据集的相关性;
- 相关系数通过除以标准差,消除了单位影响,使得结果在 [ − 1 , 1 ] [-1, 1] [−1,1] 范围内,便于跨数据集比较。
4.2 几何视角
- 协方差:反映变量偏离均值后乘积的总趋势;
- 相关系数:等价于两个变量向量的余弦相似度,衡量方向一致性。
五、计算示例
5.1 协方差计算示例
数据:某班级学生的学习时间( X X X)与考试成绩( Y Y Y)如下:
学生 | X(学习小时) | Y(成绩) |
---|---|---|
1 | 5 | 75 |
2 | 6 | 80 |
3 | 4 | 70 |
4 | 8 | 90 |
5 | 7 | 85 |
步骤:
- 计算均值: x ˉ = 6 \bar{x} = 6 xˉ=6, y ˉ = 80 \bar{y} = 80 yˉ=80;
- 计算偏差乘积并求和:
- ∑ ( x i − x ˉ ) ( y i − y ˉ ) = 5 + 0 + 20 + 20 + 5 = 50 \sum (x_i - \bar{x})(y_i - \bar{y}) = 5+0+20+20+5 = 50 ∑(xi−xˉ)(yi−yˉ)=5+0+20+20+5=50;
- 代入公式: Cov ( X , Y ) = 50 4 = 12.5 \text{Cov}(X,Y) = \frac{50}{4} = 12.5 Cov(X,Y)=450=12.5。
结论:协方差为正(12.5),表明学习时间与成绩呈正相关趋势。
5.2 皮尔逊相关系数计算
- 计算标准差:
- σ x ≈ 1.58 \sigma_x \approx 1.58 σx≈1.58, σ y ≈ 7.91 \sigma_y \approx 7.91 σy≈7.91;
- 代入公式: r x y = 12.5 1.58 × 7.91 ≈ 0.998 r_{xy} = \frac{12.5}{1.58 \times 7.91} \approx 0.998 rxy=1.58×7.9112.5≈0.998。
结论:相关系数接近1,表明学习时间与成绩高度正相关。
六、应用场景
6.1 协方差的应用
- 金融领域:
- 构建投资组合时,通过协方差矩阵分析资产间的风险相关性;
- 公式: σ p 2 = w T Σ w \sigma_p^2 = \mathbf{w}^T \Sigma \mathbf{w} σp2=wTΣw,其中 Σ \Sigma Σ 是协方差矩阵。
- 机器学习:
- 特征选择中,协方差用于剔除冗余特征;
- 例如,高度相关的特征对模型性能无显著提升。
- 信号处理:
- 分析信号的同步性(如脑电图数据)。
6.2 皮尔逊相关系数的应用
- 推荐系统:
- 用户相似度计算(基于评分数据);
- 生物信息学:
- 基因表达数据分析(共表达网络构建);
- 社会科学:
- 心理学实验中变量间关系的量化(如焦虑与睡眠质量)。
七、优缺点与注意事项
7.1 协方差的局限性
- 单位依赖:无法直接比较不同量纲的变量;
- 敏感性:对异常值敏感,可能导致误判。
7.2 皮尔逊相关系数的局限性
- 仅衡量线性关系:非线性关系(如抛物线)可能被低估;
- 假设正态分布:非正态数据需改用Spearman相关系数。
7.3 实际应用建议
- 数据预处理:
- 去除异常值,标准化数据;
- 检验数据正态性。
- 结合其他指标:
- 用散点图辅助判断非线性关系;
- 结合偏相关系数排除干扰变量。
八、扩展:协方差矩阵与多元分析
8.1 协方差矩阵
- 定义:多变量协方差的矩阵形式,用于描述变量间的整体相关性;
- 公式:
Σ = [ Var ( X 1 ) Cov ( X 1 , X 2 ) Cov ( X 2 , X 1 ) Var ( X 2 ) ] \mathbf{\Sigma} = \begin{bmatrix} \text{Var}(X_1) & \text{Cov}(X_1,X_2) \\ \text{Cov}(X_2,X_1) & \text{Var}(X_2) \end{bmatrix} Σ=[Var(X1)Cov(X2,X1)Cov(X1,X2)Var(X2)] - 应用:主成分分析(PCA)、多元回归模型。
8.2 皮尔逊相关系数的扩展
- 偏相关系数:控制其他变量影响后的相关性;
- 距离相关系数:适用于非线性关系的度量。
九、总结
协方差与皮尔逊相关系数是统计学中分析变量关系的核心工具。协方差通过数学期望和偏差乘积量化变量的联合变化趋势,其设计逻辑基于最小化线性误差的优化目标,并结合概率论的期望推导。尽管协方差存在单位依赖性和仅反映线性相关性的局限性,但它仍是统计学和数据分析中不可或缺的基础工具。通过标准化(如皮尔逊相关系数)或改进方法(如非线性相关系数),可以进一步扩展其应用范围。无论是金融建模还是生物研究,掌握这两者的原理与实践技巧,都是数据科学与统计分析的关键能力。
相关文章:
协方差与皮尔逊相关系数:从定义到应用的全面解析
目录 一、协方差与皮尔逊相关系数的定义1.1 协方差(Covariance)1.2 皮尔逊相关系数(Pearson Correlation Coefficient) 二、协方差的定义与推导逻辑2.1 核心目标:衡量变量的“协同变化”2.2 数学表达的直观性2.3 从线性…...
ICML 2025录取率公布,spotlight posters仅占2.6%
近日,ICML 2025公布了论文录用结果。本次大会共收到 12,107篇有效论文投稿,比去年增加了28%,今年录取论文3,260篇,录取率为 26.9%。其中仅有313篇被列为“焦点海报”(即所有投稿中排名前2.6%的论文)&#x…...
kotlin一个函数返回多个值
一、主要实现方式 1. Pair/Triple 元组 用途:临时快速返回 2 或 3 个简单值,适用于简单场景语法: fun getStatus(): Pair<Int, String> {return Pair(200, "Success") // 等价于 200 to "Success" }// 解构接收 …...
Clojure 学习笔记
Clojure哲学 1.又一种Lisp? 优美、灵活、代码即数据。 实现一门程序设计语言,代码同数据一般对待,这需要语言本身具有非常强的可塑性。当语言就是以这种本质的数据结构表现时,语言本身就可以操作自己的结构和行为了。 2.函数式编…...
5.7 react 路由
react 状态管理库 14:20 react 路由(补充) 数据路由 路由hooks 路由跳转 (方法 标签/内置方法) 获取路由地址栏信息 动态路由实现(多角色权限路由) redux redux-toolkit 状态管理 antd 组件使用 1.…...
8. HTML 表单基础
表单是网页开发中与用户交互的核心组件,用于收集、验证和提交用户输入的数据。本文将基于提供的代码素材,系统讲解 HTML 表单的核心概念、常用控件及最佳实践。 一、表单的基本结构 一个完整的 HTML 表单由以下部分组成: <form action&q…...
遥感数据处理、机器学习建模与空间预测的全流程指南——涵盖R语言(随机森林、XGBoost、SVM等)、特征提取、模型优化及生态学案例分析
随机森林是一种强大的集成学习方法,特别适用于复杂的遥感数据分析。它通过构建多棵决策树并引入随机性,有效降低模型的方差和过拟合风险。在训练过程中,随机森林利用Bootstrap抽样生成多样化的训练集,并在节点分裂时随机选择特征子…...
Android 数据持久化之数据库存储 Room 框架
一、简介 Room 是 Google 推出的 Android 持久层框架,建立在 SQLite 之上,提供了一个抽象层,简化了数据库操作。它通过注解和编译时检查来确保数据操作的正确性。 Room 主要由以下三个组件组成: Entity(实体&#x…...
空间数据分析新趋势:AI 与 ArcGIS Pro 的协同创新
技术点目录 AI(DeepSeek、ChatGPT)大模型介绍及应用AI(DeepSeek、ChatGPT)支持下空间数据处理及分析功能基础AI(DeepSeek、ChatGPT)支持下空间数据选择及读取AI(DeepSeek、ChatGPT)支…...
Oracle OCP认证考试考点详解083系列10
题记: 本系列主要讲解Oracle OCP认证考试考点(题目),适用于19C/21C,跟着学OCP考试必过。 46. 第46题: 题目 解析及答案: 查看以下配置: CDB1 和 CDB2 是两个容器数据库。 PDB1 是 CDB1 中的一…...
【linux常用指令】du命令
今天收到通知需要将服务器上的容量大的文件移动到大容量数据盘中。 du -sh */ | sort -h如果你想按大小排序显示文件夹,可以结合 sort 命令。这会按大小从小到大排序显示文件夹。如果想按大小从大到小排序,可以加上 -r 选项。 du -sh */ | sort -h -r...
统一返回JsonResult踩坑
定义了一个统一返回类,但是没有给Data 导致没有get/set方法,请求一直报错 public class JsonResult<T> {private int code;private String message;private T data;public JsonResult() {}public JsonResult(int code, String message, T data) {…...
MCP Client适配DeepSeek
本文是通过MCP官方的client例子进行修改,适配DeepSeek API. MCP client 先解析一下什么是MCP client。 MCP Client 是 Model Context Protocol(模型上下文协议)架构中的客户端组件,主要负责与 MCP 服务器建立和管理连接。它是一…...
物业设备管理的“多系统协同”模式:ERP、IoT与工单系统如何联动?
在智慧物业快速发展的今天,设备管理已从“被动维修”转向“主动预防”,但许多企业仍面临系统割裂、数据孤岛的困境。ERP系统记录设备台账却难实时监控,IoT设备采集数据却无法联动响应,工单系统处理流程却依赖人工流转——这些痛点…...
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】6.4 时间序列分析(窗口函数处理时间数据)
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 PostgreSQL时间序列分析:窗口函数处理时间数据实战一、时间序列分析核心场景与窗口函数优势1.1 业务场景需求1.2 窗口函数核心优势 二、窗口函数基础:…...
数据可视化:艺术与科学的交汇点,如何让数据“开口说话”?
数据可视化:艺术与科学的交汇点,如何让数据“开口说话”? 数据可视化,是科技与艺术的结合,是让冰冷的数字变得生动有趣的桥梁。它既是科学——讲究准确性、逻辑性、数据处理的严谨性;又是艺术——强调美感…...
IP 风险画像如何实现对恶意 IP 的有效拦截?
IP 风险画像作为一种强大的技术手段,在识别和拦截恶意 IP 方面发挥着至关重要的作用。 IP风险画像技术简介 IP 风险画像技术通过收集和分析 IP 地址的多维度信息,为每个 IP 构建详细的风险评估模型。 这些维度包括但不限于 IP 的地理位置、历史访问行…...
B树如何用于磁盘 ,B+树为如何用于数据库
B树 M阶B树:每个节点最多M个子节点,每个节点最多存M-1个Key-Value值,key以升序排序。 构建五阶B树。 那么value是干什么的呢。 先让我们介绍一下cpu 内存 磁盘的关系 我们知道了页的概念。B树用于磁盘的读取。Key是对文件进行编号ÿ…...
image-classifier开源程序Elixir是使用电脑学习对图像进行分类并从中提取数据或描述其内容,非常不错的图片整理工具
一、软件介绍 文末提供程序和源码下载 Elixir 机器学习功能构建一个应用程序,该应用程序执行图像字幕和语义搜索,以使用您的语音查找上传的图像! 二、为什么做这个程序 在构建我们的应用程序时,我们认为 images 这是一种必不…...
HarmonyOS 鸿蒙操作物联网设备蓝牙模块、扫描蓝牙、连接蓝牙和蓝牙通信
01【HarmonyOS 蓝牙】 物联网无线传输方案、HarmonyOS蓝牙数据通信之前的准备工作 02【HarmonyOS 蓝牙】配置蓝牙权限 检测 打开 关闭蓝牙 扫描蓝牙 显示蓝牙设备 03【HarmonyOS 蓝牙】连接蓝牙 发现服务 获取特征值 读取信息 写入信息 和蓝牙模块交互 04【物联网 Wifi模块…...
STM32开发GPIO
1、什么是GPIO General Purpose lnput Output,即通用输入输出端口,简称GPIO 作用:负责采集外部器件的信息或者控制外部器件工作,即输入输出 2、GPIO特点 1,不同芯片型号,IO口数量可能不一样,可通过选型…...
【机器学习】Logistic 回归
Logistic 回归虽然名字中带有“回归”,但它实际上是一种广泛应用于 二分类问题 的线性分类算法。 Logistic 回归的核心任务是预测一个样本属于正类的概率,而概率必须在 [ 0 , 1 ] 范围内。 Logistic回归 通过将输入特征的线性组合映射到概率空间&…...
ClimateCatcher专用CDS配置教程
文章目录 API获取官网账号注册CDSAPI本地化配置 API获取官网 首先需要访问CDS官方网站,点我蓝色字直接到官网how-to-api点我蓝色字直接到官网 目前API的网页是这样的 账号注册 如果有账号的小伙伴可以直接登录自己的账号并跳转到CDSAPI本地化配置,如…...
拆解 Prompt 工程:五大场景驱动 DeepSeek 超越 ChatGPT
同样的模型、不一样的答案,差距往往发生在一行 Prompt 里。本文围绕五大高频实战场景,给出可直接复制的 DeepSeek 提问框架,并穿插《DeepSeek 行业应用大全》中 64 个行业模板精华,帮助读者迅速跑赢 ChatGPT。🌟 剧透…...
【解决方案】CloudFront VPC Origins 实践流程深入解析 —— 安全高效架构的实战之道
目录 引言一、VPC Origins 的核心价值(一)安全性提升(二)运维效率优化(三)成本节约(四)全球分发能力的保留 二、VPC Origins 的架构解析(一)流量路径设计&…...
软考 系统架构设计师系列知识点 —— 黑盒测试与白盒测试(2)
接前一篇文章:软考 系统架构设计师系列知识点 —— 黑盒测试与白盒测试(1) 本文内容参考: 黑盒测试和白盒测试详解-CSDN博客 软件测试中的各种覆盖(Coverage)详解-CSDN博客 特此致谢! 二、白…...
【背包dp----01背包】例题三------(标准的01背包+变种01背包1【恰好装满背包体积 产生的 最大价值】)
【模板】01背包 题目链接 题目描述 : 输入描述: 输出描述: 示例1 输入 3 5 2 10 4 5 1 4输出 14 9说明 装第一个和第三个物品时总价值最大,但是装第二个和第三个物品可以使得背包恰好装满且总价值最大。 示例2 输入 3 8 12 6 11 8 6 8输出 8 0说明 装第三个物…...
设计模式之状态模式
在日常开发中,我们经常会遇到这样的场景:一个对象在不同时刻有不同的状态,不同状态下它的行为也会发生变化。此时,使用大量if...else或switch语句会让代码变得混乱而难以维护。为了更优雅地应对这种问题,状态模式(Stat…...
arXiv论文 MALOnt: An Ontology for Malware Threat Intelligence
文章讲恶意软件威胁情报本体。 作者信息 作者是老美的,单位是伦斯勒理工学院,文章是2020年的预印本,不知道后来发表在哪里(没搜到,或许作者懒得投稿,也可能是改了标题)。 中心思想 介绍开源…...
Spark处理过程-转换算子和行动算子
计算时机 转换算子 转换算子是惰性执行的,这意味着在调用转换算子时,系统不会立即进行数据处理。这种惰性计算的方式可以让 Spark 对操作进行优化,例如合并多个转换操作,减少数据的传输和处理量。行动算子 行动算子是立即执行的。…...
使用 pgrep 杀掉所有指定进程
使用 pgrep 杀掉所有指定进程 pgrep 是一个查找进程 ID 的工具,结合 pkill 或 kill 命令可以方便地终止指定进程。以下是几种方法: 方法1:使用 pkill(最简单) pkill 进程名例如杀掉所有名为 “firefox” 的进程&…...
Android学习总结之MMKV(代替SharedPreferences)
Q1:SharedPreferences 为什么会导致 ANR?MMKV 如何从根本上解决? 高频考察点:Android 主线程阻塞原理、SP 同步 / 异步机制缺陷、MMKV 内存映射技术 SP 导致 ANR 的三大元凶: 同步提交(commit ()…...
SWiRL:数据合成、多步推理与工具使用
SWiRL:数据合成、多步推理与工具使用 在大语言模型(LLMs)蓬勃发展的今天,其在复杂推理和工具使用任务上却常遇瓶颈。本文提出的Step-Wise Reinforcement Learning(SWiRL)技术,为解决这些难题带…...
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】7.2 PostgreSQL与Python数据交互(psycopg2库使用)
👉 点击关注不迷路 👉 点击关注不迷路 👉 点击关注不迷路 文章大纲 PostgreSQL与Python数据交互:psycopg2库实战指南一、引言:数据交互的桥梁1.1 psycopg2核心优势 二、环境准备与基础连接2.1 安装配置2.1.1 安装psyco…...
【Prompt工程—文生图】案例大全
目录 一、人物绘图 二、卡通头像 三、风景图 四、logo设计图 五、动物形象图 六、室内设计图 七、动漫风格 八、二次元图 九、日常场景图 十、古风神化图 十一、游戏场景图 十二、电影大片质感 本文主要介绍了12种不同类型的文生图技巧,通过加入不同的图像…...
NVM完全指南:安装、配置与最佳实践
发布于 2025年5月7日 • 阅读时间:10分钟 💡 TL;DR: 本文详细介绍了如何完整卸载旧版Node.js,安装NVM,配置阿里云镜像源,以及设置node_global与node_cache目录,打造高效Node.js开发环境。 📋 目…...
成都养老机器人“上岗”,机器人养老未来已至还是前路漫漫?
近日,成都养老机器人“上岗”引发关注,赛博养老这一概念再次成为人们讨论的焦点,究竟赛博养老未来已来,还是仍需漫长等待,引发诸多思考。 成都研发的养老机器人“上岗”确实标志着智慧养老领域的又一进步,…...
数据中心 第十五次CCF-CSP计算机软件能力认证
总结一下图树算法比如krusal 迪杰斯特拉 prim算法喜欢改变距离定义 或者求别的东西 而拓扑排序喜欢大模拟 本题使用kerusal算法求出最后一条边就可以。 ac代码: #include <iostream> #include <vector> #include <algorithm>using namespac…...
【面试 · 一】vue大集合
目录 vue2 基础属性 组件通信 全局状态管理 vueX 路由 路由守卫 vue3 基础属性 组件通信 全局状态管理 Pinia 路由 路由守卫 vue2、vue3生命周期 setup vue2 基础属性 data:用于定义组件的初始数据,必须是一个函数,返回一个对…...
Java 常用的 ORM框架(对象关系映射)
Java 常用的 ORM(对象关系映射)框架有以下几种,每种都有其特点和使用场景: Hibernate ● 特点: ○ 完整的 ORM 框架,功能强大。 ○ 支持缓存机制(一级缓存、二级缓存)。 ○ 支持多种…...
自动化创业机器人:现状、挑战与Y Combinator的启示
自动化创业机器人:现状、挑战与Y Combinator的启示 前言 AI驱动的自动化创业机器人,正逐步从科幻走向现实。我们设想的未来是:商业分析、PRD、系统设计、代码实现、测试、运营,全部可以在monorepo中由AI和人类Co-founder协作完成…...
支持向量机
支持向量机(Support Vector Machine,SVM)是一种有监督的机器学习算法,可用于分类和回归任务,尤其在分类问题上表现出色。下面将从原理、数学模型、核函数、优缺点和应用场景等方面详细介绍。 原理 支持向量机的基本思…...
华为昇腾910B通过vllm部署InternVL3-8B教程
前言 本文主要借鉴:VLLM部署deepseek,结合自身进行整理 下载模型 from modelscope import snapshot_download model_dir snapshot_download(OpenGVLab/InternVL3-8B, local_dir"xxx/OpenGVLab/InternVL2_5-1B")环境配置 auto-dl上选择单卡…...
ZArchiver解压缩工具:高效解压,功能全面
在使用智能手机的过程中,文件管理和压缩文件的处理是许多用户常见的需求。无论是解压下载的文件、管理手机存储中的文件,还是进行日常的文件操作,一款功能强大且操作简便的文件管理工具都能极大地提升用户体验。今天,我们要介绍的…...
ETL介绍
(一)ETL介绍 “ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(Extract)、转换(Transform)、加载(Load)至目的端的过程。ETL一词较…...
2025.05.07-华为机考第三题300分
📌 点击直达笔试专栏 👉《大厂笔试突围》 💻 春秋招笔试突围在线OJ 👉 笔试突围OJ 03. 城市紧急救援队伍协同规划 问题描述 智慧城市建设中,卢小姐负责设计一套紧急救援队伍协同系统。城市被规划为一个 n n n \times n...
缓存菜品-04.功能测试
一.功能测试 redis中的数据已缓存 查询数据时并没有发sql 修改鸡蛋汤价格为5元。 缓存数据没有了 价格修改成功 停售启售是一样的。修改后清理,再次查询又被缓存到redis中。...
跨境电商生死局:动态IP如何重塑数据生态与运营效率
凌晨三点的深圳跨境电商产业园,某品牌独立站运营总监李明(化名)正盯着突然中断的广告投放系统。后台日志显示,过去24小时内遭遇了17次IP封禁,直接导致黑五促销期间损失23%的预期流量。这并非个案——2023年跨境电商行业…...
day 14 SHAP可视化
一、原理——合作博弈论 SHAP(SHapley Additive exPlanations)是一种用于解释机器学习模型预测结果的方法,它基于合作博弈论中的 Shapley 值概念。Shapley 值最初用于解决合作博弈中的利益分配问题。假设有 n 个参与者共同合作完成一项任务并…...
处理PostgreSQL数据库事务死锁过程
查询pg_locks表,获取未得到满足的锁信息: select * from pg_locks where granted is false ; --查询得不到锁的,那就是两个互相等待对方持有的锁查询活动的事务会话进程,和上一步的锁的事务对应起来: select * from …...