当前位置: 首页 > news >正文

Neo4j GDS-10-neo4j GDS 库中相似度算法介绍

neo4j apoc 系列

Neo4j APOC-01-图数据库 apoc 插件介绍

Neo4j GDS-01-graph-data-science 图数据科学插件库概览

Neo4j GDS-02-graph-data-science 插件库安装实战笔记

Neo4j GDS-03-graph-data-science 简单聊一聊图数据科学插件库

Neo4j GDS-04-图的中心性分析介绍

Neo4j GDS-05-neo4j中的中心性分析算法

Neo4j GDS-06-neo4j GDS 库中社区检测算法介绍

Neo4j GDS-07-neo4j GDS 库中社区检测算法实现

Neo4j GDS-08-neo4j GDS 库中路径搜索算法介绍

Neo4j GDS-09-neo4j GDS 库中路径搜索算法实现

Neo4j GDS-10-neo4j GDS 库中相似度算法介绍

Neo4j GDS-11-neo4j GDS 库中相似度算法实现

Neo4j GDS-12-neo4j GDS 库中节点插入(Node Embedding)算法介绍

Neo4j GDS-13-neo4j GDS 库中节点插入算法实现

Neo4j GDS-14-neo4j GDS 库中链接预测算法介绍

Neo4j GDS-15-neo4j GDS 库中链接预测算法实现

Neo4j GDS-16-neo4j GDS 库创建 graph 图投影

Neo4j GDS-17-neo4j GDS 库创建 graph 图投影更复杂的场景

图的相似度算法

图的相似度算法是图论和网络科学中的核心研究领域,用于衡量两个图之间的结构或属性相似性,广泛应用于社交网络分析、生物信息学、推荐系统等场景。

以下从算法分类、应用场景、时间复杂度对比、实现案例及研究进展等方面进行系统阐述:


一、算法分类与核心方法

1. 基于结构的相似度算法

此类算法通过比较图的拓扑结构或编辑操作代价来度量相似性:

  • 图编辑距离(Graph Edit Distance, GED)
    衡量将图G₁转换为G₂所需的最少编辑操作(增/删/改节点或边)的累计代价。GED是NP-hard问题,常用A*算法或二分图匹配优化。
  • 最大公共子图(Maximum Common Subgraph, MCS)
    寻找两个图的最大共同子结构,其大小与相似度成正比。MCS与GED在某些条件下等价,但计算复杂度同样较高。
  • 子图同构与精确匹配
    通过判断子图同构或完全结构匹配(如VF2算法)确定相似性,适用于严格结构对齐的场景,但复杂度极高(NP完全)。
2. 基于节点属性的相似度算法

关注节点属性与局部结构特征,结合机器学习方法:

  • 图核方法(Graph Kernels)
    将图映射到高维特征空间,通过核函数计算相似度。常见变体包括:
    • 随机游走核:统计匹配的标签随机游走路径数量。
    • 最短路径核:基于节点间最短路径长度的匹配。
    • Weisfeiler-Lehman核:通过迭代标签压缩捕获子树结构。
  • 图神经网络(GNN)
    如SimGNN模型,结合图级嵌入(全局特征)与节点级对比(局部特征),通过神经网络学习相似度函数,显著降低计算复杂度。
3. 混合方法

结合结构与属性信息,例如:

  • 二分图匹配:将节点相似度与边相似度联合计算,转化为带权二分图最优匹配问题,使用Kuhn-Munkres算法求解。
  • 图嵌入(Graph Embedding) :将图转换为低维向量,通过向量相似度(如余弦相似度)间接度量图间相似性。

二、应用场景分析

1. 生物信息学
  • 分子结构比较:通过GED或子图匹配比较蛋白质相互作用网络或化学分子结构,识别功能相似的化合物。
  • 基因调控网络分析:利用图核方法检测基因表达模式相似性,辅助疾病机理研究。
2. 社交网络分析
  • 社区发现:通过Jaccard相似度或SimRank算法识别用户社交圈重叠度,用于推荐系统。
  • 异常检测:比较子图结构差异,发现虚假账号集群或传播网络。
3. 推荐系统与信息检索
  • 行为图匹配:计算用户行为图与物品图的相似度,生成个性化推荐。
  • 语义图搜索:将查询转化为图结构,通过相似度检索数据库中的相关文档或知识图谱节点。
4. 计算机视觉
  • 图像结构匹配:利用图同构算法识别图像中的重复模式或关键部件。

三、时间复杂度与适用场景对比

算法类别典型方法时间复杂度适用场景
基于结构图编辑距离(GED)O(n!)小规模图,需精确匹配代价
最大公共子图(MCS)NP-hard分子结构比对、严格子图匹配
基于节点属性随机游走核O(n²d)(d为游走步长)中等规模图,需捕获路径特征
Weisfeiler-Lehman核O(Nhm + N²hn)大规模图,快速子树结构比较
图神经网络SimGNNO(E)(嵌入)+ O(DN²)大规模动态图,需快速近似计算
混合方法二分图匹配(Kuhn-Munkres)O(n³)节点/边带权图的精确匹配

注:SimGNN等GNN方法通过预计算图嵌入(O(E))显著降低在线计算时间,适合实时场景。


相关文章:

Neo4j GDS-10-neo4j GDS 库中相似度算法介绍

neo4j apoc 系列 Neo4j APOC-01-图数据库 apoc 插件介绍 Neo4j GDS-01-graph-data-science 图数据科学插件库概览 Neo4j GDS-02-graph-data-science 插件库安装实战笔记 Neo4j GDS-03-graph-data-science 简单聊一聊图数据科学插件库 Neo4j GDS-04-图的中心性分析介绍 Ne…...

Unity 动画

Apply Root Motion 勾选的话就会使用动画片段自带的位移 Update Mode (动画重新计算骨骼位置转向缩放的数值): Normal : 随Update走,每次Update都计算Animate Physics :与 fixed Update() 同步&#xff0…...

【位运算】只出现一次的数字 II

文章目录 137. 只出现一次的数字 II解题思路一:借用数组的位运算解法二:不使用数组的位运算 137. 只出现一次的数字 II 137. 只出现一次的数字 II ​ 给你一个整数数组 nums ,除某个元素仅出现 一次 外,其余每个元素都恰出现 **…...

模型开发中的微调是干什么

在模型开发中,微调(Fine-tuning) 是指利用预训练模型(Pre-trained Model)的参数作为初始值,在特定任务或数据集上进一步调整模型参数的过程。它是迁移学习(Transfer Learning)的核心…...

leetcode 204. Count Primes

题目描述 这是道纯数学类问题。 先回忆一下,素数的定义。 质数(英文名:Prime number)又称素数,是指在大于1的自然数中,除了1和它本身以外不再有其他因数的自然数。 质数又称素数。一个大于1的自然数&…...

fastadmin后端添加页面,自主控制弹出框关闭,关闭父页面弹框

Form.api.bindevent($(“form[roleform]”), (data, ret) > { 重写绑定事件,返回false即可 注意:只有返回code1才能拦截,其他值不进行拦截 add: function () {//获取当前search里面的type值var type location.search.split(type)[1];Form.api.bindevent($("form[role…...

LeetCode 255 超通俗讲解:Swift 验证前序是否 BST

文章目录 摘要描述题解答案题解代码分析核心点解释: 示例测试及结果时间复杂度空间复杂度总结未来展望 摘要 在做算法题的时候,树相关的题总是“神神叨叨”的,但其实抓住核心规则,它们也挺有逻辑的。今天这题——LeetCode 255&am…...

Win32++ 使用初探

文章目录 1. 环境要求2. Win32安装3. 项目创建3.1 项目创建(1)直接使用Win32里的示例Sample(2)自行创建项目 最近想用 VC写些 UI,但又不太想用 MFC,正好对界面要求不太高,就使用了一下 Win3…...

求解时间复杂度

1.设 t 法 当求解出现while循环时&#xff0c;设t求解 void fun(int n) {int i 1;while(i < n)i i * 2; } 解法&#xff1a; 1.设循环次数为t&#xff1b; 2.将while循环中的语句展开到循环t次 1 2 3 …… t 2 2^2 2^3 …… 2^t 3.跳出循环 2^t > n …...

深度解析:如何高效识别并定位问题关键词

什么是问题关键词&#xff1f; 问题关键词是人们在搜索引擎中输入以查找信息、答案或解决方案的问题。这些查询以问题指示符开头&#xff0c;例如&#xff1a; who、what、where、when、why、how、which、will、would、should、can、could、is、are、was、were、do、does 或 d…...

c++小做——完全数

今天&#xff0c;我们来写一个完全数的代码 首先是 long long n; cin>>n; &#xff08;you~输入的数&#xff09; 然后是 long long b0;//因数的和 long long cnt0;//计数器 接着是 for(long long i2;i<n-1;i) {} 在里面插入 bb-i;再写一个for for(int a1;a&…...

GGML源码逐行调试(下)

目录 前言1. 简述2. 预分配计算图内存2.1 创建图内存分配器2.2 构建最坏情况的计算图2.3 预留计算图内存 3. 分词4. 模型推理与生成4.1 模型推理4.2 采样 结语下载链接参考 前言 学习 UP 主 比飞鸟贵重的多_HKL 的 GGML源码逐行调试 视频&#xff0c;记录下个人学习笔记&#x…...

JavaScript学习教程,从入门到精通, JavaScript 函数全面解析与案例实践(11)

JavaScript 函数全面解析与案例实践 项目导读 JavaScript 函数是编程中的核心概念&#xff0c;是执行特定任务的代码块。本教程将全面讲解函数的定义、参数、返回值及调用方式&#xff0c;并通过实际案例加深理解。 学习目标 掌握 JavaScript 函数的定义与调用方法理解函数…...

音视频之H.265/HEVC编码框架及编码视频格式

一、编码框架&#xff1a; H.265/HEVC采用混合编码框架&#xff0c;包括变换、量化、熵编码、帧内预测、帧预测以及环路滤波等模块。但是&#xff0c;H.265/HEVC几乎在每个模块都引入了新的编码技术。 1、帧内预测&#xff1a; 该模块主要用于去除图像的空间相关性。通过编码后…...

栈与队列:两种经典线性数据结构的深度解析

一、栈&#xff1a;LIFO 特性的完美诠释 &#xff08;一&#xff09;核心概念与抽象模型 定义与特性 栈是一种严格遵循后进先出&#xff08;LIFO&#xff09;原则的线性数据结构&#xff0c;其操作被限制在栈顶&#xff08;Top&#xff09;进行。形象化理解&#xff1a;如同堆…...

0x01、Redis 主从复制的实现原理是什么?

Redis 主从复制概述 Redis 的主从复制是一种机制&#xff0c;允许一个主节点&#xff08;主实例&#xff09;将数据复制到一个或多个从节点&#xff08;从实例&#xff09;。通过这一机制&#xff0c;从节点可以获取主节点的数据并与之保持同步。 复制流程 开始同步&#xf…...

Python实现贪吃蛇一

贪吃蛇是一款经典的小游戏&#xff0c;最近尝试用Python实现它。先做一个基础版本实现以下目标&#xff1a; 1、做一个按钮&#xff0c;控制游戏开始 2、按Q键退出游戏 3、右上角显示一个记分牌 4、随机生成一个食物&#xff0c;蛇吃到食物后长度加一&#xff0c;得10分 5、蛇碰…...

01-libVLC的视频播放器:环境搭建以及介绍

项目展示项目播放器 VLC简介VLC媒体播放器(VideoLAN Client)是一款开源、跨平台的自由多媒体播放器,由VideoLAN项目开发。它支持众多音频与视频格式(如MPEG-2、MPEG-4、H.264、MKV、WebM、WMV、MP3等),以及DVD、VCD和各种流媒体协议。 VLC的特点跨平台支持:Windows、mac…...

linux内核升级

这里介绍一下linux内核升级 因为需要搭建k8s集群内核内核版本过低会导致集群出现问题&#xff0c;为了避免问题发生我们对集群内核进行升级处理 这个是我目前本身的内核版本 用了很多的镜像站去进行更新发现更新不了&#xff08;阿里云不能用了&#xff0c;貌似是删除了&…...

电感详解:定义、作用、分类与使用要点

一、电感的基本定义 电感&#xff08;Inductor&#xff09; 是由导线绕制而成的储能元件&#xff0c;其核心特性是阻碍电流变化&#xff0c;将电能转化为磁能存储。 基本公式&#xff1a; 自感电动势&#xff1a; E -L * (di/dt) &#xff08;L&#xff1a;电感值&#xff0c…...

扩散模型简介

扩散模型简介 基本原理 扩散模型是一种基于概率扩散过程的生成模型&#xff0c;其核心思想是通过正向扩散过程和反向去噪过程生成数据&#xff1a; 正向扩散过程&#xff1a;从真实数据&#xff08;如图像&#xff09;开始&#xff0c;逐步添加高斯噪声&#xff0c;最终将数据…...

MySQL安装实战分享

一、在 Windows 上安装 MySQL 1. 下载 MySQL 安装包 访问 MySQL 官方下载页面。选择适合你操作系统的版本。一般推荐下载 MySQL Installer。 2. 运行安装程序 双击下载的安装文件&#xff08;例如 mysql-installer-community-<version>.msi&#xff09;。如果出现安全…...

掌握 Git 的十大基础命令

李升伟 编译 在 IT 领域&#xff0c;很少有技术能像 Git 一样占据绝对主导地位&#xff0c;几乎无人能及。Git 在软件开发中扮演着核心角色&#xff0c;其影响力之大甚至让其他版本控制系统&#xff08;如 SVN 和 Mercurial&#xff09;几乎被淘汰。如今&#xff0c;我们已难以…...

58-使用wordpress快速创建个人网站

直接找台可以联网的linux&#xff08;我的环境是rocky8.9&#xff09;一顿运行&#xff0c;思路就是安装docker&#xff0c;然后启动一个数据库&#xff0c;然后启动一个wordpress&#xff0c;然后就是把端口暴露出来。 227 yum remove podman 228 yum install -y yum-utils…...

若依前后端分离版运行教程、打包教程、部署教程

后端打包教程 注意&#xff1a;需要先运行redis 2、前端运行教程 2.1安装依赖 2.2运行 打开浏览器查看,地址&#xff1a;http://localhost:80 3、前端打包教程 3.1打包 3.2运行打包好的文件&#xff0c;先找到打包好的文件 这是nginx的文件结构 将打包好的文件放到html目录下…...

【Python3教程】Python3基础篇之数据结构

博主介绍:✌全网粉丝22W+,CSDN博客专家、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围:SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物联网、机器学习等设计与开发。 感兴趣的可…...

transformers的 pipeline是什么:将模型加载、数据预处理、推理等步骤进行了封装

transformers的 pipeline是什么:将模型加载、数据预处理、推理等步骤进行了封装 pipe = pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=50 )pipeline :这是 transformers 库中一个非常实用的工具函数。它可以基于预训练模型快速构…...

十七、TCP编程

TCP 编程是网络通信的核心&#xff0c;其 API 围绕面向连接的特性设计&#xff0c;涵盖服务端和客户端的交互流程。以下是基于 ​C 语言的 TCP 编程核心 API 及使用流程的详细解析&#xff1a; 核心 API 概览 ​函数​角色​描述socket()通用创建套接字&#xff0c;指定协议族…...

Obsidian 技巧篇

Obsidian 技巧篇 本篇文章主要汇总分享几个 Ob 中好用的小技巧&#xff0c;包括嵌入视频播放、文本颜色设置、插入大纲、Mermaid 绘制图形。原文见于&#xff1a;Obsidian技巧篇。 嵌入视频播放 <iframe width"860" height"700" src"https://ww…...

使用Fortran读取HDF5数据

使用Fortran读取HDF5数据 下面我将介绍如何在Fortran中读取HDF5文件中的各种类型数组数据&#xff0c;包括一维数组、二维数组、元数组和变长数组。 准备工作 首先需要确保系统安装了HDF5库&#xff0c;并且在编译时链接了HDF5库。例如使用gfortran编译时&#xff1a; gfor…...

L36.【LeetCode题解】查找总价格为目标值的两个商品(剑指offer:和为s的两个数字) (双指针思想,内含详细的优化过程)

目录 1.LeetCode题目 2.分析 方法1:暴力枚举(未优化的双指针) 方法2:双指针优化:利用有序数组的单调性 版本1代码 提问:版本1代码有可以优化的空间吗? 版本2代码 提问:版本2代码有可以优化的空间吗? 版本3代码(★推荐★) 3.牛客网题目:和为s的数字 1.LeetCode题目 …...

mysql 商城商品属性开发的动态解决方案

终极方案&#xff1a;动态属性解决方案 推荐使用 JSON 字段 虚拟列索引 的组合方案 结合灵活存储与查询优化&#xff0c;平衡扩展性与性能 完整实现步骤 步骤 1&#xff1a;创建基础表结构 CREATE TABLE products (id INT PRIMARY KEY AUTO_INCREMENT,name VARCHAR(100) NO…...

Java递归练习----猴子偷桃

问题&#xff1a; 有一堆桃子&#xff0c;猴子第一天吃灵其中的一般&#xff0c;并在多吃了一个&#xff01;以后每天猴子都吃其中的一半&#xff0c;然后多吃一个。当到第十天时&#xff0c;想再吃时&#xff08;即还没吃&#xff09;&#xff0c;发现只有1个桃子了&#xff…...

[干货]PHM学习软件|PHM预测性维护系统

使用步骤教程如下 1、登录 用户名&#xff1a;52phm 密码&#xff1a;xxx &#xff08;区别在于不同用户密钥不一样&#xff09; 2、上传需要分析的数据集 支持数据集格式&#xff1a;csv、xlsx、xls、mat、json 3、主题1&#xff1a;机械参数计算 计算轴承、齿轮、皮带的…...

详解正则表达式中的?:、?= 、 ?! 、?<=、?<!

1、?: - 非捕获组 语法: (?:pattern) 作用: 创建一个分组但不捕获匹配结果&#xff0c;不会将匹配的文本存储到内存中供后续使用。 优势: 提高性能和效率 不占用编号&#xff08;不会影响后续捕获组的编号&#xff09; 减少内存使用 // 使用捕获组 let regex1 /(hell…...

Java常见面试问题

一.Liunx 二.Java基础 1.final 2.static 3.与equals 三.Collection 1.LIst 2.Map 3.Stream 四、多线程 1.实现方法 2.线程池核心参数 3.应用场景 五、JVM 1.堆 2.栈 六、Spring 1.面向对象 2.IOC 3.AOP 七、Springboot 1.自动装配 八、SpringCloud 1.Nacos 2.seata 3.ga…...

C#MQTT协议服务器与客户端通讯实现(客户端包含断开重连模块)

C#MQTT协议服务器与客户端通讯实现 1 DLL版本2 服务器3 客户端 1 DLL版本 MQTTnet.DLL版本-2.7.5.0 基于比较老的项目中应用的DLL&#xff0c;其他更高版本变化可能较大&#xff0c;谨慎参考。 2 服务器 开启服务器 关闭服务器 绑定事件【客户端连接服务器事件】 绑定事件【客户…...

GGML源码逐行调试(上)

目录 前言1. 简述2. 环境配置3. ggml核心概念3.1 gguf3.2 ggml_tensor3.3 ggml_backend_buffer3.4 ggml_context3.5 backend3.6 ggml_cgraph3.7 ggml_gallocr 4. 推理流程整体梳理4.1 时间初始化与参数设置4.2 模型加载与词汇表构建4.3 计算图与内存分配4.4 文本预处理与推理过…...

智能测试用例生成:老旧平台页面查询功能的大模型改造

引言 由于GUI小工具【Deepseek APIPython 测试用例一键生成与导出】的不断升级实践&#xff0c;发现大模型的需求文档解析生成测试用例的可直接复用率不太理想&#xff0c;因此萌生了对老旧系统升级改造的想法。旧测试用例生成平台主要在于采集用户输入的字段名称、字段类型及…...

使用Python解决Logistic方程

引言 在数学和计算机科学中,Logistic 方程是描述人口增长、传播过程等现象的一种常见模型。它通常用于表示一种有限资源下的增长过程,比如动物种群、疾病传播等。本文将带领大家通过 Python 实现 Logistic 方程的求解,帮助你更好地理解这一经典数学模型。 1.什么是 Logist…...

文件上传基本原理靶场实现

一. 漏洞原理 未经验证的上传机制&#xff1a; 应用程序未对用户上传的文件进行充分验证&#xff0c;包括&#xff1a; 文件类型/扩展名&#xff1a;仅依赖客户端提交的MIME类型或简单检查扩展名&#xff08;如.jpg&#xff09;&#xff0c;但未验证文件实际内容。 文件内容&a…...

灰色预测模型:GM(1,1)预测模型

灰色预测模型 灰色预测的主要特点是模型使用的不是原始数据序列&#xff0c;而是生成的数据序列。核心体系是灰色模型&#xff0c;即对原始数据作累加生成&#xff08;或其他方法生成&#xff09;得到近似的指数规律再进行建模的方法&#xff0c;优点是不需要很多的数据&#…...

SPORT(Serial Port)接口

SPORT&#xff08;Serial Port&#xff09;接口是DSP芯片中常用的高速同步串行通信接口&#xff0c;主要用于与外部设备&#xff08;如ADC、DAC、编解码器等&#xff09;进行数据传输。以下是对SPORT接口的详细介绍&#xff1a; 1. SPORT接口概述 SPORT接口设计用于高效传输连…...

Python及C++中的字典

一、Python中的字典 &#xff08;一&#xff09;基本概念 字典&#xff08;dict&#xff09;是Python中一种可变容器模型&#xff0c;用于存储键值对&#xff08;key:value&#xff09;。字典的键必须是不可变类型&#xff08;如字符串、数字或元组&#xff09;&#xff0c;而…...

Neo4j GDS-11-neo4j GDS 库中相似度算法实现

neo4j GDS 系列 Neo4j APOC-01-图数据库 apoc 插件介绍 Neo4j GDS-01-graph-data-science 图数据科学插件库概览 Neo4j GDS-02-graph-data-science 插件库安装实战笔记 Neo4j GDS-03-graph-data-science 简单聊一聊图数据科学插件库 Neo4j GDS-04-图的中心性分析介绍 Neo…...

网络互连与互联网2

1.IP数据报首部在IHL 字段的最小值为5 2.三层交换机包括二层交换和三层转发&#xff0c;二层交换由硬件实现&#xff0c;三层转发采用软件实现 3.在BGP路由选择协议中&#xff0c;AS_PATH属性可以避免在AS之间产生环路 4.常用的电子邮件协议&#xff1a;SMTP&#xff08;25&…...

4月12日随笔

今天大风天气的第一天&#xff0c;周六&#xff0c;早上九点半起来听了排球技术台培训。结果一天都没顾得上看教学视频。黄老师说有排球基础的可以试试当主裁&#xff0c;那一定要争取一下&#xff01; 上午看了两集小排球&#xff0c;然后开始了解一些中介相关信息。因为下午…...

web自动化测试

自动化测试理论 UI&#xff1a;User Interface&#xff08;用户接口-用户界面&#xff09;&#xff0c;主要包括&#xff1a;app、web ui自动化测试&#xff1a;使用工具或代码执行用例的过程 什么样的项目适合做自动化 1、需要回归测试项目&#xff08;甲方自营项目、金…...

代码随想录二叉树小结1;(递归与迭代法小结)

一、递归遍历 1.递归算法三要素&#xff1a; 确定递归函数的参数和返回值&#xff1a; 在递归函数里加上递归的过程中需要处理的参数&#xff0c; 然后明确每次递归的返回值是什么&#xff0c;最后确定递归函数的返回类型。 确定终止条件&#xff1a; 递归算法运行的时候&…...

Audacity命令:“播录”菜单相关命令

1 Audacity命令&#xff1a;“播录”菜单相关命令 1.1 播录菜单 播录菜单中的命令可让您播放、停止、循环播放、擦洗音频或录制音频&#xff08;包括定时录制和声控录制&#xff09;。 Scripting IdActionParameters描述RescanDevice:Rescan Audio Devicesnone重新扫描连接到…...