当前位置: 首页 > news >正文

MINIRAG: TOWARDS EXTREMELY SIMPLE RETRIEVAL-AUGMENTED GENERATION论文翻译

感谢阅读

  • 注意不含评估以后的翻译
  • 原论文地址
  • 标题以及摘要
  • 介绍部分
  • MiniRAG 框架
    • 2.1 HETEROGENEOUS GRAPH INDEXING WITH SMALL LANGUAGE MODELS
    • 2.2 LIGHTWEIGHT GRAPH-BASED KNOWLEDGE RETRIEVAL
      • 2.2.1 QUERY SEMANTIC MAPPING
      • 2.2.2 TOPOLOGY-ENHANCED GRAPH RETRIEVAL

注意不含评估以后的翻译

原论文地址

点我跳转

标题以及摘要

MINIRAG: TOWARDS EXTREMELY SIMPLE
RETRIEVAL-AUGMENTED GENERATION
MINIRAG:朝着极简的检索增强生成方法迈进
ABSTRACT
The growing demand for efficient and lightweight Retrieval-Augmented Generation (RAG) systems has highlighted significant challenges when deploying Small Language Models (SLMs) in existing RAG frameworks. Current approaches face severe performance degradation(退化,腿部,这里翻译成下降) due to SLMs’ limited semantic(语义) understanding and text processing capabilities, creating barriers for widespread adoption in resource-constrained scenarios. To address these fundamental limitations, we present MiniRAG a novel RAG system designed for extreme simplicity and efficiency. MiniRAG introduces two key technical innovations: (1) a semantic-aware heterogeneous graph indexing mechanism that combines text chunks and named entities in a unified structure, reducing reliance on complex semantic understanding, and (2) a lightweight topology-enhanced retrieval approach that leverages graph structures for efficient knowledge discovery without requiring advanced language capabilities. Our extensive experiments demonstrate that MiniRAG achieves comparable performance to LLM-based methods even when using SLMs while requiring only 25% of the storage space. Additionally, we contribute a comprehensive benchmark dataset for evaluating lightweight RAG systems under realistic on-device scenarios with complex queries. We fully open-source our implementation and datasets at: https://github.com/HKUDS/MiniRAG.
摘要
随着对高效且轻量级的检索增强生成(RAG)系统的需求不断增加,在现有的RAG框架中部署小型语言模型(SLM)时出现了显著的挑战。目前的方法由于SLM在语义理解和文本处理能力上的限制,面临严重的性能下降,这为资源受限的场景中的广泛应用带来了障碍。为了应对这些根本性限制,我们提出了MiniRAG,这是一种为极简和高效设计的新型RAG系统。MiniRAG引入了两个关键技术创新:(1)一种语义感知的异构图索引机制,将文本块和命名实体结合成一个统一的结构,从而减少对复杂语义理解的依赖;(2)一种轻量级的拓扑增强检索方法,利用图结构进行高效的知识发现,而无需高级语言能力。我们的广泛实验表明,即使在使用SLM的情况下,MiniRAG也能实现与基于大语言模型(LLM)的方法相媲美的性能,同时只需25%的存储空间。此外,我们还贡献了一个综合基准数据集,用于在复杂查询的现实设备场景下评估轻量级RAG系统。我们的实现和数据集已完全开源,地址为:https://github.com/HKUDS/MiniRAG。

介绍部分

Recent advancements in Retrieval-Augmented Generation (RAG) have significantly changed how language models access and utilize external knowledge, showcasing impressive capabilities in a wide range of applications, from question answering to document synthesis (Fan et al., 2024). These systems have achieved remarkable performance by leveraging sophisticated retrieval mechanisms and powerful language models. However, they predominantly rely on Large Language Models (LLMs) throughout their entire pipeline—covering tasks from index construction and knowledge retrieval to final response generation (Gao et al., 2023).This heavy reliance on LLMs introduces substantial computational overhead and resource demands, creating significant barriers to deploying such systems in resource-constrained environments, such as edge devices, privacy-sensitive applications, and real-time processing systems (Liu et al., 2024). Despite the growing demand for efficient and lightweight language model applications, current RAG frameworks offer limited solutions to maintain strong performance under these practical constraints, exposing a critical gap between theoretical capabilities and real-world deployment needs.
近期在检索增强生成(RAG)领域的进展,彻底改变了语言模型访问和利用外部知识的方式,展示了在广泛应用中的卓越能力,从问答到文档生成(F,2024)。这些系统通过复杂的检索机制和强大的语言模型取得了显著的性能。然而,它们在整个流程中主要依赖于大语言模型(LLM),从索引构建和知识检索到最终响应生成(G,2023)。对LLM的这种广泛依赖引入了巨大的计算开销和资源需求,这为在资源受限的环境中部署系统,如边缘设备、隐私敏感应用和实时处理系统,带来了显著的障碍(Liu等人,2024)。尽管对高效和轻量级语言模型应用的需求不断增长,当前的RAG框架在这些实际约束条件下维持强大性能的解决方案有限,暴露了理论能力与现实部署需求之间的关键差距。
The limitations of existing RAG systems become particularly evident when attempting to deploy Small Language Models (SLMs) for resource-efficient(高效利用资源) applications. While these compact models offer significant advantages in computational efficiency and deployment flexibility, they encounter fundamental challenges in key RAG operations, such as semantic understanding and effective information retrieval.Current RAG architectures, like LightRAG (Guo et al., 2024) and GraphRAG (Edge et al., 2024), were originally designed to leverage the sophisticated capabilities of Large Language Models (LLMs). However, these architectures fail to accommodate the inherent constraints of SLMs in several critical functions. Specifically, SLMs struggle with tasks such as sophisticated query interpretation, multi-step reasoning, semantic matching between queries and documents, and nuanced information synthesis.This architectural mismatch manifests in two major ways: either severe performance degradation, where accuracy significantly drops, or complete system failure, where certain advanced RAG frameworks become entirely inoperable when transitioning from LLMs to SLMs.
现有RAG系统的局限性在尝试利用小型语言模型(SLM)进行资源高效部署时尤为明显。尽管这些紧凑型模型在计算效率和部署灵活性方面具有显著优势,但它们在关键的RAG操作中面临根本性挑战——从语义理解到有效的信息检索。目前的RAG架构(例如2024年Guo等人做的LightRAG和Edge他们做的GraphRAG),最初设计时是为了利用LLM的复杂能力,但未能适应SLM在多个关键功能中的固有限制:复杂的查询解释、多步推理、查询与文档之间的语义匹配以及细致的信息综合。这种架构不匹配表现为两种主要方式:一种是性能严重下降,导致准确度下降;另一种是系统完全失效,当从LLM过渡到SLM时,某些先进的RAG框架变得完全无法操作。
To address these fundamental(根本性的) challenges, we introduce MiniRAG, a novel RAG system that reimagines the information retrieval and generation pipeline with an emphasis on extreme simplicity and computational efficiency. Our design is based on three key observations about Small Language Models (SLMs): (1) although SLMs struggle with complex semantic understanding, they excel in pattern matching and localized text processing; (2) explicit structural information can effectively compensate for their limited semantic capabilities; and (3) breaking down complex RAG operations into simpler, well-defined steps can preserve system robustness without requiring advanced reasoning abilities. These insights led us to prioritize structural knowledge representation over semantic complexity, marking a significant shift away from traditional LLM-centric RAG architectures.
为了解决这些根本性的挑战,我们提出了MiniRAG,一种创新的RAG系统,它重新构想了信息检索和生成流程,重点关注极简性和计算效率。我们的设计基于对小型语言模型(SLM)的三个关键观察:(1)虽然SLM在复杂的语义理解方面存在困难,但它们在模式匹配和局部文本处理方面表现出色;(2)显式的结构信息可以有效弥补其有限的语义能力;(3)将复杂的RAG操作分解为更简单、定义明确的步骤可以在不需要高级推理能力的情况下保持系统的鲁棒性。这些洞察促使我们优先考虑结构化知识表示而非语义复杂性,从而标志着与传统LLM中心的RAG架构的显著不同。
Our design of MiniRAG is driven by three fundamental observations: (1) although Small Language Models (SLMs) struggle with semantic understanding, they excel in pattern matching and localized text processing; (2) explicit structural information can compensate for their limited semantic capabilities by providing navigational cues for retrieval; and (3) breaking down complex RAG operations into simpler, well-defined steps can maintain system robustness without requiring advanced reasoning capabilities. These insights led us to prioritize structural knowledge representation over semantic complexity, leveraging graph-based patterns that align with SLMs’ strengths while bypassing their limitations. This design philosophy allows MiniRAG to achieve efficient and reliable performance even with lightweight models, marking a significant shift away from traditional LLM-centric RAG architectures.
MiniRAG的设计受到三个基本观察的启发:(1)尽管小型语言模型(SLM)在语义理解方面存在困难,但它们在模式匹配和局部文本处理方面表现出色;(2)显式的结构信息可以通过提供检索的导航线索,弥补其有限的语义能力;(3)将复杂的RAG操作分解为更简单、定义明确的步骤,可以在不需要高级推理能力的情况下保持系统的鲁棒性。这些洞察促使我们优先考虑结构化知识表示而非语义复杂性,并利用图结构模式,这些模式自然与SLM的优势相契合,同时绕过了它们的局限性。这一设计理念使得MiniRAG即便在轻量级模型下,也能实现高效且可靠的性能,标志着与传统LLM中心的RAG架构的重大不同。
Our MiniRAG introduces two key technical innovations that capitalize on these insights: (1) a semantic-aware heterogeneous graph indexing mechanism that combines text chunks and named entities into a unified structure, thereby reducing reliance on complex semantic understanding, and (2) a lightweight, topology-enhanced retrieval approach that utilizes graph structures and heuristic search patterns for efficient knowledge discovery. Through thoughtful design choices and architectural optimization, these components work together synergistically to enable robust RAG functionality, even with limited model capabilities, fundamentally reimagining how RAG systems can operate within the constraints of SLMs while leveraging their strengths.
我们的MiniRAG引入了两项关键技术创新,充分利用了这些洞察:(1)一种语义感知的异构图索引机制,将文本块和命名实体结合成一个统一的结构,从而减少对复杂语义理解的依赖;(2)一种轻量级的拓扑增强检索方法,利用图结构和启发式搜索模式进行高效的知识发现。通过精心的设计选择和架构优化,这些组件协同工作,使得即使在模型能力有限的情况下,也能实现强大的RAG功能,根本性地重新构想了RAG系统如何在SLM的约束下操作,同时发挥其优势。
Through extensive experimentation across various datasets and Small Language Models (SLMs), we demonstrate the exceptional performance of MiniRAG. Compared to existing lightweight RAG systems, MiniRAG achieves 1.3 to 2.5 times higher effectiveness while using only 25% of the storage space. Even when transitioning from LLMs to SLMs, our system maintains remarkable robustness, with accuracy reductions ranging from just 0.8% to 20% across different scenarios. Notably, MiniRAG consistently achieves state-of-the-art performance in all evaluation settings, including tests on two comprehensive datasets with four different SLMs, while maintaining a lightweight footprint suitable for resource-constrained environments such as edge devices and privacy-sensitive applications. To support further research in this area, we also introduce LiHuaWorld, a comprehensive benchmark dataset specifically designed to evaluate lightweight RAG systems in realistic on-device scenarios, such as personal communication and local document retrieval.
通过对多个数据集和小型语言模型(SLM)进行广泛的实验,我们展示了MiniRAG的卓越性能。与现有的轻量级RAG系统相比,MiniRAG在使用仅占25%存储空间的情况下,效果提高了1.3到2.5倍。即使从LLM过渡到SLM,我们的系统依然保持了显著的鲁棒性,准确度的减少幅度在不同场景下仅为0.8%到20%。最值得注意的是,MiniRAG在所有评估设置中始终保持最先进的性能,包括在两个全面的数据集上对四种不同的SLM进行测试,同时保持适用于资源受限环境(如边缘设备和隐私敏感应用)的轻量级特性。为了促进该领域的进一步研究,我们还推出了LiHuaWorld,这是一个专门为评估在真实设备场景下(如个人通信和本地文档检索)中的轻量级RAG系统而设计的综合基准数据集。

MiniRAG 框架

In this section, we present the detailed architecture of our proposed MiniRAG framework. As illustrated in Fig.1, MiniRAG consists of two key components: (1) heterogeneous graph indexing (Sec.2.1), which creates a semantic-aware knowledge representation, and (2) lightweight graph-based knowledge retrieval (Sec.2.2), which enables efficient and accurate information retrieval.
在本节中,我们将详细介绍所提出的MiniRAG框架的架构。如图1所示,MiniRAG由两个关键组件组成:(1)异构图索引(第2.1节),用于创建语义感知的知识表示;(2)轻量级图结构知识检索(第2.2节),实现高效且准确的信息检索。

2.1 HETEROGENEOUS GRAPH INDEXING WITH SMALL LANGUAGE MODELS

2.1 基于小型语言模型的异构图索引
In resource-constrained RAG systems, Small Language Models (SLMs) face significant operational constraints that affect their effectiveness. These limitations primarily involve a reduced ability to extract and comprehend complex entity relationships and subtle contextual connections from raw text, as well as a diminished capacity to efficiently summarize large volumes of text and handle retrieved information containing noise and irrelevant content.
在资源受限的RAG(检索增强生成)系统中,小型语言模型(SLMs)面临显著的操作性限制,这些限制影响了其效果。主要体现在以下两方面:其一是从原始文本中提取和理解复杂实体关系及细微上下文关联的能力降低,其二是高效总结大量文本以及处理包含噪声和无关内容的检索信息的能力减弱。
在这里插入图片描述
图片的理解:

  1. Heterogeneous Graph Indexing(异构图索引)
    输入文本:左侧输入的是一段非结构化文本,例如包含 Wi-Fi 密码、房屋规则等信息。
    图结构:
    Chunk Node(块节点):从文本中提取的语义单元。
    Entity Node(实体节点):文本中的具体实体,如名称、地点、事件等。
    Entity-Entity Edge(实体与实体之间的边):反映实体之间的关系。
    Entity-Chunk Edge(实体与文本块之间的边):连接实体和相关语义单元。
    目的:将文本转化为一个可操作的异构图结构,捕捉文本中的关系和语义信息。
  2. Lightweight Graph-Based Knowledge Retrieval(轻量化图知识检索)
    Step 1: Query Semantic Mapping(查询语义映射):
    输入查询语句(如图中的问题:“What does Briar remind everyone to bring to practice?”)。
    系统会将查询映射到可能的答案类型(例如“事件”、“概念”等)以及相关的实体(如“Briar”、“practice”)。
    Step 2: Topology-enhanced Graph Retrieval(拓扑增强的图检索):
    系统根据查询语义和图的拓扑结构,发现关键的关系路径。
    通过路径权重(如 ω = 0.36 或 1.07 等)来评估不同路径的重要性。
  3. Integration & Generation(整合与生成)
    高分节点和边:通过检索确定哪些节点和边与查询最相关(用颜色标注)。
    答案生成:结合高分节点和边的信息,系统生成最终答案。例如,答案是“Water Bottles”。
    Figure 1: The MiniRAG employs a streamlined workflow built on key components, including heterogeneous graph indexing and lightweight graph-based knowledge retrieval. This architecture is designed to address the unique challenges faced by on-device RAG systems, optimizing for both efficiency and effectiveness.
    图1:MiniRAG 采用了一个以关键组件为基础的简化工作流程,包括异构图索引和轻量化图知识检索。该架构旨在解决设备端 RAG 系统所面临的独特挑战,并在效率和效果之间实现优化。
    As shown in Fig.2, a comparison between SLM (Phi-3.5-mini (Abdin et al., 2024)) and LLM (gpt-4o-mini (OpenAI, 2023)) highlights these limitations in practice. While both models can identify the “HOUSE RULES” entity, the SLM’s description lacks specific details and fails to capture the rules and purposes present in the original text (Limitation 1). Additionally, during the answering phase, SLMs struggle to locate relevant information within extensive contexts and are often distracted by irrelevant content, a challenge that LLMs do not face (Limitation 2).
    如图2所示,将 SLM(Phi-3.5-mini (Abdin et al., 2024))与 LLM(gpt-4o-mini (OpenAI, 2023))进行比较,揭示了这些限制在实际中的表现。尽管两种模型都能够识别出“HOUSE RULES”实体,但 SLM 的描述缺乏具体细节,未能捕捉到原始文本中的规则和目的(限制1)。此外,在回答阶段,SLM 难以在广泛的上下文中定位相关信息,常常被无关内容分散注意力,而这种问题在 LLM 中并不存在(限制2)。
    在这里插入图片描述
    Figure 2: Compared to Large Language Models (LLMs), Small Language Models (SLMs) exhibit significant limitations during both the indexing and answering phases. On the left, SLMs produce noticeably lower-quality descriptions compared to LLMs. On the right, when processing the same input, SLMs struggle to identify relevant information within large contexts, whereas LLMs handle this task effectively. To address these challenges in resource-constrained RAG systems, MiniRAG is designed with the following objectives:
    The indexing mechanism must extract key relationships and contextual connections from the data, compensating for the limited entity understanding and summarization capabilities of small models.
    The indexing approach should condense retrieved content to include only the most query-relevant elements, minimizing distractions or misleading information that could hinder the small model’s ability to summarize and effectively denoise the retrieved data.
    图2:与大型语言模型(LLMs)相比,小型语言模型(SLMs)在索引和回答阶段表现出显著的局限性。左图显示,SLMs 生成的描述质量明显低于 LLMs。右图显示,当处理相同输入时,SLMs 难以在大规模上下文中定位相关信息,而 LLMs 则能够有效完成此任务。为了有效应对资源受限的 RAG 系统中的这些挑战,MiniRAG 的设计目标包括:
    索引机制应提取数据中的关键关系和上下文连接,以弥补小模型在实体理解和总结能力方面的不足。
    索引方法应将检索到的内容浓缩为与查询最相关的元素,尽量减少可能干扰或误导小模型能力的无关信息,从而提升其总结能力并有效去噪检索内容。
    To achieve the aforementioned goals, we propose a data indexing mechanism that generates a Semantic-Aware Heterogeneous Graph. This graph structure systematically integrates both text chunks and named entities extracted from raw text, creating a rich semantic network to facilitate precise information retrieval. The heterogeneous graph consists of the following components:
    Nodes:
    Text Chunk Nodes (Vc): Represent coherent segments of the original text that retain contextual integrity.
    Entity Nodes (Ve): Key semantic elements extracted from text chunks, including events, locations, temporal references, and domain-specific concepts that serve as semantic anchors.
    This dual-node design allows data chunks to directly participate in the retrieval process, ensuring the identification of contextually relevant content while mitigating information distortion caused by the small language model’s limited summarization capabilities.
    Edges:
    Entity-Entity Connections (Eα): Capture semantic relationships, hierarchical structures, and temporal or spatial dependencies between named entities.
    Entity-Chunk Connections (Eβ): Link named entities to their corresponding textual contexts, preserving both contextual relevance and semantic coherence.
    为了实现上述目标,我们提出了一种数据索引机制,生成一个语义感知的异构图(Semantic-Aware Heterogeneous Graph)。这种图结构系统性地整合了从原始文本中提取的文本块和命名实体,构建了一个丰富的语义网络,能够促进精准的信息检索。该异构图由以下组件构成:
    节点(Nodes):
    文本块节点(Vc):代表原始文本中保留上下文完整性的连贯片段。
    实体节点(Ve):从文本块中提取的关键语义元素,包括事件、地点、时间参考以及领域特定概念,这些元素作为语义理解的核心锚点。
    这种双节点设计使得数据块能够直接参与检索阶段,确保能够识别出最具上下文相关性的内容,同时有效缓解小型语言模型总结能力不足导致的信息失真问题。
    边(Edges):
    实体-实体连接(Eα):捕捉命名实体之间的语义关系、层次结构以及时间或空间上的依赖关系。
    实体-文本块连接(Eβ):将命名实体与其对应的文本上下文连接起来,保留上下文的相关性和语义连贯性。

下面的文本涉及到公式,所以我导入到了mathauto中进行展示以及翻译(同时对部分内容进行了修改来保证可读性)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.2 LIGHTWEIGHT GRAPH-BASED KNOWLEDGE RETRIEVAL

2.2 轻量级基于图的知识检索
In on-device Retrieval Augmented Generation (RAG) systems, device computational limitations and data privacy concerns restrict the use of powerful models—such as large language models and advanced text embedding models—necessitating reliance on smaller alternatives. Consequently, current pipelines heavily depend on LLMs for a comprehensive understanding of text semantics when computing embedding similarity for retrieval, yet these smaller models often struggle to capture the precise semantic nuances within lengthy texts, complicating accurate matching. To address these challenges, it is essential to reduce the complexity of input content for generation, ensuring that semantic information is clear and concise, and to shorten the length of input content for smaller language models, thereby facilitating improved comprehension and retrieval accuracy. Additionally, employing effective graph indexing structures can help mitigate performance deficiencies in semantic matching, ultimately enhancing the overall retrieval process. In MiniRAG, we propose a Graph-based Knowledge Retrieval mechanism that leverages a semantic-aware heterogeneous graph G constructed during the indexing phase, in conjunction with lightweight text embeddings, to achieve efficient knowledge retrieval; by employing a graph-based search design, we aim to ease the burden on precise semantic matching with large language models, facilitating the acquisition of rich and accurate textual content at a low computational cost and enhancing the ability of language models to generate precise responses.
在设备端增强检索生成(RAG)系统中,由于设备计算能力受限和数据隐私问题,无法使用大型语言模型和先进文本嵌入模型等强大模型,因此只能依赖较小的替代方案,而现有的管道主要依赖大型语言模型对文本语义的全面理解来计算嵌入相似度进行检索,面临着较小模型难以捕捉长文本中精细语义差异而导致匹配不准确的重大挑战。为了解决这些问题,需要一方面降低生成输入内容的复杂性,使语义信息清晰简洁,另一方面缩短输入文本长度,从而使较小的语言模型能更好地理解并提高检索准确性。此外,采用有效的图索引结构有助于缓解语义匹配性能不足的问题,从而提升整体检索效果。基于此,在 MiniRAG 中,我们提出了一种基于图的知识检索机制,该机制利用在索引阶段构建的语义感知异构图 G,并结合轻量级文本嵌入,实现高效的知识检索;通过采用基于图的搜索设计,我们旨在减轻大型语言模型对精确语义匹配的依赖,从而以较低的计算成本获取丰富而准确的文本内容,并增强语言模型生成精准回答的能力。

2.2.1 QUERY SEMANTIC MAPPING

2.2.1 查询语义映射
In the retrieval phase, the primary goal for a user-input query q is to identify elements related to the query (e.g., text chunks) from the constructed index data, thereby aiding the model in generating accurate responses. To achieve this, it is essential to first parse the query and align it with the index data. Some prior RAG methods utilize LLMs to expand or decompose the query into fine-grained queries (Chan et al., 2024; Edge et al., 2024a; Guo et al., 2024), enhancing the match between the query and the index data. However, this process relies on LLMs to extract high-quality abstract information from the query, which poses challenges for smaller language models. Therefore, in the retrieval process of MiniRAG, we leverage entity extraction—a relatively simple and effective task for small language models—to facilitate the decomposition and mapping of the query
q to our graph-based indexing data (i.e., the semantic-aware heterogeneous graph G).
在检索阶段,用户输入的查询 q 的主要目标是从已构建的索引数据中识别与查询相关的元素(例如文本块),从而帮助模型生成准确的回答。为实现这一目标,必须先对查询进行解析并与索引数据对齐。一些先前的 RAG 方法(Chan 等,2024;Edge 等,2024a;Guo 等,2024)利用大型语言模型来扩展或分解查询为更细粒度的查询,从而增强查询与索引数据之间的匹配。然而,这一过程依赖大型语言模型从查询中提取高质量的抽象信息,对于规模较小的语言模型而言十分困难。因此,在 MiniRAG 的检索过程中,我们利用实体抽取——这对于小型语言模型而言相对简单而有效——来辅助对查询 q 的分解与映射,并将其映射到我们的图索引数据(即语义感知的异构图 G)。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
个人理解非完全翻译
查询驱动的推理路径发现:在一张能够反映语义信息的异构图中,我们通过查询引导的方式构建推理路径。对于任何给定的查询,模型需要同时考虑两个核心要点:其一是查询与实体节点之间的语义相关性,其二是实体与实体、实体与文本块之间的结构连贯性。这样一来,模型不仅能突出查询和实体节点之间的紧密联系,同时也能保留实体-实体和实体-文本块之间的关系,从而捕捉图中更加复杂的推理链。在这一框架下,推理路径的发现主要包括以下步骤:
1.初始实体识别:先从查询中提取实体,并将这些实体与图中的节点进行匹配,以找到可信的起始点,为后续的路径探索奠定基础。
2.面向答案的实体选择:根据系统预测得到的答案类型,从初始阶段选出的节点中进一步挑选出更有可能成为“答案节点”的候选实体,使得推理过程能够围绕目标答案类型展开。
3.富上下文路径构建:在完成上述实体筛选后,进一步将与这些节点相关的文本信息整合进推理路径中,从而形成完整且具有证据链的推理过程,最终实现从查询实体到潜在答案的连接。
这一轻量级方法既能保证高效性,又能在较为复杂的场景下维持语义上的准确度,非常适合在计算资源有限的边缘设备上部署。后续的搜索算法部分将讨论如何通过对节点或路径的重要性排序,进一步优化并完善推理路径。

2.2.2 TOPOLOGY-ENHANCED GRAPH RETRIEVAL

2.2.2 拓扑增强的图检索
To address the fundamental limitations of small language model-based methods in knowledge retrieval, we propose a topology-aware retrieval approach that effectively combines semantic and structural information from heterogeneous knowledge graphs. Approaches relying on small language models with limited semantic understanding often introduce substantial noise into the retrieval process due to their constrained ability to capture nuanced meanings, contextual variations, and complex entity relationships within real-world knowledge graphs. Our method overcomes these inherent challenges through a carefully designed two-stage process that synergistically leverages both embedding-based similarities and the topological structure of the knowledge graph.
在这里插入图片描述
在这里插入图片描述
为了解决小型语言模型在知识检索中的根本局限性,我们提出了一种结合语义与结构信息的“拓扑感知检索”方法。由于小型语言模型的语义理解能力较为有限,在应对真实世界知识图中各种含义微妙、上下文多变以及实体关系复杂的情况时,往往会引入大量噪声。我们的方法通过精心设计的两阶段流程,将基于嵌入的相似度匹配与知识图的拓扑结构结合起来,从而有效应对上述挑战。
在第一阶段,我们先基于嵌入相似度来确定初始的“起始实体”和“答案实体”,也可以简单理解为和查询最相关的节点。接下来进入“拓扑增强”的第二阶段,我们利用异构知识图的结构特性,发掘潜在的推理路径,并综合考虑实体之间的关联度、关键关系的重要性以及路径的连贯性来提高检索的精准度和解释性。
具体来说,“关键关系识别”主要关注图中与查询紧密关联的实体-实体连接,通常需要找出从起始节点到答案节点的最短路径附近的高价值边或关系;“查询引导的路径发现”则通过一系列无环路径,系统性地搜索从起始实体延伸至可能答案实体的合理链路,兼顾对先前已识别关键关系的利用;在“检索相关文本片段”步骤里,我们根据实体和文本块之间的关联,提取并筛选与查询最匹配的文本内容,以进一步提升整体检索效果;最后,“整合用于增强生成”会将上述所得的关键关系、文本片段和对应的答案节点统一构造成结构化输入,以便在最终的回答生成中更加精准且可解释。
通过这样分层次、分步骤的检索策略,我们在保持计算效率的同时,能够显著提升对查询相关信息的捕捉能力,并挖掘到更具深度的推理链,为小型语言模型在边缘设备上的增强生成提供了高质量的支持。

相关文章:

MINIRAG: TOWARDS EXTREMELY SIMPLE RETRIEVAL-AUGMENTED GENERATION论文翻译

感谢阅读 注意不含评估以后的翻译原论文地址标题以及摘要介绍部分MiniRAG 框架2.1 HETEROGENEOUS GRAPH INDEXING WITH SMALL LANGUAGE MODELS2.2 LIGHTWEIGHT GRAPH-BASED KNOWLEDGE RETRIEVAL2.2.1 QUERY SEMANTIC MAPPING2.2.2 TOPOLOGY-ENHANCED GRAPH RETRIEVAL 注意不含评…...

将 OneLake 数据索引到 Elasticsearch - 第二部分

作者:来自 Elastic Gustavo Llermaly 及 Jeffrey Rengifo 本文分为两部分,第二部分介绍如何使用自定义连接器将 OneLake 数据索引并搜索到 Elastic 中。 在本文中,我们将利用第 1 部分中学到的知识来创建 OneLake 自定义 Elasticsearch 连接器…...

数据密码解锁之DeepSeek 和其他 AI 大模型对比的神秘面纱

本篇将揭露DeepSeek 和其他 AI 大模型差异所在。 目录 ​编辑 一本篇背景: 二性能对比: 2.1训练效率: 2.2推理速度: 三语言理解与生成能力对比: 3.1语言理解: 3.2语言生成: 四本篇小结…...

安心即美的生活方式

如果你的心是安定的,那么,外界也就安静了。就像陶渊明说的:心远地自偏。不是走到偏远无人的边荒才能得到片刻清净,不需要使用洪荒之力去挣脱生活的枷锁,这是陶渊明式的中国知识分子的雅量。如果你自己是好的男人或女人…...

基于深度学习的输电线路缺陷检测算法研究(论文+源码)

输电线路关键部件的缺陷检测对于电网安全运行至关重要,传统方法存在效率低、准确性不高等问题。本研究探讨了利用深度学习技术进行输电线路关键组件的缺陷检测,目的是提升检测的效率与准确度。选用了YOLOv8模型作为基础,并通过加入CA注意力机…...

手写防抖函数、手写节流函数

文章目录 1 手写防抖函数2 手写节流函数 1 手写防抖函数 函数防抖是指在事件被触发n秒后再执行回调,如果在这n秒内事件又被触发,则重新计时。这可以使用在一些点击请求的事件上,避免因为用户的多次点击向后端发送多次请求。 function debou…...

UE 导入sbsar插件

Substance 3D 插件支持直接在 Unreal Engine 5 和 Unreal Engine 4 中使用 Substance 材质。无论您是在处理游戏、可视化,还是在移动设备、桌面或 XR 上进行部署,Substance 都能提供独特的体验,并优化功能以提高生产力。 Substance 资源平台…...

pytorch实现简单的情感分析算法

人工智能例子汇总:AI常见的算法和例子-CSDN博客 在PyTorch中实现中文情感分析算法通常涉及以下几个步骤:数据预处理、模型定义、训练和评估。下面是一个简单的实现示例,使用LSTM模型进行中文情感分析。 1. 数据预处理 首先,我…...

Baklib揭示内容中台实施最佳实践的策略与实战经验

内容概要 在当前数字化转型的浪潮中,内容中台的概念日益受到关注。它不再仅仅是一个内容管理系统,而是企业提升运营效率与灵活应对市场变化的重要支撑平台。内容中台的实施离不开最佳实践的指导,这些实践为企业在建设高效内容中台时提供了宝…...

11.[前端开发]Day11-HTML+CSS阶段练习(仿小米和考拉页面)

一、小米穿戴设备&#xff08;浮动&#xff09; 完整代码 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"vie…...

设计模式学习(二)

结构型 适配器模式 定义 它允许将一个类的接口转换成客户端期望的另一个接口。适配器模式通常用于使不兼容的接口能够一起工作。 适配器模式的角色 目标接口&#xff08;Target&#xff09;&#xff1a;客户端期望的接口。适配者&#xff08;Adaptee&#xff09;&#xff…...

【Docker】快速部署 Nacos 注册中心

【Docker】快速部署 Nacos 注册中心 引言 Nacos 注册中心是一个用于服务发现和配置管理的开源项目。提供了动态服务发现、服务健康检查、动态配置管理和服务管理等功能&#xff0c;帮助开发者更轻松地构建微服务架构。 仓库地址 https://github.com/alibaba/nacos 步骤 拉取…...

大白话讲清楚embedding原理

Embedding&#xff08;嵌入&#xff09;是一种将高维数据&#xff08;如单词、句子、图像等&#xff09;映射到低维连续向量的技术&#xff0c;其核心目的是通过向量表示捕捉数据之间的语义或特征关系。以下从原理、方法和应用三个方面详细解释Embedding的工作原理。 一、Embe…...

pandas中的apply方法使用

apply 用于对 DataFrame 或 Series 中的数据进行逐行或逐列的操作。它可以接受一个函数&#xff08;通常是 lambda 函数或自定义函数&#xff09;&#xff0c;并将该函数应用到每一行或每一列上。apply语法&#xff1a; DataFrame.apply(func, axis0, rawFalse, result_typeNo…...

简单易懂的倒排索引详解

文章目录 简单易懂的倒排索引详解一、引言 简单易懂的倒排索引详解二、倒排索引的基本结构三、倒排索引的构建过程四、使用示例1、Mapper函数2、Reducer函数 五、总结 简单易懂的倒排索引详解 一、引言 倒排索引是一种广泛应用于搜索引擎和大数据处理中的数据结构&#xff0c;…...

Nginx知识

nginx 精简的配置文件 worker_processes 1; # 可以理解为一个内核一个worker # 开多了可能性能不好events {worker_connections 1024; } # 一个 worker 可以创建的连接数 # 1024 代表默认一般不用改http {include mime.types;# 代表引入的配置文件# mime.types 在 ngi…...

CNN的各种知识点(三):有关于VGG16 的结构展开的问题(1)

有关于VGG16 的结构展开的问题&#xff08;1&#xff09; 1. VGG16 的原生结构2. model.avgpool 的作用原生 VGG16 中没有 avgpool 层&#xff1f;代码中的 model.avgpool 是什么&#xff1f; 3. model.classifier 的作用原生 VGG16 的 classifier用户代码中的 classifier 4. 为…...

vue3中el-input无法获得焦点的问题

文章目录 现象两次nextTick()加setTimeout()解决结论 现象 el-input被外层div包裹了&#xff0c;设置autofocus不起作用&#xff1a; <el-dialog v-model"visible" :title"title" :append-to-bodytrue width"50%"><el-form v-model&q…...

sqli-labs靶场通关

sqli-las通关 mysql数据库5.0以上版本有一个自带的数据库叫做information_schema,该数据库下面有两个表一个是tables和columns。tables这个表的table_name字段下面是所有数据库存在的表名。table_schema字段下是所有表名对应的数据库名。columns这个表的colum_name字段下是所有…...

深度学习深度解析:从基础到前沿

引言 深度学习作为人工智能的一个重要分支&#xff0c;通过模拟人脑的神经网络结构来进行数据分析和模式识别。它在图像识别、自然语言处理、语音识别等领域取得了显著成果。本文将深入探讨深度学习的基础知识、主要模型架构以及当前的研究热点和发展趋势。 基础概念与数学原理…...

sobel边缘检测算法

人工智能例子汇总&#xff1a;AI常见的算法和例子-CSDN博客 Sobel边缘检测算法是一种用于图像处理中的边缘检测方法&#xff0c;它能够突出图像中灰度变化剧烈的地方&#xff0c;也就是边缘。该算法通过计算图像在水平方向和垂直方向上的梯度来检测边缘&#xff0c;梯度值越大…...

LeetCode 349: 两个数组的交集

LeetCode 349: 两个数组的交集 - C语言 问题描述 给定两个数组 ransomNote 和 magazine&#xff0c;你需要判断 ransomNote 是否可以由 magazine 里的字符构成。每个字符可以使用一次。 解题思路 通过统计 magazine 中每个字符的频次&#xff0c;并与 ransomNote 中字符的需…...

MATLAB的数据类型和各类数据类型转化示例

一、MATLAB的数据类型 在MATLAB中 &#xff0c;数据类型是非常重要的概念&#xff0c;因为它们决定了如何存储和操作数据。MATLAB支持数值型、字符型、字符串型、逻辑型、结构体、单元数组、数组和矩阵等多种数据类型。MATLAB 是一种动态类型语言&#xff0c;这意味着变量的数…...

c++ list的front和pop_front的概念和使用案例—第2版

在 C 标准库中&#xff0c;std::list 的 front() 和 pop_front() 是与链表头部元素密切相关的两个成员函数。以下是它们的核心概念和具体使用案例&#xff1a; 1. front() 方法 概念&#xff1a; 功能&#xff1a;返回链表中第一个元素的引用&#xff08;直接访问头部元素&am…...

如何使用SliverList组件

文章目录 1 概念介绍2 使用方法3 示例代码 我们在上一章回中介绍了沉浸式状态栏相关的内容&#xff0c;本章回中将介绍SliverList组件.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1 概念介绍 我们在这里介绍的SliverList组件是一种列表类组件&#xff0c;类似我们之前介…...

DIFY源码解析

偶然发现Github上某位大佬开源的DIFY源码注释和解析&#xff0c;目前还处于陆续不断更新地更新过程中&#xff0c;为大佬的专业和开源贡献精神点赞。先收藏链接&#xff0c;后续慢慢学习。 相关链接如下&#xff1a; DIFY源码解析...

搜索引擎友好:设计快速收录的网站架构

本文来自&#xff1a;百万收录网 原文链接&#xff1a;https://www.baiwanshoulu.com/14.html 为了设计一个搜索引擎友好的网站架构&#xff0c;以实现快速收录&#xff0c;可以从以下几个方面入手&#xff1a; 一、清晰的目录结构与层级 合理划分内容&#xff1a;目录结构应…...

2007-2019年各省科学技术支出数据

2007-2019年各省科学技术支出数据 1、时间&#xff1a;2007-2019年 2、来源&#xff1a;国家统计局、统计年鉴 3、指标&#xff1a;行政区划代码、地区名称、年份、科学技术支出 4、范围&#xff1a;31省 5、指标解释&#xff1a;科学技术支出是指为促进科学研究、技术开发…...

【数据分析】案例03:当当网近30日热销图书的数据采集与可视化分析(scrapy+openpyxl+matplotlib)

当当网近30日热销图书的数据采集与可视化分析(scrapy+openpyxl+matplotlib) 当当网近30日热销书籍官网写在前面 实验目的:实现当当网近30日热销图书的数据采集与可视化分析。 电脑系统:Windows 使用软件:Visual Studio Code Python版本:python 3.12.4 技术需求:scrapy、…...

DRM系列二:DRM总体介绍

一、简介 DRM&#xff0c;全称Direct Rending Manger。是目前Linux主流的图形显示框架。相比较传统的Framebuffer&#xff08;FB原生不支持多层合成&#xff0c;不支持VSYNC&#xff0c;不支持DMA-BUF&#xff0c;不支持异步更新&#xff0c;不支持fence机制等等&#xff09;&…...

步进电机的型号和分类

步进电机的型号和分类通常根据其尺寸、结构、相数、步距角等参数来区分。以下是一些常见的步进电机型号、分类方法以及如何识别它们的指南&#xff1a; 一、常见步进电机型号 步进电机的型号通常由厂家命名&#xff0c;但也有一些通用的命名规则。以下是一些常见的型号系列&am…...

【力扣】15.三数之和

AC截图 题目 思路 这道题如果简单的用暴力三重遍历去做&#xff0c;会超时。所以我们思考假如有三个下标&#xff0c;i&#xff0c;l&#xff0c;r 其中i0&#xff08;初始&#xff09;&#xff0c;li1 rnums.size()-1 我们固定nums[i]的值&#xff0c;那么就转换为两数之和…...

Redis 基础命令

1. redis 命令官网 https://redis.io/docs/latest/commands/ 2. 在 redis-cli 中使用 help 命令 # 查看 help string 基础命令 keys * # * 代表通配符set key value # 设置键值对del key # 删除键expire key 时间 # 给键设置时间 # -2 代表时间到期了&#xff0c; -1 代表…...

CSES Missing Coin Sum

思路是对数组排序 设 S [ i ] S[i] S[i] 是数组的前缀和 R [ i ] R[i] R[i] 是递增排序后的数组 遍历数组&#xff0c;如果出现 S [ i − 1 ] 1 < R [ i ] S[i - 1] 1 < R[i] S[i−1]1<R[i]&#xff0c;就代表S[i - 1] 1是不能被合成出来的数字 因为&#xff1a…...

Python中的数据类(dataclass):简化类的定义与数据管理

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 随着Python语言的发展,代码的简洁性与可维护性变得愈发重要。Python 3.7引入的dataclass模块为数据类的定义提供了一种简便而高效的方式,…...

Java线程认识和Object的一些方法ObjectMonitor

专栏系列文章地址&#xff1a;https://blog.csdn.net/qq_26437925/article/details/145290162 本文目标&#xff1a; 要对Java线程有整体了解&#xff0c;深入认识到里面的一些方法和Object对象方法的区别。认识到Java对象的ObjectMonitor&#xff0c;这有助于后面的Synchron…...

使用真实 Elasticsearch 进行高级集成测试

作者&#xff1a;来自 Elastic Piotr Przybyl 掌握高级 Elasticsearch 集成测试&#xff1a;更快、更智能、更优化。 在上一篇关于集成测试的文章中&#xff0c;我们介绍了如何通过改变数据初始化策略来缩短依赖于真实 Elasticsearch 的集成测试的执行时间。在本期中&#xff0…...

统计学中的样本概率论中的样本

不知道当初谁想的把概率论和数理统计合并&#xff0c;作为一门课。这本身是可以合并&#xff0c;完整的一条线&#xff0c;看这里。但是&#xff0c;作为任课老师应该从整体上交代清楚&#xff0c;毕竟是两个学科&#xff0c;不同的学科合并必然会有各种不协调的问题。 举个最…...

SQL 总结

SQL 总结 引言 SQL(Structured Query Language)是一种用于管理关系数据库的计算机语言。自从1970年代被发明以来,SQL已经成为了数据库管理的基础。本文将对SQL的基本概念、常用命令、高级特性以及SQL在数据库管理中的应用进行总结。 SQL基本概念 数据库 数据库是存储数…...

Openfga 授权模型搭建

1.根据项目去启动 配置一个 openfga 服务器 先创建一个 config.yaml文件 cd /opt/openFGA/conf touch ./config.yaml 怎么配置&#xff1f; 根据官网来看 openfga/.config-schema.json at main openfga/openfga GitHub 这里讲述详细的每一个配置每一个类型 这些配置有…...

【Proteus】NE555纯硬件实现LED呼吸灯效果,附源文件,效果展示

本文通过NE555定时器芯片和简单的电容充放电电路,设计了一种纯硬件实现的呼吸灯方案,并借助Proteus仿真软件验证其功能。方案无需编程,成本低且易于实现,适合电子爱好者学习PWM(脉宽调制)和定时器电路原理。 一、呼吸灯原理与NE555功能分析 1. 呼吸灯核心原理 呼吸灯的…...

DRM系列三:drm core模块入口

本系列文章基于linux 5.15 一、drm_core_init 执行一些drm core的初始化工作 static int __init drm_core_init(void) {int ret;drm_connector_ida_init();idr_init(&drm_minors_idr);drm_memcpy_init_early();ret drm_sysfs_init();if (ret < 0) {DRM_ERROR("…...

Clock Controller of RH850/F1KH-D8, RH850/F1KM-S4, RH850/F1KM-S2

&esmp; 时钟控制器由时钟振荡电路、时钟选择电路、和时钟输出电路组成。   RH850/F1KH、RH850/F1KM单片机的时钟控制器具有以下特点: 六个片上时钟振荡器: 主振荡器(MainOSC),振荡频率分别为8、16、20和24 MHz子振荡器(SubOSC),振荡频率为32.768 kHz*1 100针的产品…...

kamailio-auth模块详解【以下内容来源于官网,本文只做翻译】

以下是《Auth 模块》文档的中文翻译&#xff1a; Auth 模块 作者&#xff1a;Jan Janak FhG Fokus janiptel.org Juha Heinanen TutPro Inc jhsong.fi Daniel-Constantin Mierla asipto.com micondagmail.com 版权所有 © 2002, 2003 FhG FOKUS 官网链接: https://kamaili…...

从TypeScript到ArkTS的适配指导

文章目录 一、ArkTS语法适配背景程序稳定性程序性能.ets代码兼容性支持与TS/JS的交互方舟运行时兼容TS/JS二、从TypeScript到ArkTS的适配规则概述强制使用静态类型禁止在运行时变更对象布局限制运算符的语义不支持 structural typing约束说明限制使用标准库一、ArkTS语法适配背…...

Git 版本控制:基础介绍与常用操作

目录 Git 的基本概念 Git 安装与配置 Git 常用命令与操作 1. 初始化本地仓库 2. 版本控制工作流程 3. 分支管理 4. 解决冲突 5. 回退和撤销 6. 查看提交日志 前言 在软件开发过程中&#xff0c;开发者常常需要在现有程序的基础上进行修改和扩展。但如果不加以管理&am…...

【Python】理解Python中的协程和生成器:从yield到async

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门! 解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界 在现代编程中,异步编程成为提升程序性能和响应速度的重要手段。Python作为一门功能强大的编程语言,提供了丰富的工具来实现异步操作,其中…...

Unity开发游戏使用XLua的基础

Unity使用Xlua的常用编码方式&#xff0c;做一下记录 1、C#调用lua 1、Lua解析器 private LuaEnv env new LuaEnv();//保持它的唯一性void Start(){env.DoString("print(你好lua)");//env.DoString("require(Main)"); 默认在resources文件夹下面//帮助…...

什么是区块链

区块链是一种去中心化的分布式账本技术&#xff0c;它通过一系列复杂而精密的设计原则和机制来确保数据的安全性、透明性和不可篡改性。在最基础的层面上&#xff0c;区块链是由一系列按照时间顺序链接起来的数据块组成的链式结构。每个数据块中包含了一定数量的交易记录或状态…...

C++中的析构器(Destructor)(也称为析构函数)

在C中&#xff0c;析构器&#xff08;Destructor&#xff09;也称为析构函数&#xff0c;它是一种特殊的成员函数&#xff0c;用于在对象销毁时进行资源清理工作。以下是关于C析构器的详细介绍&#xff1a; 析构函数的特点 名称与类名相同&#xff0c;但前面有一个波浪号 ~&a…...