当前位置：首页 > news >正文

【RAG】基于向量检索的 RAG （BGE示例）

news 来源：原创 2025/8/25 0:10:18

RAG机器人结构体

文本向量化: 使用 BGE 模型将文档和查询编码为向量。
（BGE 是专为检索任务优化的开源 Embedding 模型，除了本文API调用，也可以通过Hugging Face 本地部署BGE 开源模型）
向量检索: 从数据库中找到与查询相关的文档片段。
答案生成: 结合检索结果和用户输入，调用文心模型生成最终回答。

class RAG_Bot:def __init__(self, vector_db, llm_api, n_results=2):self.vector_db = vector_dbself.llm_api = llm_apiself.n_results = n_resultsdef chat(self, user_query):# 1. 检索search_results = self.vector_db.search(user_query, self.n_results)# 2. 构建 Promptprompt = build_prompt(prompt_template, context=search_results['documents'][0], query=user_query)# 3. 调用 LLMresponse = self.llm_api(prompt)return response
####### 创建一个RAG机器人
bot = RAG_Bot(vector_db,llm_api=get_completion
)user_query = "llama 2有多少参数?"response = bot.chat(user_query)print(response)#####
llama 2有7B, 13B和70B参数。

MyVectorDBConnector:

自定义向量数据库，存储文档向量。
embedding_fn=get_embeddings_bge: 使用 BGE 模型生成向量。
add_documents(paragraphs): 向数据库中添加文档（已提前定义 paragraphs）。

RAG_Bot:

检索增强生成机器人，结合向量搜索与大模型生成。
chat(user_query): 执行“检索→生成”流程：
将用户查询向量化。
从数据库检索相关文档。
将检索结果作为上下文，调用文心模型生成回答。

使用国产模型

import json
import requests
import os# 通过鉴权接口获取 access tokendef get_access_token():"""使用 AK，SK 生成鉴权签名（Access Token）:return: access_token，或是None(如果错误)"""url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials","client_id": os.getenv('ERNIE_CLIENT_ID'),"client_secret": os.getenv('ERNIE_CLIENT_SECRET')}return str(requests.post(url, params=params).json().get("access_token"))# 调用文心千帆 调用 BGE Embedding 接口def get_embeddings_bge(prompts):url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/embeddings/bge_large_en?access_token=" + get_access_token()payload = json.dumps({"input": prompts})headers = {'Content-Type': 'application/json'}response = requests.request("POST", url, headers=headers, data=payload).json()data = response["data"]return [x["embedding"] for x in data]# 调用文心4.0对话接口
def get_completion_ernie(prompt):url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/chat/completions_pro?access_token=" + get_access_token()payload = json.dumps({"messages": [{"role": "user","content": prompt}]})headers = {'Content-Type': 'application/json'}response = requests.request("POST", url, headers=headers, data=payload).json()return response["result"]# 创建一个向量数据库对象
new_vector_db = MyVectorDBConnector("demo_ernie",embedding_fn=get_embeddings_bge
)
# 向向量数据库中添加文档
new_vector_db.add_documents(paragraphs)# 创建一个RAG机器人
new_bot = RAG_Bot(new_vector_db,llm_api=get_completion_ernie
)user_query = "how many parameters does llama 2 have?"response = new_bot.chat(user_query)print(response)

拓展实践

1. 优化 Access Token 管理

缓存 Token：减少鉴权接口调用次数，仅在 Token 过期时刷新。

示例代码：

from datetime import datetime, timedeltaclass TokenManager:_token = None_expires_at = None@classmethoddef get_token(cls):if cls._token is None or datetime.now() > cls._expires_at:cls._refresh_token()return cls._token@classmethoddef _refresh_token(cls):url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials","client_id": os.getenv('ERNIE_CLIENT_ID'),"client_secret": os.getenv('ERNIE_CLIENT_SECRET')}response = requests.post(url, params=params)response.raise_for_status()data = response.json()cls._token = data["access_token"]# 默认 Token 有效期为 30 天，但建议按实际返回的 expires_in 设置cls._expires_at = datetime.now() + timedelta(seconds=data.get("expires_in", 2592000) - 300)  # 提前 5 分钟刷新

2. 增强错误处理与重试

重试网络请求：使用 tenacity 库自动重试失败请求。
捕获异常：明确处理常见错误（如网络超时、无效响应）。

示例代码：

from tenacity import retry, stop_after_attempt, wait_exponential, retry_if_exception_type
import requests.exceptions as req_exceptions@retry(stop=stop_after_attempt(3),wait=wait_exponential(multiplier=1, min=2, max=10),retry=retry_if_exception_type((req_exceptions.Timeout, req_exceptions.ConnectionError))
)
def safe_api_request(url, headers, payload):try:response = requests.post(url, headers=headers, data=payload, timeout=10)response.raise_for_status()return response.json()except req_exceptions.HTTPError as e:if response.status_code == 401:TokenManager._refresh_token()  # Token 可能过期，强制刷新raiseraise ValueError(f"API 错误: {e.response.text}")

3. 验证环境变量

启动时检查：确保关键配置已正确设置。

示例代码：

def validate_env_vars():required_vars = ['ERNIE_CLIENT_ID', 'ERNIE_CLIENT_SECRET']missing_vars = [var for var in required_vars if not os.getenv(var)]if missing_vars:raise EnvironmentError(f"缺少环境变量: {', '.join(missing_vars)}")# 在程序初始化时调用
validate_env_vars()

4. 优化向量数据库交互

批量插入文档：减少 API 调用次数。
分块策略：根据 Embedding 模型的最大输入长度分块文本。

示例优化（假设使用 MyVectorDBConnector）：

class MyVectorDBConnector:def __init__(self, name, embedding_fn, chunk_size=512):self.embedding_fn = embedding_fnself.chunk_size = chunk_size  # 根据模型支持的最大长度设置def add_documents(self, documents):chunks = self._chunk_documents(documents)embeddings = self.embedding_fn(chunks)# 批量存储到向量数据库def _chunk_documents(self, documents):# 实现基于句子或固定长度的分块逻辑pass

优化后的代码示例

整合上述改进后的核心逻辑：

import os
import json
import logging
from datetime import datetime, timedelta
import requests
from tenacity import retry, stop_after_attempt, wait_exponential, retry_if_exception_type
import requests.exceptions as req_exceptions# 配置日志
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)# 环境变量校验
def validate_env_vars():required_vars = ['ERNIE_CLIENT_ID', 'ERNIE_CLIENT_SECRET']missing_vars = [var for var in required_vars if not os.getenv(var)]if missing_vars:raise EnvironmentError(f"Missing env vars: {', '.join(missing_vars)}")
validate_env_vars()# Token 管理
class TokenManager:_token = None_expires_at = None@classmethoddef get_token(cls):if cls._token is None or datetime.now() > cls._expires_at:cls._refresh_token()return cls._token@classmethoddef _refresh_token(cls):logger.info("Refreshing access token...")url = "https://aip.baidubce.com/oauth/2.0/token"params = {"grant_type": "client_credentials","client_id": os.getenv('ERNIE_CLIENT_ID'),"client_secret": os.getenv('ERNIE_CLIENT_SECRET')}response = requests.post(url, params=params)response.raise_for_status()data = response.json()cls._token = data["access_token"]cls._expires_at = datetime.now() + timedelta(seconds=data.get("expires_in", 2592000) - 300)# 安全 API 请求
@retry(stop=stop_after_attempt(3),wait=wait_exponential(multiplier=1, min=2, max=10),retry=retry_if_exception_type((req_exceptions.Timeout, req_exceptions.ConnectionError))
)
def safe_api_request(url, headers, payload):try:response = requests.post(url, headers=headers, data=payload, timeout=10)response.raise_for_status()return response.json()except req_exceptions.HTTPError as e:if response.status_code == 401:TokenManager._refresh_token()raiselogger.error(f"API Error: {e.response.text}")raise# 公共 API 调用封装
def call_ernie_api(endpoint, payload):base_url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop"url = f"{base_url}/{endpoint}?access_token={TokenManager.get_token()}"headers = {'Content-Type': 'application/json'}return safe_api_request(url, headers, json.dumps(payload))# Embedding 接口
def get_embeddings_bge(prompts):logger.info(f"Generating embeddings for {len(prompts)} prompts")response = call_ernie_api("embeddings/bge_large_en", {"input": prompts})return [x["embedding"] for x in response["data"]]# 文心 4.0 对话接口
def get_completion_ernie(prompt):logger.info(f"Generating completion for prompt: {prompt[:50]}...")response = call_ernie_api("chat/completions_pro", {"messages": [{"role": "user", "content": prompt}]})return response["result"]

【RAG】基于向量检索的 RAG （BGE示例）

RAG机器人结构体文本向量化: 使用 BGE 模型将文档和查询编码为向量。 （BGE 是专为检索任务优化的开源 Embedding 模型，除了本文API调用，也可以通过Hugging Face 本地部署BGE 开源模型） 向量检索: 从数据库中找到与查询相关的文…...

编程日记 2025/8/25 0:10:18

【RAG】RAG 系统的基本搭建流程（ES关键词检索示例）

RAG 系统的基本搭建流程搭建过程： 文档加载，并按一定条件切割成片段将切割的文本片段灌入检索引擎封装检索接口构建调用流程：Query -> 检索 -> Prompt -> LLM -> 回复 1. 文档的加载与切割 # !pip install --upgrade openai…...

编程日记 2025/8/19 22:56:45

PSIM积累经验

1、三极管的部署报错。出错信息： 元件： R 名称： R2 Error: The RLC branch R2 is connected to the gate node of the switch Q1. The gate node should be connected to an On-Off Controller output. Refer to the switch Help p…...

编程日记 2025/8/25 0:09:40

C++之vector类（超详解）

这节我们来学习一下，C中一个重要的工具——STL，这是C中自带的一个标准库，我们可以直接调用这个库中的函数或者容器，可以使效率大大提升。这节我们介绍STL中的vector。文章目录前言一、标准库类型vector 二、vector的使用 2.…...

编程日记 2025/8/24 21:47:50

Go学习笔记

初始化工程 go mod init GoDemo 结构体，接口 type i struct{} type i interface{} 条件，选择循环键值对 make(map[string]int) 切片，集合 make([]int,10) 函数通道 Channel make(chan int) ch <- v…...

编程日记 2025/8/24 4:17:04

前端杂的学习笔记

什么是nginx Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器 Nginx是一款轻量级的Web 服务器/反向代理服务器，处理高并发能力是十分强大的，并且支持热部署，启动简单，可以做到7*24不间断运行正代和反代学习nginx&a…...

编程日记 2025/8/24 22:40:51

痉挛性斜颈护理：全方位呵护，重燃生活希望

痉挛性斜颈是一种以颈部肌肉不自主收缩导致头部向一侧扭转或倾斜为特征的疾病。对于痉挛性斜颈患者而言，科学有效的护理能够显著提升其生活质量，辅助病情的改善。生活护理：在生活环境布置上，要充分考虑患者行动的便利性。确保室内…...

编程日记 2025/8/22 11:03:00

MySQL的安装以及数据库的基本配置

MySQL的安装及配置 MySQL的下载选择想要安装的版本，点击Download下载 Mysql官网下载地址： https://downloads.mysql.com/archives/installer/ MySQL的安装选择是自定义安装，所以直接选择“Custom”，点击“Next” …...

编程日记 2025/8/25 0:08:56

WangEditor快速实现版效果案例代码后端 package com.diy.springboot.controller;import cn.hutool.core.util.IdUtil; import io.swagger.annotations.Api; import io.swagger.annotations.ApiOperation; import io.swagger.annotations.ApiImplicitParam; import org.sp…...

编程日记 2025/8/25 0:09:41

LeetCode Hot100刷题——反转链表（迭代+递归）

206.反转链表给你单链表的头节点 head ，请你反转链表，并返回反转后的链表。示例 1： 输入：head [1,2,3,4,5] 输出：[5,4,3,2,1]示例 2： 输入：head [1,2] 输出：[2,1]示例 3&#…...

编程日记 2025/8/23 4:41:46

10.2 继承与多态

文章目录继承多态继承继承的作用是代码复用。派生类自动获得基类的除私有成员外的一切。基类描述一般特性，派生类提供更丰富的属性和行为。在构造派生类时，其基类构造函数先被调用，然后是派生类构造函数。在析构时顺序刚好相反。 // 基类…...

编程日记 2025/8/25 0:07:55

java项目之基于ssm的智能训练管理平台（源码+文档）

项目简介智能训练管理平台实现了以下功能： 系统可以提供信息显示和相应服务，其管理员增删改查课程信息和课程信息资料，审核课程信息预订订单，查看订单评价和评分，通过留言功能回复用户提问。 💕&#x1…...

编程日记 2025/8/21 19:10:11

29-验证回文串

如果在将所有大写字符转换为小写字符、并移除所有非字母数字字符之后，短语正着读和反着读都一样。则可以认为该短语是一个回文串。字母和数字都属于字母数字字符。给你一个字符串 s，如果它是回文串 ，返回 true ；否则&#xf…...

编程日记 2025/8/23 2:14:41

（57）[HGAME 2023 week1]easyasm

nss：3477 [HGAME 2023 week1]easyasm 关于这个题吧，我还是和上一个题一样，我观察到了异或0x33 所以我就把result的结果跟0x33异或，然后我就就这样，做出来了...

编程日记 2025/8/16 10:07:44

FY-3D MWRI亮温绘制

1、FY-3D MWRI介绍风云三号气象卫星（FY-3）是我国自行研制的第二代极轨气象卫星，其有效载荷覆盖了紫外、可见光、红外、微波等频段，其目标是实现全球全天候、多光谱、三维定量探测，为中期数值天气预报提供卫星观测数…...

编程日记 2025/8/22 18:22:19

Java集合面试题

引言 Java集合框架是Java编程中不可或缺的一部分，它提供了一系列用于存储和操作对象的接口和类。在Java面试中，集合框架的相关知识往往是必考的内容。本文将汇总一系列关于Java集合的面试题，帮助求职者更好地准备面试。一、Java集合框架概…...

编程日记 2025/8/24 5:50:49

知识蒸馏综述Knowledge Distillation: A Survey解读

论文链接：Knowledge Distillation: A Survey 摘要：近年来，深度神经网络在工业界和学术界都取得了成功，尤其是在计算机视觉任务方面。深度学习的巨大成功主要归功于它能够扩展以对大规模数据进行编码，并且能够处理数十…...

编程日记 2025/8/16 10:04:52

ES映射知识

映射映射类似于关系型数据库的Schema（模式）。映射来定义字段列和存储的类型等基础信息。 {"mappings": {"properties": {"username": {"type": "keyword","ignore_above": 256 // 忽略…...

编程日记 2025/8/20 5:24:11

Spring Boot拦截器（Interceptor）与过滤器（Filter）深度解析：区别、实现与实战指南

Spring Boot拦截器（Interceptor）与过滤器（Filter）深度解析：区别、实现与实战指南一、核心概念对比 1. 本质区别维度过滤器（Filter）拦截器（Interceptor）规范层级Serv…...

编程日记 2025/8/21 2:19:15

Debian二次开发一体化工作站：提升科研效率的智能工具

在科研领域，数据处理是实验成功的关键环节之一。随着实验数据的复杂性和规模不断增加，传统的数据处理方法已经难以满足科研人员的需求。这时，一体化工作站应运而生，成为科研实验数据处理的 “智能大脑”。一体化工作站&#xff…...

编程日记 2025/8/22 4:27:37

swift-5-汇编分析闭包本质

一、枚举、结构体、类都定义方法方法占用对象的内存么？ 不占用方法的本质就是函数方法、函数都存放在代码段，因为方法都是公共的，不管对象一还是对对象二调用都是一样的，所以放在代码段，但是每个对象的成员不一样所…...

编程日记 2025/8/20 20:26:54

Linux安装升级docker

Linux 安装升级docker Linux 安装升级docker背景升级停止docker服务备份原docker数据目录移除旧版本docker安装docker ce恢复数据目录启动docker参考安装找到docker官网找到docker文档删除旧版本docker配置docker yum源参考官网继续安装docker设置开机自启配置加速测试 Linux …...

编程日记 2025/8/22 22:00:33

小程序事件系统 —— 33 事件传参 - data-*自定义数据

事件传参：在触发事件时，将一些数据作为参数传递给事件处理函数的过程，就是事件传参； 在微信小程序中，我们经常会在组件上添加一些自定义数据，然后在事件处理函数中获取这些自定义数据，从而完成…...

编程日记 2025/8/16 11:12:01

Dify 本地部署教程

目录一、下载安装包二、修改配置三、启动容器四、访问 Dify 五、总结本篇文章主要记录 Dify 本地部署过程，有问题欢迎交流~ 一、下载安装包从 Github 仓库下载最新稳定版软件包，点击下载~，当然也可以克隆仓库或者从仓库里直接下…...

编程日记 2025/8/22 16:48:26

nlp培训重点-5

1. LoRA微调 loader： # -*- coding: utf-8 -*-import json import re import os import torch import numpy as np from torch.utils.data import Dataset, DataLoader from transformers import BertTokenizer """ 数据加载 """cl…...

编程日记 2025/8/21 5:43:40

XWiki使用war部署在tomcat9

xwiki部署官方文档，比较详细。 https://www.xwiki.org/xwiki/bin/view/Documentation/AdminGuide/Installation/InstallationWAR/ xwiki是基于java的开源知识库，可以替代Confluence。有多种部署方式，本文使用war方式部署在tomca下&#x…...

编程日记 2025/8/22 11:13:27

CTA策略【量化理论】

CTA策略演变史全称：Commodity Trading Advisor （商品交易顾问） CTA最开始是指通过为客户提供期权、期货方面的交易建议，或者直接通过受管理的期货账户参与实际交易，来获得收益的机构或个人。随着市场的发展&#…...

编程日记 2025/8/21 5:43:39

旋转编码器原理与应用详解：从结构到实战 | 零基础入门STM32第四十七步

主题内容教学目的/扩展视频旋转编码器电路原理，跳线设置，结构分析。驱动程序与调用。熟悉电路和驱动程序。师从洋桃电子，杜洋老师 📑文章目录一、旋转编码器是什么？二、内部结构揭秘2.1 机械组件解剖2.2 核心部件说明…...

编程日记 2025/8/22 23:45:31

计算机视觉cv2入门之图像的读取,显示,与保存

在计算机视觉领域，Python的cv2库是一个不可或缺的工具，它提供了丰富的图像处理功能。作为OpenCV的Python接口，cv2使得图像处理的实现变得简单而高效。示例图片目录 opencv获取方式图像基本知识颜色空间 RGB HSV 图像格式 BMP格式 …...

编程日记 2025/8/18 19:30:23

基于Canvas和和原生JS实现俄罗斯方块小游戏

这里是一个完整的H5俄罗斯方块游戏，使用了 HTML CSS JavaScript (原生) 实现，支持基本的俄罗斯方块玩法，如： ✅ 方块自动下落 ✅ 方向键控制移动、旋转、加速下落 ✅ 方块堆叠、消行 ✅ 计分系统在 canvas 上绘制游戏&#x…...

编程日记 2025/8/22 4:58:36

阿里云 QwQ-32B 模型调研文档

阿里云 QwQ-32B 模型调研文档 ——技术解析、部署实践与微调指南一、模型概述 QwQ-32B 是阿里云开源的轻量化大语言模型，以 320 亿参数实现与 DeepSeek-R1（6710 亿参数）相当的推理性能。其核心优势包括：参数效率：1/20 参数量达成竞品性能，显存需求降低 70%部署灵活性…...

编程日记 2025/8/24 4:49:12

【玩转23种Java设计模式】结构型模式篇：组合模式

软件设计模式（Design pattern），又称设计模式，是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性、程序的重用性。汇总目录链接&…...

编程日记 2025/8/22 19:06:36

Eolink：专为开发者设计的API协作平台

Eolink Apikit 是一款集 API 设计、管理、自动化测试、Mock 和异常监控于一体的全生命周期智能协作平台，旨在提升 API 研发和管理的效率。以下是对其功能和特点的详细介绍： 核心功能： API 设计与文档管理：Apikit 提供了强大的 API…...

编程日记 2025/8/24 11:58:51

【Python】为什么要写init.py

文章目录 PackageA(__init__特性)应该往__init__.py里放什么东西？1、包的初始化2、管理包的公共接口3、包的信息正常我们直接导入就可以执行，但是在package的时候，有一种__init__.py的特殊存在引入moduleA.py，执行main.py&…...

编程日记 2025/8/18 5:45:57

golang 从零单排 (一) 安装环境

1.下载安装打开网址The Go Programming Language 直接点击下载go1.24.1.windows-amd64.msi 下载完成直接双击下一步下一步安装完成环境变量自动设置不必配置 2.验证 win r 输入cmd 打开命令行输入go version...

编程日记 2025/8/16 10:06:47

30-判断子序列

给定字符串 s 和 t ，判断 s 是否为 t 的子序列。字符串的一个子序列是原始字符串删除一些（也可以不删除）字符而不改变剩余字符相对位置形成的新字符串。（例如，"ace"是"abcde"的一个子序列&#…...

编程日记 2025/8/22 8:06:04

AI 驱动的软件测试革命：从自动化到智能化的进阶之路

🚀引言：软件测试的智能化转型浪潮在数字化转型加速的今天，软件产品的迭代速度与复杂度呈指数级增长。传统软件测试依赖人工编写用例、执行测试的模式，已难以应对快速交付与高质量要求的双重挑战。人工智能技术的突破为测试领域注…...

编程日记 2025/8/23 11:03:47

深度相机进行目标物体的空间姿态（位姿）估计

利用深度相机（如Kinect、Intel Realsense、Zed相机等）进行目标物体的空间姿态（位姿）估计，通常结合了3D点云处理、目标识别和位姿优化算法。以下是完整的实现流程、算法选择及注意事项： 一、实现流程 1. 目…...

编程日记 2025/8/16 11:52:46

3月8日实验

拓扑： 需求： 1.学校内部的HTTP客户端可以正常通过域名www.baidu.com访问到白度网络中的HTTP服务器 2.学校网络内部网段基于192.168.1.0/24划分，PC1可以正常访问3.3.3.0/24网段，但是PC2不允许 3.学校内部路由使用静态路由&#…...

编程日记 2025/8/18 12:25:25

GO语言学习笔记

一、viper笔记【七米】 https://liwenzhou.com/posts/Go/viper/ 二、优雅关机和平滑重启 https://liwenzhou.com/posts/Go/graceful-shutdown/ 三、gin使用zap https://liwenzhou.com/posts/Go/zap-in-gin/ 四、flag 用于命令行传参 https://liwenzhou.com/posts/Go/flag/ 五、…...

编程日记 2025/8/21 11:26:06

Autosar技术栈总目录

总目录 Autosar架构理解Autosar Mcal配置开发（TC3xx系列基于EB）Autosar Mcal配置开发（S32K3xx系列基于EB）Autosar BSW服务开发（基于Davinci CFG &Dev）Makefile编译自动化脚本持续更新中… Autosar架…...

编程日记 2025/8/23 4:38:36

开发指南107-谷歌内核浏览器滚动条设置

平台上统一制定了滚动条样式(仅限于webkit内核)：/* ------美化谷歌浏览器滚动条开始-----------*/ ::-webkit-scrollbar{width:12px;height:12px;background-color: #E1E1E1;} ::-webkit-scrollbar-button:single-button { background-color:#E1E1E1; display: …...

编程日记 2025/8/16 12:49:16

25年携程校招社招求职能力北森测评材料计算部分：备考要点与误区解析

在求职过程中，能力测评是筛选候选人的重要环节之一。对于携程这样的知名企业，其能力测评中的材料计算部分尤为关键。许多求职者在备考时容易陷入误区，导致在考试中表现不佳。本文将深入解析材料计算部分的实际考察方向，并提供针对…...

编程日记 2025/8/23 9:11:22

Linux系统编程--线程同步

目录一、前言二、线程饥饿三、线程同步四、条件变量 1、cond 2、条件变量的使用五、条件变量与互斥锁一、前言上篇文章我们讲解了线程互斥的概念，为了防止多个线程同时访问一份临界资源而出问题，我们引入了线程互斥，线程互斥其实…...

编程日记 2025/8/22 2:38:21

李沐《动手学深度学习》——14.9. 用于预训练BERT的数据集——wiki数据集问题以及存在的其他问题

问题1：出现"file is not a zip file" 原因是链接已经失效。解决方法：打开下面链接自行下载，需要魔法。下载完解压到特定位置。下载链接：项目首页 - Wikitext-2-v1数据包下载:Wikitext-2-v1 数据包下载本仓库提供了一…...

编程日记 2025/8/18 23:00:45

【英伟达AI论文】多模态大型语言模型的高效长视频理解

摘要：近年来，基于视频的多模态大型语言模型（Video-LLMs）通过将视频处理为图像帧序列，显著提升了视频理解能力。然而，许多现有方法在视觉主干网络中独立处理各帧，缺乏显式的时序建模，…...

编程日记 2025/8/21 15:50:49

深入理解 DOM 元素

深入理解 DOM 元素：构建动态网页的基石在网页开发的世界里，DOM（Document Object Model，文档对象模型）元素宛如一座桥梁，连接着静态的 HTML 结构与动态的 JavaScript 交互逻辑。它让原本呆板的网页变得鲜活…...

编程日记 2025/8/22 21:45:10

linux如何判断进程对磁盘是随机写入还是顺序写入？

模拟工具&性能测试工具：fio fio参数说明： filename/dev/sdb1：测试文件名称，通常选择需要测试的盘的data目录。 direct1：是否使用directIO，测试过程绕过OS自带的buffer，使测试磁盘的结果更真…...

编程日记 2025/8/20 14:35:30

实现静态网络爬虫（入门篇）

一、了解基本概念以及信息 1.什么是爬虫爬虫是一段自动抓取互联网信息的程序，可以从一个URL出发，访问它所关联的URL，提取我们所需要的数据。也就是说爬虫是自动访问互联网并提取数据的程序。它可以将互联网上的数据为我所用，…...

编程日记 2025/8/21 5:12:42

RAG机器人 结构体

MyVectorDBConnector:

RAG_Bot:

使用国产模型

拓展实践

1. 优化 Access Token 管理

2. 增强错误处理与重试

3. 验证环境变量

4. 优化向量数据库交互

优化后的代码示例

相关文章：

RAG机器人结构体