当前位置: 首页 > news >正文

GitHub文档加载器设计与实现

文章结构:

目录

GitHub文档加载器设计与实现

引言

架构设计

主要组件

核心功能

文档加载流程

加载单个文件

加载目录内容

错误处理与健壮性

分支回退策略

文件类型和大小限制

安全性考虑

SSL证书验证

使用示例

基本使用

测试环境配置

最佳实践

结论


GitHub文档加载器设计与实现

引言

GitHub文档加载器是一个用于从GitHub仓库加载文件和目录内容的工具。它允许应用程序直接访问GitHub仓库中的文档,将其封装为标准的Document对象,以便进一步处理和分析。

本工具主要适用于以下场景:

  • 基于GitHub仓库构建知识库系统
  • 从开源代码库提取文档进行分析
  • 构建依赖于GitHub内容的RAG(检索增强生成)应用

架构设计

GitHub文档加载器由两个主要组件组成:GitHubDocumentLoader和相应的测试类GitHubDocumentLoaderTest。下面是系统的类图:

主要组件

  1. GitHubDocumentLoader:核心类,提供从GitHub仓库加载文档的功能
    • 使用Builder模式创建实例
    • 支持加载单个文件或整个目录
    • 处理文件类型和大小限制
    • 提供智能分支回退机制
  1. TrustAllCertsConnector:用于测试环境的自定义连接器
    • 解决SSL证书验证问题
    • 仅用于测试,不建议在生产环境使用

核心功能

文档加载流程

下面的时序图展示了从GitHub加载文档的过程:

加载单个文件

loadDocument方法用于加载单个文件:

public Document loadDocument(String path) {String normalizedPath = normalizePath(path);try {log.info("从GitHub加载文档: {}, 规范化路径: {}, 分支: {}", path, normalizedPath, branch);try {GHContent content = getRepository().getFileContent(normalizedPath, branch);Assert.isTrue(content.isFile(), "路径必须指向文件");return createDocument(content);} catch (GHFileNotFoundException e) {// 如果找不到指定分支的文件,尝试使用默认分支String defaultBranch = getDefaultBranch();if (!branch.equals(defaultBranch)) {log.warn("在分支'{}'上找不到文件'{}', 尝试使用默认分支'{}'", branch, normalizedPath, defaultBranch);GHContent content = getRepository().getFileContent(normalizedPath, defaultBranch);Assert.isTrue(content.isFile(), "路径必须指向文件");return createDocument(content);} else {throw e; // 如果已经是默认分支,则重新抛出异常}}} catch (IOException e) {log.error("从GitHub加载文档失败: {}, 规范化路径: {}, 分支: {}, 原因: {}", path, normalizedPath, branch, e.getMessage());throw new RuntimeException("从GitHub加载文档失败: " + path + ", 原因: " + e.getMessage(), e);}
}

加载目录内容

loadDocuments方法用于递归加载目录下的所有文件:

public List<Document> loadDocuments(String path) {String normalizedPath = normalizePath(path);List<Document> documents = new ArrayList<>();try {log.info("从GitHub加载目录内容: {}, 规范化路径: {}, 分支: {}", path, normalizedPath, branch);List<GHContent> contents;// 获取目录内容,支持分支回退try {if (normalizedPath.isEmpty()) {contents = getRepository().getDirectoryContent("/", branch);} else {contents = getRepository().getDirectoryContent(normalizedPath, branch);}} catch (GHFileNotFoundException e) {// 分支回退逻辑...}// 处理目录内容for (GHContent content : contents) {if (content.isFile()) {try {if (isProcessableFile(content)) {documents.add(createDocument(content));} else {log.info("跳过二进制或大型文件: {}", content.getPath());}} catch (Exception e) {log.warn("加载文件失败,跳过: {}, 原因: {}", content.getPath(), e.getMessage());}} else if (content.isDirectory()) {documents.addAll(loadDocuments(content.getPath()));}}} catch (IOException e) {// 错误处理...}return documents;
}

错误处理与健壮性

分支回退策略

GitHub文档加载器实现了智能分支回退机制,当指定分支找不到文件时,会自动尝试使用仓库的默认分支。下面是分支回退的流程图:

这种分支回退机制确保了代码在面对不同分支名称时的健壮性,特别是当仓库的默认分支名称从master变更为main等情况时。

文件类型和大小限制

为了避免处理不适合的文件,加载器实现了文件过滤机制:

private boolean isProcessableFile(GHContent content) {// 检查文件大小if (content.getSize() > MAX_TEXT_FILE_SIZE) {return false;}// 检查文件扩展名String fileName = content.getName().toLowerCase();int dotIndex = fileName.lastIndexOf('.');if (dotIndex > 0) {String extension = fileName.substring(dotIndex + 1);return !BINARY_EXTENSIONS.contains(extension);}// 没有扩展名的文件假定为文本文件return true;
}

这样可以避免处理二进制文件或过大的文件,提高系统的稳定性和性能。

安全性考虑

SSL证书验证

在测试环境中,我们通常会遇到SSL证书验证问题。GitHubDocumentLoaderTest类实现了一个TrustAllCertsConnector来绕过SSL证书验证:

private static class TrustAllCertsConnector implements HttpConnector {private final SSLContext sslContext;private final HostnameVerifier allHostsValid;public TrustAllCertsConnector() {try {// 创建一个信任所有证书的TrustManagerTrustManager[] trustAllCerts = new TrustManager[]{new X509TrustManager() {public X509Certificate[] getAcceptedIssuers() {return new X509Certificate[0];}public void checkClientTrusted(X509Certificate[] certs, String authType) {}public void checkServerTrusted(X509Certificate[] certs, String authType) {}}};// 创建一个信任所有证书的SSLContextsslContext = SSLContext.getInstance("TLS");sslContext.init(null, trustAllCerts, new SecureRandom());// 创建一个接受所有主机名的HostnameVerifierallHostsValid = new HostnameVerifier() {public boolean verify(String hostname, SSLSession session) {return true;}};} catch (NoSuchAlgorithmException | KeyManagementException e) {throw new RuntimeException("初始化TrustAllCertsConnector失败", e);}}@Overridepublic HttpURLConnection connect(URL url) throws IOException {HttpURLConnection connection = (HttpURLConnection) url.openConnection();if (connection instanceof HttpsURLConnection) {HttpsURLConnection httpsConnection = (HttpsURLConnection) connection;httpsConnection.setSSLSocketFactory(sslContext.getSocketFactory());httpsConnection.setHostnameVerifier(allHostsValid);}return connection;}
}

重要安全提示:此方法仅适用于测试环境,不应在生产环境中使用,因为它会完全绕过SSL证书验证,从而使连接容易受到中间人攻击。

使用示例

基本使用

// 创建GitHub客户端
GitHub github = new GitHubBuilder().withOAuthToken(githubToken).build();// 创建文档加载器
GitHubDocumentLoader loader = GitHubDocumentLoader.builder().gitHub(github).owner("username").repo("repository").branch("master").build();// 加载单个文件
Document doc = loader.loadDocument("/README.md");// 获取文档内容
String content = doc.getText();// 加载目录下的所有文件
List<Document> docs = loader.loadDocuments("/docs");// 获取仓库信息
Map<String, Object> repoInfo = loader.getRepositoryInfo();

测试环境配置

在测试环境中,可以使用自定义的连接器来绕过SSL证书验证:

// 创建忽略SSL证书验证的GitHub客户端
GitHub github = createGitHubClientIgnoringCertificates(githubToken);// 创建文档加载器
GitHubDocumentLoader loader = GitHubDocumentLoader.builder().gitHub(github).owner("username").repo("repository").branch("master").build();

最佳实践

  1. 正确指定分支名称
    • 确保使用仓库的正确分支名称
    • 如果不确定,可以先获取仓库信息,查看defaultBranch
  1. 处理大型仓库
    • 对于大型仓库,避免一次性加载所有文件
    • 使用特定的路径加载部分内容
  1. 错误处理
    • 总是包装和处理可能的异常
    • 使用分支回退机制提高代码健壮性
  1. 安全性考虑
    • 在生产环境中正确处理SSL证书验证
    • 不要在生产代码中使用TrustAllCertsConnector
  1. 性能优化
    • 缓存频繁访问的文档
    • 限制递归深度以避免处理过多文件

结论

GitHub文档加载器是一个功能强大的工具,可以方便地从GitHub仓库中加载和处理文档。通过其智能分支回退机制和健壮的错误处理,它能够适应各种环境和场景。在实现自己的知识库系统或RAG应用时,可以充分利用这个工具从开源仓库中提取有价值的信息。


最后我叫 lenyan~ 也会持续学习更进 AI知识。让我们共进 AI 大时代。

 作者:lenyan GitHub:lenyanjgk (lenyanjgk) · GitHub CSDN:lenyan~-CSDN博客 

觉得有用的话可以点点赞 (/ω\),支持一下。

如果愿意的话关注一下。会对你有更多的帮助。

每周都会不定时更新哦 >人< 。

相关文章:

GitHub文档加载器设计与实现

文章结构&#xff1a; 目录 GitHub文档加载器设计与实现 引言 架构设计 主要组件 核心功能 文档加载流程 加载单个文件 加载目录内容 错误处理与健壮性 分支回退策略 文件类型和大小限制 安全性考虑 SSL证书验证 使用示例 基本使用 测试环境配置 最佳实践 结…...

历史数据分析——中证白酒

简介 中证白酒指数选取涉及白酒生产业务相关上市公司证券作为指数样本,为投资者提供更多样化的投资标的。 估值 中证白酒总体的PB是5.26,在过去十年间位于23.76%,属于较低的水平。 中证白酒总体的PE是20.13,在过去十年间,位于14.24%,属于较低的水平。 从估值的角度似…...

PHP8.0版本导出excel失败

环境&#xff1a;fastadmin框架&#xff0c;不是原版接手的项目。PHP8.0,mysql5.7. code // 创建一个新的 Spreadsheet 对象 $spreadsheet new Spreadsheet(); $worksheet $spreadsheet->getActiveSheet();// 设置表头 $worksheet->setCellValue(A1, ID); $worksheet…...

Seata源码—5.全局事务的创建与返回处理二

大纲 1.Seata开启分布式事务的流程总结 2.Seata生成全局事务ID的雪花算法源码 3.生成xid以及对全局事务会话进行持久化的源码 4.全局事务会话数据持久化的实现源码 5.Seata Server创建全局事务与返回xid的源码 6.Client获取Server的响应与处理的源码 7.Seata与Dubbo整合…...

mac-M系列芯片安装软件报错:***已损坏,无法打开。推出磁盘问题

因为你安装的软件在Intel 或arm芯片的mac上没有签名导致。 首先打开任何来源操作 在系统设置中配置&#xff0c;如下图&#xff1a; 2. 然后打开终端&#xff0c;输入&#xff1a; sudo spctl --master-disable然后输入电脑锁屏密码 打开了任何来源&#xff0c;还遇到已损坏…...

端到端自动驾驶系统实战指南:从Comma.ai架构到PyTorch部署

引言&#xff1a;端到端自动驾驶的技术革命 在自动驾驶技术演进历程中&#xff0c;端到端&#xff08;End-to-End&#xff09;架构正引领新一轮技术革命。不同于传统分模块处理感知、规划、控制的方案&#xff0c;端到端系统通过深度神经网络直接建立传感器原始数据到车辆控制…...

MoveIt Setup Assistant 在导入urdf文件的时候报错

在使用MoveIt Setup Assistant导入urdf文件的时候(load a urdf or collada robot model)&#xff0c;找到urdf文件后MoveIt Setup Assistant闪退并报错&#xff1a; Warning: Ignoring XDG_SESSION_TYPEwayland on Gnome. Use QT_QPA_PLATFORMwayland to run on Wayland anyway…...

uniapp +vue +springboot多商家订餐系统

uniapp vue springboot多商家订餐系统&#xff0c;这个系统我整理调试的多商家&#xff0c;多用户的&#xff0c;多端小程序订餐系统&#xff0c;主要包含了uniapp小程序端&#xff0c;管理后台页面vue端&#xff0c;后台功能接口Springboot端&#xff0c;源码齐全&#xff0c;…...

docker迅雷自定义端口号、登录用户名密码

在NAS上部署迅雷&#xff0c;确实会带来很大的方便。但是目前很多教程都是讲怎么部署docker迅雷&#xff0c;鲜有将自定义配置的方法。这里讲一下怎么部署&#xff0c;并重点讲一下支持的自定义参数。 一、部署docker 在其他教程中&#xff0c;都是介绍的如下命令&#xff0c…...

联想笔记本黑屏了,排线出问题还是静电

以下引用 联想电脑屏幕不亮&#xff0c;电源键和键盘灯均正常的解决办法&#xff08;超简单&#xff09;_拯救者屏幕不亮,键盘有电-CSDN博客 昨天正常关机后&#xff0c;今天一早来工位打开电脑&#xff0c;美美开始玩手机。 一会之后抬头屏幕是黑的&#xff0c;还以为自动息…...

uniapp -- uCharts 仪表盘刻度显示 0.9999999 这样的值问题处理。

文章目录 🍉问题🍉解决方案🍉问题 在仪表盘上,23.8变成了 23.799999999999997 🍉解决方案 formatter格式化问题 1:在 config-ucharts.js 或 config-echarts.js 配置对应的 formatter 方法 formatter: {yAxisDemo1: function (...

为 Spring Boot 应用程序构建 CI/CD 流水线

为 Spring Boot 应用程序创建构建/部署流水线涉及多个步骤&#xff0c;而 Jenkins 可以作为强大的工具来自动化这些流程。在本教程中&#xff0c;我们将指导您为托管在 GitHub 上的 Spring Boot 应用程序设置流水线&#xff0c;使用 Jenkins 构建该应用程序&#xff0c;并将其部…...

数值分析填空题速通

填空题速通 文章目录 填空题速通误差与误差传播均差插值与误差范数、赋范线性空间与内积、内积空间范数代数精度数值微分积分误差迭代方程与收敛阶微分方程数值解法的迭代公式与阶 误差与误差传播 例 设 a 1.414 a 1.414 a1.414&#xff0c; b − 0.576 b -0.576 b−0.57…...

day016-系统负载压力测试-磁盘管理

文章目录 1. 系统负载2. 模拟系统高负载2.1 模拟cpu负载2.2 模拟IO负载 3. 磁盘接口分类4. 思维导图 1. 系统负载 系统负载是衡量系统繁忙程度的指标负载值接近或超过cpu核心总数表示系统负载高负载高常见原因&#xff1a;1.占用cpu过多导致2.占用磁盘IO过多导致&#xff08;I…...

DeepSeek指令微调与强化学习对齐:从SFT到RLHF

后训练微调的重要性 预训练使大模型获得丰富的语言和知识表达能力,但其输出往往与用户意图和安全性需求不完全匹配。业内普遍采用三阶段训练流程:预训练 → 监督微调(SFT)→ 人类偏好对齐(RLHF)。预训练阶段模型在大规模语料上学习语言规律;监督微调利用人工标注的数据…...

安全性(一):加密算法总结

一、加密算法分类总览 加密类型关键特性代表算法主要用途对称加密加解密使用同一个密钥DES、3DES、AES、SM4数据加密传输、存储非对称加密公钥加密&#xff0c;私钥解密&#xff08;或反向&#xff09;RSA、DSA、ECC、SM2密钥交换、数字签名、身份认证哈希算法不可逆摘要MD5、…...

DeepSeek 赋能军事:重塑现代战争形态的科技密码

目录 一、引言&#xff1a;AI 浪潮下的军事变革与 DeepSeek 崛起二、DeepSeek 技术原理与特性剖析2.1 核心技术架构2.2 独特优势 三、DeepSeek 在军事侦察中的应用3.1 海量数据快速处理3.2 精准目标识别追踪3.3 预测潜在威胁 四、DeepSeek 在军事指挥决策中的应用4.1 战场态势实…...

我司助力高校打造「智慧创新AI学习中心」

为推动AI教育融合跨领域应用&#xff0c;东吴大学于2025年4月举行「智慧创新AI学习中心」揭牌仪式&#xff0c;并宣布正式启动AI特色课程与教学空间建置计画。此次建置由我司协助整体教室空间与设备规划&#xff0c;导入最新NVIDIA GeForce RTX 50系列桌上型电脑&#xff0c;并…...

AI赋能把“杂多集合”转化为“理想集合”的数学建模与认知升级

AI赋能把“杂多集合”转化为“理想集合”的数学建模与认知升级 一、核心概念定义 杂多集合&#xff08;Chaotic Set&#xff09; 定义&#xff1a;元素间关系模糊、结构无序的集合 数学表达&#xff1a;C{x∣x∈X,P(x)}&#xff0c;其中 P(x) 是模糊隶属函数 实例&#xf…...

NVC++ 介绍与使用指南

文章目录 NVC 介绍与使用指南NVC 简介安装 NVC基本使用编译纯 C 程序编译 CUDA C 程序 关键编译选项示例代码使用标准并行算法 (STDPAR)混合 CUDA 和 C 优势与限制优势限制 调试与优化 NVC 介绍与使用指南 NVC 是 NVIDIA 提供的基于 LLVM 的 C 编译器&#xff0c;专为 GPU 加速…...

Redis 事务与管道:原理、区别与应用实践

在现代分布式系统开发中&#xff0c;Redis 作为高性能的内存数据库&#xff0c;其事务处理和管道技术是开发者必须掌握的核心知识点。本文将深入探讨 Redis 事务和管道的实现原理、使用场景、性能差异以及最佳实践&#xff0c;帮助开发者根据实际需求选择合适的技术方案。 一、…...

Git 多人协作

目录 情景一 情景二 合并分支 情景一 目标&#xff1a;远程 master 分支下的 file.txt 文件新增代码 "aaa","bbb"。 实现&#xff1a;由开发者1新增 "aaa" ,开发者2新增 bbb。 条件&#xff1a;在一个分支下合作完成。 针对以上情景我们要注意…...

Unity 人物模型学习笔记

一、关于模型的检查 拿到人物模型时&#xff0c;检查人物&#xff1a; 位置信息是否在0点布线/UV是否正常身体各部分是否分开各部分命名是否清晰骨骼需要绑定 二、Unity人物动画 https://www.bilibili.com/video/BV1cc41197mF?spm_id_from333.788.recommend_more_video.-1&a…...

【和春笋一起学C++】(十四)指针与const

将const用于指针&#xff0c;有两种情况&#xff1a; const int *pt; int * const pt; 目录 1. const int *pt 2. int * const pt 3. 扩展 1. const int *pt 首先看第一种情况&#xff0c;const在int的前面&#xff0c;有如下语句&#xff1a; int peoples12&#xff1…...

AI知识梳理——RAG、Agent、ReAct、LangChain、LangGraph、MCP、Function Calling、JSON-RPC

AI技术I AI技术II RAG &#x1f4cc; 高度凝练表达 RAG &#xff08;检索增强生成&#xff09;是一种结合信息检索与生成式人工智能的技术框架&#xff0c;旨在提升大型语言模型&#xff08;LLM&#xff09;的输出准确性和实用性。通过在生成响应前引入外部知识库的信息&#…...

ModuleNotFoundError: No module named ‘SDToolbox‘

(py311) C:>python Python 3.11.11 | packaged by Anaconda, Inc. | (main, Dec 11 2024, 16:34:19) [MSC v.1929 64 bit (AMD64)] on win32 Type “help”, “copyright”, “credits” or “license” for more information. from SDToolbox import PostShock_eq Tracebac…...

在宝塔中使用.NET环境管理部署 .NET Core项目

本次采用的演示环境未腾讯云轻量级服务器&#xff0c;使用应用模板&#xff0c;选择宝塔liunx面板。 一、登录宝塔安装环境 直接选择免密登录 进入腾讯云webshell后&#xff0c;输入bt&#xff0c;选择14 选择网站选择.NET项目安装.NET环境管理安装对应的.NET 版本 注意&…...

【DAY21】 常见的降维算法

内容来自浙大疏锦行python打卡训练营 浙大疏锦行 目录 PCA主成分分析 t-sne降维 线性判别分析 (Linear Discriminant Analysis, LDA) 作业&#xff1a; 什么时候用到降维 降维的主要应用场景 知识点回顾&#xff1a; PCA主成分分析t-sne降维LDA线性判别 通常情况下&#xff0c;…...

Linux面试题集合(3)

一秒刷新一次某个进程的状况 top -d 1 -p pid ’显示pid为1、2、3的进程的状况 top -p 1,2,3&#xff08;按上键选择某个进程&#xff09; 强制杀死进程 kill -9 pid 说一下ps和top命令的区别 ps命令只能显示执行瞬间的进程状态 top命令实时跟进进程状态 你在工作中什么情况下…...

Pytorch实现常用代码笔记

Pytorch实现常用代码笔记 基础实现代码其他代码示例Network ModulesLossUtils 基础实现代码 参考 深度学习手写代码 其他代码示例 Network Modules Pytorch实现Transformer代码示例 Loss PyTorch实现CrossEntropyLoss示例 Focal Loss 原理详解及 PyTorch 代码实现 PyTorc…...

vscode vue 项目 css 颜色调色版有两个

vue 项目 css 颜色调色版有两个&#xff0c;不知道是哪个插件冲突了。 这个用着很别扭&#xff0c;一个个插件删除后发现是 Vue - Official 这个插件问题&#xff0c;删了就只有一个调色版了。...

MySQL刷题相关简单语法集合

去重 distinct 关键字 eg. &#xff1a;select distinct university from user_profile 返回行数限制&#xff1a; limit关键字 eg. &#xff1a;select device_id from user_profile limit 2 返回列重命名&#xff1a;as 关键字 eg.&#xff1a;select device_id as user_in…...

MySQL多条件查询深度解析

一、业务场景引入 在数据分析场景中&#xff0c;我们经常会遇到需要从多个维度筛选数据的需求。例如&#xff0c;某教育平台运营团队希望同时查看"山东大学"的所有学生以及所有"男性"用户的详细信息&#xff0c;包括设备ID、性别、年龄和GPA数据&#xff…...

RT Thread FinSH(msh)调度逻辑

文章目录 概要FinSH功能FinSH调度逻辑细节小结 概要 RT-Thread&#xff08;Real-Time Thread&#xff09;作为一款开源的嵌入式实时操作系统&#xff0c;在嵌入式设备领域得到了广泛应用。 该系统不仅具备强大的任务调度功能&#xff0c;还集成了 FinSH命令行系统&#xff0c…...

安装nerdctl和buildkitd脚本命令

#!/bin/bash set -euo pipefail # 检查是否以root权限运行 if [ "$(id -u)" -ne 0 ]; then echo "错误&#xff1a;请使用root权限或sudo运行本脚本" >&2 exit 1 fi # 检测openEuler系统&#xff08;兼容大小写&#xff09; detect_distrib…...

HTTP与HTTPS协议的核心区别

HTTP与HTTPS协议的核心区别 数据传输安全性 HTTP采用明文传输&#xff0c;数据易被窃听或篡改&#xff08;如登录密码、支付信息&#xff09;&#xff0c;而HTTPS通过SSL/TLS协议对传输内容加密&#xff0c;确保数据完整性并防止中间人攻击。例如&#xff0c;HTTPS会生成对称加…...

51单片机仿真突然出问题

最近发现仿真出问题了&#xff0c;连最简单的程序运行结果都不对&#xff0c;比如&#xff0c;左移位<<&#xff0c;如果写P1 << 1&#xff1b;则没有问题&#xff0c;但写成P1 << cnt&#xff1b;就不对&#xff08;cnt已经定义过&#xff0c;而且赋了初值&…...

(C语言)超市管理系统 (正式版)(指针)(数据结构)(清屏操作)(文件读写)(网页版预告)(html)(js)(json)

目录 前言&#xff1a; 源代码&#xff1a; product.h product.c fileio.h fileio.c main.c json_export.h json_export.c tasks.json idex.html script.js 相关步骤&#xff1a; 第一步&#xff1a; 第二步&#xff1a; 第三步&#xff1a; 第四步&#xff1a; 第五步…...

uni-app小程序登录后…

前情 最近新接了一个全新项目&#xff0c;是类似商城的小程序项目&#xff0c;我负责从0开始搭建小程序&#xff0c;我选用的技术栈是uni-app技术栈&#xff0c;其中就有一个用户登录功能&#xff0c;小程序部分页面是需要登录才可以查看的&#xff0c;对于未登录的用户需要引…...

从零开始理解Jetty:轻量级Java服务器的入门指南

目录 一、Jetty是什么&#xff1f;先看一个生活比喻 二、5分钟快速入门&#xff1a;搭建你的第一个Jetty服务 步骤1&#xff1a;Maven依赖配置 步骤2&#xff1a;编写简易Servlet&#xff08;厨房厨师&#xff09; 步骤3&#xff1a;组装服务器&#xff08;餐厅开业准备&am…...

如何免费在线PDF转换成Excel

咱们工作中是不是经常遇到这种头疼事儿&#xff1f;辛辛苦苦从别人那里拿到PDF文件&#xff0c;想改个数据调个格式&#xff0c;结果发现根本没法直接编辑&#xff01; 数据被困住&#xff1a;PDF表格无法直接计算/筛选&#xff0c;手动录入太反人类&#xff01; 格式大崩坏&…...

StarRocks MCP Server 开源发布:为 AI 应用提供强大分析中枢

过去&#xff0c;开发者要让大模型&#xff08;LLM&#xff09;使用数据库查询数据&#xff0c;往往需要开发专属插件、设计复杂的接口或手动构建 Prompt&#xff0c;这不仅费时费力&#xff0c;而且很难在不同模型之间复用。StarRocks MCP Server 提供了一个“通用适配器”接口…...

Vue百日学习计划Day21-23天详细计划-Gemini版

总目标: 在 Day 21-23 完成 Vue.js 的介绍学习、环境搭建&#xff0c;并成功运行第一个 Vue 3 项目&#xff0c;理解其基本结构。 Day 21: Vue.js 介绍与概念理解 (~3 小时) 本日目标: 理解 Vue.js 是什么、渐进式框架的概念以及选择 Vue 的原因。初步了解 Vite 是什么及其作用…...

JS逆向-某易云音乐下载器

文章目录 介绍下载链接Robots文件搜索功能JS逆向**函数a&#xff1a;生成随机字符串****函数b&#xff1a;AES-CBC加密****函数c&#xff1a;RSA公钥加密** 歌曲下载总结 介绍 在某易云音乐中&#xff0c;很多歌曲听是免费的&#xff0c;但下载需要VIP&#xff0c;此程序旨在“…...

Qt与Hid设备通信

什么是HID&#xff1f; HID&#xff08;Human Interface Device&#xff09;是‌直接与人交互的电子设备‌&#xff0c;通过标准化协议实现用户与计算机或其他设备的通信&#xff0c;典型代表包括键盘、鼠标、游戏手柄等。‌ 为什么HID要与qt进行通信&#xff1f; 我这里的应…...

QT使用QXlsx读取excel表格中的图片

前言 读取excel表格中的图片的需求比较小众&#xff0c;QXlsx可以操作excel文档&#xff0c;进行图片读取、插入操作&#xff0c;本文主要分享单独提取图片和遍历表格提取文字和图片。 源码下载 github 开发环境准备 把下载的代码中的QXlsx目录&#xff0c;整个拷贝到所创建…...

二叉树进阶

一、二叉搜索树 1.二叉搜索树的概念 二叉搜索树又称二叉排序树&#xff0c;它也可以是一棵空树&#xff0c;或是具备以下性质的树&#xff1a; 1.1 若它的左子树不为空&#xff0c;则它左子树上所有节点的值都小于根节点的值。 1.2 若它的右子树不为空&#xff0c;则它右子…...

腾讯 CodeBuddy 杀入 AI 编程赛道,能否撼动海外工具霸主地位?

在 AI 编程助手领域&#xff0c;海外的 Cursor 等工具风头正劲&#xff0c;如今腾讯带着 CodeBuddy 隆重登场&#xff0c;国产 AI 编程助手能否借其之力崛起&#xff1f;让我们一探究竟。 官网&#xff1a; 腾讯云代码助手 CodeBuddy - AI 时代的智能编程伙伴 实战安装教程 …...

项目QT+ffmpeg+rtsp(二)——海康威视相机测试

文章目录 前言一、验证RTSP地址的有效性1.1 使用VLC播放器验证1.2 使用FFmpeg命令行验证1.3 使用Python代码检查网络连接1.4 检查摄像头Web界面1.5 使用RTSP客户端工具二、关于IPV4的地址2.1 原来2.1.1 原因2.2 解决2.3 显示前言 昨晚拿到一个海康威视的相机,是连接上了交换机…...

vscode用python开发maya联动调试设置

如何在VScode里编写Maya Python脚本_哔哩哔哩_bilibili1 包括1&#xff0c;maya的python全面在vscode支持&#xff0c;2&#xff0c;通过mayacode发送到maya&#xff0c;3同步调试 import maya.cmds as cmds 1、让 maya.cmds编译通过 下载Autodesk_Maya_2018_6_Update_DEVK…...