DeepSeek底层揭秘——知识图谱与语料库的联邦学习架构
目录
1. 知识图谱与语料库的联邦学习架构
2. 技术要素
3. 技术难点与挑战
4. 技术路径
5. 应用场景
6. 最新研究与技术进展
7. 未来趋势
8. 实际案例
猫哥说
1. 知识图谱与语料库的联邦学习架构
(1) 定义
“知识图谱与语料库的联邦学习架构”是一种结合知识图谱(Knowledge Graph, KG)、语料库(Corpus)和联邦学习(Federated Learning, FL)的分布式学习框架。其核心目标是通过联邦学习技术,在保护数据隐私的前提下,整合分布式的知识图谱和语料库资源,构建一个共享的智能模型,用于知识推理、语义理解和多模态任务。
(2) 核心功能
- 隐私保护:在不共享原始数据的情况下,利用联邦学习技术对分布式的知识图谱和语料库进行联合建模。
- 知识整合:通过联邦学习框架,将不同节点上的知识图谱和语料库进行语义对齐和融合。
- 分布式推理:在多个节点上协同进行知识推理和语义理解。
- 动态更新:支持知识图谱和语料库的动态更新,并通过联邦学习同步到全局模型。
(3) 背景
- 知识图谱:是一种结构化的知识表示方法,用于存储实体及其关系,广泛应用于搜索引擎、推荐系统等领域。
- 语料库:是文本数据的集合,通常用于自然语言处理(NLP)任务,如语言建模、文本分类等。
- 联邦学习:是一种分布式机器学习技术,允许多个节点在不共享数据的情况下协同训练模型,保护数据隐私。
将知识图谱、语料库与联邦学习结合,可以在分布式环境中实现知识共享和隐私保护,特别适用于数据敏感性高、分布式数据资源丰富的场景。
2. 技术要素
(1) 知识图谱与语料库的建模
- 知识图谱建模:
- 使用图嵌入技术(如 TransE、RotatE)将实体和关系表示为向量。
- 构建知识推理模型(如基于 GNN 的知识推理)。
- 语料库建模:
- 使用预训练语言模型(如 BERT、GPT)对语料库进行语义表示。
- 提取语料库中的实体和关系,构建知识图谱。
(2) 联邦学习框架
- 联邦学习的核心组件:
- 客户端(Client):分布式节点,每个节点拥有本地的知识图谱或语料库。
- 服务器(Server):负责聚合客户端的模型更新,构建全局模型。
- 通信协议:用于客户端与服务器之间的模型参数传输。
- 联邦学习算法:
- FedAvg:通过平均客户端的模型更新构建全局模型。
- FedProx:在 FedAvg 的基础上引入正则化项,解决客户端数据异质性问题。
(3) 知识对齐与融合
- 语义对齐:
- 使用嵌入对齐技术(如基于对比学习的对齐方法)对不同节点的知识图谱进行语义对齐。
- 知识融合:
- 通过联邦学习框架,将不同节点的知识图谱和语料库进行融合,构建统一的知识表示。
(4) 隐私保护与安全性
- 差分隐私:
- 在模型更新中引入噪声,保护客户端的隐私。
- 安全多方计算(Secure Multi-Party Computation, SMPC):
- 使用加密技术保护模型参数的传输安全。
- 联邦对抗训练:
- 提高模型对恶意节点的鲁棒性。
3. 技术难点与挑战
(1) 数据异质性
- 难点:
- 不同节点的知识图谱和语料库可能具有不同的结构、分布和语义表示。
- 解决方案:
- 使用嵌入对齐技术对异构知识图谱进行语义对齐。
- 引入联邦学习算法(如 FedProx)处理数据分布不均的问题。
(2) 通信效率
- 难点:
- 联邦学习需要频繁传输模型参数,可能导致通信开销过高。
- 解决方案:
- 使用模型压缩技术(如量化、剪枝)减少通信成本。
- 采用异步联邦学习算法,降低通信频率。
(3) 隐私保护
- 难点:
- 在知识图谱和语料库的联邦学习中,如何保护数据隐私是一个关键问题。
- 解决方案:
- 使用差分隐私技术保护模型更新。
- 引入安全多方计算技术,确保参数传输的安全性。
(4) 知识对齐与融合
- 难点:
- 不同节点的知识图谱可能存在语义冲突或冗余。
- 解决方案:
- 使用基于对比学习的对齐方法解决语义冲突。
- 通过图嵌入技术对知识图谱进行去冗余处理。
4. 技术路径
(1) 数据预处理
- 知识图谱构建:
- 从语料库中提取实体和关系,构建本地知识图谱。
- 语料库建模:
- 使用预训练语言模型对语料库进行语义表示。
(2) 联邦学习训练
- 本地训练:
- 每个客户端在本地数据上训练知识图谱嵌入模型或语言模型。
- 模型聚合:
- 服务器聚合客户端的模型更新,构建全局模型。
- 知识对齐与融合:
- 在全局模型中对不同节点的知识图谱进行语义对齐和融合。
(3) 模型优化
- 隐私保护:
- 在模型更新中引入差分隐私或加密技术。
- 通信优化:
- 使用模型压缩技术减少通信成本。
5. 应用场景
(1) 医疗领域
- 场景:不同医院拥有各自的医疗知识图谱和语料库,但由于隐私问题无法共享数据。
- 应用:
- 使用联邦学习框架整合分布式的医疗知识图谱,构建统一的医学知识库。
- 通过语料库分析,提取新的医学知识。
(2) 金融领域
- 场景:不同金融机构拥有各自的客户数据和知识图谱,但数据敏感性高。
- 应用:
- 使用联邦学习框架整合分布式的金融知识图谱,提升风险评估和欺诈检测能力。
(3) 智能搜索与推荐
- 场景:不同平台拥有各自的用户行为数据和知识图谱。
- 应用:
- 使用联邦学习框架整合分布式的知识图谱,提升搜索和推荐的精准性。
(4) 教育领域
- 场景:不同教育机构拥有各自的教学资源和知识图谱。
- 应用:
- 使用联邦学习框架整合分布式的教育知识图谱,构建个性化学习系统。
6. 最新研究与技术进展
(1) 联邦学习与知识图谱的结合
- 研究:
- 2022 年,Google 提出了基于联邦学习的知识图谱构建方法,通过分布式训练实现知识共享。
- 进展:
- 在医疗和金融领域的知识图谱构建中取得了显著成果。
(2) 联邦学习与预训练模型的结合
- 研究:
- OpenAI 和 Meta 探索了将联邦学习与预训练语言模型(如 GPT、BERT)结合,用于分布式语料库建模。
- 进展:
- 在低资源语言的语义理解任务中表现优异。
(3) 隐私保护技术
- 研究:
- 2023 年,MIT 提出了基于差分隐私的联邦学习框架,用于知识图谱的隐私保护。
- 进展:
- 在医疗和教育领域的隐私保护中取得了突破。
(4) 知识对齐技术
- 研究:
- 2021 年,Stanford 提出了基于对比学习的知识对齐方法,用于分布式知识图谱的语义融合。
- 进展:
- 在跨语言知识图谱对齐任务中表现出色。
7. 未来趋势
(1) 多模态知识图谱的联邦学习
- 趋势:结合文本、图像、语音等多模态数据,构建多模态知识图谱的联邦学习框架。
- 示例:在医疗领域,结合影像数据和文本数据构建多模态医学知识图谱。
(2) 自监督学习与联邦学习结合
- 趋势:通过自监督学习方法提取更多的语义信息,提升联邦学习的效率。
- 示例:在语料库建模中,使用自监督学习方法预训练语言模型。
(3) 跨领域知识共享
- 趋势:通过联邦学习框架实现跨领域的知识共享和协同推理。
- 示例:在金融和医疗领域共享风险评估和健康管理知识。
(4) 强化学习与联邦学习结合
- 趋势:在联邦学习框架中引入强化学习技术,提升知识推理能力。
- 示例:在智能推荐系统中,通过强化学习优化推荐策略。
8. 实际案例
(1) 医疗知识图谱的联邦学习
- 实现:
- 不同医院通过联邦学习框架整合各自的医疗知识图谱,构建统一的医学知识库。
- 效果:
- 提升了疾病诊断和治疗方案推荐的准确性。
(2) 金融知识图谱的联邦学习
- 实现:
- 不同金融机构通过联邦学习框架共享风险评估知识。
- 效果:
- 提高了欺诈检测和信用评估的效率。
(3) 教育知识图谱的联邦学习
- 实现:
- 不同教育机构通过联邦学习框架共享教学资源和知识图谱。
- 效果:
- 提供了个性化的学习路径推荐。
猫哥说
“知识图谱与语料库的联邦学习架构”是一种结合知识图谱、语料库和联邦学习的创新技术,能够在保护数据隐私的前提下,实现分布式知识共享和协同推理。尽管面临数据异质性、通信效率和隐私保护等挑战,但通过嵌入对齐、差分隐私和联邦优化算法等技术,已经在医疗、金融、教育等领域取得了显著进展。未来,随着多模态学习、自监督学习和强化学习的结合,这一领域将进一步推动 AI 在知识管理和智能推理中的应用。
相关文章:
DeepSeek底层揭秘——知识图谱与语料库的联邦学习架构
目录 1. 知识图谱与语料库的联邦学习架构 2. 技术要素 3. 技术难点与挑战 4. 技术路径 5. 应用场景 6. 最新研究与技术进展 7. 未来趋势 8. 实际案例 猫哥说 1. 知识图谱与语料库的联邦学习架构 (1) 定义 “知识图谱与语料库的联邦学习架构”是一种结合知识图谱&…...
MVVM设计模式
MVVM(Model-View-ViewModel)是一种软件设计模式,MVVM模式由三个主要部分组成: Model(模型):负责管理应用程序的业务逻辑和数据。它不关心UI如何展示数据,主要负责与服务器通信和数据处处…...
5.实时推荐系统的设计与实现
接下来我们将学习实时推荐系统的设计与实现。实时推荐系统需要处理大规模数据,并在用户交互时提供即时的推荐结果。这一课我们将介绍以下内容: 实时推荐系统的基本概念实时推荐系统的架构设计实时推荐系统的关键技术实践示例 1. 实时推荐系统的基本概念…...
分层解耦-ioc引入
内聚: 软件中各个功能模块内部的功能联系。 耦合: 衡量软件中各个层/模块之间的依赖、关联的程度。 软件设计原则: 高内聚低耦合。...
Docker安装常用软件说明
1.总体步骤 2.安装tomcat docker run -d -p 8080:8080 --name tomcat1 tomcat:11.0.8 访问tomcat猫首页 出现404 这是正常情况 Docker 默认采用的是 NAT 网络模式,所以会自动创建 IPtable 规则并自动开放端口,所以无需考虑防火墙问题 新版Tomcat已经…...
陶氏环面包络减速机:为工业视觉检测注入“精准动力”!
在工业4.0时代,视觉检测技术已成为智能制造的核心环节。无论是精密电子元件的检测,还是汽车零部件的质量把控,视觉检测系统都需要极高的精度、稳定性和响应速度。而这一切,离不开一颗强大的“心脏”——陶氏环面包络减速机。 一、…...
标准日本语 导学
新版标准日本语-初级 结构 初级 上 初级 下 每章结构 教学方法...
vscode怎么更新github代码
vscode怎么更新github代码 打开终端: 在 VS Code 中,使用快捷键 Ctrl (Mac 上是 Cmd) 打开终端。 导航到项目目录: 确保你当前所在的终端目录是你的项目目录。如果不是,可以使用 cd 命令导航到项目目录,例如…...
【转载】开源鸿蒙OpenHarmony社区运营报告(2025年1月)
●截至2025年1月31日,开放原子开源鸿蒙(OpenAtom OpenHarmony,简称“开源鸿蒙”或“OpenHarmony”)社区累计超过8200名贡献者,共63家成员单位,产生51.2万多个PR、2.9万多个Star、10.5万多个Fork、68个SIG。…...
Pdf手册阅读(1)--数字签名篇
原文阅读摘要 PDF支持的数字签名, 不仅仅是公私钥签名,还可以是指纹、手写、虹膜等生物识别签名。PDF签名的计算方式,可以基于字节范围进行计算,也可以基于Pdf 对象(pdf object)进行计算。 PDF文件可能包…...
【C#】任务调度的实现原理与组件应用Quartz.Net
Quartz 是一个流行的开源作业调度库,最初由 Terracotta 开发,现在由 Terracotta 的一部分 Oracle 所有。它主要用于在 Java 应用程序中调度作业的执行。Quartz 使用了一种复杂的底层算法来管理任务调度,其中包括任务触发、执行、持久化以及集…...
HTML之JavaScript函数声明
HTML之JavaScript函数声明 1. function 函数名(){}2. var 函数名 function(){}<!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1…...
如何在 Qt 中添加和使用系统托盘图标
在 Qt 中实现系统托盘图标是一个常见的需求,尤其是在桌面应用程序中。系统托盘图标可以让应用程序在后台运行时仍然具有可见性,同时避免占用过多的桌面空间。本文将详细介绍如何在 Qt 项目中添加托盘图标,并通过资源系统(.qrc 文件…...
day5QT套接字通信
Widget.cpp #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);objtimer new QTimer (this);//连接定时器的timeout信号到启动的槽函数//connect(objtimer,&…...
JVM速成=。=
JVM跨平台原理 跨平台:一次编译,到处运行 本质:不同操作系统上运行的JVM不一样,只需要把java程序编译成一份字节码文件,JVM执行不同的字节码文件。 Java是高级语言,提前编译一下(变成字节码文件…...
操作系统中的任务调度算法
在多任务操作系统中,任务调度算法(Task Scheduling Algorithm)是决定CPU资源如何分配给进程或线程的核心机制。优秀的调度算法需要平衡响应时间、吞吐量和公平性,同时适应不同的应用场景。 任务调度的核心目标 CPU利用率最大化&a…...
第七节 文件与流
基本的输入输出(iostream) C标准库提供了一组丰富的输入/输出功能,C的I/O发生在流中,流是字节序列。如果字节流是从设备(键盘、磁盘驱动器、网络连接等)流向内存,叫做输入操作。如果字节流是从…...
回首2024,展望2025
2024年,是个充满挑战与惊喜的年份。在这366个日夜里,我站在编程与博客的交汇点,穿越了无数的风景与挑战,也迎来了自我成长的丰收时刻。作为开发者的第十年,我依然步伐坚定,心中始终带着对知识的渴望与对自我…...
Ubuntu指令学习(个人记录、偶尔更新)
Ubuntu指令学习 0、一点常用指令列表一、Ubuntu下复制与移动,cp/mv二、Ubuntu下echo 与 重定向>,>>三、Ubuntu下chmod,用户权限四、Ubuntu下的tar打包,gzip压缩五、Ubuntu(22.04)下系统语言为中文,切换主目录文件名为英文。六、Ubun…...
【牛客】动态规划专题一:斐波那契数列
文章目录 DP1 斐波那契数列法1:递归法2:动态规划法3:优化空间复杂度 2.分割连接字符串3. 给定一个字符串s和一组单词dict,在s中添加空格将s变成一个句子 DP1 斐波那契数列 法1:递归 // 递归 #include <iostream>…...
HCIA-Access V2.5_13_1_1_VLAN类型
VLAN类型(1)Standard VLAN VLAN类型(1)-Smart VLAN Smart可以包含多个上行口,和多个业务虚端口(Service Port),以太网端口在同一下VLAN中是互通的,但是业务虚端口,在同一个VLAN之间是…...
【动态规划】风扫枯杨,满地堆黄叶 - 9. 完全背包问题
本篇博客给大家带来的是完全背包问题之动态规划解法技巧. 🐎文章专栏: 动态规划 🚀若有问题 评论区见 ❤ 欢迎大家点赞 评论 收藏 分享 如果你不知道分享给谁,那就分享给薯条. 你们的支持是我不断创作的动力 . 王子,公主请阅🚀 要开心要快乐顺…...
Android ndk兼容 64bit so报错
1、报错logcat如下 2025-01-13 11:34:41.963 4687-4687 DEBUG pid-4687 A #01 pc 00000000000063b8 /system/lib64/liblog.so (__android_log_default_aborter16) (BuildId: 467c2038cdfa767245f9280e657fdb85) 2025…...
极狐GitLab 17.8 正式发布,多项 DevOps 重点功能解读【一】
GitLab 是一个全球知名的一体化 DevOps 平台,很多人都通过私有化部署 GitLab 来进行源代码托管。极狐GitLab 是 GitLab 在中国的发行版,专门为中国程序员服务。可以一键式部署极狐GitLab。 学习极狐GitLab 的相关资料: 极狐GitLab 官网极狐…...
java面试题
以下是一些Java面试题: 一、基础概念 Java中的基本数据类型有哪些?它们的默认值是什么? 答案: 基本数据类型有byte(字节型,默认值为0)、short(短整型,默认值为0)、int(整型,默认值为0)、long(长整型,默认值为0L)、float(浮点型,默认值为0.0f)、double(双精…...
C语言蓝桥杯1003: [编程入门]密码破译
要将"China"译成密码,译码规律是:用原来字母后面的第4个字母代替原来的字母. 例如,字母"A"后面第4个字母是"E"."E"代替"A"。因此,"China"应译…...
react实例与总结(一)
目录 一、简单认识 1.1、特点 1.2、JSX语法规则 1.3、函数组件和类式组件 1.4、类组件三大属性state、props、refs 1.4.1、state 1.4.2、props 1.4.3、refs 1.5、事件处理 1.6、收集表单数据—非受控组件和受控组件 1.7、高阶函数—函数柯里化 1.8、生命周期—新旧…...
科技赋能直播!DeepSeek大模型+智享AI直播第三代plus版本,未来直播将更加智能化!
科技赋能直播!DeepSeek大模型智享AI直播第三代plus版本,未来直播将更加智能化! 能成事的人,都是懂得整合资源的高手。 要学会“万物不为我所有,万物皆为我所用。”的思维方式。 一个人的成就高低,在于他的…...
几种3D 旋转 的参数化形式
在 3D 空间中,旋转是 3 自由度的,刚体变换是 6 自由度的(3自由度旋转3自由度平移)。 3x3 的旋转矩阵有 9 个量,表达了 3自由度的旋转。 旋转矩阵是有 自约束的,即一个旋转矩阵是一个 正交矩阵,…...
【kubernetes组件合集】深入解析Kubernetes组件之三:client-go
深入解析Kubernetes组件之三:client-go 目录 深入解析Kubernetes组件之三:client-go 引言 1. client-go简介 2. client-go的功能 2.1 资源操作 2.2 资源监听 2.3 认证和授权 2.4 错误处理和重试 2.5 扩展性和定制化 3. 使用client-go与Kubern…...
强化学习概念入门
1 概述 强化学习,英文名为reinforcement learning,简称RL,是机器学习的一个分支,其想要解决的问题是智能体(agent)如何在复杂环境(environment)下最大化其能获得的奖励。 一般来说…...
自动控制视频讲解
本视频几乎包含了所有《自动控制原理》(胡寿松)所有重点章节。针对于考研都能满足。 视频内容包括但不限于:时域分析、信号流图、结构图绘制、跟轨迹、幅相曲线、稳定裕度、z变换、离散传递函数、数字控制器、稳定判据、相平面法、描述函数法…...
【Mastering Vim 2_01】开篇词:在 AI 时代持续深耕底层技术,做长期主义的坚定捍卫者
【最新版《Mastering Vim》封面,涵盖 Vim 9.0 版特性】 文章目录 1 背景:AI 时代的底层技术觉醒2 Vim:一款被严重低估的文本编辑神器3 聊聊 IT 人士的职业病4 进阶之道:构建完整的知识体系5 从 AI 时代的深耕与精进再谈长期主义 1…...
zsh: command not found: conda
场景描述 在 Linux 服务器上使用 zsh 时,如果出现 zsh: command not found: conda 错误,说明你的系统未正确配置 conda 命令,或者你尚未安装 Anaconda/Miniconda。 解决方案 确保已安装 Anaconda 或 Miniconda conda 是 Anaconda 或 Minico…...
Unity中使用Best MQTT v3插件实现MQTT通信功能,进行模块拆分
概述 本文将详细介绍如何在Unity中使用Best MQTT v3插件实现MQTT通信功能。将通过模块化设计实现配置加载、连接管理、订阅/发布等功能,并提供完整的代码实现。 重连说明:当意外断开连接的时候,会进行重新连接,重连上之后会再次订…...
NO.14十六届蓝桥杯备战|switch语句|break|default|2道练习(C++)
switch语句 除了 if 语句外,C语⾔还提供了 switch 语句来实现分⽀结构。 switch 语句是⼀种特殊形式的 if…else 结构,⽤于判断条件有多个结果的情况。它把多重的 else if 改成更易⽤、可读性更好的形式。 switch (expression) { case value1: stat…...
探索B-树系列
🌈前言🌈 本文将讲解B树系列,包含 B-树,B树,B*树,其中主要讲解B树底层原理,为什么用B树作为外查询的数据结构,以及B-树插入操作并用代码实现;介绍B树、B*树。 Ǵ…...
【SpringBoot实现全局API限频】 最佳实践
在 Spring Boot 中实现全局 API 限频(Rate Limiting)可以通过多种方式实现,这里推荐一个结合 拦截器 Redis 的分布式解决方案,适用于生产环境且具备良好的扩展性。 方案设计思路 核心目标:基于客户端标识(…...
esxi添加内存条因为资源不足虚拟机无法开机——避坑
exsi8.0我加了6根内存条,然后将里面的ubuntu的内存增加 haTask-2-vim.VirtualMachine.powerOn-919 描述 打开该虚拟机电源 虚拟机 ub22 状况 失败 - 模块“MonitorLoop”打开电源失败。 错误 模块“MonitorLoop”打开电源失败。无法将交换文件 /vmfs/volumes…...
实验8 配置标准访问控制列表IPv4 ACL
实验8 配置标准访问控制列表IPv4 ACL 一.实验目的 1、掌握IPv4 ACL工作方式和工作过程。 2、掌握定义编号和命名的标准 IPv4 ACL 的方法。 3、掌握接口和VTY下应用标准IPv4 ACL的方法。 二.实验内容 配置IPv4 ACL的实验拓扑如下图所示。 图1 实验拓扑…...
5.7.2 进度管理
文章目录 进度管理Gantt图PERT图 进度管理 进度安排:通过将项目分解成多个活动,分析活动间的依赖关系,估算工作量,分配资源,制定活动时序。 Gantt图 Gantt图横坐标表示时间,纵坐标表示不同任务。使用一条条…...
Android新版高斯模糊(毛玻璃)官方实现,Kotlin
Android新版高斯模糊(毛玻璃)官方实现,Kotlin 从Android 12开始,Android官方API支持高斯模糊(毛玻璃)效果。关键是通过RenderEffect实现。 https://developer.android.com/reference/android/graphics/RenderEffecthttps://developer.android.com/refer…...
b站——《【强化学习】一小时完全入门》学习笔记及代码(1-3 多臂老虎机)
问题陈述 我们有两个多臂老虎机(Multi-Armed Bandit),分别称为左边的老虎机和右边的老虎机。每个老虎机的奖励服从不同的正态分布: 左边的老虎机:奖励服从均值为 500,标准差为 50 的正态分布,即…...
使用开源项目xxl-cache构建多级缓存
xxl-cache简介 官网地址:https://www.xuxueli.com/xxl-cache/ 概述 XXL-CACHE 是一个 多级缓存框架,高效组合本地缓存和分布式缓存(RedisCaffeine),支持“多级缓存、一致性保障、TTL、Category隔离、防穿透”等能力;拥有“高性…...
分层解耦-三层架构
controller: 控制层,接收前端发送的请求,对请求进行处理,并响应数据。 service: 业务逻辑层,处理具体的业务逻辑。 dao: 数据访问层(Data Access Object)(持久层),负责数据访问操作,包括数据的增、删、改…...
简化的动态稀疏视觉Transformer的PyTorch代码
存一串代码(简化的动态稀疏视觉Transformer的PyTorch代码) import torch import torch.nn as nn import torch.nn.functional as F class DynamicSparseAttention(nn.Module): def __init__(self, dim, num_heads8, dropout0.1): super().__init__()…...
掌握 PHP 单例模式:构建更高效的应用
在 PHP 应用开发中,资源的高效管理至关重要。单例模式是一种能够帮助我们实现这一目标的设计模式。本文将深入探讨单例模式的概念、工作原理以及在 PHP 项目中何时应该(或不应该)使用它。 什么是单例模式? 单例模式是一种设计模…...
今日AI和商界事件(2025-02-11)
今日AI大事件主要包括以下几个方面: 一、行业竞购与合作变动 马斯克组团竞购OpenAI 据《华尔街日报》报道,马斯克率投资者财团出价974亿美元竞购OpenAI,欲使其回归开源公益使命。xAI支持此次竞购,若成功,xAI或与OpenA…...
ArcGIS Pro批量创建离线服务sd包
背景: 主要针对一个工程内有多个地图框项: 处理方法:通过Python脚本处理打包。 运行环境 在Pro的Python环境中去运行编写的Python脚本。 Python 脚本参考 import arcpy import os# Set output file names outdir r"d:\data\out&…...
R语言 文本分析 天龙八部
起因, 目的: 前面有人对 “倚天屠龙记” 进行分析,我这里只是进行模仿而已。 完整的文件, 已经绑定了,反正读者可以找一下。 案例背景 小说《天龙八部》是金庸先生所著的武侠小说,也是“射雕三部曲”的前传。全书共50章,字数超过一百万字。故事发生在北宋末年,以大理…...