AI与自然语言处理(NLP):从BERT到GPT的演进
AI与自然语言处理(NLP):从BERT到GPT的演进
系统化学习人工智能网站(收藏)
:https://www.captainbed.cn/flu
文章目录
- AI与自然语言处理(NLP):从BERT到GPT的演进
- 摘要
- 引言
- 技术架构演进:从Transformer到千亿参数模型
- 1. Transformer双分支技术路线
- 2. 模型参数竞赛:从亿级到万亿级
- 训练范式创新:从无监督到自监督
- 1. BERT:自编码预训练范式
- 2. GPT:自回归预训练范式
- 3. 训练数据与算力消耗对比
- 应用场景拓展:从工具到伙伴
- 1. 垂直领域落地:智能客服与文档分析
- 2. 通用智能探索:代码生成与多模态对话
- 3. 商业化路径对比
- 关键挑战与突破方向
- 1. 技术瓶颈
- 2. 伦理与法律
- 3. 成本控制竞赛
- 未来展望
- 结论
摘要
自然语言处理(NLP)作为人工智能核心领域,正经历从“规则驱动”到“数据驱动”再到“认知智能”的范式跃迁。本文以BERT(2018)与GPT(2018-2023)两大技术流派为脉络,系统梳理预训练语言模型(PLM)在架构创新、训练范式、应用场景及产业生态中的演进路径。通过对比Transformer双分支技术路线(自编码vs自回归)、千亿参数模型竞赛、多模态融合趋势及商业化落地挑战,揭示NLP技术从“理解语言”到“生成世界”的底层逻辑,为AI从业者提供技术演进全景图谱。
引言
根据斯坦福大学《2023 AI Index Report》,NLP领域论文占比从2010年的8%跃升至2022年的27%,预训练模型参数规模年均增长4.2倍。技术突破呈现两大特征:
- 模型规模:从BERT的3.4亿参数跃升至GPT-4的1.8万亿参数
- 能力边界:从文本分类、机器翻译拓展至代码生成、数学推理、跨模态对话
本文通过以下维度展开对比分析:
- 技术架构:Transformer双分支(BERT vs GPT)的底层差异
- 训练范式:自编码与自回归的路径选择
- 应用场景:从垂直领域到通用智能的商业化路径
- 产业生态:开源社区与商业巨头的博弈格局
技术架构演进:从Transformer到千亿参数模型
1. Transformer双分支技术路线
-
BERT分支(2018):
- 核心创新:引入双向Transformer编码器,通过“掩码语言模型”(MLM)任务预训练,实现上下文语义融合。
- 技术参数:Base版1.1亿参数,Large版3.4亿参数,使用BooksCorpus+Wikipedia(16GB)数据集。
- 应用突破:在GLUE基准测试中,将文本分类准确率提升至86.7%,超越人类平均水平(86.4%)。
-
GPT分支(2018-2023):
- GPT-1(2018):1.17亿参数,单向Transformer解码器,首创“预训练+微调”范式。
- GPT-2(2019):15亿参数,引入“零样本学习”(Zero-Shot),实现无需标注数据的文本生成。
- GPT-3(2020):1750亿参数,采用“上下文学习”(In-Context Learning),通过提示工程(Prompt Engineering)实现任务泛化。
- GPT-4(2023):1.8万亿参数,支持多模态输入(文本+图像),在律师资格考试中超越90%人类考生。
2. 模型参数竞赛:从亿级到万亿级
# 模型参数规模增长曲线(模拟代码)
import matplotlib.pyplot as plt
years = [2018, 2019, 2020, 2021, 2022, 2023]
params = [340e6, 1.5e9, 175e9, 530e9, 1.1e12, 1.8e12]
plt.plot(years, params, marker='o')
plt.xlabel('Year')
plt.ylabel('Parameters')
plt.title('NLP Model Parameter Growth')
plt.show()
-
参数增长驱动因素:
- 数据规模:Common Crawl数据从GPT-2的40GB扩展至GPT-4的45TB
- 算力突破:单卡训练从V100(32GB)升级至H100(80GB),集群规模达10万卡级
- 算法优化:混合精度训练、张量并行、梯度检查点等技术降低显存需求
-
典型模型对比:
模型 参数规模 训练数据量 预训练任务 BERT-Large 3.4亿 16GB MLM+NSP T5-11B 110亿 750GB 文本到文本统一框架 GPT-3 1750亿 45TB 语言建模+上下文学习 PaLM-540B 5400亿 7800亿词 路径注意力机制 GPT-4 1.8万亿 13万亿词 多模态对齐
训练范式创新:从无监督到自监督
1. BERT:自编码预训练范式
- 技术特点:
- 双向上下文建模:突破传统LSTM单向限制,实现跨句语义融合
- 任务适配性:通过微调适配文本分类、问答、命名实体识别等10+NLP任务
- 局限性:生成能力弱,需额外解码器模块
2. GPT:自回归预训练范式
# GPT-3因果掩码机制示例
def causal_mask(tokens, seq_len):mask = torch.triu(torch.ones(seq_len, seq_len), diagonal=1)return mask.to(tokens.device)# 训练过程
for batch in dataloader:inputs = batch['text']targets = inputs[:, 1:] # 左移一位作为目标mask = causal_mask(inputs, len(inputs[0]))outputs = model(inputs, attention_mask=mask)loss = criterion(outputs, targets)
- 技术突破:
- 零样本/少样本学习:通过提示工程(Prompt Engineering)实现任务泛化
- 上下文学习:模型通过示例理解任务需求,无需参数更新
- 指令遵循:GPT-4在1200+任务指令上达到人类水平
3. 训练数据与算力消耗对比
模型 | 预训练数据量 | 训练成本(估算) | 碳足迹(吨CO₂) |
---|---|---|---|
BERT | 16GB | $60万 | 140 |
GPT-3 | 45TB | $1200万 | 2840 |
PaLM | 7800亿词 | $9000万 | 3400 |
GPT-4 | 13万亿词 | $1亿+ | 5520 |
应用场景拓展:从工具到伙伴
1. 垂直领域落地:智能客服与文档分析
-
典型案例:
- 招商银行:基于BERT的智能客服系统,问答准确率提升至92%,工单处理效率提高40%
- Salesforce Einstein:集成GPT-3的合同审查工具,条款提取速度提升10倍,错误率降低至1.2%
-
技术挑战:
- 领域适应:金融术语、医疗术语等垂直领域数据稀缺
- 可解释性:黑箱模型导致决策过程难以审计
2. 通用智能探索:代码生成与多模态对话
- GitHub Copilot:基于Codex(GPT-3变体)的代码补全工具,生成代码采纳率达46%,开发效率提升55%
- GPT-4V:支持图像输入的对话系统,在医学影像诊断中达到专家级水平(AUC=0.92)
- DALL·E 3:文本到图像生成模型,分辨率达2048×2048,艺术风格迁移准确率98%
3. 商业化路径对比
企业 | 核心产品 | 定价模式 | 客户规模 |
---|---|---|---|
OpenAI | ChatGPT Plus | $20/月 | 1亿+用户 |
百度 | 文心一言 | 企业API调用收费 | 50万+开发者 |
谷歌 | Bard | 免费+广告 | 8000万用户 |
微软 | Copilot Studio | 按订阅席位收费 | 10万+企业 |
关键挑战与突破方向
1. 技术瓶颈
- 长文本处理:BERT的512 token限制与GPT的2048 token限制,导致长文档分析困难
- 事实一致性:大模型生成内容存在“幻觉”问题(Hallucination),事实错误率高达15%
- 能源消耗:GPT-4训练一次消耗1287兆瓦时电力,相当于3000户家庭年用电量
2. 伦理与法律
- 版权争议:训练数据中未经授权的版权内容占比达30%(斯坦福研究)
- 偏见与歧视:模型在职业推荐中存在性别偏见(女性工程师推荐率低于男性23%)
- 监管政策:欧盟《AI法案》将GPT-4列为高风险系统,要求透明度报告与风险评估
3. 成本控制竞赛
优化方向 | 典型技术 | 降本幅度 |
---|---|---|
模型压缩 | 量化、剪枝、知识蒸馏 | 5-10倍 |
硬件加速 | 定制化AI芯片(如TPU、昇腾) | 3-5倍 |
算法创新 | 混合专家模型(MoE) | 2-3倍 |
数据效率 | 合成数据生成、主动学习 | 40%数据量 |
未来展望
-
技术融合:
- 多模态大模型:GPT-5将整合语音、视频、3D点云输入,实现跨模态理解
- 具身智能:结合机器人控制,实现“语言-动作”对齐(如谷歌SayCan项目)
-
应用场景:
- 教育领域:个性化学习助手,实现动态课程生成与认知诊断
- 医疗领域:电子病历分析、药物研发、手术机器人协同
- 工业领域:故障预测、工艺优化、数字孪生
-
产业生态:
- 开源社区:Meta Llama 3、Mistral等模型推动技术普惠
- 商业巨头:OpenAI估值达800亿美元,微软AI业务年收入突破200亿美元
- 国家战略:中国“东数西算”工程布局AI算力网络,美国《芯片与科学法案》投资520亿美元
结论
NLP技术的演进史,本质是“数据-算法-算力”三角关系的动态平衡。BERT与GPT两大流派分别代表“理解优先”与“生成优先”的技术哲学,其竞争推动模型参数从亿级跃升至万亿级,应用场景从工具型AI向认知型AI转型。随着稀疏激活、量子计算、神经符号融合等技术的突破,2025-2030年或迎来通用人工智能(AGI)的曙光。最终胜出者需在技术深度、商业闭环、伦理合规间构建护城河,而这场竞赛将重新定义人类与机器的协作边界。
相关文章:
AI与自然语言处理(NLP):从BERT到GPT的演进
AI与自然语言处理(NLP):从BERT到GPT的演进 系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu 文章目录 AI与自然语言处理(NLP):从BERT到GPT的演进摘要引言…...
TRO高能预警,Keith律所×Tane Hannah Meets版权两案王炸维权
紧急避雷贴,keith律所代理Tane Hannah Meets 10个版权连发两案突袭跨境圈!案件详情如下: 案件基本情况: 起诉时间:2025-5-8 案件号:25-cv-05079、25-cv-05088 品牌:Tane Meets Works 原告&…...
在 Spring Boot 中选择合适的 HTTP 客户端
在现代的 Spring Boot 应用程序中,与外部服务进行 HTTP 通信是一个常见的需求。Spring Boot 提供了多种方式来实现 HTTP 请求,包括 Java 的 HttpClient、Spring 的 RestTemplate、WebClient,以及第三方库如 Apache HttpClient。本文将详细介绍…...
Go语言中 源文件开头的 // +build 注释的用法
// build注释主要用于实现条件编译。借助设置不同的构建标签(build tags),我们能够指定在特定的操作系统、架构或者其他自定义条件下才编译某个文件 1、基本规则 格式要求: 这种注释必须出现在文件的开头部分。注释与包声明之间至…...
C++八股 —— map/unordered_map
1. 底层数据结构 map —— 红黑树 随处可见的红黑树:原理、实现及应用场景 - 知乎 unordered_map —— 散列表 [C] 哈希表(散列表)详解_c哈希表-CSDN博客 2. 常见面试题 底层为红黑树的容器有哪些 mapmultimapsetmultiset 红黑树和AVL树…...
PostgreSQL创建只读账号
环境说明 部署环境:linux服务器docker容器部署 数据库:PostgreSQL 成果 只读账号/密码:read_only/xxx123 授权可读库:xxx、xxxdata 操作过程 #进入PostgreSQL容器(如果你没有用docker容器忽略这一步就可以了ÿ…...
DVWA靶场保姆级通关教程--06不安全验证机制
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 目录 文章目录 前言 原理详解 1. 前后端验证逻辑不一致 2. 验证码值保存在客户端 3. 验证码可预测或重复 4. 验证码验证与逻辑解耦 一、处理关卡报错 二、low级别源…...
【日撸 Java 三百行】Day 7(Java的数组与矩阵元素相加)
目录 Day 7:Java 的数组与矩阵元素相加 一、基本知识 二、矩阵的建立与基本计算 三、代码及测试 拓展:Arrays类详解 小结 Day 7:Java 的数组与矩阵元素相加 Task: 矩阵的赋值.二重循环. 一、基本知识 在学习 Java 中的数组与矩…...
【递归、搜索和回溯】递归、搜索和回溯介绍及递归类算法例题
个人主页 : zxctscl 专栏 【C】、 【C语言】、 【Linux】、 【数据结构】、 【算法】 如有转载请先通知 文章目录 递归、搜索和回溯递归搜索VS 深度优先遍历 VS 深度优先搜索 VS 宽度优先遍历 VS 宽度优先搜索 VS 暴搜回溯与剪枝 1 面试题 08.06. 汉诺塔问题1.1 分析…...
2025最新精选5款3DMAX建筑可视化插件
在3DMAX建筑可视化领域,各类工具如同繁星般璀璨,它们为设计师们搭建起通往理想作品的桥梁。今天,就让我们一同走进几款极具特色的工具——RetailStore插件、2Dto3D插件、DrawFloorPlan插件、MaxToCAD插件以及EXR透视贴图技术,探寻…...
麒麟系统使用-个性化设置
文章目录 前言一、个性化设置-背景二、个性化设置-主题三、个性化设置-锁屏四、个性化设置-屏保五、个性化设置-字体总结 前言 与windows系统相比,麒麟系统中的个性化设置大体相似,在细节上稍有不同。本文将讲述麒麟系统中的个性化设置中的各个模块。 一…...
flask开启https服务支持
目录 一、背景 二、开启https支持 三、自签名 1、安装openssl 2、验证安装 3、自签名 四、编写代码 五、访问https接口 一、背景 最近在做自动化业务,需要兼容现在主流的框架开发的前端页面,于是到github找到了几个项目,clone下来项目并…...
CNN处理图片
In [5]: 123456789101112131415161718192021222324252627282930313233import tensorflow as tfimport matplotlib.pyplot as pltimport numpy as np# 平滑均值滤波#KaTeX parse error: Expected EOF, got _ at position 14: \text {filter_̲{arg}np.}.full (sha…...
【Bootstrap V4系列】学习入门教程之 组件-表单(Forms)
Bootstrap V4系列 学习入门教程之 组件-表单(Forms) 表单(Forms)一、Overview二、Form controls 表单控件2.1 Sizing 尺寸2.2 Readonly 只读2.3 Readonly plain text 只读纯文本 三、Checkboxes and radios 复选框和单选框3.1 Def…...
图像来源:基于协同推理的双视角超声造影分类隐式数据增强方法|文献速递-深度学习医疗AI最新文献
Title 题目 Image by co-reasoning: A collaborative reasoning-based implicit data augmentation method for dual-view CEUS classification 图像来源:基于协同推理的双视角超声造影分类隐式数据增强方法 01 文献速递介绍 结合了B型超声(BUS&…...
MySQL性能分析工具:SHOW PROCESSLIST
概述 以下是一份详细的 MySQL SHOW PROCESSLIST 使用教程,帮助您监控和分析数据库当前活动,快速定位性能问题资料已经分类整理好,喜欢的朋友自取:https://pan.quark.cn/s/f52968c518d3 1. 命令基本作用 SHOW PROCESSLIST 显示当…...
Linux网络编程day8本地套接字
本地套接字 利用cs模型实现本地套接字完成进程间通信 对比网络编程TCP C/S模型,注意以下几点 1、int socket(int domain, int type, int protocol); domain-->AF_INET改为AF_UNIX , type都可写SOCK_STREAM/SOCK_DGRAM2、地址结构 sockaddr_in -->sockadd…...
使用 React Native实现鸿蒙开发的详细方案
一、环境准备 1. 基础环境要求 操作系统:Windows 10/11 或 macOS (建议版本最新)Node.js: v16.x 或更高版本npm: v8.x 或更高版本Java JDK: 11 或更高版本DevEco Studio: 3.1 或更高版本 (鸿蒙官方IDE)2. 安装 DevEco Studio 从华为开发者官网下载安装时选择以下组件: Harmo…...
WebRTC流媒体传输协议RTP点到点传输协议介绍,WebRTC为什么使用RTP协议传输音视频流?
通过上一章《WebRTC工作原理详细介绍、WebRTC信令交互过程和WebRTC流媒体传输协议介绍》,我们知道WEBRTC在完成 SDP 协商和 ICE 候选交换信令后,双方就可以建立 RTP 流,开始传输音视频数据,这时,RTP 数据包就通过在 IC…...
【Unity笔记】PathCreator使用教程:用PathCreator实现自定义轨迹动画与路径控制
在Unity开发过程中,角色移动、摄像机动画、轨道系统、AI巡逻等功能中,路径控制是常见又复杂的需求之一。如何优雅、高效地创建路径并控制对象沿路径运动,是游戏开发、动画制作乃至工业仿真中的关键问题。 在这篇文章中,我将介绍一…...
生产安全管理系统标杆
生产安全不容小视,防患于未然是企业安全生产的基石。好的安全预防系统能让隐患产生最初就被扼杀在摇篮里。国内一些好的生产安全防范系统也有很多,今天我们主要介绍一下众联心安这款产品。 安全生产管理,目标制度管理,风险隐患管理,应急安全管理,设备设…...
temu采购自养号全流程解析:从账号搭建到安全下单的技术闭环
temu 自养号采购下单技术是一个精细的过程,需要从多个方面进行考虑和操作,其核心在于通过技术手段模拟真实用户行为,构建独立、安全的账号环境以确保账号的安全性、真实性和采购下单的成功率。以下是对该技术的详细解析 1. 账号准备 手机号…...
MySQl 数据库操作
目录 一、MySQL 数据库介绍 二、MySQl 库操作 1. 系统数据库 2. 数据库操作 (1)创建数据库 (2)数据库命名规则 (3)选择数据库 (4)查看数据库 (5)删除…...
OpenHarmony launcher开发——删除dock栏
开发环境 OpenHarmony 5.0.0 代码修改 效果...
zst-2001 历年真题 设计模式
设计模式 - 第1题 a 设计模式 - 第2题 一个产品可以产生多个就是抽象,一个就是工厂 比如这样 第二题a是意图 bc: d 设计模式 - 第3题 b 设计模式 - 第4题 类图里全是builder,疯狂暗示 设计模式 - 第5题 aa 设计模式 - 第6题 只有工厂方法是创…...
Vue3 + Element Plus 动态表单实现
完整代码 <template><div class"dynamic-form-container"><el-formref"dynamicFormRef":model"formData":rules"formRules"label-width"auto"label-position"top"v-loading"loading"&g…...
QML AnimatedImage组件详解
目录 引言相关阅读基础知识:AnimatedImage核心属性与方法工程结构与示例展示工程结构示例1:可控制播放/暂停的AnimatedImage示例2:带进度条的AnimatedImage主界面整合(SwipeView滑动展示) 总结下载链接 引言 在UI开发…...
Ascend的aclgraph(2)_npu_backend中还有些什么秘密?
1 _npu_backend 文章还是从代码开始 import torch_npu, torchair config torchair.CompilerConfig() # 设置图下沉执行模式 config.mode "reduce-overhead" npu_backend torchair.get_npu_backend(compiler_configconfig) opt_model torch.compile(model, back…...
免布线视频桩:智慧城市停车降本增效的破局利器
在智慧城市建设的进程中,传统停车管理面临成本高、效率低、施工复杂等难题。而视频桩作为创新解决方案,以“免布线、智能化”为核心,正逐步改变这一局面。视频桩通过融合物联网与AI技术,实现自动化监测与数据实时管理,…...
Vulfocus靶场-文件上传-2
monstra 文件上传 (CVE-2020-13384) Monstra 是一个现代化的轻量级内容管理系统。它易于安装、升级和使用。 Monstra CMS 3.0.4版本中存在着一处安全漏洞,该漏洞源于程序没有正确验证文件扩展名。攻击者可以上传特殊后缀的文件执行任意PHP代…...
nvidia-smi 和 nvcc -V 作用分别是什么?
命令1:nvidia-smi 可以查看当前显卡的驱动版本,以及该驱动支持的CUDA版本。 命令2:nvcc -V 可以看到实际安装的CUDA工具包版本为 12.8 更详细的介绍,可以参考如下链接...
力扣刷题(第二十一天)
灵感来源 - 保持更新,努力学习 - python脚本学习 二叉树的最大深度 解题思路 这道题要求计算二叉树的最大深度,即从根节点到最远叶子节点的最长路径上的节点数。可以使用递归或迭代方法解决: 递归法(推荐)&#…...
AIOps 工具介绍
AIOps(智能运维)是通过人工智能技术优化IT运维流程的实践,其核心在于利用机器学习、大数据分析等技术实现运维自动化与智能化。以下从定义、核心价值、技术架构及工具等方面展开说明: 一、AIOps的定义与核心价值 AIOps࿰…...
4.3【LLaMA-Factory实战】教育大模型:个性化学习路径生成系统全解析
【LLaMA-Factory实战】教育大模型:个性化学习路径生成系统全解析 一、引言 在教育领域,传统"一刀切"的教学模式难以满足学生的个性化需求。本文基于LLaMA-Factory框架,详细介绍如何构建一个个性化学习路径生成系统,包…...
如何构建容器镜像并将其推送到极狐GitLab容器镜像库?
极狐GitLab 是 GitLab 在中国的发行版,关于中文参考文档和资料有: 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 构建容器镜像并将其推送到容器镜像库 (BASIC ALL) 在构建和推送容器镜像之前,您必须通过容器镜像库的身份验证。 …...
雷赛伺服L7-EC
1电子齿轮比: 电机圈脉冲1万 (pa11的值 x 4倍频) 2电机刚性: pa003 或者 0x2003 // 立即生效的 3LED显示: PA5.28 1 电机速度 4精度: PA14 //默认30,超过3圈er18…...
爬虫学习————开始
🌿自动化的思想 任何领域的发展原因————“不断追求生产方式的改革,即使得付出与耗费精力越来愈少,而收获最大化”。由此,创造出方法和设备来提升效率。 如新闻的5W原则直接让思考过程规范化、流程化。或者前端框架/后端轮子的…...
Shell 脚本编程详细指南:第五章 - 函数与参数传递
Shell 脚本编程详细指南:第五章 - 函数与参数传递 引言:函数在脚本工程化中的核心价值 函数是Shell脚本实现模块化编程的基石。本章将深入解析函数编程的各个方面,从基础定义到高级应用,助您构建可维护、可重用的脚本架构。我们…...
使用 docker 安装 nacos3.x
一、安装 nacos 1.拉取镜像 使用如下指令拉取镜像 docker pull nacos/nacos-server 拉取完成后,可以使用以下命令查看是否拉取到对应的镜像,默认拉取最新镜像 docker images 2.新建挂载文件目录 mkdir -p /home/ubuntu/nacos/conf/mkdir -p /home/…...
Docker的基础操作
docker是一个用Go语言实现的开源项目,可以让我们方便的创建和使用容器,docker将程序以及程序所有的依赖都打包到docker container,这样你的程序可以在任何环境都会有一致的表现,这里程序运行的依赖也就是容器就好比集装箱…...
权限控制模型全解析:RBAC、ACL、ABAC 与现代混合方案
权限控制模型全解析:RBAC、ACL、ABAC 与现代混合方案 在企业信息系统、SaaS 应用、安全平台中,权限控制模型是确保用户访问安全和功能隔离的基础架构设计之一。本文将系统性梳理常见的权限控制模型,包括 RBAC、ACL、ABAC、DAC、MAC、ReBAC 等…...
内存安全革命:工具、AI 与政策驱动的 C 语言转型之路
引言 在 CVE-2025-21298 等高危漏洞频发的背景下,内存安全已成为全球软件产业的核心议题。根据 CISA 最新数据,2024 年全球 72% 的网络攻击源于内存安全漏洞,而 C/C 代码贡献了其中 89% 的风险。这一严峻现实催生了技术革新的三重浪潮&#…...
电厂数据库未来趋势:时序数据库 + AI 驱动的自优化系统
在电力行业加速数字化与智能化转型的进程中,电厂数据库作为数据管理与应用的核心枢纽,正经历着深刻变革。时序数据库与 AI 技术的融合,正催生一种全新的自优化系统,为电厂设备全生命周期管理带来前所未有的效能提升与创新机遇。这…...
stm32 debug卡在0x1FFFxxxx
自己画的一个四轴飞机电路板,之前还能debug,改了一下mos管两端的电阻,还能正常下载,蓝牙接收也正常,但是debug出问题了,刚下载就自动运行,然后程序就在0x1FFFxxxx附近循环运行,这一块…...
什么是AI写作
一、AI写作简介 AI 写作正在成为未来 10 年最炙手可热的超级技能。已经有越来越多的人通过 AI 写作,在自媒体、公文写作、商业策划等领域实现了提效,甚至产生了变现收益。 掌握 AI 写作技能,不仅能提高个人生产力,还可能在未来的 …...
港大今年开源了哪些SLAM算法?
过去的5个月,香港大学 MaRS 实验室陆续开源了四套面向无人机的在线 SLAM 框架:**FAST-LIVO2 、Point-LIO(grid-map 分支) 、Voxel-SLAM 、Swarm-LIO2 **。这四套框架覆盖了单机三传感器融合、高带宽高速机动、长时间多级地图优化以…...
PostgreSQL 表空间占用分析与执行计划详解
PostgreSQL 表空间占用分析与执行计划详解 引言 在数据库管理和优化中,了解表占用的空间大小以及查询的执行计划是至关重要的。本文将详细介绍如何在 PostgreSQL 中查看普通表和分区表的空间占用情况,以及如何分析和解读执行计划。 一、查看表空间占用 …...
robotframe启动ride.py
我的双击ride.py会自动用pycharm打开,变成代码文件 解决方法:定位到ride.py所在文件夹(在anaconda的scripts里面),文件夹上方输入cmd 再输入该命令即可...
通过Linux系统服务管理IoTDB集群的高效方法
IoTDB是一款专为工业物联网领域设计的高性能时间序列数据库。在生产环境中,确保IoTDB集群的稳定运行至关重要。本文将介绍如何利用Linux系统服务来管理IoTDB集群,以实现高效的启动、监控和自动重启。 一、基本配置与环境需求 为了解决传统IoTDB启动方式…...
机器学习-数据集划分和特征工程
一.数据集划分 API函数: sklearn.model_selection.train_test_split(*arrays,**options) 参数: - arrays:多个数组,可以是列表,numpy数组,也可以是dataframe数据框等 - options:&…...