当前位置: 首页 > news >正文

AI与自然语言处理(NLP):从BERT到GPT的演进

AI与自然语言处理(NLP):从BERT到GPT的演进

系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu

文章目录

  • AI与自然语言处理(NLP):从BERT到GPT的演进
    • 摘要
    • 引言
    • 技术架构演进:从Transformer到千亿参数模型
      • 1. Transformer双分支技术路线
      • 2. 模型参数竞赛:从亿级到万亿级
    • 训练范式创新:从无监督到自监督
      • 1. BERT:自编码预训练范式
      • 2. GPT:自回归预训练范式
      • 3. 训练数据与算力消耗对比
    • 应用场景拓展:从工具到伙伴
      • 1. 垂直领域落地:智能客服与文档分析
      • 2. 通用智能探索:代码生成与多模态对话
      • 3. 商业化路径对比
    • 关键挑战与突破方向
      • 1. 技术瓶颈
      • 2. 伦理与法律
      • 3. 成本控制竞赛
    • 未来展望
    • 结论

摘要

自然语言处理(NLP)作为人工智能核心领域,正经历从“规则驱动”到“数据驱动”再到“认知智能”的范式跃迁。本文以BERT(2018)与GPT(2018-2023)两大技术流派为脉络,系统梳理预训练语言模型(PLM)在架构创新、训练范式、应用场景及产业生态中的演进路径。通过对比Transformer双分支技术路线(自编码vs自回归)、千亿参数模型竞赛、多模态融合趋势及商业化落地挑战,揭示NLP技术从“理解语言”到“生成世界”的底层逻辑,为AI从业者提供技术演进全景图谱。
在这里插入图片描述


引言

根据斯坦福大学《2023 AI Index Report》,NLP领域论文占比从2010年的8%跃升至2022年的27%,预训练模型参数规模年均增长4.2倍。技术突破呈现两大特征:

  • 模型规模:从BERT的3.4亿参数跃升至GPT-4的1.8万亿参数
  • 能力边界:从文本分类、机器翻译拓展至代码生成、数学推理、跨模态对话

本文通过以下维度展开对比分析:

  1. 技术架构:Transformer双分支(BERT vs GPT)的底层差异
  2. 训练范式:自编码与自回归的路径选择
  3. 应用场景:从垂直领域到通用智能的商业化路径
  4. 产业生态:开源社区与商业巨头的博弈格局

技术架构演进:从Transformer到千亿参数模型

1. Transformer双分支技术路线

Transformer架构
自编码分支: BERT
自回归分支: GPT
双向掩码语言模型
MLM任务+NSP任务
单向自回归生成
因果掩码+语言建模
  • BERT分支(2018)

    • 核心创新:引入双向Transformer编码器,通过“掩码语言模型”(MLM)任务预训练,实现上下文语义融合。
    • 技术参数:Base版1.1亿参数,Large版3.4亿参数,使用BooksCorpus+Wikipedia(16GB)数据集。
    • 应用突破:在GLUE基准测试中,将文本分类准确率提升至86.7%,超越人类平均水平(86.4%)。
  • GPT分支(2018-2023)

    • GPT-1(2018):1.17亿参数,单向Transformer解码器,首创“预训练+微调”范式。
    • GPT-2(2019):15亿参数,引入“零样本学习”(Zero-Shot),实现无需标注数据的文本生成。
    • GPT-3(2020):1750亿参数,采用“上下文学习”(In-Context Learning),通过提示工程(Prompt Engineering)实现任务泛化。
    • GPT-4(2023):1.8万亿参数,支持多模态输入(文本+图像),在律师资格考试中超越90%人类考生。

2. 模型参数竞赛:从亿级到万亿级

# 模型参数规模增长曲线(模拟代码)
import matplotlib.pyplot as plt
years = [2018, 2019, 2020, 2021, 2022, 2023]
params = [340e6, 1.5e9, 175e9, 530e9, 1.1e12, 1.8e12]
plt.plot(years, params, marker='o')
plt.xlabel('Year')
plt.ylabel('Parameters')
plt.title('NLP Model Parameter Growth')
plt.show()
  • 参数增长驱动因素

    • 数据规模:Common Crawl数据从GPT-2的40GB扩展至GPT-4的45TB
    • 算力突破:单卡训练从V100(32GB)升级至H100(80GB),集群规模达10万卡级
    • 算法优化:混合精度训练、张量并行、梯度检查点等技术降低显存需求
  • 典型模型对比

    模型参数规模训练数据量预训练任务
    BERT-Large3.4亿16GBMLM+NSP
    T5-11B110亿750GB文本到文本统一框架
    GPT-31750亿45TB语言建模+上下文学习
    PaLM-540B5400亿7800亿词路径注意力机制
    GPT-41.8万亿13万亿词多模态对齐

训练范式创新:从无监督到自监督

1. BERT:自编码预训练范式

文本数据 掩码处理 双向编码器 分类头 随机遮盖15%token 输入完整上下文 输出掩码token预测 最小化交叉熵损失 文本数据 掩码处理 双向编码器 分类头
  • 技术特点
    • 双向上下文建模:突破传统LSTM单向限制,实现跨句语义融合
    • 任务适配性:通过微调适配文本分类、问答、命名实体识别等10+NLP任务
    • 局限性:生成能力弱,需额外解码器模块

2. GPT:自回归预训练范式

# GPT-3因果掩码机制示例
def causal_mask(tokens, seq_len):mask = torch.triu(torch.ones(seq_len, seq_len), diagonal=1)return mask.to(tokens.device)# 训练过程
for batch in dataloader:inputs = batch['text']targets = inputs[:, 1:]  # 左移一位作为目标mask = causal_mask(inputs, len(inputs[0]))outputs = model(inputs, attention_mask=mask)loss = criterion(outputs, targets)
  • 技术突破
    • 零样本/少样本学习:通过提示工程(Prompt Engineering)实现任务泛化
    • 上下文学习:模型通过示例理解任务需求,无需参数更新
    • 指令遵循:GPT-4在1200+任务指令上达到人类水平

3. 训练数据与算力消耗对比

模型预训练数据量训练成本(估算)碳足迹(吨CO₂)
BERT16GB$60万140
GPT-345TB$1200万2840
PaLM7800亿词$9000万3400
GPT-413万亿词$1亿+5520

应用场景拓展:从工具到伙伴

1. 垂直领域落地:智能客服与文档分析

  • 典型案例

    • 招商银行:基于BERT的智能客服系统,问答准确率提升至92%,工单处理效率提高40%
    • Salesforce Einstein:集成GPT-3的合同审查工具,条款提取速度提升10倍,错误率降低至1.2%
  • 技术挑战

    • 领域适应:金融术语、医疗术语等垂直领域数据稀缺
    • 可解释性:黑箱模型导致决策过程难以审计

2. 通用智能探索:代码生成与多模态对话

  • GitHub Copilot:基于Codex(GPT-3变体)的代码补全工具,生成代码采纳率达46%,开发效率提升55%
  • GPT-4V:支持图像输入的对话系统,在医学影像诊断中达到专家级水平(AUC=0.92)
  • DALL·E 3:文本到图像生成模型,分辨率达2048×2048,艺术风格迁移准确率98%

3. 商业化路径对比

企业核心产品定价模式客户规模
OpenAIChatGPT Plus$20/月1亿+用户
百度文心一言企业API调用收费50万+开发者
谷歌Bard免费+广告8000万用户
微软Copilot Studio按订阅席位收费10万+企业

关键挑战与突破方向

1. 技术瓶颈

  • 长文本处理:BERT的512 token限制与GPT的2048 token限制,导致长文档分析困难
  • 事实一致性:大模型生成内容存在“幻觉”问题(Hallucination),事实错误率高达15%
  • 能源消耗:GPT-4训练一次消耗1287兆瓦时电力,相当于3000户家庭年用电量

2. 伦理与法律

  • 版权争议:训练数据中未经授权的版权内容占比达30%(斯坦福研究)
  • 偏见与歧视:模型在职业推荐中存在性别偏见(女性工程师推荐率低于男性23%)
  • 监管政策:欧盟《AI法案》将GPT-4列为高风险系统,要求透明度报告与风险评估

3. 成本控制竞赛

优化方向典型技术降本幅度
模型压缩量化、剪枝、知识蒸馏5-10倍
硬件加速定制化AI芯片(如TPU、昇腾)3-5倍
算法创新混合专家模型(MoE)2-3倍
数据效率合成数据生成、主动学习40%数据量

未来展望

  1. 技术融合

    • 多模态大模型:GPT-5将整合语音、视频、3D点云输入,实现跨模态理解
    • 具身智能:结合机器人控制,实现“语言-动作”对齐(如谷歌SayCan项目)
  2. 应用场景

    • 教育领域:个性化学习助手,实现动态课程生成与认知诊断
    • 医疗领域:电子病历分析、药物研发、手术机器人协同
    • 工业领域:故障预测、工艺优化、数字孪生
  3. 产业生态

    • 开源社区:Meta Llama 3、Mistral等模型推动技术普惠
    • 商业巨头:OpenAI估值达800亿美元,微软AI业务年收入突破200亿美元
    • 国家战略:中国“东数西算”工程布局AI算力网络,美国《芯片与科学法案》投资520亿美元

结论

NLP技术的演进史,本质是“数据-算法-算力”三角关系的动态平衡。BERT与GPT两大流派分别代表“理解优先”与“生成优先”的技术哲学,其竞争推动模型参数从亿级跃升至万亿级,应用场景从工具型AI向认知型AI转型。随着稀疏激活、量子计算、神经符号融合等技术的突破,2025-2030年或迎来通用人工智能(AGI)的曙光。最终胜出者需在技术深度、商业闭环、伦理合规间构建护城河,而这场竞赛将重新定义人类与机器的协作边界。

相关文章:

AI与自然语言处理(NLP):从BERT到GPT的演进

AI与自然语言处理(NLP):从BERT到GPT的演进 系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu 文章目录 AI与自然语言处理(NLP):从BERT到GPT的演进摘要引言…...

TRO高能预警,Keith律所×Tane Hannah Meets版权两案王炸维权

紧急避雷贴,keith律所代理Tane Hannah Meets 10个版权连发两案突袭跨境圈!案件详情如下: 案件基本情况: 起诉时间:2025-5-8 案件号:25-cv-05079、25-cv-05088 品牌:Tane Meets Works 原告&…...

在 Spring Boot 中选择合适的 HTTP 客户端

在现代的 Spring Boot 应用程序中,与外部服务进行 HTTP 通信是一个常见的需求。Spring Boot 提供了多种方式来实现 HTTP 请求,包括 Java 的 HttpClient、Spring 的 RestTemplate、WebClient,以及第三方库如 Apache HttpClient。本文将详细介绍…...

Go语言中 源文件开头的 // +build 注释的用法

// build注释主要用于实现条件编译。借助设置不同的构建标签(build tags),我们能够指定在特定的操作系统、架构或者其他自定义条件下才编译某个文件 1、基本规则 格式要求: 这种注释必须出现在文件的开头部分。注释与包声明之间至…...

C++八股 —— map/unordered_map

1. 底层数据结构 map —— 红黑树 随处可见的红黑树:原理、实现及应用场景 - 知乎 unordered_map —— 散列表 [C] 哈希表(散列表)详解_c哈希表-CSDN博客 2. 常见面试题 底层为红黑树的容器有哪些 mapmultimapsetmultiset 红黑树和AVL树…...

PostgreSQL创建只读账号

环境说明 部署环境:linux服务器docker容器部署 数据库:PostgreSQL 成果 只读账号/密码:read_only/xxx123 授权可读库:xxx、xxxdata 操作过程 #进入PostgreSQL容器(如果你没有用docker容器忽略这一步就可以了&#xff…...

DVWA靶场保姆级通关教程--06不安全验证机制

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 目录 文章目录 前言 原理详解 1. 前后端验证逻辑不一致 2. 验证码值保存在客户端 3. 验证码可预测或重复 4. 验证码验证与逻辑解耦 一、处理关卡报错 二、low级别源…...

【日撸 Java 三百行】Day 7(Java的数组与矩阵元素相加)

目录 Day 7:Java 的数组与矩阵元素相加 一、基本知识 二、矩阵的建立与基本计算 三、代码及测试 拓展:Arrays类详解 小结 Day 7:Java 的数组与矩阵元素相加 Task: 矩阵的赋值.二重循环. 一、基本知识 在学习 Java 中的数组与矩…...

【递归、搜索和回溯】递归、搜索和回溯介绍及递归类算法例题

个人主页 : zxctscl 专栏 【C】、 【C语言】、 【Linux】、 【数据结构】、 【算法】 如有转载请先通知 文章目录 递归、搜索和回溯递归搜索VS 深度优先遍历 VS 深度优先搜索 VS 宽度优先遍历 VS 宽度优先搜索 VS 暴搜回溯与剪枝 1 面试题 08.06. 汉诺塔问题1.1 分析…...

2025最新精选5款3DMAX建筑可视化插件

在3DMAX建筑可视化领域,各类工具如同繁星般璀璨,它们为设计师们搭建起通往理想作品的桥梁。今天,就让我们一同走进几款极具特色的工具——RetailStore插件、2Dto3D插件、DrawFloorPlan插件、MaxToCAD插件以及EXR透视贴图技术,探寻…...

麒麟系统使用-个性化设置

文章目录 前言一、个性化设置-背景二、个性化设置-主题三、个性化设置-锁屏四、个性化设置-屏保五、个性化设置-字体总结 前言 与windows系统相比,麒麟系统中的个性化设置大体相似,在细节上稍有不同。本文将讲述麒麟系统中的个性化设置中的各个模块。 一…...

flask开启https服务支持

目录 一、背景 二、开启https支持 三、自签名 1、安装openssl 2、验证安装 3、自签名 四、编写代码 五、访问https接口 一、背景 最近在做自动化业务,需要兼容现在主流的框架开发的前端页面,于是到github找到了几个项目,clone下来项目并…...

CNN处理图片

In [5]: 123456789101112131415161718192021222324252627282930313233import tensorflow as tf​import matplotlib.pyplot as plt​import numpy as np​​​​# 平滑均值滤波#KaTeX parse error: Expected EOF, got _ at position 14: \text {filter_̲{arg}np.}.full (sha…...

【Bootstrap V4系列】学习入门教程之 组件-表单(Forms)

Bootstrap V4系列 学习入门教程之 组件-表单(Forms) 表单(Forms)一、Overview二、Form controls 表单控件2.1 Sizing 尺寸2.2 Readonly 只读2.3 Readonly plain text 只读纯文本 三、Checkboxes and radios 复选框和单选框3.1 Def…...

图像来源:基于协同推理的双视角超声造影分类隐式数据增强方法|文献速递-深度学习医疗AI最新文献

Title 题目 Image by co-reasoning: A collaborative reasoning-based implicit data augmentation method for dual-view CEUS classification 图像来源:基于协同推理的双视角超声造影分类隐式数据增强方法 01 文献速递介绍 结合了B型超声(BUS&…...

MySQL性能分析工具:SHOW PROCESSLIST

概述 以下是一份详细的 MySQL SHOW PROCESSLIST 使用教程,帮助您监控和分析数据库当前活动,快速定位性能问题资料已经分类整理好,喜欢的朋友自取:https://pan.quark.cn/s/f52968c518d3 1. 命令基本作用 SHOW PROCESSLIST 显示当…...

Linux网络编程day8本地套接字

本地套接字 利用cs模型实现本地套接字完成进程间通信 对比网络编程TCP C/S模型,注意以下几点 1、int socket(int domain, int type, int protocol); domain-->AF_INET改为AF_UNIX , type都可写SOCK_STREAM/SOCK_DGRAM2、地址结构 sockaddr_in -->sockadd…...

使用 React Native实现鸿蒙开发的详细方案

一、环境准备 1. 基础环境要求 操作系统:Windows 10/11 或 macOS (建议版本最新)Node.js: v16.x 或更高版本npm: v8.x 或更高版本Java JDK: 11 或更高版本DevEco Studio: 3.1 或更高版本 (鸿蒙官方IDE)2. 安装 DevEco Studio 从华为开发者官网下载安装时选择以下组件: Harmo…...

WebRTC流媒体传输协议RTP点到点传输协议介绍,WebRTC为什么使用RTP协议传输音视频流?

通过上一章《WebRTC工作原理详细介绍、WebRTC信令交互过程和WebRTC流媒体传输协议介绍》,我们知道WEBRTC在完成 SDP 协商和 ICE 候选交换信令后,双方就可以建立 RTP 流,开始传输音视频数据,这时,RTP 数据包就通过在 IC…...

【Unity笔记】PathCreator使用教程:用PathCreator实现自定义轨迹动画与路径控制

在Unity开发过程中,角色移动、摄像机动画、轨道系统、AI巡逻等功能中,路径控制是常见又复杂的需求之一。如何优雅、高效地创建路径并控制对象沿路径运动,是游戏开发、动画制作乃至工业仿真中的关键问题。 在这篇文章中,我将介绍一…...

生产安全管理系统标杆

生产安全不容小视,防患于未然是企业安全生产的基石。好的安全预防系统能让隐患产生最初就被扼杀在摇篮里。国内一些好的生产安全防范系统也有很多,今天我们主要介绍一下众联心安这款产品。 安全生产管理,目标制度管理,风险隐患管理,应急安全管理,设备设…...

temu采购自养号全流程解析:从账号搭建到安全下单的技术闭环

temu 自养号采购下单技术是一个精细的过程,需要从多个方面进行考虑和操作,其核心在于通过技术手段模拟真实用户行为,构建独立、安全的账号环境以确保账号的安全性、真实性和采购下单的成功率。以下是对该技术的详细解析 1. 账号准备 手机号…...

MySQl 数据库操作

目录 一、MySQL 数据库介绍 二、MySQl 库操作 1. 系统数据库 2. 数据库操作 (1)创建数据库 (2)数据库命名规则 (3)选择数据库 (4)查看数据库 (5)删除…...

OpenHarmony launcher开发——删除dock栏

开发环境 OpenHarmony 5.0.0 代码修改 效果...

zst-2001 历年真题 设计模式

设计模式 - 第1题 a 设计模式 - 第2题 一个产品可以产生多个就是抽象,一个就是工厂 比如这样 第二题a是意图 bc: d 设计模式 - 第3题 b 设计模式 - 第4题 类图里全是builder,疯狂暗示 设计模式 - 第5题 aa 设计模式 - 第6题 只有工厂方法是创…...

Vue3 + Element Plus 动态表单实现

完整代码 <template><div class"dynamic-form-container"><el-formref"dynamicFormRef":model"formData":rules"formRules"label-width"auto"label-position"top"v-loading"loading"&g…...

QML AnimatedImage组件详解

目录 引言相关阅读基础知识&#xff1a;AnimatedImage核心属性与方法工程结构与示例展示工程结构示例1&#xff1a;可控制播放/暂停的AnimatedImage示例2&#xff1a;带进度条的AnimatedImage主界面整合&#xff08;SwipeView滑动展示&#xff09; 总结下载链接 引言 在UI开发…...

Ascend的aclgraph(2)_npu_backend中还有些什么秘密?

1 _npu_backend 文章还是从代码开始 import torch_npu, torchair config torchair.CompilerConfig() # 设置图下沉执行模式 config.mode "reduce-overhead" npu_backend torchair.get_npu_backend(compiler_configconfig) opt_model torch.compile(model, back…...

免布线视频桩:智慧城市停车降本增效的破局利器

在智慧城市建设的进程中&#xff0c;传统停车管理面临成本高、效率低、施工复杂等难题。而视频桩作为创新解决方案&#xff0c;以“免布线、智能化”为核心&#xff0c;正逐步改变这一局面。视频桩通过融合物联网与AI技术&#xff0c;实现自动化监测与数据实时管理&#xff0c;…...

Vulfocus靶场-文件上传-2

monstra 文件上传 &#xff08;CVE-2020-13384&#xff09; Monstra 是一个现代化的轻量级内容管理系统。它易于安装、升级和使用。 Monstra CMS 3.0.4版本中存在着一处安全漏洞&#xff0c;该漏洞源于程序没有正确验证文件扩展名。攻击者可以上传特殊后缀的文件执行任意PHP代…...

nvidia-smi 和 nvcc -V 作用分别是什么?

命令1&#xff1a;nvidia-smi 可以查看当前显卡的驱动版本&#xff0c;以及该驱动支持的CUDA版本。 命令2&#xff1a;nvcc -V 可以看到实际安装的CUDA工具包版本为 12.8 更详细的介绍&#xff0c;可以参考如下链接...

力扣刷题(第二十一天)

灵感来源 - 保持更新&#xff0c;努力学习 - python脚本学习 二叉树的最大深度 解题思路 这道题要求计算二叉树的最大深度&#xff0c;即从根节点到最远叶子节点的最长路径上的节点数。可以使用递归或迭代方法解决&#xff1a; 递归法&#xff08;推荐&#xff09;&#…...

AIOps 工具介绍

AIOps&#xff08;智能运维&#xff09;是通过人工智能技术优化IT运维流程的实践&#xff0c;其核心在于利用机器学习、大数据分析等技术实现运维自动化与智能化。以下从定义、核心价值、技术架构及工具等方面展开说明&#xff1a; 一、AIOps的定义与核心价值 AIOps&#xff0…...

4.3【LLaMA-Factory实战】教育大模型:个性化学习路径生成系统全解析

【LLaMA-Factory实战】教育大模型&#xff1a;个性化学习路径生成系统全解析 一、引言 在教育领域&#xff0c;传统"一刀切"的教学模式难以满足学生的个性化需求。本文基于LLaMA-Factory框架&#xff0c;详细介绍如何构建一个个性化学习路径生成系统&#xff0c;包…...

如何构建容器镜像并将其推送到极狐GitLab容器镜像库?

极狐GitLab 是 GitLab 在中国的发行版&#xff0c;关于中文参考文档和资料有&#xff1a; 极狐GitLab 中文文档极狐GitLab 中文论坛极狐GitLab 官网 构建容器镜像并将其推送到容器镜像库 (BASIC ALL) 在构建和推送容器镜像之前&#xff0c;您必须通过容器镜像库的身份验证。 …...

雷赛伺服L7-EC

1电子齿轮比&#xff1a; 电机圈脉冲1万 &#xff08;pa11的值 x 4倍频&#xff09; 2电机刚性&#xff1a; pa003 或者 0x2003 // 立即生效的 3LED显示&#xff1a; PA5.28 1 电机速度 4精度&#xff1a; PA14 //默认30&#xff0c;超过3圈er18…...

爬虫学习————开始

&#x1f33f;自动化的思想 任何领域的发展原因————“不断追求生产方式的改革&#xff0c;即使得付出与耗费精力越来愈少&#xff0c;而收获最大化”。由此&#xff0c;创造出方法和设备来提升效率。 如新闻的5W原则直接让思考过程规范化、流程化。或者前端框架/后端轮子的…...

Shell 脚本编程详细指南:第五章 - 函数与参数传递

Shell 脚本编程详细指南&#xff1a;第五章 - 函数与参数传递 引言&#xff1a;函数在脚本工程化中的核心价值 函数是Shell脚本实现模块化编程的基石。本章将深入解析函数编程的各个方面&#xff0c;从基础定义到高级应用&#xff0c;助您构建可维护、可重用的脚本架构。我们…...

使用 docker 安装 nacos3.x

一、安装 nacos 1.拉取镜像 使用如下指令拉取镜像 docker pull nacos/nacos-server 拉取完成后&#xff0c;可以使用以下命令查看是否拉取到对应的镜像&#xff0c;默认拉取最新镜像 docker images 2.新建挂载文件目录 mkdir -p /home/ubuntu/nacos/conf/mkdir -p /home/…...

Docker的基础操作

docker是一个用Go语言实现的开源项目&#xff0c;可以让我们方便的创建和使用容器&#xff0c;docker将程序以及程序所有的依赖都打包到docker container&#xff0c;这样你的程序可以在任何环境都会有一致的表现&#xff0c;这里程序运行的依赖也就是容器就好比集装箱&#xf…...

权限控制模型全解析:RBAC、ACL、ABAC 与现代混合方案

权限控制模型全解析&#xff1a;RBAC、ACL、ABAC 与现代混合方案 在企业信息系统、SaaS 应用、安全平台中&#xff0c;权限控制模型是确保用户访问安全和功能隔离的基础架构设计之一。本文将系统性梳理常见的权限控制模型&#xff0c;包括 RBAC、ACL、ABAC、DAC、MAC、ReBAC 等…...

内存安全革命:工具、AI 与政策驱动的 C 语言转型之路

引言 在 CVE-2025-21298 等高危漏洞频发的背景下&#xff0c;内存安全已成为全球软件产业的核心议题。根据 CISA 最新数据&#xff0c;2024 年全球 72% 的网络攻击源于内存安全漏洞&#xff0c;而 C/C 代码贡献了其中 89% 的风险。这一严峻现实催生了技术革新的三重浪潮&#…...

电厂数据库未来趋势:时序数据库 + AI 驱动的自优化系统

在电力行业加速数字化与智能化转型的进程中&#xff0c;电厂数据库作为数据管理与应用的核心枢纽&#xff0c;正经历着深刻变革。时序数据库与 AI 技术的融合&#xff0c;正催生一种全新的自优化系统&#xff0c;为电厂设备全生命周期管理带来前所未有的效能提升与创新机遇。这…...

stm32 debug卡在0x1FFFxxxx

自己画的一个四轴飞机电路板&#xff0c;之前还能debug&#xff0c;改了一下mos管两端的电阻&#xff0c;还能正常下载&#xff0c;蓝牙接收也正常&#xff0c;但是debug出问题了&#xff0c;刚下载就自动运行&#xff0c;然后程序就在0x1FFFxxxx附近循环运行&#xff0c;这一块…...

什么是AI写作

一、AI写作简介 AI 写作正在成为未来 10 年最炙手可热的超级技能。已经有越来越多的人通过 AI 写作&#xff0c;在自媒体、公文写作、商业策划等领域实现了提效&#xff0c;甚至产生了变现收益。 掌握 AI 写作技能&#xff0c;不仅能提高个人生产力&#xff0c;还可能在未来的 …...

港大今年开源了哪些SLAM算法?

过去的5个月&#xff0c;香港大学 MaRS 实验室陆续开源了四套面向无人机的在线 SLAM 框架&#xff1a;**FAST-LIVO2 、Point-LIO&#xff08;grid-map 分支&#xff09; 、Voxel-SLAM 、Swarm-LIO2 **。这四套框架覆盖了单机三传感器融合、高带宽高速机动、长时间多级地图优化以…...

PostgreSQL 表空间占用分析与执行计划详解

PostgreSQL 表空间占用分析与执行计划详解 引言 在数据库管理和优化中&#xff0c;了解表占用的空间大小以及查询的执行计划是至关重要的。本文将详细介绍如何在 PostgreSQL 中查看普通表和分区表的空间占用情况&#xff0c;以及如何分析和解读执行计划。 一、查看表空间占用 …...

robotframe启动ride.py

我的双击ride.py会自动用pycharm打开&#xff0c;变成代码文件 解决方法&#xff1a;定位到ride.py所在文件夹&#xff08;在anaconda的scripts里面&#xff09;&#xff0c;文件夹上方输入cmd 再输入该命令即可...

通过Linux系统服务管理IoTDB集群的高效方法

IoTDB是一款专为工业物联网领域设计的高性能时间序列数据库。在生产环境中&#xff0c;确保IoTDB集群的稳定运行至关重要。本文将介绍如何利用Linux系统服务来管理IoTDB集群&#xff0c;以实现高效的启动、监控和自动重启。 一、基本配置与环境需求 为了解决传统IoTDB启动方式…...

机器学习-数据集划分和特征工程

一.数据集划分 API函数&#xff1a; sklearn.model_selection.train_test_split(*arrays&#xff0c;**options) 参数&#xff1a; - arrays&#xff1a;多个数组&#xff0c;可以是列表&#xff0c;numpy数组&#xff0c;也可以是dataframe数据框等 - options&#xff1a;&…...