GTC2025——英伟达布局推理领域加速
英伟达GTC2025大会于今年3月18日举行,会上NVIDIA CEO黄仁勋展示了其过去所取得的成就,以及未来的布局目标——通过纵向扩展(scale out)和横向扩展(scale up)解决终极的计算问题——推理。本文将回顾NVIDIA在近年来的多项成就,并结合GTC2025大会上黄仁勋主题演讲的内容,解析英伟达最新的技术动态,并分析当前硬件行业开发者的挑战与机遇。
一、GTC会议介绍
GTC会议,全称GPU Technology Conference(GPU技术大会),是由NVIDIA主办的全球顶级科技开发者盛会。GTC最早于2009年举办,每年一届,已成为GPU计算、人工智能(AI)、深度学习、高性能计算、自动驾驶、数据中心、工业仿真、图形渲染、边缘计算以及元宇宙等相关领域前沿技术的重要发布和交流平台。
近十年来,GTC大会持续聚焦于AI算力的竞赛与全球技术布局。自2017年推出集成Tensor Core的Volta架构以来,英伟达正式开启了AI专用计算新时代,GPU在深度学习、AI训练及推理加速中的优势日益凸显。自2022年起,黄仁勋在GTC大会上接连发布了H100(Hopper)、GH200(Grace Hopper超级芯片)、B100/B200(Blackwell)等重磅产品,并围绕自动驾驶(Orin平台)、智能生物医疗(Clara平台)、元宇宙协作(Omniverse平台)、生成式AI等前沿行业应用展开主题阐述,进一步巩固了NVIDIA在全球AI训练领域无可撼动的领先地位。
GTC2025于2025年3月17日至21日在美国加利福尼亚州圣何塞的McEnery会议中心隆重举行。黄仁勋在Keynote演讲中将GTC从"AI行业的伍德斯托克摇滚音乐节"的比喻升级为"AI行业的超级碗",反映了该会议在全球科技领域的重要地位。本届大会包含超过1,000场专题演讲,邀请了2,000位演讲嘉宾,近400家企业参展,涵盖的track极为广泛,包含1)具身AI与机器人;2)Agentic AI;3)量子计算;4)数字中心与云基础设施;5)生成式AI应用;6)科学计算与模拟;7)OpenUSD与数字孪生;8)自动驾驶与交通技术;9)网络安全;10)企业生产力与自动化等等主题。
图1 GTC2025在美国加州圣何塞举行
黄仁勋认为,AI正在经历三个发展阶段,生成式AI->代理AI->具身AI,目前AI已进入代理AI阶段,这一阶段的特点是AI系统能够自主规划、推理并完成复杂任务。黄仁勋强调,业界此前对AI算力需求增长放缓的判断是错误的,尤其是针对中国DeepSeek开发的能在较少芯片上运行的新AI模型的说法。算力市场需求仍然强劲,机器人、智能驾驶等落地应用场景火热增长。然而推理和训练的需求很不同,主题演讲中多次提及Agentic AI与推理,并强调了推理能力在端侧的重要性:“训练在乎的是时间,推理在乎的是成本”。本文将从“推理”出发,围绕黄仁勋在GTC2025的主题演讲展开讨论。
图2 GTC2025黄仁勋主题演讲现场
二、关键技术概述
黄仁勋将如今的大模型厂商比作一个AI工厂,它原材料是GPU和电力,产品是token。传统的逻辑推理大模型推理相比于传统大模型带来了更高的token要求:用户希望更快、更廉价的token,可以在相比以往成本几乎不变的前提下更好地解决问题;企业希望提升token产生的速度,以产生更多的token获取利润。但受限于能源问题,必须提高单位能源下的token产出数量。作为AI工厂设备提供方的NVIDIA为此提出了他们的野心——纵向扩展(scale up)和横向扩展(scale out)。
所谓纵向扩展,就是更强的集中式计算,让一个机架内集成更多的GPU或使其中的GPU具有更强的算力,它解决的是一个机架内的问题;横向扩展就是,让AI工厂内的所有GPU总体的产能最高,它解决的是数据工厂内多个机架沟通的问题。为此,英伟达提出了他们的最新解决方案——Dynamo和CPO。
(一)Dynamo
Dynamo是一个开源的推理服务框架,起到更高层次的、专门为大规模AI工作负载设计的运行时和编排管理系统。它是英伟达为应对AI规模化时代提出的一个关键软件基础设施组件,可以认为是AI工厂的大脑。Dynamo的核心任务是高效地管理和调度在数千个GPU上运行的复杂和庞大的模型所需的一切资源,是提高现有AI工厂投入产出比、面向未来模型容量更大计算需求更高情形的前瞻性解决方案。主要包括以下功能:
(1)分离式预填充和解码推理:将大型语言模型(LLM)的处理和生成阶段分离到不同的GPU上,从而提高每个GPU的吞吐量。简单来说,就是将任务拆分,让一组GPU处理数据,另一组GPU生成最终输出。
(2)动态GPU调度:根据需求的波动动态调度GPU,以优化性能。
(3)LLM感知请求路由:避免KV缓存的重新计算成本。通过减少不必要的KV缓存重新计算释放GPU资源。
(4)加速异步数据传输:在GPU之间加速异步数据传输,以减少推理响应时间。
(5)KV缓存跨内存层级管理:将KV缓存分布在数千个GPU上,并跨越不同的内存层级进行卸载,以提高系统吞吐量。
(6)智能路由器:在多GPU推理部署中合理分配每个token,确保在预加载和解码阶段均衡负载,避免瓶颈。
(7)GPU规划器:可以自动调整预加载和解码节点,依据日内需求波动动态增加或重新分配GPU资源,进一步实现负载均衡。
(8)改进的NCCL:NCCL的新算法使得小token传输延迟降低4倍,从而显著提高推理吞吐量。
通过上述优化,提升AI工厂单个机架构成的互联系统的产量。作为对比,将传统的管理多服务器的框架Hopper用于GPU最多管理8个,英伟达最新的NV Link技术可以管理72个GPU,并且在Dynamo的加持下,可以更好的在AI工厂和用户间取得平衡(图3高亮处),帮助AI工厂获取利润。
图3 Dynamo效果对比:横轴表示AI响应速度(用户端)、纵轴表示单位功耗下的计算能力(AI工厂端)
(二)CPO
Dynamo是NVIDIA为解决纵向扩展问题的答卷。然而将至数十万个GPU连在一起的挑战在于连接速度。目前单个机架内GPU的连接通常使用铜缆连接,这种方案比较可靠、能效极高、成本极低,速度可达1.8 TB/s,但适用范围仅限一两米以内,并不适用于横向扩展。CPO便是为解决以上问题被提出的。
黄仁勋表示,NVIDIA光子学团队携手产业伙伴推动CPO联合创新,包括首款采用微环谐振器调制器(Micro Ring Modulators,MRM)1.6Tbps硅光CPO芯片,首个采用TSMC制程3D堆叠硅光子引擎,搭载了高输出功率激光器和直连光纤连接器。CPO技术可以取代传统的可插拔光学收发器,使光纤直接连接到交换机,大幅减少数据中心的功耗。据英伟达测算,该技术可降低40MW的功耗,并提高AI计算集群的网络传输效率,为未来超大规模AI数据中心奠定基础。
NVIDIA CPO交换机内部涉及到的技术细节,如图4所示,包括EIC、PIC、3D封装、光耦合可插拔光连接器、光学模组、外置激光器模块、激光器芯片封装、interposer等。对于Quantum-x硅光CPO交换机而言,各组成部分是通过interposer中介实现互联的。除了中间的交换芯片(Quantum-X800 ASIC),周围的chiplet(硅光引擎)均为3D垂直堆叠:这些chiplet上层是EIC——电芯片,下层是PIC(Photonic IC)。
图4 NVIDIA CPO交换机
MRM是CPO的关键技术之一,是一种光调制技术,将电信号转换为光。硅光领域主要有两类调制器:MRM和Mach-Zehnder(MZM)。其中MZM常见于可插拔光收发器,基于这种方案的光通过波导,切分成两个并行的部分,再应用电场去做调制,改变光的相位,然后再结合构成单波导。而MRM则基于环形波导,如果光在环内谐振构成驻波,则会提取出来,过滤出来的波长用于后续处理分析。MRM具备更紧凑的特点,相比MZM的损失也更低;不过通常MRM对温度较为敏感,所以还需要配合更精准的温度控制电路。
基于上述技术,NVIDIA推出Spectrum-X和Quantum-X交换机。其中Spectrum-X以太网平台是专为多租户超大规模AI工厂设计,带宽密度达传统以太网的1.6倍,支持全球最大规模超级计算机。Quantum-X光子InfiniBand平台是基于200Gb/s SerDes技术提供144个800Gb/s端口,采用液冷设计高效冷却硅光模块,AI计算架构速度较前代提升2倍,可扩展性增强5倍。
谈及GPU纵向扩展,笔者还想简单聊聊NVIDIA GPU发展路线图。NVIDIA每年发布一次路线图,每两年推出一种架构,每年推出一个新产品线,并不断在关键技术上取得进步。之前NVIDIA相关产品以Rubin科学家命名,下一代产品将于2028年发布,以Feyman科学家命名。该信息主要为“AI工厂的建设方”服务,作用在于安抚市场信息,巩固自身地位。
图5 英伟达GPU发布时间线
三、挑战与机遇
虽然GTC名为GPU技术大会,但黄仁勋在其主题演讲中多次强调AI工厂的组建成本与潜在收益,凸显了其商业化落地的重要性。CUDA作为并行计算平台与编程模型,高效驱动其GPU硬件,并与Torch、TensorFlow等主流框架深度绑定,共同构筑了英伟达在模型训练领域的坚实护城河,使得AMD、英特尔等传统GPU厂商及其他ASIC设计者难以望其项背。在此基础上,英伟达的战略重心在于,凭借其在模型训练领域的稳固地位,面向逻辑模型日益庞大、token计算需求激增的推理场景,进一步抢占这块新兴市场。
在推理市场,传统GPU厂商如AMD与英特尔,尽管其单颗GPU可能具备有竞争力的算力,却缺乏如NVIDIA NVLink般高效的互联技术,难以构建大规模、高带宽的计算集群。而对于ASIC设计者,其“需求定义先行、定制设计置后”的模式,在模型算法日新月异的背景下,常面临设计刚完成验证即被新模型迭代所超越的风险。
然而,随着模型推理需求的持续演进、神经网络技术的不断突破以及应用场景的日益丰富,其他GPU厂商和ASIC设计者依然拥有突围的机遇。尽管训练市场目前由NVIDIA主导,其CUDA及NVLink的技术壁垒难以轻易逾越,但推理市场不仅规模更为广阔,场景也更趋分散,且对成本和功耗表现得更为敏感。因此,针对特定推理负载优化的ASIC,尤其是在边缘计算和特定云端推理场景中,仍有巨大的市场空间。例如,在超低功耗边缘推理、特定通信算法加速、专用科学计算以及机器人特定感知与控制模块等领域,为特定算法和数据流精心设计的ASIC,依然有机会在性能、功耗与成本的综合表现上取得显著优势。此外,AI技术仍在飞速发展,新的网络模型、算法及计算范式(如神经形态计算、存内计算等)层出不穷,ASIC凭借其架构定制的灵活性,能够更敏捷地针对这些新兴方向进行创新,从而在特定赛道实现“弯道超车”。
参考资料
[1] GTC2025-黄仁勋主题演讲(nvidia.cn)
[2] 硅谷101-“再造一个CUDA”:英伟达的第二护城河与“超级碗”阳谋【深度解析GTC 2025】(bilibili.com)
[3]4个问题快速看懂NVIDIA Photonics硅光芯片:它对Agentic AI很重要?-电子工程专辑
相关文章:
GTC2025——英伟达布局推理领域加速
英伟达GTC2025大会于今年3月18日举行,会上NVIDIA CEO黄仁勋展示了其过去所取得的成就,以及未来的布局目标——通过纵向扩展(scale out)和横向扩展(scale up)解决终极的计算问题——推理。本文将回顾NVIDIA在…...
5.12 note
Leetcode 图 邻接矩阵的dfs遍历 class Solution { private: vector<vector<int>> paths; vector<int> path; void dfs(vector<vector<int>>& graph, int node) { // 到n - 1结点了保存 if (node graph.size() - 1)…...
Java Spring Boot项目目录规范示例
以下是一个典型的 Java Spring Boot 项目目录结构规范示例,结合了分层架构和模块化设计的最佳实践: text 复制 下载 src/ ├── main/ │ ├── java/ │ │ └── com/ │ │ └── example/ │ │ └── myapp/ │…...
记录裁员后的半年前端求职经历
普通的人生终起波澜 去年下半年应该算是我毕业以来发生人生变故最多的一段时间。 先是 7 月份的时候发作了一次急性痛风,一个人在厦门,坐在床上路都走不了,那时候真的好想旁边能有个人能扶我去医院,真的是感受到 10 级的孤独。尝…...
学习黑客BitLocker与TPM详解
BitLocker与TPM详解:数据加密的坚固堡垒 🔐🛡️ 学习目标:掌握BitLocker加密原理、TPM工作机制及其配置方法,提升数据安全防护水平 1. 数据保护的最后防线:BitLocker与TPM简介 💼 在当今世界&a…...
综合实验二之grub2密文加密
实验二、grub2密文加密 Grub2 密文加密的作用: 保护系统安全: 防止未经授权的用户在系统启动时进入 Grub2 菜单,通过修改启动参数来绕过系统的安全机制,进而访问或篡改系统文件和数据。例如,恶意用户可能试图通过修改启…...
【Java学习】Lambda表达式
目录 一、函数式匿名 1.环境确定 2.Lambda部分实现 二、函数式书写 Lambda表达式: 三、函数式接口 1.Consumer行为接口 1.1Lambda匿名实现(核心) 1.2创建使用全过程 1.2.1创建匿名子类实例 1.2.1.1环境确定 1.2.1.2匿名实现 1.2.2向上转型 1.2.3Lamb…...
精益数据分析(55/126):双边市场模式的挑战、策略与创业阶段关联
精益数据分析(55/126):双边市场模式的挑战、策略与创业阶段关联 在创业和数据分析的学习旅程中,我们持续探索不同商业模式的奥秘。今天,依旧怀揣着与大家共同进步的想法,深入研读《精益数据分析》…...
人工智能100问☞第21问:神经网络如何模拟人脑结构?
目录 一、通俗解释 二、专业解析 三、权威参考 神经网络通过分层连接的人工神经元模拟人脑结构,其中输入层接收信号(模拟树突接收信息),隐藏层通过权重调整(模拟突触可塑性)进行特征提取,输出层生成结果(类似轴突传递信号),并利用反向传播机制(类比生物神…...
Vue 3 实现转盘抽奖效果
🎡 使用 Vue 3 实现转盘抽奖效果 在移动端或营销活动中,转盘抽奖是一种非常常见的互动方式。本文基于 Vue 3 TypeScript 实现一个视觉炫酷、逻辑完整的转盘抽奖功能,并支持「指定奖品必中」的逻辑。 iShot_2025-05-12_11.31.27 ᾟ…...
Python 处理图像并生成 JSONL 元数据文件 - 灵活text版本
Python 处理图像并生成 JSONL 元数据文件 - 灵活text版本 flyfish import os import json import argparse from PIL import Image from xpinyin import Pinyinclass ImageConverter:def __init__(self, src_folder, dest_folder, target_size1024, output_format"JPEG&…...
LeRobot 项目部署运行逻辑(七)—— ACT 在 Mobile ALOHA 训练与部署
全部流程为:硬件配置 -> 环境安装 -> 遥操作数据采集 -> 数据集可视化 -> 策略训练 -> 策略评估 在之前的笔记中已经完成了绝大部分,最后再记录一下最后的训练部署,算是最简单的部分了 目录 1 ACT 训练 2 ALOHA 部署 3 更…...
【NextPilot日志移植】ULog
📚 ULog 日志系统详解 关键词:结构化日志、飞行数据记录、自描述格式、嵌入式系统、PX4、NextPilot 🧠 一、ULog 是什么? ULog(Universal Log) 是 PX4/NextPilot 飞控系统中使用的结构化日志格式ÿ…...
扩展:React 项目执行 yarn eject 后的 scripts 目录结构详解
扩展:React 项目执行 yarn eject 后的 scripts 目录结构详解 什么是 yarn eject?scripts 目录结构与说明各脚本说明说明 什么是 yarn eject? yarn eject 是 Create React App(简称 CRA)提供的一条命令,用于…...
Android11.0 framework第三方无源码APP读写断电后数据丢失问题解决
1.前言 在11.0中rom定制化开发中,在某些产品开发中,在某些情况下在App用FileOutputStream读写完毕后,突然断电 会出现写完的数据丢失的问题,接下来就需要分析下关于使用FileOutputStream读写数据的相关流程,来实现相关 功能 2.framework第三方无源码APP读写断电后数据丢…...
多样本整合Banksy空间聚类分析(Visium HD, Xenium, CosMx)
在空间数据分析中,传统的单细胞聚类算法,例如Seurat和Scanpy中的lovain和leiden等聚类算法,通常在处理空间数据时忽略了空间信息。然而,由于细胞状态受其周围细胞的影响,将转录组数据与细胞的空间信息结合起来进行聚类…...
【2025最新】Vm虚拟机中直接使用Ubuntu 免安装过程直接使用教程与下载
Ubuntu 是一个基于 Debian 的自由开源 Linux 操作系统,面向桌面、服务器和云计算平台广泛应用。 由英国公司 Canonical Ltd. 维护和发布,Ubuntu 强调易用性、安全性和稳定性,适合个人用户、开发者以及企业部署使用。 Ubuntu 默认使用 GNOME …...
【Leetcode】系列之206反转链表
反转链表 题目描述解决思路过程示例代码示例结果展示 总结 题目描述 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 解决思路 next_node:临时存放当前指针指向下一个指针的变量;pre:存放空指针;curr࿱…...
图灵爬虫练习平台第十九题js逆向
题十九:法外狂徒 该题适合JS逆向学习的小伙伴练习,模拟国内某大型网站 数据加密设计,给大家练练手 还是先f12看看是什么加密,发现是 返回数据最后加密了 还是先堆栈分析一下,直接点进去 打上断点分析一下,…...
Ubuntu 22初始配置(root、ssh)
1.设置root密码 并启用root用户 sudo passwd root sudo passwd -u root 2.安装ssh apt install openssh-server systemctl enable --now ssh 3.支持root通过ssh登录 vim /etc/ssh/sshd_config 是sshd_config(服务端) 不是ssh_config(客户端) 最后增加一…...
css3响应式布局
css3响应式布局 响应式设计是现代网页开发的重要组成部分,它确保网页在不同的屏幕尺寸上都有良好的显示效果。 在CSS中,实现响应式布局是一种常用的技术,旨在使网页能够根据用户的设备和屏幕尺寸自动调整其布局和样式。这种技术对于确保网站…...
【DeepSeek问答记录】请结合实例,讲解一下pytorch的DataLoader的使用方法
PyTorch的DataLoader是数据加载的核心工具,可高效处理批量数据、并行加载和自动打乱。以下是一个结合实例的分步讲解: 1. 基础使用流程 import torch from torch.utils.data import Dataset, DataLoader# 自定义数据集类(必须实现__len__和…...
Codeforces Round 1024 (Div. 2)(A-D)
题面链接:Dashboard - Codeforces Round 1024 (Div. 2) - Codeforces A. Dinner Time 思路 一共n个数被分成n/p个区间,每个区间内的和是q,如果还有除构成区间外剩余的数那么就一定能构造,如果没有剩余就看所有区间的和是否等于…...
大语言模型强化学习双强:OpenRLHF与verl技术解析
引言 随着大语言模型(LLM)参数规模突破千亿级,如何高效完成基于人类反馈的强化学习(RLHF)训练成为行业焦点。OpenRLHF与verl作为开源社区两大标杆框架,分别以Ray分布式架构和HybridFlow混合控制器为核心&a…...
ARM Cortex-M3内核详解
目录 一、ARM Cortex-M3内核基本介绍 (一)基本介绍 (二)主要组成部分 (三)调试系统 二、ARM Cortex-M3内核的内核架构 三、ARM Cortex-M3内核的寄存器 四、ARM Cortex-M3内核的存储结构 五、ARM Co…...
关于高并发GIS数据处理的一点经验分享
1、背景介绍 笔者过去几年在参与某个大型央企的项目开发过程中,遇到了十分棘手的难题。其与我们平常接触的项目性质完全不同。在一般的项目中,客户一般只要求我们能够通过桌面软件对原始数据进行加工处理,将各类地理信息数据加工处理成地图/场景和工作空间,然后再将工作空…...
vue3+flask+sqlite前后端项目实战
基础环境安装 pycharm 下载地址: https://www.jetbrains.com/zh-cn/pycharm/download/?sectionwindows vscode 下载地址 https://code.visualstudio.com/docs/?dvwin64user python 下载地址 https://www.python.org/downloads/windows/ Node.js(含npm…...
支付宝API-SKD-GO版
前言 支付宝api的sdk没有提供go版,这里自己封装了一个go版的sdk,有需要的朋友可以自取使用 支付宝 AliPay SDK for Go, 集成简单,功能完善,持续更新,支持公钥证书和普通公钥进行签名和验签。 安装 go get github.c…...
uniapp(微信小程序)>关于父子组件的样式传递问题(自定义组件样式穿透)
由于"微信小程序"存在【样式隔离机制】,且默认设置为isolated(启用样式隔离),因此这里给出以下两种解决方案: 注意: 这2种方案父子组件<style>标签不能添加"scoped" 1.CSS变量穿透(推荐: 此方案不受样…...
AI时代还需要目视解译吗?——目视解译详解
在遥感技术迅猛发展的今天,尽管计算机自动解译算法层出不穷,目视解译仍然保持着其基础性和权威性的地位。作为遥感信息提取的"黄金标准",目视解译凭借人类认知系统的独特优势,在多个专业领域持续发挥着不可替代的作用。…...
苹果电脑笔记本macos Mac安装mixly 米思齐软件详细指南
一、下载安装包 二、安装 1、解压下载的文件,然后将解压后文件夹中的中文名称部分删掉只保留英文名称,例如:mixly2.0-mac 2、将mixly2.0-mac文件夹移动到当前用户的Documents路径下,注意路径中不要有中文。 3、进入mixly2.0-mac文…...
slackware系统详解
Slackware 是最古老的活跃维护的 Linux 发行版之一,由 Patrick Volkerding 于 1993 年创建。它以简洁性、稳定性和遵循 Unix 哲学为核心理念,适合追求高度控制和手动配置的用户。以下是 Slackware 的详细介绍: 1. 核心特点 简洁性 (Simplici…...
力扣210(拓扑排序)
210. 课程表 II - 力扣(LeetCode) 这是一道拓扑排序的模板题。简单来说,给出一个有向图,把这个有向图转成线性的排序就叫拓扑排序。如果有向图中有环就没有办法进行拓扑排序了。因此,拓扑排序也是图论中判断有向无环图…...
Promise/A+ 规范中文解读
一、简介 Promise/A 是一个开放、健全且通用的JavaScript Promise标准,由开发者制定并供开发者参考。其核心目标是定义then方法的行为,确保不同Promise实现的互操作性。规范聚焦于异步操作的最终结果交互机制,而非Promise的创建、解决或拒绝…...
多媒体预研
主要包含h265 av1 等各种 多媒体的具体应用 svac_plugin ZLMediaKit/ext-codec at master cyf88/ZLMediaKit D:\java\xiachu\otherzlm\ZLMediaKit> sip-client GB28181-Service/SipClient at master Washington-DC/GB28181-Service yolo Jackson-Tan/wvp_pro_yolo: 小…...
动态网站 LNMP
一、名词解释: LNMP: L : 代表 Linux 操作系统,为网站提供了可靠的运行环境N : 代表 Nginx,它是一款轻量级的高性能 Web 服务器,能够快速处理大量并 发连接,有效提升网站的访问速度和性能 M : 代表…...
【Leetcode刷题随笔】349. 两个数组的交集
1. 题目描述 给定两个数组nums1和nums2,返回它们的交集。输出结果中的每个元素一定是唯一的。我们可以不考虑输出结果的顺序。 示例1: 输入:nums1 [1,2,2,1], nums2 [2,2] 输出:[2] 题目条件: 1 < nums1.length, nums2.length < 10…...
如何优雅的使用CMake中的FindPkgConfig模块
背景 如果你遇到下面的场景,那么FindPkgConfig模块可以用来解决我们引用上游库的问题。 上游库没有提供CMake的配置文件。CMake没有提供相应的查找模块,即Find<PackageName>.cmake的文件。上游库提供了pkg-config使用的.pc文件。 如果上面三个条…...
Docker Volumes
Docker Volumes 是 Docker 提供的一种机制,用于持久化存储容器数据。与容器的生命周期不同,Volumes 可以独立存在,即使容器被删除,数据仍然保留。以下是关于 Docker Volumes 的详细说明: 1. 为什么需要 Volumes&#…...
[原创](现代Delphi 12指南):[macOS 64bit App开发]: 如何获取当前用户主目录(即:~波浪符号目录)?
[作者] 常用网名: 猪头三 出生日期: 1981.XX.XX 企鹅交流: 643439947 个人网站: 80x86汇编小站 编程生涯: 2001年~至今[共24年] 职业生涯: 22年 开发语言: C/C++、80x86ASM、Object Pascal、Objective-C、C#、R、Python、PHP、Perl、 开发工具: Visual Studio、Delphi、XCode、…...
day23 机器学习管道 Pipeline
在机器学习中,数据预处理、特征提取、模型训练和评估等步骤通常是按顺序执行的。为了更高效地管理和复用这些步骤,我们可以使用 Pipeline(管道)来构建一个完整的机器学习流水线。本文将详细介绍 Pipeline 的基础概念,并…...
The Graph:区块链数据索引的技术架构与创新实践
作为Web3生态的核心基础设施,The Graph通过去中心化索引协议重塑了链上数据访问的范式。其技术设计不仅解决了传统区块链数据查询的效率瓶颈,还通过经济模型与多链兼容性构建了一个开放的开发者生态。本文从技术角度解析其架构、机制及创新实践。 一、技…...
nginx配置sse流传输问题:直到所有内容返回后才往下传输
一、禁用缓冲(如实时流传输): location /stream {proxy_buffering off; } 二、开启分块传输 location /your-path {proxy_chunked_transfer_encoding on; # 显式启用分块传输(默认已启用) }...
使用Daemonset部署日志收集守护进程
1.DaemonSet简介: 在Kubernetes(简称k8s)中,DaemonSet是一种控制器,用于确保集群中的每个(或部分)节点运行一个指定的Pod副本。DaemonSet非常适合需要全局部署、节点级运行的服务,如…...
在Mac环境下搭建Docker环境的全攻略
在Mac环境下搭建Docker环境的全攻略 在现代软件开发中,Docker已经成为不可或缺的工具之一。它不仅简化了应用的部署和管理,还极大地提升了开发效率。然而,在某些公司环境中,桌面版的Docker可能会被禁用,这给开发工作带…...
Go 语言 slice(切片) 的使用
序言 在许多开发语言中,动态数组是必不可少的一个组成部分。在实际的开发中很少会使用到数组,因为对于数组的大小大多数情况下我们是不能事先就确定好的,所以他不够灵活。动态数组通过提供自动扩容的机制,极大地提升了开发效率。这…...
C++ string比较、string随机访问、string字符插入、string数据删除
string的字符串进行比较,代码见下。 #include<iostream>using namespace std;int main() {// 1 comparestring s1 "aab";string t11 "aab";int r11 s1.compare(t11);cout << "1: " << r11 << endl;strin…...
web 自动化之 Unittest 应用:测试报告装饰器断言
文章目录 一、常见的第三方库结合 unittest 生产 html 格式测试报告1、HtmlTestRunner2、BeatifulReport 二、装饰器 unittest.skip 强制跳过&条件跳过三、unittest的常用断言方法 一、常见的第三方库结合 unittest 生产 html 格式测试报告 1、HtmlTestRunner 官网下载 …...
前端基础之《Vue(16)—Vue脚手架介绍》
一、脚手架环境 1、推荐windows10 Node vue/cli(webpack) 2、测试node安装成功 node -v npm -v 3、什么是脚手架 Vue CLI:CLI就是脚手架的意思 脚手架生成一套模板(入口文件、配置文件、目录结构) 4、常用的包管理器 npm:no…...
MySQL 事务(一)
文章目录 CURD不加控制,会有什么问题CURD满足什么属性,能解决上述问题?什么是事务为什么要有事务事务的版本支持了解事务的提交方式 事务常见操作方式研究并发场景事务的正常操作事务的非正常情况的案例结论事务操作的注意事项 CURD不加控制&…...