【CUDA编程】CUDA Warp 与 Warp-Python 对比文档
相关文档: Nvidia-Warp
GitHub:nvidia/warp
CUDA Warp 和 Warp-Python 库 的对比与统一文档,涵盖两者的核心概念、区别、使用场景及示例:
1. CUDA Warp(硬件/编程模型概念)
1.1 定义与核心概念
- 定义:
CUDA Warp 是 NVIDIA GPU 的线程调度单位,由 32 个连续线程 组成(Volta 架构后支持独立线程调度)。 - 核心特性:
- SIMT 执行模型:同一 Warp 内的线程执行相同指令,但处理不同数据。
- 分支发散:若 Warp 内线程执行不同分支,性能会显著下降。
- 内存访问优化:需对齐和连续的全局内存访问(合并内存事务)。
- 目标:
最大化 GPU 吞吐量,通过减少分支发散和优化内存访问提升性能。
1.2 Warp 的关键特性
(1) 线程调度
- GPU 以 Warp 为单位调度线程到流多处理器(SM)。
- 每个 SM 可同时管理多个活跃的 Warp,通过上下文切换隐藏内存延迟(Latency Hiding)。
(2) 内存访问模式
- 合并内存访问(Coalesced Memory Access):
- 同一 Warp 的线程访问全局内存时,若地址连续且对齐,GPU 可合并为少数内存事务。
- 非连续访问会导致多次内存事务,显著降低性能。
- 共享内存(Shared Memory):
- 合理利用共享内存可减少全局内存访问冲突,优化 Warp 执行效率。
(3) 分支发散处理
- 若 Warp 内线程的条件分支不同,GPU 会执行所有分支路径,跳过不满足条件的线程。
- 例如:若一个 Warp 中有两种分支路径,总执行时间是两种路径的耗时之和。
1.3 Warp 的使用方式
(1) 显式控制线程逻辑
- 通过
threadIdx.x
计算线程在 Warp 内的位置:int lane_id = threadIdx.x % 32; // Warp 内的线程编号(0~31) int warp_id = threadIdx.x / 32; // Warp 的索引
- 利用
lane_id
进行 Warp 内的数据交换(如 Shuffle 指令)。
(2) 避免分支发散
- 优化分支条件:尽量让同一 Warp 内的线程走相同分支。
// 差:可能导致分支发散 if (threadIdx.x % 2 == 0) { ... } else { ... }// 优:通过条件重组,让相邻线程执行相同分支 if ((threadIdx.x / 16) % 2 == 0) { ... } else { ... }
(3) 使用 Warp 级原语
- Shuffle 指令(Warp Shuffle Functions):
- 允许同一 Warp 内的线程直接交换数据,无需通过共享内存。
- 例如
__shfl_sync()
、__shfl_up_sync()
等函数。
int value = __shfl_sync(0xffffffff, input_value, src_lane);
(4) Warp 级规约(Reduction)
- 在 Warp 内进行高效规约(如求和、最大值):
for (int offset = 16; offset > 0; offset /= 2)value += __shfl_down_sync(0xffffffff, value, offset);
1.4 优化技巧
-
最小化分支发散:
- 重构代码,确保同一 Warp 的线程执行相同分支。
- 使用掩码(如
__ballot_sync()
)统计条件满足的线程数。
-
内存访问对齐:
- 确保全局内存访问是连续的(如
threadIdx.x
对应内存地址连续)。 - 使用
cudaMallocPitch
处理二维数组的内存对齐。
- 确保全局内存访问是连续的(如
-
利用活跃 Warp 隐藏延迟:
- 提高内核的“Occupancy”(SM 中活跃 Warp 的比例),通过调整线程块大小和共享内存使用。
-
避免 Warp 内线程的负载不均衡:
- 均匀分配任务,避免部分线程空闲。
1.5 使用场景
- 高性能计算:如矩阵运算、物理模拟、深度学习推理。
- 优化方向:
- 减少分支发散(重组线程逻辑)。
- 合并内存访问(连续地址对齐)。
- 利用 Warp 级原语(如 Shuffle 指令)。
1.6 示例代码(CUDA C++)
(1) 向量加法(无分支发散)
__global__ void add_vectors(float *a, float *b, float *c) {int idx = blockIdx.x * blockDim.x + threadIdx.x;c[idx] = a[idx] + b[idx]; // 无分支,Warp 高效执行
}
(2) Warp 级求和规约
__device__ float warp_reduce_sum(float val) {for (int offset = 16; offset > 0; offset /= 2)val += __shfl_down_sync(0xffffffff, val, offset);return val;
}
2. Warp-Python(高性能 GPU 编程库)
2.1 定义与核心概念
- 定义:
Warp-Python 是 NVIDIA 推出的 Python 库,允许用户通过 Python 语法编写 GPU 加速代码,并自动编译为 CUDA 内核。 - 特点:
- 类似 NumPy 的数组操作,支持 GPU 并行计算。
- 支持自定义内核(Kernels)和梯度计算(自动微分)。
- 与 PyTorch、TensorFlow 等框架兼容。
- 自动内存管理(无需手动分配 GPU 内存)。
- 核心特性:
- 类 Python 语法:无需直接编写 CUDA C++ 代码。
- 自动内存管理:无需手动分配 GPU 内存。
- 内置自动微分:支持机器学习中的梯度计算。
- 与 CUDA 兼容:底层生成优化的 CUDA 代码。
- 目标:
- 简化 GPU 编程,快速实现高性能计算任务。
2.2 使用场景
- 快速原型开发:如物理模拟、数值计算。
- 机器学习:自定义损失函数和梯度计算。
- 科学计算:替代 NumPy 实现 GPU 加速。
2.3 安装 Warp
通过 pip
直接安装:
pip install warp-lang
验证安装:
import warp as wp
print(wp.__version__) # 输出版本号(如 1.7.0)
2.4 示例代码(Warp-Python)
(1) 简单向量加法
import warp as wp
import numpy as np# 初始化 Warp 上下文
wp.init()# 定义 GPU 数组
n = 1024
a = wp.array(np.random.rand(n), dtype=wp.float32)
b = wp.array(np.random.rand(n), dtype=wp.float32)
c = wp.zeros(n, dtype=wp.float32)# 定义 GPU 内核(@wp.kernel 装饰器)
@wp.kernel
def add_vectors(a: wp.array(dtype=wp.float32),b: wp.array(dtype=wp.float32),c: wp.array(dtype=wp.float32)):i = wp.tid() # 获取线程索引c[i] = a[i] + b[i]# 启动内核(指定线程数)
wp.launch(kernel=add_vectors, dim=n, inputs=[a, b, c])# 将结果拷贝回 CPU
result = c.numpy()
print(result)
(2) 矩阵乘法
@wp.kernel
def matrix_mult(a: wp.array2d(dtype=wp.float32),b: wp.array2d(dtype=wp.float32),c: wp.array2d(dtype=wp.float32)):i, j = wp.tid()c[i, j] = 0.0for k in range(a.shape[1]):c[i, j] += a[i, k] * b[k, j]# 定义矩阵
a = wp.array(np.random.rand(64, 64), dtype=wp.float32)
b = wp.array(np.random.rand(64, 64), dtype=wp.float32)
c = wp.zeros((64, 64), dtype=wp.float32)# 执行矩阵乘法
wp.launch(matrix_mult, dim=(64, 64), inputs=[a, b, c])
(3) 自定义原子操作
@wp.kernel
def atomic_add_example(counter: wp.array(dtype=wp.int32)):wp.atomic_add(counter, 0, 1) # 原子加操作counter = wp.zeros(1, dtype=wp.int32)
wp.launch(atomic_add_example, dim=100, inputs=[counter])
print(counter.numpy()) # 输出 [100]
2.5 高级功能案例
(1) 物理模拟(粒子系统)
@wp.kernel
def update_particles(positions: wp.array(dtype=wp.vec3),velocities: wp.array(dtype=wp.vec3),dt: float):tid = wp.tid()velocities[tid] += wp.vec3(0.0, -9.8, 0.0) * dt # 重力加速度positions[tid] += velocities[tid] * dt# 初始化粒子
num_particles = 1000
positions = wp.array(np.random.rand(num_particles, 3), dtype=wp.vec3)
velocities = wp.zeros(num_particles, dtype=wp.vec3)# 模拟多步
for _ in range(100):wp.launch(update_particles, dim=num_particles, inputs=[positions, velocities, 0.01])
(2) 自动微分(Autograd)
@wp.kernel
def loss_function(x: wp.array(dtype=wp.float32),y: wp.array(dtype=wp.float32)) -> wp.float32:tid = wp.tid()return (x[tid] - y[tid]) ** 2# 定义输入和梯度
x = wp.array(np.random.rand(10), dtype=wp.float32, requires_grad=True)
y = wp.array(np.zeros(10), dtype=wp.float32)# 计算损失和梯度
with wp.Tape() as tape:loss = wp.launch(loss_function, dim=10, inputs=[x, y], outputs=wp.float32(0.0))tape.backward(loss)
print(x.grad.numpy()) # 输出梯度
2.6 关键 API 和功能
功能 | API/语法 | 说明 |
---|---|---|
定义内核 | @wp.kernel | 将 Python 函数编译为 CUDA 内核 |
启动内核 | wp.launch(kernel, dim, inputs) | 指定线程数和输入参数 |
数组操作 | wp.array(data, dtype) | 创建 GPU 数组(类似 NumPy) |
原子操作 | wp.atomic_add() , wp.atomic_max() | 线程安全的原子操作 |
数学函数 | wp.sqrt() , wp.sin() | 支持 GPU 加速的数学函数 |
自动微分 | wp.Tape() | 记录计算图并计算梯度 |
2.7 测试案例
import warp as wp
from warp import float32 as f32
import numpy as np
import cv2# 设置画布大小
n = 800
pixel = wp.zeros((n, n), dtype=f32, device='cuda:0')@wp.func
def mandelbrot_func(z: wp.vec2, c: wp.vec2) -> wp.vec2:return wp.vec2(z[0] * z[0] - z[1] * z[1] + c[0], 2.0 * z[0] * z[1] + c[1])@wp.kernel
def paint(p: wp.array2d(dtype=f32), t: f32):i, j = wp.tid()# 动态缩放和平移zoom = 2.8 + wp.sin(t * 0.2) * 0.5center_x = -0.5 + wp.cos(t * 0.1) * 0.1center_y = wp.sin(t * 0.15) * 0.1x = (f32(j) / f32(n) - 0.5) * zoom + center_xy = (f32(i) / f32(n) - 0.5) * zoom + center_yc = wp.vec2(x, y)z = wp.vec2(0.0, 0.0)iteration = f32(0.0)max_iter = f32(200.0)# 迭代计算while wp.length(z) < 2.0 and iteration < max_iter:z = mandelbrot_func(z, c)iteration += 1.0# 平滑着色smooth_iter = iteration + 1.0 - wp.log2(wp.log2(wp.length(z)))p[i, j] = smooth_iter / max_iterdef main():t = 0.0while True:wp.launch(paint, dim=(n, n), inputs=[pixel, wp.constant(t)], device='cuda:0')# 创建彩色效果np_pixel = pixel.numpy()# 使用更丰富的颜色映射colored = cv2.applyColorMap((np_pixel * 255).astype(np.uint8), cv2.COLORMAP_MAGMA)cv2.imshow("Mandelbrot Set", colored)t += 0.01if cv2.waitKey(1) & 0xFF == ord('q'):breakif __name__ == "__main__":main()
3. 核心区别与联系
特性 | CUDA Warp | Warp-Python |
---|---|---|
定位 | GPU 硬件执行单元/编程模型概念 | Python 库,用于简化 GPU 编程 |
使用语言 | CUDA C++ | Python |
控制粒度 | 直接操作线程、Warp 和内存 | 通过高阶 API 抽象(如 wp.array 和内核) |
性能优化 | 需手动优化分支发散和内存访问 | 自动生成优化代码,用户关注算法逻辑 |
适用场景 | 需要极致性能优化的底层开发 | 快速原型设计、科学计算、机器学习 |
依赖关系 | 依赖 CUDA 工具链 | 依赖 CUDA 运行时和 Python 环境 |
4. 联合使用场景
4.1 在 Warp-Python 中利用 CUDA Warp 知识
-
优化 Warp-Python 内核:
通过重组线程索引减少分支发散(例如将相邻线程分配到同一 Warp)。@wp.kernel def optimized_kernel(data: wp.array(dtype=wp.float32)):tid = wp.tid()warp_id = tid // 32 # 显式控制 Warp 分组lane_id = tid % 32# 确保同一 Warp 内线程执行相同逻辑
-
内存访问优化:
使用wp.array
的连续内存布局,避免全局内存访问碎片化。
4.2 示例:结合两者的粒子模拟
@wp.kernel
def particle_update(positions: wp.array(dtype=wp.vec3),velocities: wp.array(dtype=wp.vec3),dt: float
):tid = wp.tid()# Warp 级优化:同一 Warp 内的线程处理连续数据if tid % 32 == 0:# 每个 Warp 的第一个线程处理同步逻辑(示例)passvelocities[tid] += wp.vec3(0, -9.8, 0) * dtpositions[tid] += velocities[tid] * dt
5. 关键注意事项
5.1 CUDA Warp
- 分支发散:避免同一 Warp 内线程执行不同条件分支。
- 内存对齐:全局内存访问需连续对齐(如
threadIdx.x
对应连续地址)。 - Volta+ 架构:支持独立线程调度,但需注意隐式同步问题。
5.2 Warp-Python
- 安装依赖:需提前安装 CUDA 工具包(建议 CUDA 11+)。
- 性能瓶颈:避免频繁的 CPU-GPU 数据传输(利用
wp.array
驻留 GPU 内存)。 - 调试工具:使用
wp.synchronize()
确保内核执行完成。
6. 总结
场景 | 推荐工具 | 原因 |
---|---|---|
底层 GPU 优化(如 HPC 内核) | CUDA Warp(CUDA C++) | 直接控制线程、内存和 Warp 级操作 |
快速开发 GPU 加速算法 | Warp-Python | Python 语法简单,自动内存管理和代码生成 |
物理模拟/机器学习 | Warp-Python | 内置自动微分和物理建模工具 |
通过理解 CUDA Warp 的底层机制和 Warp-Python 的高层抽象,开发者可以灵活选择工具,兼顾开发效率与性能优化。
相关文章:
【CUDA编程】CUDA Warp 与 Warp-Python 对比文档
相关文档: Nvidia-Warp GitHub:nvidia/warp CUDA Warp 和 Warp-Python 库 的对比与统一文档,涵盖两者的核心概念、区别、使用场景及示例: 1. CUDA Warp(硬件/编程模型概念) 1.1 定义与核心概念 定义: C…...
中厂算法岗面试总结
时间:2025.4.10 地点:上市的电子有限公司 面试流程: 1.由负责人讲解公司文化 2,由技术人员讲解公司的技术岗位,还有成果 3.带领参观各个工作位置,还有场所 4.中午吃饭 5.面试题,闭卷考试…...
Losson 4 NFS(network file system(网络文件系统))
网络文件系统:在互联网中共享服务器中文件资源。 使用nfs服务需要安装:nfs-utils 以及 rpcbind nfs-utils : 提供nfs服务的程序 rpcbind :管理nfs所有进程端口号的程序 nfs的部署 1.客户端和服务端都安装nfs-utils和rpcbind #安装nfs的软件rpcbind和…...
自动化运行后BeautifulReport内容为空
一、问题描述 自动化程序运行后发现运行目录下生成的html报告文件内容为空,没有运行结果。 二、测试环境 操作系统:Windows 11 家庭版BeautifulReport:0.1.3Python:3.11.9Appium-Python-Client:5.0.0Appium Server:2.…...
CTF-WEB排行榜制作
CTF-WEB排行榜制作 项目需求: 现在14道题对应有14个flag,我需要使用dockerfile搭建一个简单的,能够实现验证这些题目对应的flag来计分的简单网站(要求页面比较精美) 前十题设置为10分 11-14题设置为20分 1. flag{5a3…...
架构生命周期(高软57)
系列文章目录 架构生命周期 文章目录 系列文章目录前言一、软件架构是什么?二、软件架构的内容三、软件设计阶段四、构件总结 前言 本节讲明架构设计的架构生命周期概念。 一、软件架构是什么? 二、软件架构的内容 三、软件设计阶段 四、构件 总结 就…...
STM32单片机定时器的输入捕获和输出比较
目录 一、定时器的输入捕获 1、工作原理 2、示例代码 二、定时器的输出比较 1、工作原理 2、示例代码 三、总结 在STM32单片机中,定时器是一个非常重要的外设,广泛应用于时间管理、事件计时、波形生成等多种场景。其中输入捕获和输出比较是两个基…...
计算机组成原理-系统总线
1. 系统总线的定义 系统总线是计算机系统中各功能部件(CPU、存储器、I/O设备等)之间传递信息的公共通路,遵循统一的电气规范和时序协议,是计算机硬件互联的基础。 核心作用:实现数据、地址和控制信号的传输ÿ…...
【android bluetooth 框架分析 02】【Module详解 3】【HciHal 模块介绍】
1. 背景 我们在 gd_shim_module 介绍章节中,看到 我们将 HciHal 模块加入到了 modules 中。 modules.add<hal::HciHal>();在 ModuleRegistry::Start 函数中我们对 加入的所有 module 挨个初始化。 而在该函数中启动一个 module 都要执行那下面几步ÿ…...
Git 远程仓库
Git 入门笔记 远程仓库 Git 远程仓库 Git 远程仓库是一个托管在网络服务器上的代码仓库,它是团队协作开发的核心。 通过远程仓库,开发者可以共享代码、同步更新,实现分布式协作。 SSH 密钥 SSH 密钥可以让你在使用 Git 时安全地连接远程…...
209.长度最小的子数组- 力扣(LeetCode)
题目: 给定一个含有 n 个正整数的数组和一个正整数 target 。 找出该数组中满足其总和大于等于 target 的长度最小的 子数组 [numsl, numsl1, ..., numsr-1, numsr] ,并返回其长度。如果不存在符合条件的子数组,返回 0 。 示例 1:…...
符号右移“ >>= “ 与 无符号右移“ >>>= “ 的区别
符号右移" >> " 与 无符号右移" >>> " 的区别 一、符号右移" >> " 与 无符号右移" >>> " 的区别1. 符号右移(>>)与无符号右移(>>>)的区别…...
山东大学软件学院项目实训-基于大模型的模拟面试系统-专栏管理部分
本周我的主要任务是关于专栏管理部分的完善。 专栏图片的显示问题 问题分析 根据代码可知:图片URL来自于portfolio.headImgUrl,而且如果URL不存在的话,应该显示的是无图片,而网页中显示加载失败说明portfolio.headImgUrl应该是存…...
从 SYN Flood 到 XSS:常见网络攻击类型、区别及防御要点
常见的网络攻击类型 SYN Flood、DoS(Denial of Service) 和 DDoS(Distributed Denial of Service) 是常见的网络攻击类型,它们的目标都是使目标系统无法正常提供服务。以下是它们的详细说明: 1. SYN Flood…...
ros2-rviz2控制unity仿真的6关节机械臂,探索从仿真到实际应用的过程
文章目录 前言(Introduction)搭建开发环境(Setup Development Environment)在window中安装Unity(Install Unity in window)创建Docker容器,并安装相关软件(Create Docker containers…...
01_通过调过api文字生成音频示例
第1 第2 第3,测试音色 第4 第5 第6 第7生成api_key 第8代码 import requestsurl "https://api.siliconflow.cn/v1/audio/speech"payload {"input": "在中国传统文化中,谦让被视为一种美德,但过度的让步…...
使用PyTorch实现目标检测边界框转换与可视化
一、引言 在目标检测任务中,边界框(Bounding Box)的坐标表示与转换是核心基础操作。本文将演示如何: 实现边界框的两种表示形式(角点坐标 vs 中心坐标)之间的转换 使用Matplotlib在图像上可视化边界框 验…...
QEMU学习之路(8)— ARM32通过u-boot 启动Linux
QEMU学习之路(8)— ARM32通过u-boot 启动Linux 一、前言 参考文章: Linux内核学习——内核的编译和启动 Linux 内核的编译和模拟执行 Linux内核运行——根文件系统 Linux 内核学习——使用 uboot 加载内核 二、构建Linux内核 1、获取Linu…...
flutter 桌面应用之右键菜单
在 Flutter 桌面应用开发中,context_menu 和 contextual_menu 是两款常用的右键菜单插件,各有特色。以下是对它们的对比分析: 🧩 context_menu 集成方式:通过 ContextMenuArea 组件包裹目标组件,定义…...
系统设计面试总结:高性能相关:CDN(内容分发网络)、什么是静态资源、负载均衡(Nginx)、canal、主从复制
以下为本人自学回顾使用,请支持javaGuide原版。 1.CDN概述 CDN 就是将静态资源分发到多个不同的地方以实现就近访问,进而加快静态资源的访问速度,减轻服务器以及带宽的负担。 你可以将 CDN 看作是服务上一层的特殊缓存服务,分布…...
从红黑树到哈希表:原理对比与典型场景应用解析(分布式以及布隆过滤器)
在数据结构的世界里,红黑树一直以「自平衡二叉查找树」的身份备受赞誉。凭借红黑节点的精妙设计,它能将插入、删除、查找的时间复杂度稳定控制在 ( log n ) (\log n) (logn),成为处理有序数据的经典方案。然而,当业务场景对「…...
动手学深度学习:手语视频在VGG模型中的测试
前言 其他所有部分同上一篇AlexNet一样,所以就不再赘诉,直接看VGG搭建部分。 模型 VGG是第一个采取块进行模块化搭建的模型。 def vgg_block(num_convs,in_channels,out_channels):layers[]for _ in range(num_convs):layers.append(nn.Conv2d(in_ch…...
微信小程序实战案例 - 餐馆点餐系统 阶段 4 - 订单列表 状态
✅ 阶段 4 – 订单列表 & 状态 目标 展示用户「我的订单」列表支持状态筛选(全部 / 待处理 / 已完成)支持分页加载和实时刷新使用原生组件编写 ✅ 1. 页面结构:文件结构 pages/orders/├─ index.json├─ index.wxml├─ index.js└─…...
深度学习理论-直观理解 Attention
本文首先介绍 Attention 的原始公式,然后以 Self-Attention 为例,简化后逐步分析 Attention 计算结果表达的含义 Attention Attention 公式如下: A t t e n t i o n s o f t m a x ( Q ⋅ K T d k ) ⋅ V Attention softmax(\frac{Q \cd…...
python中 “with” 关键字的取舍问题
自动管理资源(自动关闭文件) 当你使用 with 打开文件时,文件会在 with 代码块结束后自动关闭,无论是否发生异常。这意味着你不需要显式地调用 f.close() 来关闭文件 示例: with open("words.txt", "r…...
ISIS协议(动态路由协议)
ISIS基础 基本概念 IS-IS(Intermediate System to Intermediate System,中间系统到中间系统)是ISO (International Organization for Standardization,国际标准化组织)为它的CLNP(ConnectionL…...
llm开发框架新秀
原文链接:https://i68.ltd/notes/posts/20250404-llm-framework3/ google开源ADK-Agent Development Kit 开源的、代码优先的 Python 工具包,用于构建、评估和部署具有灵活性和控制力的复杂智能体项目仓库:https://github.com/google/adk-python 2.6k项目文档:Age…...
Zookeeper的典型应用场景?
大家好,我是锋哥。今天分享关于【Zookeeper的典型应用场景?】面试题。希望对大家有帮助; Zookeeper的典型应用场景? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 ZooKeeper 是一个开源的分布式协调服务,主要用于管理和协调大…...
【C数据结构】 TAILQ双向有尾链表的详解
TAILQ双向有尾链表的详解 常见的链表结构1.SLIST2.STAILQ3.LIST4.TAILQ5.CIRCLEQ 一、TAILQ链表简介二、TAILQ的定义和声明三、TAILQ队列的函数1.链表头的初始化2.获取第一个节点地址3.获取最后一个节点地址4.链表是否为空5.下一个节点地址6.上一个节点地址7.插入头节点8.插入尾…...
redisson的unlock方法
//分布式方式,分布式锁,采用redisson锁 RLock lock redissonClient.getLock(userId.toString());//lock方法会无限重试。getLock底层是hash,大key是userid,小key是线程,value是重入次数 try {//boolean b lock.tryLo…...
ffmpeg 切割视频失败 ffmpeg 命令参数 -vbsf 在新版本中已经被弃用,需要使用 -bsf:v 替代
ffmpeg 切割视频失败 ffmpeg 命令参数 -vbsf 在新版本中已经被弃用,需要使用 -bsf:v 替代 从日志中可以看到问题出在第一个 ffmpeg 命令执行时: Unrecognized option vbsf.Error splitting the argument list: Option not found这是因为 ffmpeg 命令参…...
设计模式——抽象工厂模式总结
理解了前面的工厂模式后,再理解抽象工厂模式就很容易了。 工厂模式:https://blog.csdn.net/inside802/article/details/147170118?spm1011.2415.3001.10575&sharefrommp_manage_link 抽象工厂模式就是工厂模式的更加抽象化,父类不仅不承…...
JavaScript 定时器
在 JavaScript 中,定时器是实现代码在特定时间间隔执行或延迟执行的重要工具。下面我们将深入探讨定时器的相关知识。 定时器基础 setTimeout() setTimeout() 函数用于在指定的延迟时间后执行一次回调函数。它接受两个参数,第一个参数是要执行的回调函…...
企业经营决策风险
在企业的经营过程中,领导者每天都在面对大量的决策——该扩大生产还是收缩业务?该增设销售渠道还是提升产品质量?但你知道吗,企业最大的成本,不是生产成本,也不是人工成本,而是决策错误的成本&a…...
【云安全】云原生-centos7搭建/安装/部署k8s1.23.6单节点
一、节点基本配置 1、准备操作系统 2、 修改主机名 hostnamectl set-hostname master-1 hostnamectl set-hostname node1 hostnamectl set-hostname node2#验证hostnamectl status 3、修改/etc/hosts cat <<EOF >>/etc/hosts 192.168.255.137 master-1 192.168…...
【已更新完毕】2025泰迪杯数据挖掘竞赛B题数学建模思路代码文章教学:基于穿戴装备的身体活动监测
基于穿戴装备的身体活动监测 摘要 本研究基于加速度计采集的活动数据,旨在分析和统计100名志愿者在不同身体活动类别下的时长分布。通过对加速度数据的处理,活动被划分为睡眠、静态活动、低强度、中等强度和高强度五类,进而计算每个志愿者在…...
力扣每日打卡 1922. 统计好数字的数目 (中等)
力扣 1922. 统计好数字的数目 中等 前言一、题目内容二、解题方法1. 暴力解法(会超时,此法不通)2. 快速幂运算3. 组合计数的思维逻辑分析组合计数的推导例子分析思维小结论 4.官方题解4.1 方法一:快速幂 三、快速幂运算快速幂运算…...
宝塔Linux面板 - 添加站点建站时没有域名实现 IP 地址访问测试(宝塔面板建站 IP 访问)
前言 使用面板添加站点时,必须要填写一个域名用来指向程序,没有域名怎么办? 答案:域名直接写 【服务器 IP 地址】 操作步骤 如果还没有添加站点,则直接在创建站点的时候,域名那填写服务器地址即可&#…...
【GitHub探索】mcp-go,MCP协议的Golang-SDK
近期大模型Agent应用开发方面,MCP的概念比较流行,基于MCP的ToolServer能力开发也逐渐成为主流趋势。由于笔者工作原因,主力是Go语言,为了调研大模型应用开发,也接触到了mcp-go这套MCP的SDK实现。 对于企业内部而言&am…...
手撕TCP内网穿透及配置树莓派
注意: 本文内容于 2025-04-13 15:09:48 创建,可能不会在此平台上进行更新。如果您希望查看最新版本或更多相关内容,请访问原文地址:手撕TCP内网穿透及配置树莓派。感谢您的关注与支持! 之前入手了树莓派5,…...
人形机器人运动与操作: 控制、规划和学习方面的当前进展与挑战
前言 图 1:执行运动和操作任务的人形机器人:(a)HRP-4 在适应地形的同时擦拭木板[1];(b-g)Digit、Hector[2]、Atlas、H1、Justin[3]和 Apollo 取放物体;(h)iCu…...
C++ 重构muduo网络库
本项目参考的陈硕老师的思想 1. 基础概念 进程里有 Reactor、Acceptor、Handler 这三个对象 Reactor 对象的作用是监听和分发事件;Acceptor 对象的作用是获取连接;Handler 对象的作用是处理业务; 先说说 阻塞I/O,非阻塞I/O&…...
【计算机网络实践】(十二)大学校园网综合项目设计
本系列包含: (一)以太网帧分析与网际互联协议报文结构分析 (二)地址解析协议分析与传输控制协议特性分析 (三)交换机的基本操作、配置、 虚拟局域网配置和应用 (四)交…...
通过api程序的方式编辑ps的三种方式
目前只使用了第一种 ps-python-api去操作 还没有尝试其他两种方式对于第一种方式必须要开启ps程序,程序调用修改新增图层和文档时会同步到ps页面,可以直观看到修改结果...
论文阅读笔记——Reactive Diffusion Policy
RDP 论文 通过 AR 提供实时触觉/力反馈;慢速扩散策略,用于预测低频潜在空间中的高层动作分块;快速非对称分词器实现闭环反馈控制。 ACT、 π 0 \pi_0 π0 采取了动作分块,在动作分块执行期间处于开环状态,无法及时响…...
MySQL表的增删改查进阶版
Mysql 1、数据库的约束1.1约束类型1.2 NULL约束1.3 UNIQUE:唯一约束1.4 DEFAULT:默认值约束1.5 PRIMARY KEY:主键约束(重点)1.6 FOREIGN KEY:外键约束(重点) 2.表的设计2.1一对一2.2…...
【C#】Socket通信的使用
在C#中,Socket通信是一种用于实现网络通信的底层技术。通过Socket,程序可以在网络上与其他设备进行数据交换。以下是如何使用C#中的System.Net.Sockets命名空间来实现Socket通信的详细步骤。 1. Socket通信的基本概念 Socket: 一个Socket是网络通信的端…...
linux以C方式和内核交互监听键盘[香橙派搞机日记]
最近在深入研究我的香橙派,不可避免的遇到了怎么认识和使用Linux内核的问题。 我给自己留了一个简单的任务:使用原生C来监听内核,实现读取键盘的消息。 CSDN上也有其他文章来解决这个问题,不过要么是技术不达标(直接和…...
【C++初学】课后作业汇总复习(七) 指针-深浅copy
1、 HugeInt类:构造、、cout Description: 32位整数的计算机可以表示整数的范围近似为-20亿到+20亿。在这个范围内操作一般不会出现问题,但是有的应用程序可能需要使用超出上述范围的整数。C可以满足这个需求,创建功能强大的新的…...
【iOS】UIPageViewController学习
UIPageViewController学习 前言创建一个UIPageViewController最简单的使用 UIPageViewController的方法说明:效果展示 UIPageViewController的协议方法 前言 笔者最近在写项目时想实现一个翻书效果,上网学习到了UIPageViewController今天写本篇博客总结…...