当前位置：首页 > news >正文

【CUDA编程】CUDA Warp 与 Warp-Python 对比文档

news 来源：原创 2025/9/9 14:30:46

相关文档: Nvidia-Warp
GitHub：nvidia/warp

CUDA Warp 和 Warp-Python 库的对比与统一文档，涵盖两者的核心概念、区别、使用场景及示例：

1. CUDA Warp（硬件/编程模型概念）

1.1 定义与核心概念

定义：
CUDA Warp 是 NVIDIA GPU 的线程调度单位，由 32 个连续线程 组成（Volta 架构后支持独立线程调度）。
核心特性：
- SIMT 执行模型：同一 Warp 内的线程执行相同指令，但处理不同数据。
- 分支发散：若 Warp 内线程执行不同分支，性能会显著下降。
- 内存访问优化：需对齐和连续的全局内存访问（合并内存事务）。
目标：
最大化 GPU 吞吐量，通过减少分支发散和优化内存访问提升性能。

1.2 Warp 的关键特性

(1) 线程调度

GPU 以 Warp 为单位调度线程到流多处理器（SM）。
每个 SM 可同时管理多个活跃的 Warp，通过上下文切换隐藏内存延迟（Latency Hiding）。

(2) 内存访问模式

合并内存访问（Coalesced Memory Access）：
- 同一 Warp 的线程访问全局内存时，若地址连续且对齐，GPU 可合并为少数内存事务。
- 非连续访问会导致多次内存事务，显著降低性能。
共享内存（Shared Memory）：
- 合理利用共享内存可减少全局内存访问冲突，优化 Warp 执行效率。

(3) 分支发散处理

若 Warp 内线程的条件分支不同，GPU 会执行所有分支路径，跳过不满足条件的线程。
例如：若一个 Warp 中有两种分支路径，总执行时间是两种路径的耗时之和。

1.3 Warp 的使用方式

(1) 显式控制线程逻辑

通过 threadIdx.x 计算线程在 Warp 内的位置：

int lane_id = threadIdx.x % 32;  // Warp 内的线程编号（0~31）
int warp_id = threadIdx.x / 32;  // Warp 的索引

利用 lane_id 进行 Warp 内的数据交换（如 Shuffle 指令）。

(2) 避免分支发散

优化分支条件：尽量让同一 Warp 内的线程走相同分支。

// 差：可能导致分支发散
if (threadIdx.x % 2 == 0) { ... } else { ... }// 优：通过条件重组，让相邻线程执行相同分支
if ((threadIdx.x / 16) % 2 == 0) { ... } else { ... }

(3) 使用 Warp 级原语

Shuffle 指令（Warp Shuffle Functions）：
- 允许同一 Warp 内的线程直接交换数据，无需通过共享内存。
- 例如 __shfl_sync()、__shfl_up_sync() 等函数。
```
int value = __shfl_sync(0xffffffff, input_value, src_lane);
```

(4) Warp 级规约（Reduction）

在 Warp 内进行高效规约（如求和、最大值）：

for (int offset = 16; offset > 0; offset /= 2)value += __shfl_down_sync(0xffffffff, value, offset);

1.4 优化技巧

最小化分支发散：
- 重构代码，确保同一 Warp 的线程执行相同分支。
- 使用掩码（如 __ballot_sync()）统计条件满足的线程数。
内存访问对齐：
- 确保全局内存访问是连续的（如 threadIdx.x 对应内存地址连续）。
- 使用 cudaMallocPitch 处理二维数组的内存对齐。
利用活跃 Warp 隐藏延迟：
- 提高内核的“Occupancy”（SM 中活跃 Warp 的比例），通过调整线程块大小和共享内存使用。
避免 Warp 内线程的负载不均衡：
- 均匀分配任务，避免部分线程空闲。

1.5 使用场景

高性能计算：如矩阵运算、物理模拟、深度学习推理。
优化方向：
- 减少分支发散（重组线程逻辑）。
- 合并内存访问（连续地址对齐）。
- 利用 Warp 级原语（如 Shuffle 指令）。

1.6 示例代码（CUDA C++）

(1) 向量加法（无分支发散）

__global__ void add_vectors(float *a, float *b, float *c) {int idx = blockIdx.x * blockDim.x + threadIdx.x;c[idx] = a[idx] + b[idx];  // 无分支，Warp 高效执行
}

(2) Warp 级求和规约

__device__ float warp_reduce_sum(float val) {for (int offset = 16; offset > 0; offset /= 2)val += __shfl_down_sync(0xffffffff, val, offset);return val;
}

2. Warp-Python（高性能 GPU 编程库）

2.1 定义与核心概念

定义：
Warp-Python 是 NVIDIA 推出的 Python 库，允许用户通过 Python 语法编写 GPU 加速代码，并自动编译为 CUDA 内核。
特点：
- 类似 NumPy 的数组操作，支持 GPU 并行计算。
- 支持自定义内核（Kernels）和梯度计算（自动微分）。
- 与 PyTorch、TensorFlow 等框架兼容。
- 自动内存管理（无需手动分配 GPU 内存）。
核心特性：
- 类 Python 语法：无需直接编写 CUDA C++ 代码。
- 自动内存管理：无需手动分配 GPU 内存。
- 内置自动微分：支持机器学习中的梯度计算。
- 与 CUDA 兼容：底层生成优化的 CUDA 代码。
目标：
- 简化 GPU 编程，快速实现高性能计算任务。

2.2 使用场景

快速原型开发：如物理模拟、数值计算。
机器学习：自定义损失函数和梯度计算。
科学计算：替代 NumPy 实现 GPU 加速。

2.3 安装 Warp

通过 pip 直接安装：

pip install warp-lang

验证安装：

import warp as wp
print(wp.__version__)  # 输出版本号（如 1.7.0）

2.4 示例代码（Warp-Python）

(1) 简单向量加法

import warp as wp
import numpy as np# 初始化 Warp 上下文
wp.init()# 定义 GPU 数组
n = 1024
a = wp.array(np.random.rand(n), dtype=wp.float32)
b = wp.array(np.random.rand(n), dtype=wp.float32)
c = wp.zeros(n, dtype=wp.float32)# 定义 GPU 内核（@wp.kernel 装饰器）
@wp.kernel
def add_vectors(a: wp.array(dtype=wp.float32),b: wp.array(dtype=wp.float32),c: wp.array(dtype=wp.float32)):i = wp.tid()  # 获取线程索引c[i] = a[i] + b[i]# 启动内核（指定线程数）
wp.launch(kernel=add_vectors, dim=n, inputs=[a, b, c])# 将结果拷贝回 CPU
result = c.numpy()
print(result)

(2) 矩阵乘法

@wp.kernel
def matrix_mult(a: wp.array2d(dtype=wp.float32),b: wp.array2d(dtype=wp.float32),c: wp.array2d(dtype=wp.float32)):i, j = wp.tid()c[i, j] = 0.0for k in range(a.shape[1]):c[i, j] += a[i, k] * b[k, j]# 定义矩阵
a = wp.array(np.random.rand(64, 64), dtype=wp.float32)
b = wp.array(np.random.rand(64, 64), dtype=wp.float32)
c = wp.zeros((64, 64), dtype=wp.float32)# 执行矩阵乘法
wp.launch(matrix_mult, dim=(64, 64), inputs=[a, b, c])

(3) 自定义原子操作

@wp.kernel
def atomic_add_example(counter: wp.array(dtype=wp.int32)):wp.atomic_add(counter, 0, 1)  # 原子加操作counter = wp.zeros(1, dtype=wp.int32)
wp.launch(atomic_add_example, dim=100, inputs=[counter])
print(counter.numpy())  # 输出 [100]

2.5 高级功能案例

(1) 物理模拟（粒子系统）

@wp.kernel
def update_particles(positions: wp.array(dtype=wp.vec3),velocities: wp.array(dtype=wp.vec3),dt: float):tid = wp.tid()velocities[tid] += wp.vec3(0.0, -9.8, 0.0) * dt  # 重力加速度positions[tid] += velocities[tid] * dt# 初始化粒子
num_particles = 1000
positions = wp.array(np.random.rand(num_particles, 3), dtype=wp.vec3)
velocities = wp.zeros(num_particles, dtype=wp.vec3)# 模拟多步
for _ in range(100):wp.launch(update_particles, dim=num_particles, inputs=[positions, velocities, 0.01])

(2) 自动微分（Autograd）

@wp.kernel
def loss_function(x: wp.array(dtype=wp.float32),y: wp.array(dtype=wp.float32)) -> wp.float32:tid = wp.tid()return (x[tid] - y[tid]) ** 2# 定义输入和梯度
x = wp.array(np.random.rand(10), dtype=wp.float32, requires_grad=True)
y = wp.array(np.zeros(10), dtype=wp.float32)# 计算损失和梯度
with wp.Tape() as tape:loss = wp.launch(loss_function, dim=10, inputs=[x, y], outputs=wp.float32(0.0))tape.backward(loss)
print(x.grad.numpy())  # 输出梯度

2.6 关键 API 和功能

功能	API/语法	说明
定义内核	`@wp.kernel`	将 Python 函数编译为 CUDA 内核
启动内核	`wp.launch(kernel, dim, inputs)`	指定线程数和输入参数
数组操作	`wp.array(data, dtype)`	创建 GPU 数组（类似 NumPy）
原子操作	`wp.atomic_add()`, `wp.atomic_max()`	线程安全的原子操作
数学函数	`wp.sqrt()`, `wp.sin()`	支持 GPU 加速的数学函数
自动微分	`wp.Tape()`	记录计算图并计算梯度

2.7 测试案例

import warp as wp
from warp import float32 as f32
import numpy as np
import cv2# 设置画布大小
n = 800
pixel = wp.zeros((n, n), dtype=f32, device='cuda:0')@wp.func
def mandelbrot_func(z: wp.vec2, c: wp.vec2) -> wp.vec2:return wp.vec2(z[0] * z[0] - z[1] * z[1] + c[0], 2.0 * z[0] * z[1] + c[1])@wp.kernel
def paint(p: wp.array2d(dtype=f32), t: f32):i, j = wp.tid()# 动态缩放和平移zoom = 2.8 + wp.sin(t * 0.2) * 0.5center_x = -0.5 + wp.cos(t * 0.1) * 0.1center_y = wp.sin(t * 0.15) * 0.1x = (f32(j) / f32(n) - 0.5) * zoom + center_xy = (f32(i) / f32(n) - 0.5) * zoom + center_yc = wp.vec2(x, y)z = wp.vec2(0.0, 0.0)iteration = f32(0.0)max_iter = f32(200.0)# 迭代计算while wp.length(z) < 2.0 and iteration < max_iter:z = mandelbrot_func(z, c)iteration += 1.0# 平滑着色smooth_iter = iteration + 1.0 - wp.log2(wp.log2(wp.length(z)))p[i, j] = smooth_iter / max_iterdef main():t = 0.0while True:wp.launch(paint, dim=(n, n), inputs=[pixel, wp.constant(t)], device='cuda:0')# 创建彩色效果np_pixel = pixel.numpy()# 使用更丰富的颜色映射colored = cv2.applyColorMap((np_pixel * 255).astype(np.uint8), cv2.COLORMAP_MAGMA)cv2.imshow("Mandelbrot Set", colored)t += 0.01if cv2.waitKey(1) & 0xFF == ord('q'):breakif __name__ == "__main__":main()

warp_demo

3. 核心区别与联系

特性	CUDA Warp	Warp-Python
定位	GPU 硬件执行单元/编程模型概念	Python 库，用于简化 GPU 编程
使用语言	CUDA C++	Python
控制粒度	直接操作线程、Warp 和内存	通过高阶 API 抽象（如 `wp.array` 和内核）
性能优化	需手动优化分支发散和内存访问	自动生成优化代码，用户关注算法逻辑
适用场景	需要极致性能优化的底层开发	快速原型设计、科学计算、机器学习
依赖关系	依赖 CUDA 工具链	依赖 CUDA 运行时和 Python 环境

4. 联合使用场景

4.1 在 Warp-Python 中利用 CUDA Warp 知识

优化 Warp-Python 内核：
通过重组线程索引减少分支发散（例如将相邻线程分配到同一 Warp）。

@wp.kernel
def optimized_kernel(data: wp.array(dtype=wp.float32)):tid = wp.tid()warp_id = tid // 32  # 显式控制 Warp 分组lane_id = tid % 32# 确保同一 Warp 内线程执行相同逻辑

内存访问优化：
使用 wp.array 的连续内存布局，避免全局内存访问碎片化。

4.2 示例：结合两者的粒子模拟

@wp.kernel
def particle_update(positions: wp.array(dtype=wp.vec3),velocities: wp.array(dtype=wp.vec3),dt: float
):tid = wp.tid()# Warp 级优化：同一 Warp 内的线程处理连续数据if tid % 32 == 0:# 每个 Warp 的第一个线程处理同步逻辑（示例）passvelocities[tid] += wp.vec3(0, -9.8, 0) * dtpositions[tid] += velocities[tid] * dt

5. 关键注意事项

5.1 CUDA Warp

分支发散：避免同一 Warp 内线程执行不同条件分支。
内存对齐：全局内存访问需连续对齐（如 threadIdx.x 对应连续地址）。
Volta+ 架构：支持独立线程调度，但需注意隐式同步问题。

5.2 Warp-Python

安装依赖：需提前安装 CUDA 工具包（建议 CUDA 11+）。
性能瓶颈：避免频繁的 CPU-GPU 数据传输（利用 wp.array 驻留 GPU 内存）。
调试工具：使用 wp.synchronize() 确保内核执行完成。

6. 总结

场景	推荐工具	原因
底层 GPU 优化（如 HPC 内核）	CUDA Warp（CUDA C++）	直接控制线程、内存和 Warp 级操作
快速开发 GPU 加速算法	Warp-Python	Python 语法简单，自动内存管理和代码生成
物理模拟/机器学习	Warp-Python	内置自动微分和物理建模工具

通过理解 CUDA Warp 的底层机制和 Warp-Python 的高层抽象，开发者可以灵活选择工具，兼顾开发效率与性能优化。

【CUDA编程】CUDA Warp 与 Warp-Python 对比文档

相关文档: Nvidia-Warp GitHub：nvidia/warp CUDA Warp 和 Warp-Python 库的对比与统一文档，涵盖两者的核心概念、区别、使用场景及示例： 1. CUDA Warp（硬件/编程模型概念） 1.1 定义与核心概念定义： C…...

编程日记 2025/9/9 14:30:46

中厂算法岗面试总结

时间：2025.4.10 地点：上市的电子有限公司面试流程： 1.由负责人讲解公司文化 2，由技术人员讲解公司的技术岗位，还有成果 3.带领参观各个工作位置，还有场所 4.中午吃饭 5.面试题，闭卷考试…...

编程日记 2025/9/8 21:36:47

Losson 4 NFS（network file system（网络文件系统））

网络文件系统：在互联网中共享服务器中文件资源。使用nfs服务需要安装:nfs-utils 以及 rpcbind nfs-utils : 提供nfs服务的程序 rpcbind ：管理nfs所有进程端口号的程序 nfs的部署 1.客户端和服务端都安装nfs-utils和rpcbind #安装nfs的软件rpcbind和…...

编程日记 2025/9/9 14:28:40

自动化运行后BeautifulReport内容为空

一、问题描述自动化程序运行后发现运行目录下生成的html报告文件内容为空，没有运行结果。二、测试环境操作系统：Windows 11 家庭版BeautifulReport：0.1.3Python：3.11.9Appium-Python-Client：5.0.0Appium Server:2.…...

编程日记 2025/9/9 14:28:42

CTF-WEB排行榜制作

CTF-WEB排行榜制作项目需求： 现在14道题对应有14个flag，我需要使用dockerfile搭建一个简单的，能够实现验证这些题目对应的flag来计分的简单网站（要求页面比较精美） 前十题设置为10分 11-14题设置为20分 1. flag{5a3…...

编程日记 2025/9/9 1:30:03

架构生命周期（高软57）

系列文章目录架构生命周期文章目录系列文章目录前言一、软件架构是什么？二、软件架构的内容三、软件设计阶段四、构件总结前言本节讲明架构设计的架构生命周期概念。一、软件架构是什么？ 二、软件架构的内容三、软件设计阶段四、构件总结就…...

编程日记 2025/9/9 14:27:56

STM32单片机定时器的输入捕获和输出比较

目录一、定时器的输入捕获 1、工作原理 2、示例代码二、定时器的输出比较 1、工作原理 2、示例代码三、总结在STM32单片机中，定时器是一个非常重要的外设，广泛应用于时间管理、事件计时、波形生成等多种场景。其中输入捕获和输出比较是两个基…...

编程日记 2025/9/3 18:17:45

计算机组成原理-系统总线

1. 系统总线的定义系统总线是计算机系统中各功能部件（CPU、存储器、I/O设备等）之间传递信息的公共通路，遵循统一的电气规范和时序协议，是计算机硬件互联的基础。核心作用：实现数据、地址和控制信号的传输&#xff…...

编程日记 2025/8/31 15:54:23

【android bluetooth 框架分析 02】【Module详解 3】【HciHal 模块介绍】

1. 背景我们在 gd_shim_module 介绍章节中，看到我们将 HciHal 模块加入到了 modules 中。 modules.add<hal::HciHal>();在 ModuleRegistry::Start 函数中我们对加入的所有 module 挨个初始化。而在该函数中启动一个 module 都要执行那下面几步&#xff…...

编程日记 2025/9/9 14:25:30

Git 远程仓库

Git 入门笔记远程仓库 Git 远程仓库 Git 远程仓库是一个托管在网络服务器上的代码仓库，它是团队协作开发的核心。通过远程仓库，开发者可以共享代码、同步更新，实现分布式协作。 SSH 密钥 SSH 密钥可以让你在使用 Git 时安全地连接远程…...

编程日记 2025/9/9 11:30:50

209.长度最小的子数组- 力扣(LeetCode)

题目： 给定一个含有 n 个正整数的数组和一个正整数 target 。找出该数组中满足其总和大于等于 target 的长度最小的子数组 [numsl, numsl1, ..., numsr-1, numsr] ，并返回其长度。如果不存在符合条件的子数组，返回 0 。示例 1：…...

编程日记 2025/9/9 14:25:31

符号右移“ ＞＞= “ 与无符号右移“ ＞＞＞= “ 的区别

符号右移" >> " 与无符号右移" >>> " 的区别一、符号右移" >> " 与无符号右移" >>> " 的区别1. 符号右移（>>）与无符号右移（>>>）的区别…...

编程日记 2025/9/9 14:25:32

山东大学软件学院项目实训-基于大模型的模拟面试系统-专栏管理部分

本周我的主要任务是关于专栏管理部分的完善。专栏图片的显示问题问题分析根据代码可知：图片URL来自于portfolio.headImgUrl，而且如果URL不存在的话，应该显示的是无图片，而网页中显示加载失败说明portfolio.headImgUrl应该是存…...

编程日记 2025/9/9 14:30:45

从 SYN Flood 到 XSS：常见网络攻击类型、区别及防御要点

常见的网络攻击类型 SYN Flood、DoS（Denial of Service） 和 DDoS（Distributed Denial of Service） 是常见的网络攻击类型，它们的目标都是使目标系统无法正常提供服务。以下是它们的详细说明： 1. SYN Flood…...

编程日记 2025/9/5 1:00:54

ros2-rviz2控制unity仿真的6关节机械臂，探索从仿真到实际应用的过程

文章目录前言（Introduction）搭建开发环境（Setup Development Environment）在window中安装Unity（Install Unity in window）创建Docker容器，并安装相关软件（Create Docker containers…...

编程日记 2025/9/9 14:28:40

01_通过调过api文字生成音频示例

第1 第2 第3，测试音色第4 第5 第6 第7生成api_key 第8代码 import requestsurl "https://api.siliconflow.cn/v1/audio/speech"payload {"input": "在中国传统文化中，谦让被视为一种美德，但过度的让步…...

编程日记 2025/9/6 9:21:21

使用PyTorch实现目标检测边界框转换与可视化

一、引言在目标检测任务中，边界框（Bounding Box）的坐标表示与转换是核心基础操作。本文将演示如何： 实现边界框的两种表示形式（角点坐标 vs 中心坐标）之间的转换使用Matplotlib在图像上可视化边界框验…...

编程日记 2025/9/5 1:22:35

QEMU学习之路（8）— ARM32通过u-boot 启动Linux

QEMU学习之路（8）— ARM32通过u-boot 启动Linux 一、前言参考文章： Linux内核学习——内核的编译和启动 Linux 内核的编译和模拟执行 Linux内核运行——根文件系统 Linux 内核学习——使用 uboot 加载内核二、构建Linux内核 1、获取Linu…...

编程日记 2025/9/7 14:40:09

flutter 桌面应用之右键菜单

在 Flutter 桌面应用开发中，context_menu 和 contextual_menu 是两款常用的右键菜单插件，各有特色。以下是对它们的对比分析： 🧩 context_menu 集成方式：通过 ContextMenuArea 组件包裹目标组件，定义…...

编程日记 2025/9/9 14:29:07

系统设计面试总结：高性能相关：CDN（内容分发网络）、什么是静态资源、负载均衡（Nginx）、canal、主从复制

以下为本人自学回顾使用，请支持javaGuide原版。 1.CDN概述 CDN 就是将静态资源分发到多个不同的地方以实现就近访问，进而加快静态资源的访问速度，减轻服务器以及带宽的负担。你可以将 CDN 看作是服务上一层的特殊缓存服务，分布…...

编程日记 2025/9/5 0:03:55

从红黑树到哈希表：原理对比与典型场景应用解析（分布式以及布隆过滤器）

在数据结构的世界里，红黑树一直以「自平衡二叉查找树」的身份备受赞誉。凭借红黑节点的精妙设计，它能将插入、删除、查找的时间复杂度稳定控制在 ( log ⁡ n ) (\log n) (logn)，成为处理有序数据的经典方案。然而，当业务场景对「…...

编程日记 2025/9/9 14:29:09

动手学深度学习：手语视频在VGG模型中的测试

前言其他所有部分同上一篇AlexNet一样，所以就不再赘诉，直接看VGG搭建部分。模型 VGG是第一个采取块进行模块化搭建的模型。 def vgg_block(num_convs,in_channels,out_channels):layers[]for _ in range(num_convs):layers.append(nn.Conv2d(in_ch…...

编程日记 2025/9/9 14:27:57

微信小程序实战案例 - 餐馆点餐系统阶段 4 - 订单列表状态

✅ 阶段 4 – 订单列表 & 状态目标展示用户「我的订单」列表支持状态筛选（全部 / 待处理 / 已完成）支持分页加载和实时刷新使用原生组件编写 ✅ 1. 页面结构：文件结构 pages/orders/├─ index.json├─ index.wxml├─ index.js└─…...

编程日记 2025/9/3 19:14:50

深度学习理论-直观理解 Attention

本文首先介绍 Attention 的原始公式，然后以 Self-Attention 为例，简化后逐步分析 Attention 计算结果表达的含义 Attention Attention 公式如下： A t t e n t i o n s o f t m a x ( Q ⋅ K T d k ) ⋅ V Attention softmax(\frac{Q \cd…...

编程日记 2025/9/9 14:30:45

python中 “with” 关键字的取舍问题

自动管理资源（自动关闭文件） 当你使用 with 打开文件时，文件会在 with 代码块结束后自动关闭，无论是否发生异常。这意味着你不需要显式地调用 f.close() 来关闭文件示例： with open("words.txt", "r…...

编程日记 2025/9/9 14:29:08

ISIS协议（动态路由协议）

ISIS基础基本概念 IS-IS（Intermediate System to Intermediate System，中间系统到中间系统）是ISO （International Organization for Standardization，国际标准化组织）为它的CLNP（ConnectionL…...

编程日记 2025/9/9 14:29:08

llm开发框架新秀

原文链接:https://i68.ltd/notes/posts/20250404-llm-framework3/ google开源ADK-Agent Development Kit 开源的、代码优先的 Python 工具包，用于构建、评估和部署具有灵活性和控制力的复杂智能体项目仓库:https://github.com/google/adk-python 2.6k项目文档:Age…...

编程日记 2025/9/7 19:15:46

Zookeeper的典型应用场景?

大家好，我是锋哥。今天分享关于【Zookeeper的典型应用场景?】面试题。希望对大家有帮助； Zookeeper的典型应用场景? 1000道互联网大厂Java工程师精选面试题-Java资源分享网 ZooKeeper 是一个开源的分布式协调服务，主要用于管理和协调大…...

编程日记 2025/9/9 14:29:09

【C数据结构】 TAILQ双向有尾链表的详解

TAILQ双向有尾链表的详解常见的链表结构1.SLIST2.STAILQ3.LIST4.TAILQ5.CIRCLEQ 一、TAILQ链表简介二、TAILQ的定义和声明三、TAILQ队列的函数1.链表头的初始化2.获取第一个节点地址3.获取最后一个节点地址4.链表是否为空5.下一个节点地址6.上一个节点地址7.插入头节点8.插入尾…...

编程日记 2025/9/3 4:37:08

redisson的unlock方法

//分布式方式，分布式锁，采用redisson锁 RLock lock redissonClient.getLock(userId.toString());//lock方法会无限重试。getLock底层是hash，大key是userid，小key是线程，value是重入次数 try {//boolean b lock.tryLo…...

编程日记 2025/9/9 8:13:23

ffmpeg 切割视频失败 ffmpeg 命令参数 -vbsf 在新版本中已经被弃用，需要使用 -bsf:v 替代

ffmpeg 切割视频失败 ffmpeg 命令参数 -vbsf 在新版本中已经被弃用，需要使用 -bsf:v 替代从日志中可以看到问题出在第一个 ffmpeg 命令执行时： Unrecognized option vbsf.Error splitting the argument list: Option not found这是因为 ffmpeg 命令参…...

编程日记 2025/9/9 14:27:55

设计模式——抽象工厂模式总结

理解了前面的工厂模式后，再理解抽象工厂模式就很容易了。工厂模式：https://blog.csdn.net/inside802/article/details/147170118?spm1011.2415.3001.10575&sharefrommp_manage_link 抽象工厂模式就是工厂模式的更加抽象化，父类不仅不承…...

编程日记 2025/9/4 5:26:26

JavaScript 定时器

在 JavaScript 中，定时器是实现代码在特定时间间隔执行或延迟执行的重要工具。下面我们将深入探讨定时器的相关知识。定时器基础 setTimeout() setTimeout() 函数用于在指定的延迟时间后执行一次回调函数。它接受两个参数，第一个参数是要执行的回调函…...

编程日记 2025/8/29 4:03:52

企业经营决策风险

在企业的经营过程中，领导者每天都在面对大量的决策——该扩大生产还是收缩业务？该增设销售渠道还是提升产品质量？但你知道吗，企业最大的成本，不是生产成本，也不是人工成本，而是决策错误的成本&a…...

编程日记 2025/9/9 1:30:05

【云安全】云原生-centos7搭建/安装/部署k8s1.23.6单节点

一、节点基本配置 1、准备操作系统 2、修改主机名 hostnamectl set-hostname master-1 hostnamectl set-hostname node1 hostnamectl set-hostname node2#验证hostnamectl status 3、修改/etc/hosts cat <<EOF >>/etc/hosts 192.168.255.137 master-1 192.168…...

编程日记 2025/9/7 2:56:43

【已更新完毕】2025泰迪杯数据挖掘竞赛B题数学建模思路代码文章教学:基于穿戴装备的身体活动监测

基于穿戴装备的身体活动监测摘要本研究基于加速度计采集的活动数据，旨在分析和统计100名志愿者在不同身体活动类别下的时长分布。通过对加速度数据的处理，活动被划分为睡眠、静态活动、低强度、中等强度和高强度五类，进而计算每个志愿者在…...

编程日记 2025/9/5 12:10:12

力扣每日打卡 1922. 统计好数字的数目 (中等)

力扣 1922. 统计好数字的数目中等前言一、题目内容二、解题方法1. 暴力解法（会超时，此法不通）2. 快速幂运算3. 组合计数的思维逻辑分析组合计数的推导例子分析思维小结论 4.官方题解4.1 方法一：快速幂三、快速幂运算快速幂运算…...

编程日记 2025/9/7 15:15:33

宝塔Linux面板 - 添加站点建站时没有域名实现 IP 地址访问测试（宝塔面板建站 IP 访问）

前言使用面板添加站点时，必须要填写一个域名用来指向程序，没有域名怎么办？ 答案：域名直接写【服务器 IP 地址】操作步骤如果还没有添加站点，则直接在创建站点的时候，域名那填写服务器地址即可&#…...

编程日记 2025/9/7 5:11:13

【GitHub探索】mcp-go，MCP协议的Golang-SDK

近期大模型Agent应用开发方面，MCP的概念比较流行，基于MCP的ToolServer能力开发也逐渐成为主流趋势。由于笔者工作原因，主力是Go语言，为了调研大模型应用开发，也接触到了mcp-go这套MCP的SDK实现。对于企业内部而言&am…...

编程日记 2025/8/26 17:08:19

手撕TCP内网穿透及配置树莓派

注意： 本文内容于 2025-04-13 15:09:48 创建，可能不会在此平台上进行更新。如果您希望查看最新版本或更多相关内容，请访问原文地址：手撕TCP内网穿透及配置树莓派。感谢您的关注与支持！ 之前入手了树莓派5，…...

编程日记 2025/9/1 19:00:13

人形机器人运动与操作：控制、规划和学习方面的当前进展与挑战

前言图 1：执行运动和操作任务的人形机器人：（a）HRP-4 在适应地形的同时擦拭木板[1]；（b-g）Digit、Hector[2]、Atlas、H1、Justin[3]和 Apollo 取放物体；（h）iCu…...

编程日记 2025/9/9 8:23:40

C++ 重构muduo网络库

本项目参考的陈硕老师的思想 1. 基础概念进程里有 Reactor、Acceptor、Handler 这三个对象 Reactor 对象的作用是监听和分发事件；Acceptor 对象的作用是获取连接；Handler 对象的作用是处理业务； 先说说阻塞I/O，非阻塞I/O&…...

编程日记 2025/9/6 16:45:35

【计算机网络实践】(十二)大学校园网综合项目设计

本系列包含： （一）以太网帧分析与网际互联协议报文结构分析 （二）地址解析协议分析与传输控制协议特性分析 （三）交换机的基本操作、配置、虚拟局域网配置和应用 （四）交…...

编程日记 2025/9/8 4:30:02

通过api程序的方式编辑ps的三种方式

目前只使用了第一种 ps-python-api去操作还没有尝试其他两种方式对于第一种方式必须要开启ps程序，程序调用修改新增图层和文档时会同步到ps页面，可以直观看到修改结果...

编程日记 2025/8/17 21:12:02

论文阅读笔记——Reactive Diffusion Policy

RDP 论文通过 AR 提供实时触觉/力反馈；慢速扩散策略，用于预测低频潜在空间中的高层动作分块；快速非对称分词器实现闭环反馈控制。 ACT、 π 0 \pi_0 π0 采取了动作分块，在动作分块执行期间处于开环状态，无法及时响…...

编程日记 2025/9/9 0:26:48

MySQL表的增删改查进阶版

Mysql 1、数据库的约束1.1约束类型1.2 NULL约束1.3 UNIQUE：唯一约束1.4 DEFAULT：默认值约束1.5 PRIMARY KEY：主键约束（重点）1.6 FOREIGN KEY：外键约束（重点） 2.表的设计2.1一对一2.2…...

编程日记 2025/9/7 16:01:56

【C#】Socket通信的使用

在C#中，Socket通信是一种用于实现网络通信的底层技术。通过Socket，程序可以在网络上与其他设备进行数据交换。以下是如何使用C#中的System.Net.Sockets命名空间来实现Socket通信的详细步骤。 1. Socket通信的基本概念 Socket: 一个Socket是网络通信的端…...

编程日记 2025/9/8 4:56:39

linux以C方式和内核交互监听键盘[香橙派搞机日记]

最近在深入研究我的香橙派，不可避免的遇到了怎么认识和使用Linux内核的问题。我给自己留了一个简单的任务：使用原生C来监听内核，实现读取键盘的消息。 CSDN上也有其他文章来解决这个问题，不过要么是技术不达标（直接和…...

编程日记 2025/8/28 17:33:23

【C++初学】课后作业汇总复习（七）指针-深浅copy

1、 HugeInt类:构造、、cout Description: 32位整数的计算机可以表示整数的范围近似为－20亿到＋20亿。在这个范围内操作一般不会出现问题，但是有的应用程序可能需要使用超出上述范围的整数。C可以满足这个需求，创建功能强大的新的…...

编程日记 2025/9/7 4:40:00

【iOS】UIPageViewController学习

UIPageViewController学习前言创建一个UIPageViewController最简单的使用 UIPageViewController的方法说明：效果展示 UIPageViewController的协议方法前言笔者最近在写项目时想实现一个翻书效果，上网学习到了UIPageViewController今天写本篇博客总结…...

编程日记 2025/9/7 21:52:49

CUDA Warp 和 Warp-Python 库 的对比与统一文档，涵盖两者的核心概念、区别、使用场景及示例：