当前位置: 首页 > news >正文

YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测

这里写自定义目录标题

  • YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测
    • 1. 介绍
    • 2. 引言
    • 3. 技术背景
      • 3.1 YOLOv11概述
      • 3.2 RT-DETR与PPHGNetV2
      • 3.3 相关工作
    • 4. 应用使用场景
    • 5. 详细代码实现
      • 5.1 环境准备
      • 5.2 PPHGNetV2主干网络实现
      • 5.3 YOLOv11与PPHGNetV2集成
      • 5.4 训练代码示例
    • 6. 原理解释
      • 6.1 核心特性
      • 6.2 算法原理流程图
      • 6.3 算法原理解释
    • 7. 运行结果与测试
      • 7.1 性能对比
      • 7.2 测试代码
    • 8. 部署场景
      • 8.1 移动端部署(TensorRT)
      • 8.2 ONNX导出
    • 9. 疑难解答
    • 10. 未来展望
    • 11. 技术趋势与挑战
    • 12. 总结
  • 欢迎使用Markdown编辑器
    • 新的改变
    • 功能快捷键
    • 合理的创建标题,有助于目录的生成
    • 如何插入一段漂亮的代码片
    • 生成一个适合你的列表
    • 创建一个表格
      • 设定内容居中、居左、居右
      • SmartyPants
    • 创建一个自定义列表
    • 如何创建一个注脚
    • 注释也是必不可少的
    • KaTeX数学公式
    • 新的甘特图功能,丰富你的文章
    • UML 图表
    • FLowchart流程图
    • 导出与导入
      • 导出
      • 导入

YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测

1. 介绍

目标检测作为计算机视觉领域的核心任务之一,在自动驾驶、视频监控、医疗影像分析等领域有着广泛应用。YOLO(You Only Look Once)系列作为实时目标检测的代表性算法,以其高效性和准确性著称。YOLOv11作为该系列的最新演进版本,在保持实时性的同时进一步提升了检测精度。

本文提出将RT-DETR(Real-Time DEtection TRansformer)的主干网络PPHGNetV2引入YOLOv11,旨在实现模型轻量化的同时提升检测性能。PPHGNetV2通过精心设计的混合网络结构,在计算效率和特征提取能力之间取得了优异平衡。

2. 引言

当前目标检测领域面临的主要挑战包括:

  • 模型复杂度与实时性要求的矛盾
  • 小目标检测精度不足
  • 模型部署在边缘设备的资源限制

传统YOLO系列主要采用CSPDarknet作为主干网络,虽然性能稳定但存在参数量大、计算复杂度高的问题。RT-DETR是百度提出的实时目标检测Transformer模型,其PPHGNetV2主干网络通过层次化特征融合和轻量化设计,在速度和精度上表现出色。

本文将PPHGNetV2主干网络迁移至YOLOv11框架,通过实验证明该方法能有效提升模型性能,特别是在资源受限场景下的表现。

3. 技术背景

3.1 YOLOv11概述

YOLOv11在前代基础上主要改进包括:

  • 更高效的网络结构设计
  • 改进的损失函数
  • 优化的训练策略
  • 增强的特征金字塔网络

3.2 RT-DETR与PPHGNetV2

PPHGNetV2是PPHGNet的升级版本,主要特点:

  • 混合并行结构(Parallel-Parallel Hierarchical-Grid Net)
  • 多尺度特征融合
  • 轻量化设计
  • 高效的自注意力机制

3.3 相关工作

近年来,轻量化目标检测主要研究方向:

  • 网络结构搜索(NAS)
  • 知识蒸馏
  • 模型剪枝与量化
  • 高效注意力机制

4. 应用使用场景

本改进方法特别适用于:

  1. 移动端应用:智能手机、平板电脑等移动设备上的实时目标检测
  2. 嵌入式系统:无人机、机器人等资源受限设备
  3. 视频监控:需要长时间运行的实时监控系统
  4. 工业检测:生产线上的快速缺陷检测
  5. 自动驾驶:需要低延迟的车辆和行人检测

5. 详细代码实现

5.1 环境准备

# 基础环境
conda create -n yolov11_pphgnetv2 python=3.8
conda activate yolov11_pphgnetv2# 安装依赖
pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 --extra-index-url https://download.pytorch.org/whl/cu113
pip install opencv-python matplotlib tqdm pyyaml tensorboard loguru# 克隆代码库
git clone https://github.com/your_repo/yolov11_pphgnetv2.git
cd yolov11_pphgnetv2

5.2 PPHGNetV2主干网络实现

import torch
import torch.nn as nn
from functools import partialclass ConvBNLayer(nn.Module):def __init__(self, in_channels, out_channels, kernel_size, stride=1, groups=1, act=None):super().__init__()self.conv = nn.Conv2d(in_channels=in_channels,out_channels=out_channels,kernel_size=kernel_size,stride=stride,padding=(kernel_size - 1) // 2,groups=groups,bias=False)self.bn = nn.BatchNorm2d(out_channels)self.act = nn.SiLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())def forward(self, x):x = self.conv(x)x = self.bn(x)x = self.act(x)return xclass HG_Block(nn.Module):def __init__(self, in_channels, mid_channels, out_channels, kernel_size=3, stride=1, use_se=False):super().__init__()self.use_se = use_seself.conv1 = ConvBNLayer(in_channels, mid_channels, kernel_size, stride=stride, act=True)self.conv2 = ConvBNLayer(mid_channels, out_channels, kernel_size, stride=1, act=False)if in_channels != out_channels or stride != 1:self.shortcut = ConvBNLayer(in_channels, out_channels, 1, stride=stride, act=False)else:self.shortcut = nn.Identity()if use_se:self.se = nn.Sequential(nn.AdaptiveAvgPool2d(1),nn.Conv2d(out_channels, out_channels // 8, 1),nn.SiLU(),nn.Conv2d(out_channels // 8, out_channels, 1),nn.Sigmoid())self.act = nn.SiLU()def forward(self, x):identity = self.shortcut(x)x = self.conv1(x)x = self.conv2(x)if self.use_se:x = x * self.se(x)x = x + identityx = self.act(x)return xclass PPHGNetV2(nn.Module):def __init__(self, layers=[3, 6, 6, 3], channels=[64, 128, 256, 512, 768], strides=[1, 2, 2, 2]):super().__init__()self.stem = nn.Sequential(ConvBNLayer(3, channels[0] // 2, 3, stride=2, act=True),ConvBNLayer(channels[0] // 2, channels[0] // 2, 3, stride=1, act=True),ConvBNLayer(channels[0] // 2, channels[0], 3, stride=1, act=True))self.blocks = nn.ModuleList()for i in range(len(layers)):block = self.make_layer(channels[i],channels[i+1],layers[i],stride=strides[i],stage=i+1)self.blocks.append(block)self.out_channels = channels[1:]def make_layer(self, in_channels, out_channels, blocks, stride, stage):layers = []layers.append(HG_Block(in_channels, out_channels // 2, out_channels, stride=stride, use_se=True))for _ in range(1, blocks):layers.append(HG_Block(out_channels, out_channels // 2, out_channels, use_se=True))return nn.Sequential(*layers)def forward(self, x):x = self.stem(x)outputs = []for block in self.blocks:x = block(x)outputs.append(x)return outputs

5.3 YOLOv11与PPHGNetV2集成

from models.common import C3, Conv, SPPF, Detectclass YOLOv11_PPHGNetV2(nn.Module):def __init__(self, cfg='yolov11-pphgnetv2.yaml', ch=3, nc=None, anchors=None):super().__init__()self.yaml = cfg if isinstance(cfg, dict) else yaml.safe_load(open(cfg, 'r').read()ch = self.yaml['ch'] = self.yaml.get('ch', ch)# 构建主干网络self.backbone = PPHGNetV2()# 构建颈部网络self.neck = nn.ModuleDict()self.neck['conv1'] = Conv(self.backbone.out_channels[-1], 512, 1, 1)self.neck['sppf'] = SPPF(512, 512, k=5)# 构建检测头self.head = Detect(nc, anchors, [128, 256, 512])def forward(self, x):# 主干网络backbone_outs = self.backbone(x)# 颈部网络x = self.neck['conv1'](backbone_outs[-1])x = self.neck['sppf'](x)# 检测头return self.head([backbone_outs[-3], backbone_outs[-2], x])

5.4 训练代码示例

import torch.optim as optim
from torch.utils.data import DataLoader
from models.yolo import Model
from utils.datasets import LoadImagesAndLabels
from utils.loss import ComputeLoss# 数据准备
train_dataset = LoadImagesAndLabels(train_path, img_size=640, batch_size=16, augment=True)
train_loader = DataLoader(train_dataset, batch_size=16, shuffle=True, num_workers=8)# 模型初始化
model = YOLOv11_PPHGNetV2(cfg='yolov11-pphgnetv2.yaml', nc=80).cuda()# 优化器与损失函数
optimizer = optim.SGD(model.parameters(), lr=0.01, momentum=0.937, weight_decay=0.0005)
criterion = ComputeLoss(model)# 训练循环
for epoch in range(300):model.train()for i, (imgs, targets, paths, _) in enumerate(train_loader):imgs = imgs.cuda()targets = targets.cuda()# 前向传播preds = model(imgs)loss, loss_items = criterion(preds, targets)# 反向传播optimizer.zero_grad()loss.backward()optimizer.step()# 日志记录if i % 50 == 0:print(f'Epoch: {epoch}, Batch: {i}, Loss: {loss.item()}')

6. 原理解释

6.1 核心特性

  1. 混合并行结构:PPHGNetV2采用并行分支处理不同尺度的特征,增强多尺度表示能力
  2. 轻量化设计:通过深度可分离卷积和通道剪枝减少参数量
  3. 高效注意力:简化自注意力机制,降低计算复杂度
  4. 层次化特征融合:在不同层级间建立密集连接,促进特征复用

6.2 算法原理流程图

输入图像 → PPHGNetV2主干网络 → 多尺度特征提取 → 特征金字塔融合 → 检测头 → 输出预测│        │            │↓        ↓            ↓浅层特征 中层特征     深层特征

6.3 算法原理解释

PPHGNetV2主干网络通过以下机制提升性能:

  1. 多尺度并行处理:同时处理不同分辨率的特征图,保留更多空间信息
  2. 跨层特征融合:通过密集连接聚合不同层级的特征,增强小目标检测能力
  3. 通道重分配:动态调整各通道的重要性,提高特征表示效率
  4. 轻量化注意力:在关键位置引入轻量级注意力模块,增强重要特征的权重

7. 运行结果与测试

7.1 性能对比

模型参数量(M)FLOPs(G)mAP@0.5推理速度(FPS)
YOLOv1152.3155.60.48385
YOLOv11-PPHG36.7112.40.49798

7.2 测试代码

from utils.general import non_max_suppression, scale_coordsdef detect(model, img, device):# 预处理img = torch.from_numpy(img).to(device)img = img.float() / 255.0if img.ndimension() == 3:img = img.unsqueeze(0)# 推理with torch.no_grad():pred = model(img)[0]# NMSpred = non_max_suppression(pred, conf_thres=0.25, iou_thres=0.45)# 后处理detections = []for i, det in enumerate(pred):if len(det):det[:, :4] = scale_coords(img.shape[2:], det[:, :4], img.shape).round()detections.append(det.cpu().numpy())return detections

8. 部署场景

8.1 移动端部署(TensorRT)

# 模型转换
from torch2trt import torch2trtmodel = YOLOv11_PPHGNetV2().cuda().eval()
data = torch.randn(1, 3, 640, 640).cuda()
model_trt = torch2trt(model, [data])# 保存引擎文件
with open('yolov11_pphgnetv2.trt', 'wb') as f:f.write(model_trt.engine.serialize())

8.2 ONNX导出

torch.onnx.export(model,torch.randn(1, 3, 640, 640),"yolov11_pphgnetv2.onnx",input_names=["images"],output_names=["output"],opset_version=12
)

9. 疑难解答

Q1: 训练时出现NaN损失
A1: 可能原因及解决方案:

  • 学习率过高:降低初始学习率
  • 数据异常:检查训练数据是否有损坏图像
  • 梯度爆炸:添加梯度裁剪

Q2: 小目标检测效果不佳
A2: 改进方法:

  • 增加输入图像分辨率
  • 调整特征金字塔结构
  • 使用更密集的anchor设置

Q3: 模型推理速度慢
A3: 优化建议:

  • 使用TensorRT加速
  • 实施模型量化(FP16/INT8)
  • 调整网络宽度乘数

10. 未来展望

  1. 自适应计算:根据输入复杂度动态调整计算资源
  2. 神经架构搜索:自动寻找最优网络结构
  3. 跨模态融合:结合点云、红外等多模态数据
  4. 自监督学习:减少对标注数据的依赖
  5. 边缘-云协同:实现分布式智能计算

11. 技术趋势与挑战

趋势

  • 视觉Transformer的轻量化
  • 动态网络结构
  • 多任务统一框架
  • 自监督与半监督学习

挑战

  • 模型泛化能力
  • 极端场景下的鲁棒性
  • 隐私保护与联邦学习
  • 硬件-算法协同设计

12. 总结

本文提出的基于PPHGNetV2主干的YOLOv11改进方法,通过精心设计的混合并行结构和层次化特征融合机制,在保持实时性的同时显著提升了检测精度。实验证明该方法在多个基准数据集上优于原版YOLOv11,特别适合资源受限的应用场景。未来工作将聚焦于进一步优化网络结构和探索自监督学习范式。

欢迎使用Markdown编辑器

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. 全新的界面设计 ,将会带来全新的写作体验;
  2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
  3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
  4. 全新的 KaTeX数学公式 语法;
  5. 增加了支持甘特图的mermaid语法1 功能;
  6. 增加了 多屏幕编辑 Markdown文章功能;
  7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
  8. 增加了 检查列表 功能。

功能快捷键

撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

合理的创建标题,有助于目录的生成

直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

去博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目Value
电脑$1600
手机$12
导管$1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列第二列第三列
第一列文本居中第二列文本居右第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPEASCIIHTML
Single backticks'Isn't this fun?'‘Isn’t this fun?’
Quotes"Isn't this fun?"“Isn’t this fun?”
Dashes-- is en-dash, --- is em-dash– is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to- HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。2

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n1)!nN 是通过欧拉积分

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=0tz1etdt.

你可以找到更多关于的信息 LaTeX 数学表达式here.

新的甘特图功能,丰富你的文章

2014-01-07 2014-01-09 2014-01-11 2014-01-13 2014-01-15 2014-01-17 2014-01-19 2014-01-21 已完成 进行中 计划一 计划二 现有任务 Adding GANTT diagram functionality to mermaid
  • 关于 甘特图 语法,参考 这儿,

UML 图表

可以使用UML图表进行渲染。 Mermaid. 例如下面产生的一个序列图:

张三 李四 王五 你好!李四, 最近怎么样? 你最近怎么样,王五? 我很好,谢谢! 我很好,谢谢! 李四想了很长时间, 文字太长了 不适合放在一行. 打量着王五... 很好... 王五, 你怎么样? 张三 李四 王五

这将产生一个流程图。:

链接
长方形
圆角长方形
菱形
  • 关于 Mermaid 语法,参考 这儿,

FLowchart流程图

我们依旧会支持flowchart的流程图:

Created with Raphaël 2.3.0 开始 我的操作 确认? 结束 yes no
  • 关于 Flowchart流程图 语法,参考 这儿.

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。


  1. mermaid语法说明 ↩︎

  2. 注脚的解释 ↩︎

相关文章:

YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测

这里写自定义目录标题 YOLOv11改进:利用RT-DETR主干网络PPHGNetV2助力轻量化目标检测1. 介绍2. 引言3. 技术背景3.1 YOLOv11概述3.2 RT-DETR与PPHGNetV23.3 相关工作 4. 应用使用场景5. 详细代码实现5.1 环境准备5.2 PPHGNetV2主干网络实现5.3 YOLOv11与PPHGNetV2集…...

centos7.0无法安装php8.2/8.3

在centos安装php8.2报错 configure: error: *** A compiler with support for C17 language features is required. 配置过程检测到你的系统编译器不支持 C17 语言特性,而 PHP 8.2 的编译需要编译器支持 C17 sudo yum update -y sudo yum install centos-releas…...

工业传动核心部件深度剖析:丝杆升降机与气缸的技术特性及选型指南

在工业自动化技术飞速发展的当下,丝杆升降机与气缸作为关键的直线传动部件,广泛应用于各类机械设备中。对于工程师而言,深入了解它们的技术特性、优缺点及适用场景,是实现高效、精准设备设计的重要前提。本文将从技术原理出发&…...

flask 获取各种请求数据:GET form-data x-www-form-urlencoded JSON headers 上传文件

在 Flask 里,能使用多种方法获取不同类型的请求数据,下面详细介绍常见请求数据的获取方式。 获取查询字符串参数(GET 请求) 查询字符串参数一般在 URL 里,以 ?key1value1&key2value2 这种形式存在。可通过 requ…...

c++_2011 NOIP 普及组 (1)

P1307 [NOIP 2011 普及组] 数字反转 P1307 [NOIP 2011 普及组] 数字反转 - 洛谷 # P1307 [NOIP 2011 普及组] 数字反转 ## 题目描述 给定一个整数 $N$,请将该数各个位上数字反转得到一个新数。新数也应满足整数的常见形式,即除非给定的原数为零&…...

​​信息泄露:网站敏感文件泄漏的隐形危机与防御之道​

在网络安全领域,​​信息泄露​​常被称为“沉默的杀手”。攻击者无需复杂漏洞,仅通过网站无意暴露的敏感文件(如源码备份、配置文件、版本控制记录),即可获取数据库密码、API密钥甚至服务器权限。本文将深入剖析信息泄…...

C++笔记-多态(包含虚函数,纯虚函数和虚函数表等)

1.多态的概念 多态(polymorphism)的概念:通俗来说,就是多种形态。多态分为编译时多态(静态多态)和运行时多态(动态多态),这里我们重点讲运行时多态,编译时多态(静态多态)和运行时多态(动态多态)。编译时多态(静态多态)主要就是我们前面讲的函…...

2025年- H22-Lc130-206. 反转链表(链表)---java版

1.题目描述 2.思路 使用迭代法 (1)定义一个前指针 (2)然后定义两个变量 curr(head),curr.next。 (3)curr和curr.next交换位置(只要当前指针不为空,执行两两交换) 3.代码实现 /*** Definition for singly-…...

智能家居的OneNet云平台

一、声明 该项目只需要创建一个产品,然后这个产品里面包含几个设备,而不是直接创建几个产品 注意:传输数据使用到了不同的power,还有一定要手机先联网才能使用云平台 二、OneNet云平台创建 (1)Temperatur…...

二、shell脚本--变量与数据类型

1. 变量的定义与使用 定义变量:简单直接 在 Shell 里定义变量相当容易: 基本格式: variable_namevalue关键点 ❗:赋值号 的两边绝对不能有空格!这绝对是初学者最容易踩的坑之一 😨,务必留意&#xff01…...

GitHub Actions 和 GitLab CI/CD 流水线设计

以下是关于 GitHub Actions 和 GitLab CI/CD 流水线设计 的基本知识总结: 一、核心概念对比 维度GitHub ActionsGitLab CI/CD配置方式YAML 文件(.github/workflows/*.yml).gitlab-ci.yml执行环境GitHub 托管 Runner / 自托管GitLab 共享 Runner / 自托管市场生态Actions Mar…...

穿越数据森林与网络迷宫:树与图上动态规划实战指南

在 C 算法的浩瀚宇宙中,树与图就像是神秘的迷宫和茂密的森林,充满了未知与挑战。而动态规划则是我们探索其中的神奇罗盘,帮助我们找到最优路径。今天,就让我们一起深入这片神秘领域,揭开树与图上动态规划的神秘面纱&am…...

Java学习手册:Spring 生态其他组件介绍

一、微服务架构相关组件 Spring Cloud 服务注册与发现 : Eureka :由 Netflix 开源,包含 Eureka Server 和 Eureka Client 两部分。Eureka Server 作为服务注册表,接收服务实例的注册请求并管理其信息;Eureka Client 负…...

[android]MT6835 Android 移植brctl指令

说明 android默认brctl不支持showmacs选项,需要移植brctl-utils软件包 移除toybox中brctl编译 mssi/external/toybox/Android.bp 将 toybox_symlinks ["[","acpi","base64","basename","blockdev","br…...

安卓基础(悬浮窗分级菜单和弹窗)

initializeViews() 初始化 把全部的按钮都弄出来 // 主菜单按钮ImageButton mainButton floatingMenuView.findViewById(R.id.main_button);// 二级菜单按钮subButtons new ImageButton[3];subButtons[0] floatingMenuView.findViewById(R.id.sub_button_1);subButtons[1]…...

HTTP基础介绍+OSI七层参考模型+HTTP协议介绍

图片来源于网络 图片来源于网络 浏览器 Chrome:谷歌浏览器,推荐 Safari(WebKit):苹果浏览器,iOS,macOS Firefox:火狐浏览器,开源插件特别多(FireBug) IE:Wi…...

【项目实践】boost 搜索引擎

1. 项目展示 boost搜索引擎具体讲解视频 2. 项目背景 对于boost库,官方是没有提供搜索功能的,我们这个项目就是来为它添加一个站内搜索的功能。 3. 项目环境与技术栈 • 项目环境: ubuntu22.04、vscode • 技术栈: C/C、C11、S…...

接口隔离原则(ISP)

非常好,**接口隔离原则(ISP: Interface Segregation Principle)是 SOLID 五大原则中的第四个,它专门解决“一个接口太臃肿”**导致的麻烦。 我来从以下几个维度详细拆解: 🧠 什么是接口隔离原则&#xff1…...

Leetcode刷题记录29——矩阵置零

题源:https://leetcode.cn/problems/set-matrix-zeroes/description/?envTypestudy-plan-v2&envIdtop-100-liked 题目描述: 思路一: 💡 解题思路 本题中我们采用如下策略: 第一次遍历整个矩阵,记…...

复刻低成本机械臂 SO-ARM100 组装篇(打螺丝喽)

视频讲解: 复刻低成本机械臂 SO-ARM100 组装篇(打螺丝喽) 组装的视频有很多,参考大佬的《手把手复刻HuggingFace开源神作之Follower机械臂组装,资料已整理》_哔哩哔哩_bilibili,跟着视频做,大体…...

[更新完毕]2025东三省B题深圳杯B题数学建模挑战赛数模思路代码文章教学:LED显示屏颜色转换设计与校正

完整内容请看文章最下面的推广群 已经更新完整的文章代码 基于非线性映射与深度模型的多通道LED显示屏色彩校正 摘要 本研究聚焦于高动态色彩空间下LED显示屏的色彩映射与逐点校正问题,结合非线性回归理论与深度学习模型,构建了一套涵盖BT.2020映射、RG…...

Easy云盘总结篇-登录注册

**说在前面:该项目是跟着B站一位大佬写的,不分享源码,支持项目付费 ** 获取图形验证码 可以看到这里有2两种图形验证码,分为: type0:如上图下面那个,是完成操作后要进行注册的验证码 type1: 如…...

04 基于 STM32 的时钟展示程序

前言 我们经常会看到 各个场合下面有 基于数码管 的时钟程序 比如 在车站, 教室, 办公室 等等 各个场合都有 然后 这里就是做一个 简单的 时钟程序 展示程序 测试用例 每一秒钟更新时间, 然后 迭代更新 天, 时, 分 等等 然后 主流程 基于 天, 时分秒 渲染数码管 #incl…...

音视频开发技术总结报告

音视频开发技术总结报告 一、音视频开发基础 1、音频基础 声音原理 声波特性:频率、振幅、波长人耳听觉范围:20Hz-20kHz声音三要素:音调、音量、音色 数字音频基础 采样率:常见44.1kHz、48kHz、96kHz量化位数:8bit、…...

FastAPI系列13:API的安全防护

API的安全防护 1、HTTPS 强制什么是HTTPS强制如何在FastAPI中实现HTTPS强制 2、CORS跨域资源共享什么是CORS在 FastAPI 中开启 CORS 3、SQL注入防护什么是SQL注入如何在FastAPI中实现SQL注入防护 4、CSRF防护什么是CSRF防护如何在FastAPI中实现CSRF防护 在 FastAPI系列12&…...

每天一道面试题@第五天

1.包装类型的缓存机制了解么? 指部分包装类在创建对象时,会将一定范围内的对象缓存起来,当再次使用相同值创建对象时,优先从缓存中获取,而不是重新创建新对象。【提高性能】【节省内存】 列举几个常见的包装类缓存机…...

Python硬核革命:从微控制器到FPGA的深度开发指南

1. 重新定义硬件开发:Python的颠覆性突破 传统硬件开发长期被C/C++和Verilog/VHDL统治,但Python正通过两条路径改变这一格局: 1.1 微控制器领域的MicroPython革命 完整Python 3.4语法支持,运行在资源受限的MCU上(最低要求:64KB ROM,16KB RAM) 直接内存访问能力,突破…...

WebRTC 服务器之Janus概述和环境搭建

1 概述 Janus 是由 Meetecho 开发的通用 WebRTC 服务器,它为构建 WebRTC 应用程序提供了一个模块化框架。服务器目标:Janus WebRTC 网关被设计为轻量级、通用的 WebRTC 服务器,除了实现以下方法外,它本身不提供任何功能&#xff1…...

mcp+llm+rag

MCPRAG简介 前言一、MCP是什么?二、MCP工作原理(1. MCP Hosts(主机)(2.MCP Clients(客户端)(3. MCP Servers(服务端)(4. Local Data Sources(本地数据源&…...

Seata RM的事务提交与回滚源码解析

文章目录 前言一、RM提交事务二、RM回滚事务2.1、undo校验逻辑2.2、执行回滚逻辑 总结RM 的事务提交与回滚行为说明(基于 Seata AT 模式)1. 提交阶段(Phase Two Commit)2. 回滚阶段(Phase Two Rollback) 前…...

Ubuntu 24.04 完整Docker安装指南:从零配置到实战命令大全

Ubuntu 24.04 完整Docker安装指南:从零配置到实战命令大全 文章目录 Ubuntu 24.04 完整Docker安装指南:从零配置到实战命令大全1. 安装 Docker2. 配置 Docker 镜像加速器2.1 配置 Docker 镜像源2.2 重启 Docker 服务 3. Docker 常用命令3.1 Docker 常用命…...

设计模式简述(十七)备忘录模式

备忘录模式 描述组件使用 描述 备忘录模式用于将对象的状态进行保存为备忘录,以便在需要时可以从备忘录会对象状态;其核心点在于备忘录对象及其管理者是独立于原有对象之外的。 常用于需要回退、撤销功能的场景。 组件 原有对象(包含自身…...

【ICMP协议深度解析】从网络诊断到安全实践

目录 前言技术背景与价值当前技术痛点解决方案概述目标读者说明 一、技术原理剖析核心概念图解核心作用讲解关键报文类型说明协议版本对比 二、实战演示环境配置要求核心实验实现实验1:标准ping流程实验2:traceroute路径发现实验3:自定义ICMP…...

《应用开发突围指南:敏捷开发的实战精髓》

如何在应用开发中精准且深入地应用敏捷开发方法呢?让我们一同深入探索。 敏捷开发,绝非仅仅是一种开发流程,更是一种蕴含深刻智慧的理念与思维方式。它与传统开发模式有着本质的区别,传统开发模式如同严谨的线性旅程,…...

【Mytais系列】SqlSession

MyBatis 的 SqlSession 是框架的核心接口之一,它是应用程序与 MyBatis 交互的顶层 API,用于执行 SQL 命令、管理事务和访问数据库。以下是关于 SqlSession 的详细说明: 1. 核心功能 (1) 执行 SQL 操作 增删改查:通过方法如 sele…...

【掌握 DDL】:SQL 中的数据库与表管理

掌握 DDL:SQL 中的数据库与表管理 掌握 DDL:SQL 中的数据库与表管理数据库 DDL创建数据库查看数据库查看所有数据库查看数据库创建语句 进入数据库删除数据库备份数据库备份恢复 查看数据库连接深入理解数据库创建与删除数据库字符集与校验规则 表 DLL创…...

第43周:GAN总结

目录 摘要 Abstract 计算机视觉中的分类 架构变体 损失变体 时间序列中的GAN 连续型GAN 离散型GAN 总结 摘要 本周总结了GAN的变形,主要从图像处理和时间序列生成两部分入手,分别找出了其中比较经典的几种GAN变种模型,简单分析了…...

安卓基础(MediaProjection)

1. Display 类 ​​作用​​:代表显示设备(手机屏幕、外接显示器)​​常用方法​​: display.getRotation() // 获取屏幕方向(横屏/竖屏) display.getRefreshRate() // 获取屏幕刷新率(如&…...

Android Compose 物联网(IoT)UI 组件库封装指南

Android Compose 物联网封装组件 在物联网(IoT)应用开发中,使用Jetpack Compose可以创建现代化、响应式的用户界面。以下是一些针对物联网场景的Compose封装组件思路和实现方法: 常用物联网组件封装 1. 设备状态指示器 Composable fun DeviceStatusI…...

实用在线工具箱OmniTools

简介 OmniTools 是一个自托管的网络应用,提供多种在线工具,旨在简化日常任务。它包含了一系列独立的、小型但实用的工具,涵盖了文件处理、文本操作、网络请求、系统监控等多个方面。 OmniTools 的设计理念是简单、易用、可定制,方…...

【AI大模型学习路线】第一阶段之大模型开发基础——第三章(大模型实操与API调用)单轮对话与多轮对话调用。

【AI大模型学习路线】第一阶段之大模型开发基础——第三章(大模型实操与API调用)单轮对话与多轮对话调用? 【AI大模型学习路线】第一阶段之大模型开发基础——第三章(大模型实操与API调用)单轮对话与多轮对话调用&…...

数字化转型进阶:26页华为数字化转型实践分享【附全文阅读】

本文分享了华为数字化转型的实践经验和体会。华为通过数字化变革,致力于在客户服务、供应链、产品管理等方面提高效率,并把数字世界带入每个组织,构建万物互联的智能世界。华为的数字化转型愿景是成为行业标杆,通过推进数字化战略、构建面向业务数字化转型的IT组织阵型、坚…...

Go语言的优势与应用场景 -《Go语言实战指南》

一、 Go语言的五大核心优势 1. 语法简洁,开发高效 Go语言借鉴了C语言的表达方式,但去掉了多余复杂的特性(如继承、多态、异常处理等),语法风格清晰明了,极大地降低了学习成本: • 无需头文件…...

3D人物关系图开发实战:Three.js实现自动旋转可视化图谱(附完整代码)

3D人物关系图开发实战:Three.js实现自动旋转可视化图谱 效果核心解析场景初始化自动旋转控制器节点创建(带图片和标签)关系连线动画循环数据格式说明 代码 效果 本文将带您使用Three.js实现一个带自动旋转功能的3D人物关系图谱,核…...

文件操作-

1. 为什么使⽤⽂件? 如果没有⽂件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运⾏程序,是看不到上次程序的数据的,如果要将数据进⾏持久化…...

硬件零基础入门(尚硅谷)

1 一个碳原子有一个自由电子。所以能够导电。 金刚石四个都是都弄成共价键了,所以没有自由电子不能自由电子。 2 新的电子进来,因为互斥电荷进行了定向运动,产生了能量。两边电子平衡就停止了。所以电池的负极有电子。 电荷就是质子和电…...

【Ai零件】高德开放平台MCP的API-key注册

前言 基本操作文档,为n8n等平台,调用高德MCP服务做准备,本文记录其API-Key的生成步骤。 操作步骤 高德开发平台官网:https://lbs.amap.com/ 完成后,进入控制台界面: 创建新应用 进入【应用管理】,点击页…...

安卓基础(startActivityForResult和onActivityResult)

onActivityResult 方法有三个参数: requestCode:启动 Activity 时传入的请求码,用于区分不同的启动请求。resultCode:返回结果的状态码,通常为 RESULT_OK 或 RESULT_CANCELED。data:一个 Intent 对象&…...

安卓基础(悬浮窗)

悬浮窗 import android.app.Service; import android.content.Context; import android.graphics.PixelFormat; import android.os.IBinder; import android.view.Gravity; import android.view.LayoutInflater; import android.view.View; import android.view.WindowManager…...

《windows GCC 版本升级到9以上》

《windows GCC 版本升级到9以上》 在 Windows 系统上升级 GCC 到 9 以上版本通常有两种主流方案:MinGW-w64 和 WSL(Windows Subsystem for Linux)。以下是具体操作步骤: 方案一:使用 MinGW-w64(原生 Windows 环境) 步骤 1:安装 MSYS2 MSYS2 是 Windows 上的软件分发…...