当前位置: 首页 > news >正文

Pascal VOC 2012 数据集格式与文件结构

Pascal VOC 2012

  • 1 Pascal VOC 2012 数据集
    • 1.1 数据集概述
    • 1.2 文件结构
    • 1.3 关键文件和内容格式
      • (1) Annotations/ 目录
      • (2) ImageSets/ 目录
      • (3) JPEGImages/ 目录
      • (4) SegmentationClass/ 和 SegmentationObject/ 目录
    • 1.4 标注格式说明
      • (1) 目标检测标注
      • (2) 语义分割标注
      • (3)实例分割标注说明
    • 1.5 数据集的任务支持
      • (1) 目标检测
      • (2) 语义分割
      • (3) 实例分割
      • (4) 图像分类
    • 1.6 总结
  • 2 读取查看VOC 2012语义分割数据集

1 Pascal VOC 2012 数据集

Pascal VOC 2012 是计算机视觉领域中一个非常经典的数据集,广泛用于目标检测、语义分割、图像分类等任务。以下是 Pascal VOC 2012 数据集的格式和文件结构的详细介绍:

1.1 数据集概述

  • 任务类型:支持目标检测、语义分割、动作识别、图像分类等。
  • 类别数量:包含 20 个物体类别(如 aeroplane, bicycle, car 等)以及一个背景类别。
  • 图像数量
    • 训练集 + 验证集:共 11,530 张图像。
    • 测试集:未公开标注,需提交结果到官方服务器进行评估。

1.2 文件结构

Pascal VOC 2012 的文件组织非常清晰,通常解压后会看到以下目录结构:

VOCdevkit/
└── VOC2012/├── Annotations/         # 存储目标检测的 XML 标注文件├── ImageSets/           # 存储不同任务的图像索引文件│   ├── Action/          # 动作识别任务的图像列表│   ├── Layout/          # 布局任务的图像列表│   ├── Main/            # 目标检测任务的图像列表│   └── Segmentation/    # 语义分割任务的图像列表├── JPEGImages/          # 存储原始图像文件(JPEG 格式)├── SegmentationClass/   # 存储语义分割的类别标签图(PNG 格式)└── SegmentationObject/  # 存储实例分割的对象标签图(PNG 格式)

1.3 关键文件和内容格式

(1) Annotations/ 目录

目录下包含了很多 XML 文件,如下图所示:
在这里插入图片描述

  • 每张图像对应一个 XML 文件,存储目标检测的标注信息。
  • XML 文件的内容包括:
    • 图像的基本信息(文件名、尺寸等)。
    • 每个目标的类别和边界框坐标(xmin, ymin, xmax, ymax)。

示例 XML 文件内容:

<annotation><folder>VOC2012</folder><filename>2007_000032.jpg</filename><size><width>500</width><height>333</height><depth>3</depth></size><object><name>aeroplane</name><bndbox><xmin>104</xmin><ymin>78</ymin><xmax>375</xmax><ymax>183</ymax></bndbox></object>
</annotation>

(2) ImageSets/ 目录

  • 包含不同任务的图像索引文件,用于划分训练集、验证集和测试集。
  • 文件格式为纯文本,每行是一个图像的 ID(不带扩展名)。

常用子目录:

  • Segmentation/:语义分割任务的图像列表。

    • 示例文件名:train.txt, val.txt, trainval.txt
    • train.txt 文件图中的图片编号,表示已经被收入到训练集的图片,val.txt, trainval.txt情况也是类似。
      在这里插入图片描述
  • Main/:目标检测任务的图像列表,分为训练集、验证集等。

    • 示例文件名:train.txt, val.txt, trainval.txt,以及 物体名称_train/val/train_val.txt
    • 在这里插入图片描述
    • 示例内容(假设为aeroplane_train.txt文件):
2008_000032 1
2008_000129 -1
2008_000130 0
...
- 标注标志的含义:- 1:表示该图像中存在目标类别(如飞机),并且标注是可靠的。- 0:表示该图像中不存在目标类别(如飞机)。- -1:表示该图像中可能存在目标类别,但标注不可靠或难以判断。

(3) JPEGImages/ 目录

  • 存储所有原始图像文件(JPEG 格式)。
  • 文件命名规则:年份_编号.jpg,例如 2007_000032.jpg

(4) SegmentationClass/ 和 SegmentationObject/ 目录

  • SegmentationClass/:存储语义分割的类别标签图。
    • 每个像素的RGB值用来表示其所属的类别(共21个类别,0 表示背景,1-20 表示物体类别,但图像中并不是直接显示类别索引,而是有一个从RGB到类别的映射,可以通过本文第二章的程序来理解)。
    • 文件格式为 PNG,无压缩。
# 图像中的物体类别
VOC_CLASSES = ['background', 'aeroplane', 'bicycle', 'bird', 'boat','bottle', 'bus', 'car', 'cat', 'chair', 'cow','diningtable', 'dog', 'horse', 'motorbike', 'person','potted plant', 'sheep', 'sofa', 'train', 'tv/monitor']# 每个类别对应的RGB值
VOC_COLORMAP = [[0, 0, 0], [128, 0, 0], [0, 128, 0], [128, 128, 0],[0, 0, 128], [128, 0, 128], [0, 128, 128], [128, 128, 128],[64, 0, 0], [192, 0, 0], [64, 128, 0], [192, 128, 0],[64, 0, 128], [192, 0, 128], [64, 128, 128], [192, 128, 128],[0, 64, 0], [128, 64, 0], [0, 192, 0], [128, 192, 0],[0, 64, 128]]
  • SegmentationObject/:存储实例分割的对象标签图。
    • 每个对象都有唯一的 ID,用于区分不同的实例。
    • 背景像素值为 0。

示例:

  • 对于一张图像 2007_000042.jpg
    • 类别标签图:SegmentationClass/2007_000042.png
    • 实例标签图:SegmentationObject/2007_000042.png

原图 SegmentationClass/2007_000042.jpg:
在这里插入图片描述

类别标签图:
在这里插入图片描述
实例标签图(两个实例):
在这里插入图片描述

1.4 标注格式说明

(1) 目标检测标注

  • 使用 XML 文件存储,主要字段包括:
    • <filename>:图像文件名。
    • <size>:图像尺寸(宽、高、通道数)。
    • <object>:每个目标的类别和边界框信息。
      • <name>:类别名称。
      • <bndbox>:边界框坐标(xmin, ymin, xmax, ymax)。

(2) 语义分割标注

  • 使用 PNG 文件存储,不能使用JPEG,因为JPEG会压缩,要保证标注文件和原始文件有相同的分辨率
  • 标注文件的相关内容,可以通过本文第二章的程序来理解。

(3)实例分割标注说明

  • 假设有一张图像包含以下内容:

    • 背景区域。
    • 两个“人”(person)对象。
    • 一辆“汽车”(car)。
  • 对应的标签文件(png文件)中,内容如下:

    • 背景区域的像素值为 0。
    • 第一个人的像素值为 1。
    • 第二个人的像素值为 2。
    • 汽车的像素值为 3

实例分割不但要划分不同实例,还需要区分每个实例所属的类别,每个实例具体属于什么类别,需要去Annotations/下面的XML文件中确定,XML文件中的<name> </name>顺序即为 png 文件中的实例类别顺序。(XML三个目标的类别顺序分别是 person、person、car,那么分别对应png文件中的1、2、3的实例类别名)

<object><name>person</name><bndbox><xmin>104</xmin><ymin>78</ymin><xmax>375</xmax><ymax>183</ymax></bndbox>
</object>
<object><name>person</name><bndbox><xmin>400</xmin><ymin>100</ymin><xmax>500</xmax><ymax>250</ymax></bndbox>
</object>
<object><name>car</name><bndbox><xmin>200</xmin><ymin>300</ymin><xmax>400</xmax><ymax>400</ymax></bndbox>
</object>

1.5 数据集的任务支持

(1) 目标检测

  • 使用 Annotations/ 中的 XML 文件和 ImageSets/Main/ 中的图像列表。
  • 每个目标的类别和边界框用于训练和评估目标检测模型。

(2) 语义分割

  • 使用 SegmentationClass/ 中的类别标签图和 ImageSets/Segmentation/ 中的图像列表。
  • 评估指标通常采用 mIoU(mean Intersection over Union)。

(3) 实例分割

  • 使用 SegmentationObject/ 中的实例标签图。
  • 每个实例有唯一 ID,用于区分同一类别的不同对象。

(4) 图像分类

  • 使用 ImageSets/Main/ 中的图像列表和 XML 文件中的类别信息。

1.6 总结

Pascal VOC 2012 数据集的文件结构清晰,格式规范,非常适合初学者和研究者使用。它的多任务支持(目标检测、语义分割、实例分割等)使其成为计算机视觉领域的基准数据集之一。在使用时,可以根据任务需求选择相应的标注文件和图像列表进行训练和评估。

2 读取查看VOC 2012语义分割数据集

以下内容是在notebook中运行得到,然后转化成Markdown并粘贴过来。

import os
import torch
import torchvision
import matplotlib.pyplot as plt
def read_voc_segmentation_images(voc_dir, is_train=True):"""读取VOC中用于语义分割的图像与标签"""# 获取包含图像名的 txt 文件txt_fname = os.path.join(voc_dir, 'ImageSets', 'Segmentation','train.txt' if is_train else 'val.txt')# 从 txt 文件中获取图像名(不含后缀)with open(txt_fname, 'r') as f:images = f.read().split()# 以RGB方式读取标签(标签被保存成了png格式)mode = torchvision.io.image.ImageReadMode.RGB# 获取图像与标签features, labels = [], []for i, fname in enumerate(images):img_path = os.path.join(voc_dir, 'JPEGImages', f'{fname}.jpg')image = torchvision.io.read_image(img_path)features.append(image)mask_path = os.path.join(voc_dir, 'SegmentationClass' ,f'{fname}.png')mask = torchvision.io.read_image(mask_path, mode)labels.append(mask)return features, labelsvoc_dir = r'./VOCdevkit/VOC2012'
train_features, train_labels = read_voc_segmentation_images(voc_dir, True)
n = 5
imgs = [img.permute(1, 2, 0).numpy() for img in train_features[0:n]]  # 转换图像维度 (3, H, W) -> (H, W, 3)
labels = [label.permute(1, 2, 0).numpy() if len(label.shape) == 3 else label for label in train_labels[0:n]]  # 确保标签形状正确# 创建图像网格
fig, axes = plt.subplots(2, n, figsize=(15, 6))  # 2 行 n 列# 显示图像和标签
for i in range(n):# 第一行:显示原始图像axes[0, i].imshow(imgs[i])  # 假设 imgs[i] 的值范围在 [0, 1] 或 [0, 255]axes[0, i].axis('off')  # 关闭坐标轴axes[0, i].set_title(f"Image {i+1}")# 第二行:显示语义分割标签axes[1, i].imshow(labels[i], cmap='viridis')  # 使用颜色映射显示标签axes[1, i].axis('off')  # 关闭坐标轴axes[1, i].set_title(f"Class {i+1}")# 调整子图间距
plt.tight_layout()# 显示图像
plt.show()

在这里插入图片描述

第一张图片是飞机,标签的类别编号是1

"创建 类别-颜色映射"# 图像中的物体类别
VOC_CLASSES = ['background', 'aeroplane', 'bicycle', 'bird', 'boat','bottle', 'bus', 'car', 'cat', 'chair', 'cow','diningtable', 'dog', 'horse', 'motorbike', 'person','potted plant', 'sheep', 'sofa', 'train', 'tv/monitor']# 每个类别对应的RGB值
VOC_COLORMAP = [[0, 0, 0], [128, 0, 0], [0, 128, 0], [128, 128, 0],[0, 0, 128], [128, 0, 128], [0, 128, 128], [128, 128, 128],[64, 0, 0], [192, 0, 0], [64, 128, 0], [192, 128, 0],[64, 0, 128], [192, 0, 128], [64, 128, 128], [192, 128, 128],[0, 64, 0], [128, 64, 0], [0, 192, 0], [128, 192, 0],[0, 64, 128]]

标签也是图片,如果把图片中的每个像素拿出来,然后根据它的RGB组合去查该像素的类别,则需要很长的运行时间,因此这里考虑使用矩阵进行并行,所以有了下面两个函数:

def voc_colormap2label():"""构建从RGB值到VOC类别索引的映射"""# 先创建一个长度为 256 ** 3 的向量colormap2label = torch.zeros(256 ** 3, dtype=torch.long)# 将VOC_COLORMAP中的RGB组合转化成坐标轴上的点,实际上是把三位的点降成一维,# 然后在指定点上赋予类别索引for i, colormap in enumerate(VOC_COLORMAP):position_1d = (colormap[0] * 256 + colormap[1]) * 256 + colormap[2]colormap2label[position_1d] = ireturn colormap2labeldef voc_label_indices(label, colormap2label):"""将标签中每个像素点的RGB值映射到它们的类别索引"""label = label.permute(1, 2, 0).numpy().astype('int32')idx = ((label[:, :, 0] * 256 + label[:, :, 1]) * 256 + label[:, :, 2])return colormap2label[idx]
colormap2label = voc_colormap2label()
y = voc_label_indices(train_labels[0], colormap2label)  # 查看第一张图片的label
y[105:115, 130:140], VOC_CLASSES[1]     # 第一张图片的类别编号是1
(tensor([[0, 0, 0, 0, 0, 0, 0, 0, 0, 1],[0, 0, 0, 0, 0, 0, 0, 1, 1, 1],[0, 0, 0, 0, 0, 0, 1, 1, 1, 1],[0, 0, 0, 0, 0, 1, 1, 1, 1, 1],[0, 0, 0, 0, 0, 1, 1, 1, 1, 1],[0, 0, 0, 0, 1, 1, 1, 1, 1, 1],[0, 0, 0, 0, 0, 1, 1, 1, 1, 1],[0, 0, 0, 0, 0, 1, 1, 1, 1, 1],[0, 0, 0, 0, 0, 0, 1, 1, 1, 1],[0, 0, 0, 0, 0, 0, 0, 0, 1, 1]]),'aeroplane')

0表示对应的像素是背景,1表示对应的像素是飞机。

能不能把上述矩阵不映射到RGB,而是直接保存成一个通道?当然是可以的,但这样我们查看标签文件的时候就不方便了,一个通道的图像是黑白的,0和1在灰度上看起来没差,另外,如果要表示的类别数超过256,一个通道就不够用了。

相关文章:

Pascal VOC 2012 数据集格式与文件结构

Pascal VOC 2012 1 Pascal VOC 2012 数据集1.1 数据集概述1.2 文件结构1.3 关键文件和内容格式(1) Annotations/ 目录(2) ImageSets/ 目录(3) JPEGImages/ 目录(4) SegmentationClass/ 和 SegmentationObject/ 目录 1.4 标注格式说明(1) 目标检测标注(2) 语义分割标注(3)实例分…...

11:00开始面试,11:08就出来了,问的问题有点变态。。。

从小厂出来&#xff0c;没想到在另一家公司又寄了。 到这家公司开始上班&#xff0c;加班是每天必不可少的&#xff0c;看在钱给的比较多的份上&#xff0c;就不太计较了。没想到8月一纸通知&#xff0c;所有人不准加班&#xff0c;加班费不仅没有了&#xff0c;薪资还要降40%…...

MySQL与Oracle字段类型对比及迁移指南

文章目录 MySQL与Oracle字段类型对比及迁移指南1. 核心字段类型对照表2. 常见函数对照表2.1 字符串函数2.2 日期函数2.3 数值函数2.4 类型转换函数2.5 空值处理函数2.6 其他常用函数3. 迁移配置细则4. 迁移工具推荐5. 常见问题解决方案6. 性能优化建议MySQL与Oracle字段类型对比…...

Spring MVC 处理 HTTP 状态码、响应头和异常的完整示例

Spring MVC 处理 HTTP 状态码、响应头和异常的完整示例 1. 正常响应处理 通过 ResponseEntity 可以灵活控制 HTTP 状态码、响应头和响应体。 代码示例&#xff1a;创建资源返回 201 并设置 Location 头 import org.springframework.http.HttpHeaders; import org.springfram…...

http页面的加载过程

HTTP/2 核心概念 1.1 流&#xff08;Stream&#xff09; • 定义&#xff1a;HTTP/2 连接中的逻辑通道&#xff0c;用于传输数据&#xff0c;每个流有唯一标识符&#xff08;Stream ID&#xff09;。 • 特点&#xff1a; ◦ 支持多路复用&#xff08;多个流并行传输&#…...

动手人形机器人(RL)

1 PPO的讲解 核心步骤&#xff0c;如策略网络和价值网络的定义、优势估计、策略更新、价值更新等基础功能的实现 2 代码构成 可能涉及 初始化&#xff0c;Behavior Clone 3 动手强化学习 import pytorch as torch class actorcritic ##等待补充 4 PD Gains 在机器人学中&…...

使用RabbitMQ实现异步秒杀

搭建RabbitMQ 在虚拟机上用docker搭建RabbitMQ&#xff0c;首先拉取镜像 docker run --privilegedtrue -d -p 5672:5672 -p 15672:15672 --name rabbitmq rabbitmq:management mkdir -p /usr/local/docker/rabbitmq再创建rabbitmq容器&#xff0c;下面的命令已经能够创建之后…...

基于PyQt5的企业级生日提醒系统设计与实现

在企业人力资源管理场景中,员工生日提醒是一项重要的关怀功能。本文将以一个基于PyQt5开发的生日提醒系统为例,深入解析桌面应用程序开发中的关键技术实现,涵盖GUI设计、数据持久化、系统集成、动画效果等核心模块。 一、技术选型分析 1.1 PyQt5框架优势 跨平台特性:支持W…...

蓝桥杯嵌入式第16届——ADC模数转化部分

将外部的模拟信号转换为数字信号 &#xff08; ADC可以将引脚上连续变化的模拟电压转换为内存中存储的数字变量&#xff0c;建立模拟电路到数字电路的桥梁 &#xff09; STM32 - ADC 笔记_stm32 adc电容-CSDN博客 引脚状况 STM32cubemx配置 ADC1配置 ADC2配置 代码部分 …...

拜特科技签约天津城投集团,携手共建司库管理系统

近日&#xff0c;拜特科技成功签约天津城市基础设施建设投资集团有限公司&#xff08;以下简称“天津城投集团”&#xff09;&#xff0c;携手共建司库管理系统。 自2015年结缘以来&#xff0c;拜特科技与天津城投集团已携手并进十年&#xff0c;构建了稳固且高效的合作桥梁。…...

Spring Boot 中集成 Knife4j:解决文件上传不显示文件域的问题

Spring Boot 中集成 Knife4j&#xff1a;解决文件上传不显示文件域的问题 在使用 Knife4j 为 Spring Boot 项目生成 API 文档时&#xff0c;开发者可能会遇到文件上传功能不显示文件域的问题。本文将详细介绍如何解决这一问题&#xff0c;并提供完整的解决方案。 Knife4j官网…...

Nuxt.js的useHead有哪些对象

在Nuxt.js框架中&#xff0c;useHead是一个用于操作页面<head>部分的辅助函数。它返回一个包含多个对象的集合&#xff0c;允许你轻松地在组件中修改或添加 HTML 的<head>内容。 具体来说&#xff0c;useHead 返回的对象集合包括&#xff1a; title: 用于设置页面…...

JavaScript的可选链操作符 ?.

JavaScript的可选链操作符&#xff08;Optional Chaining Operator&#xff09;是 ES2020&#xff08;ES11&#xff09; 引入的新特性&#xff0c;通过语法 ?. 简化对深层嵌套对象属性、方法或数组元素的访问&#xff0c;避免因中间值为 null 或 undefined 而引发的错误。 核…...

增长黑客:激活实验助力增长

激活实验是推动用户增长的重要手段。下面为大家详细介绍激活实验的关键步骤与重点解决问题 激活实验的三个关键步骤 1. 明晰 “啊哈时刻” 路径 “啊哈时刻” 指用户瞬间领悟产品价值的瞬间。要达成这一点&#xff0c;需明确用户体验到 “啊哈时刻” 的所有路径。以在线绘图工具…...

STM32低功耗

设置不同位来配置是哪种低功耗模式 WAKEUP引脚可以唤醒任何睡眠状态,但是只有待机模式是属于WAKEUP唤醒&#xff0c;其他模式都是属于中断唤醒&#xff0c;所以待机模式要使能EWUP引脚&#xff0c;还要手动清除唤醒标志位&#xff08;在进入待机模式前就要清除标志位&#xff…...

【精品PPT】2025固态电池知识体系及最佳实践PPT合集(36份).zip

精品推荐&#xff0c;2025固态电池知识体系及最佳实践PPT合集&#xff0c;共36份。供大家学习参考。 1、中科院化学所郭玉国研究员&#xff1a;固态金属锂电池及其关键材料.pdf 2、中科院物理所-李泓固态电池.pdf 3、全固态电池技术研究进展.pdf 4、全固态电池生产工艺.pdf 5、…...

头歌数据库【数据库概论】第10-11章 故障恢复与并发控制

第1关&#xff1a;数据库恢复技术 1、事务的&#xff08; A&#xff09;特性要求事务必须被视为一个不可分割的最小工作单元 A、原子性 B、一致性 C、隔离性 D、持久性 2、事务的&#xff08;C &#xff09;特性要求一个事务在执行时&#xff0c;不会受到其他事务的影响。 A、原…...

qt之opengl使用

使用qt中的openglWidget绘制一个三角形。自定义的类继承关系sunOpengl : public QOpenGLWidget,QOpenGLFunctions_3_3_Core 代码如下 /*----MainWindow.cpp----------------------------------------------*/ #include "mainwindow.h" #include "./ui_mainwin…...

Spark Core编程

一 Spark 运行架构 1 运行架构 定义 Spark 框架的核心是一个计算引擎&#xff0c;整体来说&#xff0c;它采用了标准 master-slave 的结构 如图所示 2 核心组件 Spark 框架有两个核心组件: 1)Driver 2)Spark 驱动器节点&#xff08;用于执行 Spark 任务中的 main 方法&…...

蓝桥杯 B3619 10 进制转 x 进制

题目描述 给定一个十进制整数 n 和一个小整数 x。将整数 n 转为 x 进制。对于超过十进制的数码&#xff0c;用 A&#xff0c;B ... 表示。 输入格式 第一行一个整数 n&#xff1b; 第二行一个整数 x。 输出格式 输出仅包含一个整数&#xff0c;表示答案。 输入输出样例 …...

spring mvc中不同服务调用类型(声明式(Feign)、基于模板(RestTemplate)、基于 SDK、消息队列、gRPC)对比详解

RestControllerAdvice 和 ControllerAdvice 对比详解 1. 基本概念 注解等效组合核心作用ControllerAdviceComponent RequestMapping&#xff08;隐式&#xff09;定义全局控制器增强类&#xff0c;处理跨控制器的异常、数据绑定或全局响应逻辑。RestControllerAdviceControll…...

敏捷迭代实战经验分享

一、敏捷迭代团队成员构成 比较高效的敏捷开发团队人员一般保持在7~10人左右,一般一个完整的敏捷迭代团队包含PM、BA、开发、测试、设计5类角色成员,由于不同项目的现状不同,可根据现实情况配置相应角色。 图:项目核心团队角色 二、敏捷实践活动 敏捷迭代的周期可以根据各…...

《从底层逻辑剖析:分布式软总线与传统计算机硬件总线的深度对话》

在科技飞速发展的当下&#xff0c;我们正见证着计算机技术领域的深刻变革。计算机总线作为信息传输的关键枢纽&#xff0c;其发展历程承载着技术演进的脉络。从传统计算机硬件总线到如今备受瞩目的分布式软总线&#xff0c;每一次的变革都为计算机系统性能与应用拓展带来了质的…...

服务器运维ACL访问控制列表如何配置

ACL(访问控制列表)在服务器运维中用于细粒度地控制用户或主机对资源的访问权限。正确配置ACL能有效限制未授权访问&#xff0c;增强系统安全性。以下是ACL的基本配置流程及示例&#xff0c;主要以Linux系统为例进行说明。 一、启用ACL支持 1. 检查文件系统是否支持ACL tune2fs …...

PIXOR:基于LiDAR的3D检测模型解析

目录 1、前言 2、PIXOR介绍 2.1. 什么是PIXOR&#xff1f; 2.2. PIXOR如何工作&#xff1f; 3、表现和应用 3.1、PIXOR的性能表现 3.2、PIXOR的应用场景 3.3、PIXOR的局限性与挑战 4. PIXOR的未来展望 5. 结语 1、前言 自动驾驶技术正以前所未有的速度发展&#xff…...

【OSG学习笔记】Day 2: 场景图(Scene Graph)的核心概念

今天课程分为两部分&#xff0c;第一部分我们学习一下Scene Graph理论知识&#xff0c;第二部分我们熟悉下OSG的源码。 第一部分&#xff08;Scene Graph&#xff09; 在OpenSceneGraph中&#xff0c;场景图&#xff08;Scene Graph&#xff09;通过树状层级结构高效管理3D对…...

虚幻5的C++调试踩坑

本地调试VS附加调试 踩坑1 预编译版本的UE5没有符号文件&#xff0c;无法调试源码 官方代码调试所需要的符号文件bdp需要下载导入。我安装的5.5.4是预编译版本&#xff0c;并非ue5源码。所以不含bdp文件。需要调试官方代码则需要通过EPIC中下载安装。右键UE版本&#xff0c;打…...

【软件测试】自动化测试框架Pytest + Selenium的使用

Pytest Selenium 是一种常见的自动化测试框架组合&#xff0c;用于编写和执行 Web 应用程序的自动化测试。Pytest 是一个强大的 Python 测试框架&#xff0c;而 Selenium 是一个用于浏览器自动化的工具&#xff0c;二者结合使用可以高效地进行 Web 应用的功能测试、UI 测试等。…...

蓝桥杯补题

方法技巧&#xff1a; 1.进行循环暴力骗分&#xff0c;然后每一层的初始进行判断&#xff0c;如果已经不满足题意了&#xff0c;那么久直接continue&#xff0c;后面的循环就不用浪费时间了。我们可以把题目所给的等式&#xff0c;比如说有四个未知量&#xff0c;那么我们可以用…...

2025年港口危货储存单位主要安全管理人员备考练习题

港口危货储存单位主要安全管理人员备考练习题&#xff1a; 单选题 1、依据《安全生产法》&#xff0c;危险物品的生产、储存单位的安全生产管理人员的任免&#xff0c;应当告知&#xff08; &#xff09;。 A. 主管的负有安全生产监督管理职责的部门 B. 当地人民政府 C. 行…...

openEuler欧拉系统配置local的yum源

1.下载iso openEuler | 开源社区 | openEuler社区官网 2.上传openEuler镜像文件至服务器&#xff08;例如上传至/home目录&#xff09; 3.创建挂载目录 #mkdir -p /mount/iso 4.镜像挂载 #mount -o loop /home/openEuler-22.03-LTS-x86_64-dvd.iso&#xff08;镜像上传目…...

AI比人脑更强,因为被植入思维模型【52】福格行为模型

giszz的理解&#xff1a;重要公式&#xff0c;是BMAT&#xff0c;行为动机能力触发点。也许是乘以。这个挺深刻的&#xff0c;在产品设计中&#xff0c;界面交互&#xff0c;都可以用到这样的思维模型。 一、定义 福格行为模型&#xff08;Fogg Behavior Model&#xff09;是由…...

DocLayout-YOLO:通过多样化合成数据与全局-局部感知实现文档布局分析突破

论文地址:https://arxiv.org/pdf/2410.12628 目录 一、论文概览:当YOLO遇见文档分析 二、创新点解析:两大核心技术 创新点1:Mesh-candidate BestFit合成算法 创新点2:全局-局部可控感知模块(GL-CRM) 三、实验结果:全面超越SOTA 主要指标对比(D4LA数据集) 消融…...

栈(算法)

在 C 里&#xff0c;栈是一种遵循后进先出&#xff08;LIFO&#xff09;原则的数据结构。下面从多个方面为你介绍 C 栈&#xff1a; 1. 使用标准库中的std::stack C 标准库提供了std::stack容器适配器&#xff0c;能方便地实现栈的功能。以下是简单示例&#xff1a; cpp #in…...

leetcode每日一题:子数组异或查询

引言 今天的每日一题原题是3375. 使数组的值全部为 K 的最少操作次数&#xff0c;比较水&#xff0c;可以分成2种情况&#xff1a; 存在比k更小的数&#xff0c;由于每次操作只能使得部分数变小&#xff0c;但是不能把任何数变大&#xff0c;所以肯定无法达成 不存在比k更小的…...

openEuler-22.03-LTS-SP3-x86_64 离线编译安装 nginx 1.20.1

openEuler-22.03-LTS-SP3-x86_64 离线编译安装 nginx 1.20.1 一、概述二、安装依赖1、安装 pcre、pcre-devel2、安装 zlib、zlib-devel3、安装 make、gcc、gcc-c3、编译 openssl5、安装 libtool6、编译 pcre-8.45 三、下载编译 nginx四、运行 nginx 一、概述 本文档适用于无法…...

使用Alamofire下载网站首页内容

用Alamofire库写一个下载网站首页内容的Swift代码。首先&#xff0c;我需要确认用户的需求。他们可能是在开发一个iOS应用&#xff0c;需要从某个网站获取首页的数据&#xff0c;比如HTML内容或者API数据。Alamofire是一个常用的Swift网络库&#xff0c;基于URLSession&#xf…...

服务器DNS失效

服务器异常 xx.t.RequestException: java.net.UnknownHostException: test.ac.xxxx.cn现象分析 本地测试正常&#xff0c;说明域名本身无问题。服务器 DNS 解析异常&#xff0c;导致 UnknownHostException。**服务器可正常解析 ****baidu.com**&#xff0c;说明网络正常&#…...

#无类域间路由(快速复习版)

判断两个无类&#xff08;CIDR&#xff09;地址是否属于同一个子网 &#x1f3af; 问题本质&#xff1a; 判断两个 IP 地址是否属于同一个子网&#xff0c;其实就是 对比它们的“网络地址”是否相同。 &#x1f50d; 原理步骤&#xff08;通用方法&#xff09; 我们按步骤来判…...

【Linux】jumpserver开源堡垒机部署

JumpServer 安装部署指南 本文档详细记录了 JumpServer 安装部署的过程、核心脚本功能说明以及后续管理使用提示&#xff0c;方便运维人员快速查阅和二次安装。 1. 前提条件 操作系统要求&#xff1a; 仅支持 Linux 系统&#xff0c;不支持 Darwin&#xff08;macOS&#xff0…...

Memcached缓存系统:从部署到实战应用指南

#作者&#xff1a;猎人 文章目录 一、安装libevent二、安装配置memcached三、安装Memcache的PHP扩展四、使用libmemcached的客户端工具五、Nginx整合memcached:六、php将会话保存至memcached Memcached是一款开源、高性能、分布式内存对象缓存系统&#xff0c;可应用各种需要缓…...

【rdma tx data flow问题】

rdma data flow问题 1 SQ_doorbell如何产生&#xff1f; --RDMA网卡doorbell寄存器触发&#xff1b;2 CPU如何访问网卡的Doorbell寄存器&#xff1f;3 为什么需要roce_qid_convert把local_qid转换成global_qid;4.WQE的format是什么&#xff1f;5.WQE在网卡硬件中的处理流程&…...

Vue 框架组件间通信方式

组件间通信方式 不管是 vue2 还是 vue3&#xff0c;组件通信方式很重要&#xff0c;以下是常见的几种通信方式&#xff1a; props&#xff1a;可以实现父子组件、子父组件、甚至兄弟组件通信自定义事件&#xff1a;可以实现子父组件通信全局事件总线 $bus&#xff1a;可以实现…...

React 第三十节 使用 useState 和 useEffect Hook实现购物车

不使用 redux 实现 购物车案例 使用 React 自带的 useState 和 useEffect Hook 即可实现购物车 export default function ShoppingCar() {// 要结算的商品 总数 以及总价const [totalNum, setTotalNum] useState(0)const [totalPerice, setTotalPerice] useState(0)// 商品…...

卷积神经网络CNN

目录 一、图像基础知识 图像基本概念 图像的加载 二、CNN概述 CNN概述 三、卷积层 卷积计算 Padding Stride 多通道卷积计算 PyTorch卷积层API 四、池化层 池化层计算 Stride Padding 多通道池化层计算 PyTorch 池化 API 五、图像分类案例 CIFAR10 数据集 …...

【大数据生态】Hive的metadata服务未开启

解决办法 进入到Hive的bin目录下,键入命令: #启动元服务 [atguiguhadoop102 bin]$ pwd /opt/module/hive-3.1.2/bin [atguiguhadoop102 bin]$ ./hive --service metastore & #启动hive [atguiguhadoop102 hive-3.1.2]$ pwd /opt/module/hive-3.1.2 [atguiguhadoop102 hiv…...

【RabbitMQ】死信队列

1.概述 死信&#xff0c;顾名思义就是无法被消费的消息&#xff0c;也就是没有被传到消费者的消息&#xff0c;或者即使传到了也没有被消费。当然有死信就有死信队列。死信队列就是用来存储死信的。 它的应用场景就是保证订单业务的消息数据不丢失&#xff0c;当消息消费发 生…...

区间 dp 系列 题解

1.洛谷 P4342 IOI1998 Polygon 我的博客 2.洛谷 P4290 HAOI2008 玩具取名 题意 某人有一套玩具&#xff0c;并想法给玩具命名。首先他选择 W, I, N, G 四个字母中的任意一个字母作为玩具的基本名字。然后他会根据自己的喜好&#xff0c;将名字中任意一个字母用 W, I, N, G …...

Typora使用笔记

文章目录 主题自动编号字体设置两端对齐Step1Step 2 代码块显示行号设置快捷键参考文献 主题自动编号 typora-theme-auto-numbering 字体设置两端对齐 Step1 切记从typora的偏好设置中打开主题所在的文件夹&#xff0c;并修改对应的css文件。&#xff08;以 github.css 为例…...

k8s部署grafana

先决条件 这里部署过程的前提是已经部署好storageclass,所以pv会根据pvc自动创建. 详情参考:k8s-StoargClass的使用-基于nfs_a volume that contains injected data from multiple-CSDN博客 直接开始: 部署pvc [rootmodule /zpf/grafana]$cat pvc.yml apiVersion: v1 kind…...