当前位置: 首页 > news >正文

计算机视觉领域开源数据集资源整理

1. 目标检测数据集

1.1 COCO2017 数据集

COCO2017 是 2017 年发布的 COCO 数据集的一个版本,主要用于 COCO 在 2017 年后持有的物体检测任务、关键点检测任务和全景分割任务。
在这里插入图片描述

1.2 火焰和烟雾图像数据集

数据集链接:http://m6z.cn/6fzn0f

该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。大约有 7000 张图像数据。图像是在各种照明条件(室内和室外场景)、天气等条件下拍摄的。该数据集非常适合早期火灾和烟雾探测。数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景,如垃圾焚烧、纸塑焚烧、田间作物焚烧、家庭烹饪等。
在这里插入图片描述

1.3 DOTA 航拍图像数据集

数据集链接:http://m6z.cn/6vIKlJ

DOTA 是用于航空图像中目标检测的大型数据集。它可以用于开发和评估航空图像中的目标探测器。这些图像是从不同的传感器和平台收集的。每个图像的大小在 800×800 到 20000×20000 像素之间,包含显示各种比例、方向和形状的对象。DOTA 图像中的实例由航空图像解释专家通过任意(8 d.o.f.)四边形进行注释。
在这里插入图片描述

1.4 AITEX 数据集

数据集链接:http://m6z.cn/5DdJL1

该数据库由七个不同织物结构的 245 张 4096 x 256 像素图像组成。数据库中有 140 个无缺陷图像,每种类型的织物 20 个,除此之外,有 105 幅纺织行业中常见的不同类型的织物缺陷(12 种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。
在这里插入图片描述

1.5 T-LESS 数据集

数据集链接:http://m6z.cn/5wnucm

该数据集采集的目标为工业应用、纹理很少的目标,同时缺乏区别性的颜色,且目标具有对称性和互相关性,数据集由三个同步的传感器获得,一个结构光传感器,一个 RGBD sensor,一个高分辨率 RGBsensor,从每个传感器分别获得了 3.9w 训练集和 1w 测试集,此外为每个目标创建了 2 个 3D model,一个是 CAD 手工制作的另一个是半自动重建的。训练集图片的背景大多是黑色的,而测试集的图片背景很多变,会包含不同光照、遮挡等等变换(之所以这么做作者说是为了使任务更具有挑战性)。同时作者解释了本数据集的优势在于:1.大量跟工业相关的目标;2.训练集都是在可控的环境下抓取的;3.测试集有大量变换的视角;4.图片是由同步和校准的 sensor 抓取的;5.准确的 6D pose 标签;6.每个目标有两种 3D 模型。
在这里插入图片描述

1.6 H²O 行人交互检测数据集

数据集链接:http://m6z.cn/6fzmQf

H²O 由 V-COCO 数据集中的 10301 张图像组成,其中添加了 3635 张图像,这些图像主要包含人与
人之间的互动。所有的 H²O 图像都用一种新的动词分类法进行了注释,包括人与物和人与人之间的互
动。该分类法由 51 个动词组成,分为 5 类:

  • 描 述 主 语 一 般 姿 势 的 动 词
  • 与 主 语 移 动 方 式 有 关 的 动 词
  • 与 宾 语 互 动 的 动 词
  • 描 述 人 与 人 之 间 互 动 的 动 词
  • 涉 及 力 量 或 暴 力 的 互 动 动 词

在这里插入图片描述

1.7 SpotGarbage 垃圾识别数据集

数据集链接:http://m6z.cn/5ZMmRG

图像中的垃圾(GINI)数据集是 SpotGarbage 引入的一个数据集,包含2561 张图像,956 张图像包含垃圾,其余的是在各种视觉属性方面与垃圾非常相似的非垃圾图像。
在这里插入图片描述

1.8 NAO 自然界对抗样本数据集

数据集链接:http://m6z.cn/5KJWJA

NAO 包含 7934 张图像和 9943 个对象,这些图像未经修改,代表了真实世界的场景,但会导致最先进的检测模型以高置信度错误分类。与标准 MSCOCO 验证集相比,在 NAO 上评估时,EfficientDet-D7 的平均精度(mAP)下降了 74.5%。
在这里插入图片描述

1.9 Labelme 图像数据集

数据集链接:http://m6z.cn/5Sg9NX

Labelme Dataset 是用于目标识别的图像数据集,涵盖 1000 多个完全注释和 2000 个部分注释的图像,其中部分注释图像可以被用于训练标记算法 ,测试集拥有来自于世界不同地方拍摄的图像,这可以保证图片在续联和测试之间会有较大的差异。该数据集由麻省理工学院 –计算机科学和人工智能实验室于 2007 年发布,相关论文有《LabelMe: a database and web-based tool for image annotation》。
在这里插入图片描述

1.10 印度车辆数据集

数据集链接:http://m6z.cn/6uxAIx

该数据集包括小众印度车辆的图像,如 Autorikshaw、Tempo、卡车等。该数据集由用于分类和目标检测的小众印度车辆图像组成。据观察,这些小众车辆(如 autorickshaw、tempo、trucks 等)上几乎没有可用的数据集。这些图像是在白天、晚上和晚上的不同天气条件下拍摄的。该数据集具有各种各样的照明、距离、视点等变化。该数据集代表了一组非常具有挑战性的利基类车辆图像。该数据集可用于驾驶员辅助系统、自动驾驶等的图像识别和目标检测。
在这里插入图片描述

1.11 Seeing 3D chairs 椅子检测模型

数据集链接:http://m6z.cn/5DdK0v

椅子数据集包含大约 1000 个不同三维椅子模型的渲染图像。
在这里插入图片描述

1.12 SUN09 场景理解数据集

数据集链接:http://m6z.cn/60wX8r

SUN09 数据集包含 12000 个带注释的图像,其中包含 200 多个对象类别。它由自然、室内和室外图像组成。每个图像平均包含 7 个不同的注释对象,每个对象的平均占用率为图像大小的 5%。对象类别的频率遵循幂律分布。发布者使用 397 个采样良好的类别进行场景识别,并以此搭配最先进的算法建立新的性能界限。该数据集由普林斯顿视觉与机器人实验室于 2014 年发布,相关论文有《SUN Database: Large-scale Scene Recognition from Abbey to Zoo》、《SUN Database: Exploring a Large Collection of Scene Categories》。
在这里插入图片描述

1.13 Unsplash 图片检索数据集

数据集链接:http://m6z.cn/5wnuoM

使用迄今为止公开共享的全球最大的开放检索信息数据集。Unsplash 数据集由 250000 多名贡献摄影师创建,并包含了数十亿次照片搜索的信息和对应的照片信息。由于 Unsplash 数据集中包含广泛的意图和语义,它为研究和学习提供了新的机会。
在这里插入图片描述

1.14 HICO-DET 人物交互检测数据集

数据集链接:http://m6z.cn/5DdK6D

HICO-DET 是一个用于检测图像中人-物交互(HOI)的数据集。它包含47776 幅图像(列车组 38118 幅,测试组 9658 幅),600 个 HOI 类别,由 80 个宾语类别和 117 个动词类别构成。HICO-DET 提供了超过 150k个带注释的人类对象对。V-COCO 提供了 10346 张图像(2533 张用于训练,2867 张用于验证,4946 张用于测试)和 16199 人的实例。
在这里插入图片描述

1.15 上海科技大学人群统计数据集

数据集链接:http://m6z.cn/5Sgafn
上海科技数据集是一个大规模的人群统计数据集。它由 1198 张带注释的群组图像组成。数据集分为两部分,A 部分包含 482 张图像,B 部分包含 716 张图像。A 部分分为训练和测试子集,分别由 300 和 182 张图像组成。B 部分分为 400 和 316 张图像组成的序列和测试子集。群组图像中的每个人都有一个靠近头部中心的点进行注释。总的来说,该数据集由 33065 名带注释的人组成。A 部分的图像是从互联网上收集的,而 B部分的图像是在上海繁忙的街道上收集的。
在这里插入图片描述

1.16 生活垃圾数据集

数据集链接:http://m6z.cn/6n5Adu

大约 9000 多张独特的图片。该数据集由印度国内常见垃圾对象的图像组成。图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。
在这里插入图片描述

1.17 RMFD 口罩遮挡人脸数据集

数据集下载地址:http://m6z.cn/61z9Fv

当前大多数高级人脸识别方法都是基于深度学习而设计的,深度学习取决于大量人脸样本。但是,目前尚没有公开可用的口罩遮挡人脸识别数据集。为此,这项工作提出了三种类型的口罩遮挡人脸数据集,包括口罩遮挡人脸检测数据集(MFDD),真实口罩遮挡人脸识别数据集(RMFRD)和模拟口罩遮挡人脸识别数据集(SMFRD)。基于这些数据集,可以开发口罩遮挡人脸的各种应用。本项目开发的多粒度口罩遮挡人脸识别模型可达到 95%的准确性,超过了行业报告的结果。
在这里插入图片描述

1.18 GTSRB 德国交通标志数据集

数据集下载地址:http://m6z.cn/5wJJLA

德国交通标志基准测试是在 2011 年国际神经网络联合会议 (IJCNN)上举办的多类单图像分类挑战赛。我们诚邀相关领域的研究人员参与:该比赛旨在参与者无需特殊领域知识。我们的基准测试具有以下属性:

  • 单 图 像 、 多 类 分 类 问 题
  • 40 多 个 分 类
  • 总 共 超 过 50,000 张 图 片
  • 逼 真 的 大 型 数 据 库

在这里插入图片描述

1.19 VOC2005 车辆数据集

数据集下载地址:http://m6z.cn/5U2X4u

该数据集中含有自行车、摩托车、汽车、货车的图像数据,可用于 CNN模型以实现车辆识别和车辆分类,其中自行车、摩托车、汽车数据来自 2005 PASCAL 视觉类挑战赛(VOC2005)所使用的数据的筛选处理结果,货车图片来自网络收集,后期通过筛选处理得到。在本数据中,训练数据集与测试数据集占比约为 5:1。
在这里插入图片描述

1.20 Winegrape 检测数据集

数据集下载地址:http://m6z.cn/5TikF9

WGISD(Wine Grape Instance Segmentation Dataset)是为了提供图像和注释来研究对象检测和实例分割,用于葡萄栽培中基于图像的监测和现场机器人技术。它提供了来自五种不同葡萄品种的实地实例。这些实例显示了葡萄姿势、光照和焦点的变化,包括遗传和物候变化,如形状、颜色和紧实度。可能的用途包括放宽实例分割问题:分类(图像中是否有葡萄?)、语义分割(图像中的“葡萄像素”是什么?)、对象检测(图像中的葡萄在哪里?)、和计数(每个簇有多少浆果?)。
在这里插入图片描述

1.21 全球小麦检测数据集

数据集下载地址:http://m6z.cn/5wJK64

检测小麦穗是一项重要任务,可以估计相关性状,包括穗种群密度和穗特征,如卫生状况、大小、成熟阶段和芒的存在。本数据集包含 4,700张高分辨率 RGB 图像和 190,000 个标记的小麦头,这些小麦头采集自世界各地不同生长阶段的不同基因型的多个国家。
在这里插入图片描述

1.22 Linkopings 交通标志数据集

数据集下载地址:http://m6z.cn/68ldS0

通过记录超过 350 公里的瑞典高速公路和城市道路的序列,创建了一个数据集。一个 1.3 兆像素的彩色摄像机,一个点灰色变色龙,被放置在一辆汽车的仪表板上,从前窗向外看。摄像头略微指向右侧,以便尽可能多地覆盖相关标志。该镜头的焦距为 6.5 毫米,视野约为 41 度。高速公路上的典型速度标志大约为 90 cm 宽,如果要在大约 30 m 的距离处检测到它们,则对应于大约 50 像素的大小。总共记录了超过 20000 帧,其中每五帧被手动标记。每个标志的标签包含标志类型(人行横道、指定车道右侧、禁止站立或停车、优先道路、让路、50 公里/小时或 30 公里/小时)、能见度状态(遮挡、模糊或可见)和道路状态(是否标志是在正在行驶的道路上或在小路上)。
在这里插入图片描述

1.23 防护装备-头盔和背心检测

数据集下载地址:http://m6z.cn/61zarT

包含 774 个众包图像和 698 个网络挖掘图像。众包和网络挖掘的图像分别包含 2,496 和 2,230 个工人实例。
在这里插入图片描述

1.24 加州理工学院相机陷阱数据集

数据集链接:https://beerys.github.io/CaltechCameraTraps/

该数据集包含来自美国西南部 140 个摄像头位置的 243,100 张图像,带有 21 个动物类别的标签(加上空白),主要是在物种级别(例如,最常见的标签是负鼠、浣熊和土狼),以及 大约 66,000 个边界框注释。大约 70% 的图像被标记为空。
在这里插入图片描述

1.25 水下垃圾检测数据集

数据集下载地址:http://m6z.cn/6nnDQK

该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像,这些图像是从现实世界环境中捕获的,提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外,水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像,这些图像构成了该数据集,所有图像都在垃圾实例、植物和动物等生物对象以及 ROV上标有边界框。
在这里插入图片描述

2. 小目标检测数据集

2.1 AI-TOD 航空图像数据集

数据集下载地址:http://m6z.cn/5MjlYk

AI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比,AI-TOD 中目标的平均大小约为 12.8 像素,远小于其他数据集。
在这里插入图片描述

2.2 iSAID 航空图像大规模数据集

数据集下载地址:http://m6z.cn/6nUrYe

现有的 Earth Vision 数据集要么适用于语义分割,要么适用于对象检测。iSAID 是第一个用于航空图像实例分割的基准数据集。这个大规模和密集注释的数据集包含 2,806 张高分辨率图像的 15 个类别的 655, 451 个对象实例。iSAID 的显着特征如下:(a) 大量具有高空间分辨率的图像,(b) 十五个重要且常见的类别,© 每个类别的大量实例,(d)每个类别的大量标记实例图像,这可能有助于学习上下文信息,(e) 巨大的对象尺度变化,通常在同一图像内包含小、中和大对象,(f) 图像内具有不同方向的对象的不平衡和不均匀分布,描绘真实-生活空中条件,(g)几个小尺寸物体,外观模糊,只能通过上下文推理来解决,(h)由专业注释者执行的精确实例级注释,由符合良好规范的专家注释者交叉检查和验证定义的指导方针。
在这里插入图片描述

2.3 TinyPerson 数据集

数据集下载地址:http://m6z.cn/6vqF3T

在 TinyPerson 中有 1610 个标记图像和 759 个未标记图像(两者主要来自同一视频集),总共有 72651 个注释。
在这里插入图片描述

2.4 Deepscores 数据集

数据集下载地址:http://m6z.cn/5xgYdY

DeepScores 数据集的目标是推进小物体识别的最新技术,并将物体识别问题置于场景理解的背景下。DeepScores 包含高质量的乐谱图像,分为 300 0 000 张书面音乐,其中包含不同形状和大小的符号。拥有近一亿个小对象,这使得我们的数据集不仅独一无二,而且是最大的公共数据集。DeepScores 带有用于对象分类、检测和语义分割的基本事实。因此,DeepScores 总体上对计算机视觉提出了相关挑战,超出了光学音乐识别 (OMR) 研究的范围。
在这里插入图片描述

2.5 密集行人检测数据集

数据集下载地址:http://m6z.cn/6nUs1C

WiderPerson 数据集是野外行人检测基准数据集,其图像选自广泛的场景,不再局限于交通场景。我们选择了 13,382 张图像并标记了大约 400K 带有各种遮挡的注释。我们随机选择 8000/1000/4382 图像作为训练、验证和测试子集。与 CityPersons 和 WIDER FACE 数据集类似,我们不发布测试图像的边界框基本事实。用户需要提交最终的预测文件,我们将进行评估。
在这里插入图片描述

2.6 加州理工学院行人检测数据集

数据集下载地址:http://m6z.cn/5N3Yk7

加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成,该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧(在 137 个大约分钟长的片段中),总共 350,000 个边界框和2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系。
在这里插入图片描述

2.7 NWPU VHR-10 卫星图像数据集

数据集下载地址:http://m6z.cn/5UAbEW

NWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集,其拥有 650 张包含目标的图像和 150 张背景图像,共计 800 张,目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。
该数据集由西北工业大学于 2014 年发布,相关论文有《Multi-class geospatial object detection and geographic image classification based on collection of part detectors》、《A survey on object detection in optical remote sensing images》和《Learning rotation-invariant convolutional neural networks for object detection in VHR optical remote sensing images》。
在这里插入图片描述

2.8 Inria 航空影像数据集

数据集下载地址:http://m6z.cn/6nUs6s

Inria 航空影像标注解决了遥感中的一个核心主题:航空影像的自动像素级标注(论文链接)。数据集特点:

  • 覆 盖 面 积 810 平 方 公 里 ( 405 平 方 公 里 用 于 训 练 , 405 平 方公 里 用 于 测 试 )
  • 空 间 分 辨 率 为 0.3 m 的 航 空 正 射 校 正 彩 色 图 像
  • 两 个 语 义 类 的 地 面 实 况 数 据 :构 建 和 非 构 建( 仅 针 对 训 练 子 集 公
    开 披 露 )
  • 这 些 图 像 涵 盖 了 不 同 的 城 市 住 区 ,从 人 口 稠 密 的 地 区( 例 如 ,旧
    金 山 的 金 融 区 ) 到 高 山 城 镇 ( 例 如 , 奥 地 利 蒂 罗 尔 的 Lienz) 。
    在这里插入图片描述

2.9 RSOD 遥感图像数据集

数据集下载地址:http://m6z.cn/5EN96H

它是一个开放的遥感图像目标检测数据集。数据集包括飞机、油箱、游乐场和立交桥。此数据集的格式为 PASCAL VOC。数据集包括 4 个文件,每个文件用于一种对象。

  • 飞 机 数 据 集 , 446 张 图 片 中 有 4993 架 飞 机 。
  • 操 场 , 189 张 图 片 中 的 191 个 操 场 。
  • 天 桥 , 176 张 图 片 中 的 180 座 天 桥 。
  • 油 箱 , 165 张 图 片 中 的 1586 个 油 箱 。
    在这里插入图片描述

2.10 小目标检测数据集

数据集下载地址:http://m6z.cn/616t6R

从Internet(例如YouTube或Google)上的图像/视频收集的四个小物体数据集,包括4种类型的图像,可用于小物体目标检测的研究。
数据集包含四类:

  • fly:飞行数据集,包含600个视频帧,平均每帧86±39个物体(648×72 @ 30 fps)。
    32张图像用于训练(1:6:187),50张图像用于测试(301:6:600)。
  • honeybee:蜜蜂数据集,包含118张图像,每张图像平均有28±6个蜜蜂(640×480)。 数据集被平均分配用于训练和测试集。仅前32张图像用于训练。
  • seagull:海鸥数据集,包含三个高分辨率图像(624×964),每个图像平均有866±107个海鸥。
    第一张图片用于训练,其余图片用于测试。
  • fish:鱼数据集,包含387帧视频数据,平均每帧56±9条鱼(300×410 @ 30 fps)。
    32张图像进行训练(1:3:94),65张图像进行测试(193:3:387)。

在这里插入图片描述

3. 工业检测数据集

3.1 坑洼检测数据集

数据集下载地址:http://m6z.cn/5wJJTa

本数据集汇总了 700 个在坑洼处带有 3K +注释的图像,用于从道路图像中检测坑洼,检测道路地形和坑洼。
在这里插入图片描述

3.2 天池铝型材表面缺陷数据集

数据集下载地址:http://m6z.cn/61EksR

大赛数据集里有 1 万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。
在这里插入图片描述

3.3 Kylberg 纹理数据集

数据集下载地址:http://m6z.cn/61Ekw5

在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。布匹疵点检验是纺织行业生产和质量管理的重要环节,目前人工检测易受主观因素影响,缺乏一致性;并且检测人员在强光下长时间工作对视力影响极大。由于布匹疵点种类繁多、形态变化多样、观察识别难道大,导致布匹疵点智能检测是困扰行业多年的技术瓶颈。本数据涵盖了纺织业中布匹的各类重要瑕疵,每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类,其中,素色布数据约 8000 张;花色布数据约 12000 张。
在这里插入图片描述

3.4 东北大学带钢表面缺陷数据集

数据集下载地址:http://m6z.cn/5U87us

数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块 6 种缺陷,每种缺陷 300 张,图像尺寸为 200×200。数据集包括分类和目标检测两部分,不过目标检测的标注中有少量错误,需要注意。
在这里插入图片描述

3.5 Severstal 带钢缺陷数据集

数据集下载地址:http://m6z.cn/61EkBp

该数据集中提供了四种类型的带钢表面缺陷。训练集共有 12568 张,测
试集 5506 张。图像尺寸为 1600×256。
在这里插入图片描述

3.6 UCI 带钢缺陷数据集

数据集下载地址:http://m6z.cn/61EkUh

该数据集包含了 7 种带钢缺陷类型。这个数据集不是图像数据,而是带钢缺陷的 28 种特征数据,可用于机器学习项目。钢板故障的 7 种类型:装饰、Z_划痕、K_划痕、污渍、肮脏、颠簸、其他故障。
在这里插入图片描述

3.7 DAGM 2007 数据集

数据集下载地址:http://m6z.cn/5F5eQV
该数据集主要针对纹理背景上的杂项缺陷,为较弱监督的训练数据。包含十个数据集,前六个为训练数据集,后四个为测试数据集。每个数据集均包含以灰度 8 位 PNG 格式保存的 1000 个“无缺陷”图像和 150 个“有缺陷”图像,每个数据集由不同的纹理模型和缺陷模型生成。“无缺陷”图像显示的背景纹理没有缺陷,“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。所有数据集已随机分为大小相等的训练和测试子数据集。弱标签以椭圆形表示,大致表示缺陷区域。
在这里插入图片描述

3.8 磁瓦缺陷数据集

数据集下载地址:http://m6z.cn/5F5eSd

中国科学院自动所一个课题组收集的数据集,是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了 6 种常见磁瓦缺陷的图像,并做了语义分割的标注。
在这里插入图片描述

3.9 RSDDs 铁轨表面缺陷数据集

数据集下载地址:http://m6z.cn/61EkKL

RSDDs 数据集包含两种类型的数据集:第一种是从快车道捕获的 I 型 RSDDs 数据集,其中包含 67 个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的 II 型 RSDDs 数据集,其中包含 128 个具有挑战性的图像。
两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。RSDDs 数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。
在这里插入图片描述

3.10 KTH-TIPS 纹理图像数据集

数据集下载地址:http://m6z.cn/61EkMH

KTH-TIPS 是一个纹理图像数据集,在不同的光照、角度和尺度下拍摄的不同材质表面纹理图片。类型包括砂纸、铝箔、发泡胶、海绵、灯芯绒、亚麻、棉、黑面包、橙皮和饼干共 10 类。
在这里插入图片描述

3.11 印刷电路板(PCB)瑕疵数据集

数据集下载地址:http://m6z.cn/5U87Ji

这是一个公共的合成 PCB 数据集,由北京大学发布,其中包含 1386 张图像以及 6 种缺陷(缺失孔,鼠咬坏,开路,短路,杂散,伪铜),用于检测,分类和配准任务。
在这里插入图片描述

4. 人脸识别数据集

4.1 IMDB-WIKI 人脸数据集

数据集下载地址:http://m6z.cn/6gGnTd

IMDB-WIKI 500k+ 是一个包含名人人脸图像、年龄、性别的数据集,图像和年龄、性别信息从 IMDB 和 WiKi 网站抓取,总计 524230 张名人人脸图像及对应的年龄和性别。其中,获取自 IMDB 的 460723张,获取自 WiKi 的 62328 张。
在这里插入图片描述

4.2 WiderFace 人脸检测数据集

数据集下载地址:http://m6z.cn/5Nm7gp

WIDER FACE 数据集是人脸检测的一个 benchmark 数据集,包含 32203 图像,以及 393,703 个标注人脸,其中,158,989 个标注人脸位于训练集,39,496 个位于验证集。每一个子集都包含 3 个级别的检测难度:Easy,Medium,Hard。这些人脸在尺度,姿态,光照、表情、遮挡方面都有很大的变化范围。WIDER FACE 选择的图像主要来源于公开数据集 WIDER。制作者来自于香港中文大学,他们选择了 WIDER 的 61 个事件类别,对于每个类别,随机选择 40%10%50%作为训练、验证、测试集。
在这里插入图片描述

4.3 LFW 人像图像数据集

数据集下载地址:http://m6z.cn/61EnzL

该数据集是用于研究无约束面部识别问题的面部照片数据库。数据集包含从网络收集的 13000 多张图像。每张脸都贴上了所画的人的名字,图片中的 1680 人在数据集中有两个或更多不同的照片。
在这里插入图片描述

4.4 GENKI 人脸图像数据集

数据集下载地址:http://m6z.cn/5F5hLp

GENKI 数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包
含 GENKI-R2009a,GENKI-4K,GENKI-SZSL 三个部分。GENKI-R2009a
包含 11159 个图像,GENKI-4K 包含 4000 个图像,分为“笑”和“不
笑”两种,每个图片的人脸的尺度大小,姿势,光照变化,头的转动等
都不一样,专门用于做笑脸识别。GENKI-SZSL 包含 3500 个图像,这些
图像包括广泛的背景,光照条件,地理位置,个人身份和种族等。
在这里插入图片描述

4.5 哥伦比亚大学公众人物脸部数据库

数据集链接:http://m6z.cn/5DlIR9

PubFig Dataset 是一个大型人脸数据集,主要用于人脸识别和身份鉴定,其涵盖互联网上 200 人的 58,797 张图像,不同于大多数现有面部数据集,这些图像是在主体完全不受控制的情况下拍摄的,因此不同图像中姿势、光照、表情、场景、相机、成像条件和参数存在较大差异,该数据集类似于 UMass-Amherst 创建的 LFW 数据集。该数据集由哥伦比亚大学于 2009 年发布,相关论文有《Attribute and Simile Classifiers for Face Verification》。
在这里插入图片描述

4.6 CelebA 人脸数据集

数据集链接:http://m6z.cn/60EW0n

CelebFaces Attributes Dataset (CelebA) 是一个大规模的人脸属性数据集,包含超过 20 万张名人图像,每张都有 40 个属性注释。该数据集中的图像涵盖了较大的姿势变化和杂乱的背景。CelebA 种类多、数量多、注释丰富,包括 10,177 个身份,202,599 张人脸图像,以及 5个地标位置,每张图像 40 个二进制属性注释。该数据集可用作以下计算机视觉任务的训练和测试集:人脸属性识别、人脸识别、人脸检测、地标(或人脸部分)定位以及人脸编辑与合成。
在这里插入图片描述

4.7 美国国防部人脸库

数据集链接:http://m6z.cn/5So6DB
为促进人脸识别算法的研究和实用化,美国国防部的 Counterdrug Technology Transfer Program(CTTP)发起了一个人脸识别技术(Face Recognition Technology 简称 FERET)工程,它包括了一个通用人脸库以及通用测试标准。到 1997 年,它已经包含了 1000 多人的 10000 多张照片,每个人包括了不同表情,光照,姿态和年龄的照片。
在这里插入图片描述

4.8 MTFL 人脸识别数据集

数据集链接:http://m6z.cn/6fHmaT

该数据集包含 12,995 张人脸图像,这些图像用 (1) 五个面部标志,(2)性别、微笑、戴眼镜和头部姿势的属性进行了注释。
在这里插入图片描述

4.9 BioID 人脸数据集

数据集链接:http://m6z.cn/5ZUjyC

这个数据集包含了 1521 幅分辨率为 384x286 像素的灰度图像。每一幅图像来自于 23 个不同的测试人员的正面角度的人脸。为了便于做比较,这个数据集也包含了对人脸图像对应的手工标注的人眼位置文件。图像以 "BioID_xxxx.pgm"的格式命名,其中 xxxx 代表当前图像的索引(从 0开始)。类似的,形如"BioID_xxxx.eye"的文件包含了对应图像中眼睛的位置。
在这里插入图片描述

4.10 PersonID 人脸识别数据集

数据集链接:http://m6z.cn/5So6vR

该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼
猎人巴菲》和《生活大爆炸》。
在这里插入图片描述

4.11 CMU PIE 人脸库

数据集链接:http://m6z.cn/5vPwfO

CMU PIE 人脸库建立于 2000 年 11 月,它包括来自 68 个人的 40000张照片,其中包括了每个人的 13 种姿态条件,43 种光照条件和 4 种表情下的照片,现有的多姿态人脸识别的文献基本上都是在 CMU PIE 人脸库上测试的。
在这里插入图片描述

4.12 Youtube 视频人脸数据集

数据集链接:http://m6z.cn/6u3P2V

该数据集包含 1,595 个不同人的 3,425 个视频。 所有视频都是从 YouTube 下载的。 每个主题平均有 2.15 个视频可用。 最短剪辑时长为 48 帧,最长剪辑为 6070 帧,视频剪辑的平均长度为 181.3 帧。在这个数据集下,算法需要判断两段视频里面是不是同一个人。有不少在照片上有效的方法,在视频上未必有效/高效。
在这里插入图片描述

4.13 CASIA 人脸图像数据集

数据集链接:http://m6z.cn/5vPwio

CASIA 人脸图像数据库版本 5.0(或 CASIA-FaceV5)包含 500 个对象的 2,500 个彩色人脸图像。CASIA-FaceV5 的面部图像是使用罗技USB 摄像头在一个会话中捕获的。CASIA-FaceV5 的志愿者包括研究生、工人、服务员等。所有人脸图像均为 16 位彩色 BMP 文件,图像分辨率为 640*480。典型的类内变化包括照明、姿势、表情、眼镜、成像距离等。
在这里插入图片描述

4.14 Caltech 人脸数据库

数据集链接:http://m6z.cn/5So6VP

该数据集包含通过在谷歌图片搜索中输入常见的名字从网络上收集的人的图像。每个正面的眼睛、鼻子和嘴巴中心的坐标在地面实况文件中提供。此信息可用于对齐和裁剪人脸或作为人脸检测算法的基本事实。该数据集有 10,524 个不同分辨率和不同设置的人脸,例如 肖像图像、人群等。侧面或非常低分辨率的面孔未标记。
在这里插入图片描述

5. 人体姿态估计数据集

5.1 MPII 人体模型数据集

数据集链接:http://m6z.cn/69aaIe

MPII Human Shape 人体模型数据是一系列人体轮廓和形状的 3D 模型及工具。模型是从平面扫描数据库 CAESAR 学习得到。
在这里插入图片描述

5.2 MPII 人类姿态数据集

数据集链接:http://m6z.cn/6gGnPb

MPII 人体姿态数据集是用于评估人体关节姿势估计的最先进基准。该数据集包括大约 25,000 张图像,其中包含超过 40,000 个带有注释身体关节的人。这些图像是使用已建立的人类日常活动分类法系统收集的。总的来说,数据集涵盖了 410 项人类活动,每个图像都提供了一个活动标签。每张图像都是从 YouTube 视频中提取的,并提供前后未注释的帧。此外,测试集有更丰富的注释,包括身体部位遮挡和 3D 躯干和头部方向。
在这里插入图片描述

5.3 KTH 多视图足球数据集

数据集链接:http://m6z.cn/692agI

作者收集了一个带有注释关节的足球运动员数据集,可用于多视图重建。
数据集包括:

  • 771 张 足 球 运 动 员 的 照 片
  • 在 257 个 时 间 实 例 中 从 3 个 视 图 中 获 取 的 图 像
  • 14 个 带 注 释 的 身 体 关 节
    在这里插入图片描述

5.4 宾夕法尼亚动作数据集

数据集链接:http://m6z.cn/692akK

Penn Action Dataset(宾夕法尼亚大学)包含 15 个不同动作的 2326 个视频序列以及每个序列的人类联合注释。
在这里插入图片描述

5.5 BBC 姿态数据集

数据集链接:http://m6z.cn/5xr6Xq

BBC Pose 包含 20 个视频(每个视频长度为 0.5 小时至 1.5 小时),由 BBC 录制,并配有手语翻译。这 20 个视频分为 10 个用于训练的视频、5 个用于验证的视频和 5 个用于测试的视频。
在这里插入图片描述

5.6 Poser 数据集

数据集链接:http://m6z.cn/6gynqz

Poser 数据集是用于姿态估计的数据集,由 1927 个训练图像和 418个测试图像组成。这些图像是综合生成的,并调整为单峰预测。这些图像是使用 Poser 软件包生成的。
在这里插入图片描述

5.7 野外 3D 姿势数据集

数据集链接:http://m6z.cn/5xr6Z2

“野外 3D 姿势数据集”是野外第一个具有准确 3D 姿势用于评估的数据集。 虽然存在户外其他数据集,但它们都仅限于较小的记录量。 3DPW 是第一个包含从移动电话摄像头拍摄的视频片段的技术。
数据集包括:

  • 60 个视频序列。
  • 2D 姿势注释。
  • 使用我们的方法获得的 3D 姿势。 我们的方法利用了视频和 IMU,尽管场景很复杂,但姿势非常准确。
  • 序列中每一帧的相机姿势。
  • 3D 身体扫描和 3D 人物模型(可重新调整和重新塑造)。 每个序列都包含其对应的模型。
  • 18 个不同服装款式的 3D 模型。
    在这里插入图片描述

5.8 V-COCO 数据集

数据集链接:http://m6z.cn/5UGaii

V-COCO 是一个基于 COCO 的数据集,用于人机交互检测。V-COCO提供 10,346 张图像(2,533 张用于训练,2,867 张用于验证,4,946张用于测试)和 16,199 个人物实例。每个人都有 29 个动作类别的注释,并且没有包括对象在内的交互标签。
在这里插入图片描述

5.9 宜家 ASM 数据集

数据集链接:http://m6z.cn/692aos

宜家 ASM 数据集是装配任务的多模式和多视图视频数据集,可对人类活动进行丰富的分析和理解。它包含 371 个家具组件样本及其真实注释。每个样本包括 3 个 RGB 视图、一个深度流、原子动作、人体姿势、对象片段、对象跟踪和外部相机校准。
在这里插入图片描述

5.10 立体人体姿势估计数据集

数据集链接:http://m6z.cn/62cnp5

这是一个立体图像对数据集,适用于上身人的立体人体姿态估计。SHPED 由 630 个立体图像对(即 1260 个图像)组成,分为 42 个视频片段,每个片段 15 帧。这些剪辑是从 26 个立体视频中提取的,这些视频是从 YouTube 获得的,标签为 yt3d:enable = true。此外,SHPED 包含 1470 条火柴人上身注释,对应于 49 个人根据这些条件:直立位置、所有上身部分几乎可见以及身体的非侧面视点。
在这里插入图片描述

5.11 AIST++ 舞蹈动作数据集

数据集链接:http://m6z.cn/5xr6M8

AIST++ 舞蹈动作数据集是从 AIST 舞蹈视频数据库构建的。 对于多视图视频,设计了一个精心设计的管道来估计相机参数、3D 人体关键点和 3D 人体舞蹈动作序列:
它为 1010 万张图像提供 3D 人体关键点注释和相机参数,涵盖 9 个视图中的 30 个不同主题。 这些属性使其成为具有 3D 人体关键点注释的最大和最丰富的现有数据集。它还包含 1,408 个 3D 人类舞蹈动作序列,表示为关节旋转以及根轨迹。 舞蹈动作平均分布在 10 种舞蹈流派中,有数百种编舞。 运动持续时间从 7.4 秒不等。 至 48.0 秒。 所有的舞蹈动作都有相应的音乐。
在这里插入图片描述

5.12 HiEve 数据集

数据集链接:http://m6z.cn/6o4AAg

该数据集专注于在各种人群和复杂事件中进行非常具有挑战性和现实性的以人为中心的分析任务,包括地铁上下车、碰撞、战斗和地震逃生。并且具有大规模和密集注释的标签,涵盖了以人为中心的分析中的广泛任务。
在这里插入图片描述

6. 自动驾驶数据集

6.1 KITTI 道路数据集

数据集链接:http://m6z.cn/5xz4OW

道路和车道估计基准包括 289 次培训和 290 幅测试图像。我们在鸟瞰空间中评估道路和车道的估计性能。它包含不同类别的道路场景:城市无标记、城市标记、 城市多条标记车道以及以上三者的结合。
在这里插入图片描述

6.2 CrackForest 数据集

数据集链接:http://m6z.cn/5xz4Qo

CrackForest 数据集是一个带注释的道路裂缝图像数据库,可以大致反映城市路面状况。
在这里插入图片描述

6.3 KITTI-2015 立体声数据集

数据集链接:http://m6z.cn/6gGllt

stero 2015 基准测试包含 200 个训练场景和 200 个测试场景(每个场景 4 幅彩色图像,以无损 png 格式保存)。 与stereo 2012 和flow 2012 基准测试相比,它包含动态场景,在半自动过程中为其建立了真值。该数据集是通过在卡尔斯鲁厄中等规模城市、农村地区和高速公路上行驶而捕获的。 每张图像最多可以看到 15 辆汽车和 30 名行人。
在这里插入图片描述

6.4 KITTI-2015 光流数据集

数据集下载地址:http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php?benchmark=flow

Flow 2015 基准测试包含 200 个训练场景和 200 个测试场景(每个场景 4 幅彩色图像,以无损 png 格式保存)。与 stereo 2012 和 flow 2012 基准测试相比,它包含动态场景,在半自动过程中为其建立了真值。该数据集是通过在卡尔斯鲁厄中等规模城市、农村地区和高速公路上行驶而捕获的。每张图像最多可以看到 15 辆汽车和 30 名行人。

在这里插入图片描述

6.5 KITTI-2015 场景流数据集

数据集下载地址:http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php

Sceneflow 2015 基准测试包含 200 个训练场景和 200 个测试场景(每个场景 4 幅彩色图像,以无损 png 格式保存)。与 stereo 2012和 flow 2012 基准测试相比,它包含动态场景,在半自动过程中为其
建立了真值。该数据集是通过在卡尔斯鲁厄中等规模城市、农村地区和高速公路上行驶而捕获的。每张图像最多可以看到 15 辆汽车和 30 名行人。
在这里插入图片描述

6.6 KITTI 深度数据集

数据集下载地址:http://www.cvlibs.net/datasets/kitti/eval_depth_all.php

KITTI-depth 包含超过 93,000 个深度图以及相应的原始 LiDaR 扫描和 RGB 图像。鉴于大量的训练数据,该数据集应允许训练复杂的深度学习模型,以完成深度补全和单幅图像深度预测的任务。此外,该数据集提供了带有未发布深度图的手动选择图像,作为这两个具有挑战性的任务的基准。
在这里插入图片描述

7. 目标跟踪数据集

7.1 ALOV300++跟踪数据集

数据集下载地址:http://m6z.cn/61Eogv

ALOV++,Amsterdam Library of Ordinary Videos for tracking是一个物体追踪视频数据,旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪。
在这里插入图片描述

8. 动作识别数据集

8.1 HMDB 人类动作视频数据集

数据集下载地址:http://m6z.cn/6gGlzF

由布朗大学发布的人类动作视频数据集,该数据集视频多数来源于电影,还有一部分来自公共数据库以及 YouTube 等网络视频库。数据库包含有6849 段样本,分为 51 类,每类至少包含有 101 段样本。
在这里插入图片描述

8.2 UCF50 动作识别数据集

数据集下载地址:http://m6z.cn/69a8xy

UCF50 是一个由中佛罗里达大学发布的动作识别数据集,由来自 youtube 的真实视频组成,包含 50 个动作类别,如棒球投球、篮球投篮、卧推、骑自行车、骑自行车、台球、蛙泳、挺举、跳水、击鼓等。对于所有 50 个类别,视频分为 25 组,其中每组由超过 4 个动作剪辑。同一组中的视频片段可能具有一些共同的特征,例如同一个人、相似背景、相似视点等。
在这里插入图片描述

8.3 SBU Kinect 交互数据集

数据集下载地址:http://m6z.cn/6vILNp

SBU Kinect Interaction 是一个复杂的人类活动数据集,描述了两个人的交互,包括同步视频、深度和运动捕捉数据。
在这里插入图片描述

9. 图像分类数据集

9.1 宠物图像数据集

数据集下载地址:http://m6z.cn/5TAgdC

一个包含 37 个类别的宠物数据集,每个类别大约有 200 张图像。这些图像在比例、姿势和照明方面有很大的变化。所有图像都有相关的品种、头部 ROI 和像素级三元图分割的地面实况注释。
在这里插入图片描述

9.2 猫咪数据集

数据集下载地址:http://m6z.cn/5TAgbw

CAT 数据集包括超过 9,000 张猫图像。对于每张图像,猫的头部都有九个点的注释,眼睛两个,嘴巴一个,耳朵六个。
在这里插入图片描述

9.3 斯坦福狗狗数据集

数据集下载地址:http://m6z.cn/6nF6kM

斯坦福狗数据集包含来自世界各地的 120 种狗的图像。 该数据集是使用 ImageNet 中的图像和注释构建的,用于细粒度图像分类任务。
该数据集的内容:

  • 类别数:120
  • 图片数量:20,580
  • 注释:类标签、边界框
    在这里插入图片描述

9.4 CBCL 街道场景数据

数据集下载地址:http://m6z.cn/5TAgeA

StreetScenes Challenge Framework 是用于对象检测的图像、注释、软件和性能测量的集合。 每张图像都是从马萨诸塞州波士顿及其周边地区的 DSC-F717 相机拍摄的。 然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。 这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关于遮挡和其他常见的图像变换。
在这里插入图片描述

9.5 Stanford 汽车图片数据

数据集下载地址:http://m6z.cn/616wop

Cars 数据集包含 196 类汽车的 16,185 张图像。 数据分为 8,144 个训练图像和 8,041 个测试图像,其中每个类别大致按 50-50 分割。 课程通常在品牌、型号、年份级别,例如 2012 Tesla Model S 或 2012 BMW M3 coupe。
在这里插入图片描述

9.6 MNIST 手写数字图像数据集

数据集下载地址:https://www.cvmart.net/dataSets/detail/236

MNIST数据集是一个手写阿拉伯数字图像识别数据集,图片分辨率为 20x20 灰度图图片,包含‘0 - 9’ 十组手写手写阿拉伯数字的图片。其中,训练样本 60000 ,测试样本 10000,数据为图片的像素点值,作者已经对数据集进行了压缩。

在这里插入图片描述

9.7 Kaggle 垃圾分类图片数据集

数据集下载地址: https://www.cvmart.net/dataSets/detail/242

该数据集是图片数据,分为训练集85%(Train)和测试集15%(Test)。其中O代表Organic(有机垃圾),R代表Recycle(可回收)
在这里插入图片描述

10. 图像识别数据集

10.1 街景门牌号 (SVHN) 数据集

数据集下载地址:http://m6z.cn/5ExMWb

SVHN 是一个真实世界的图像数据集,用于开发机器学习和对象识别算法,对数据预处理和格式化的要求最低。它可以被视为与 MNIST 风格相似(例如,图像是经过裁剪的小数字),但包含一个数量级的更多标记数据(超过 600,000 个数字图像),并且来自一个更难、未解决的现实世界问题(识别自然场景图像中的数字和数字)。SVHN 是从谷歌街景图像中的门牌号获得的。
在这里插入图片描述

10.2 3D MNIST 数字识别图像数据

数据集下载地址:http://m6z.cn/5SUfEd

此数据集的目的是提供一种简单的方法来开始解决 3D 计算机视觉问题,例如 3D 形状识别。现在可以(轻松且廉价地)从不同来源获得精确的3D 点云:

  • RGB-D 设备:Google Tango、Microsoft Kinect 等
  • 激光雷达。
  • 从多个图像进行 3D 重建。
    在这里插入图片描述

11. 图像分割数据集

11.1 LVIS 数据集

数据集下载地址:https://www.lvisdataset.org/dataset

LVIS 是一个大规模细粒度词汇集标记数据集,该数据集针对超过 1000
类物体进行了约 200 万个高质量的实例分割标注,包含 164k 张图像。在这里插入图片描述

11.2 高密度人群及移动物体视频数据集

数据集下载地址:https://www.cvmart.net/dataSets/detail/240

Crowd Segmentation Dataset 是一个高密度人群和移动物体视频数据,视频来自BBC Motion Gallery 和 Getty Images 网站。
在这里插入图片描述

11.3 DAVIS 视频分割数据集

数据集下载地址:https://www.cvmart.net/dataSets/detail/245

Densely Annotated Video Segmentation 是一个高清视频中的物体分割数据集,包括 50个 视频序列,3455个 帧标注,视频采集自高清 1080p 格式。
在这里插入图片描述

11.4 UAVid无人机语义分割数据集

数据集下载地址: https://www.cvmart.net/dataSets/detail/1159

UAVid是一个高分辨率的无人机语义分割数据集作为补充,带来了新的挑战,包括大规模变异、运动目标识别和时间一致性保持。无人机数据集由 30 个视频序列组成,以倾斜视图捕获 4K 高分辨率图像。总共有 300 张图像被密集标记,用于语义标记任务的 8 个类别。
在这里插入图片描述

12. NLP 相关数据集

12.1 文档影印和内容数据

数据集下载地址:http://m6z.cn/6nF67S

MediaTeam Oulu Document 数据集是一个文档扫描图像和文档内容数据集,包含 500篇 1975年之前的文档信息。
在这里插入图片描述

相关文章:

计算机视觉领域开源数据集资源整理

1. 目标检测数据集 1.1 COCO2017 数据集 COCO2017 是 2017 年发布的 COCO 数据集的一个版本,主要用于 COCO 在 2017 年后持有的物体检测任务、关键点检测任务和全景分割任务。 1.2 火焰和烟雾图像数据集 数据集链接:http://m6z.cn/6fzn0f 该数据集由…...

idea更新git代码报错No Git Roots

idea更新git代码报错: No Git Roots None of configured Git roots are under Git. The configured directory must have ".git directory in it.但是本地项目里是存在.git文件的,就是突然间不能更新代码了 然后尝试重新拉新项目代码提示: Git i…...

flutter EventBus 的使用介绍

一、EventBus 初识 EventBus 是一个只有20多行的代码库, 通常用它来做事件分发。 EventBus 遵从 publish/subscribe 模式,即发布/订阅模式;简化了模块之间通信,对于项目的解耦很实用; 组件地址: https://github.com/marcojakob/dart-event-bus 源码: class EventBus…...

Spring Boot 整合 Keycloak

1、概览 本文将带你了解如何设置 Keycloak 服务器,以及如何使用 Spring Security OAuth2.0 将Spring Boot应用连接到 Keycloak 服务器。 2、Keycloak 是什么? Keycloak是针对现代应用和服务的开源身份和访问管理解决方案。 Keycloak 提供了诸如单点登…...

4-001:MySQL 中的索引数量是否越多越好?为什么?

MySQL 中的索引并不是越多越好,索引数量要合理控制! 📌 过多索引的影响 增加存储开销 每个索引都会占用额外的磁盘空间,索引多了,存储成本增加。 降低 INSERT、UPDATE、DELETE 性能 任何涉及数据修改的操作&#xff…...

C++蓝桥杯皮亚诺曲线距离求解

C蓝桥杯皮亚诺曲线距离求解 一、题目概述二、解题分析2.1解题思路2.2k值范围限制 三、实现代码四、代码测试4.1蓝桥杯测试平台4.2直接传入原始输入的k值4.3限制k值大小4.4pow函数求整数高次幂存在误差4.5满分代码 附录error: ‘long long int y1’ redeclared as different kin…...

LabVIEW伺服阀高频振动测试

在伺服阀高频振动测试中,闭环控制系统的实时性与稳定性至关重要。针对用户提出的1kHz控制频率需求及Windows平台兼容性问题,本文重点分析NI PCIe-7842R实时扩展卡的功能与局限性,并提供其他替代方案的综合对比,以帮助用户选择适合…...

Linux 》》Ubuntu 18 LTS 之后的版本 修改IP地址 主机名

进入目录 /etc/netplan 修改 50-cloud-init.yaml 》保存文件后,执行以下命令应用更改: sudo netplan apply 》》 DHCP模式 修改主机名 hostnamectl set-hostname xxxx 修改cloud.cfg 防止重启主机名还原 但测试下来 不修改, 重启 也不会还…...

使用OpenCV和MediaPipe库——抽烟检测(姿态监控)

目录 抽烟检测的运用 1. 安全监控 (1) 公共场所禁烟监管 (2) 工业安全 2. 智能城市与执法 (1) 城市违章吸烟检测 (2) 无人值守管理 3. 健康管理与医疗 (1) 吸烟习惯分析 (2) 远程监护 4. AI 监控与商业分析 (1) 保险行业 (2) 商场营销 5. 技术实现 (1) 计算机视…...

为什么要使用前缀索引,以及建立前缀索引:sql示例

背景: 你想啊,数据库里有些字段,它老长了,就像那种 varchar(255) 的字段,这玩意儿要是整个字段都拿来建索引,那可太占地方了。打个比方,这就好比你要在一个超级大的笔记本上记东西,每…...

Android UDP广播与监听

在Android中,UDP广播和监听可以通过DatagramSocket和DatagramPacket来实现。UDP广播允许你将数据包发送到网络中的所有设备,而监听则允许你接收这些广播数据包。 1. 发送UDP广播 要发送UDP广播,你需要创建一个DatagramSocket,并使…...

谷粒商城:性能压测JVM堆区

目录 Kit Apache JMeter VisualVM 堆内存 jvm内存模型 垃圾回收(Garbage Collection, GC) 新对象分配内存 GC步骤 MinorGC 性能优化 影响因素 优化 nginx动静分离 优化三级分类获取 Jvm参数配置堆区 测试 Kit Apache JMeter 压力测试&…...

Redis项目_黑马点评

部署: 1. 导入sql 开发: Session登录: session的原理是cookie,每个session都有个唯一的sessionId, 在每次访问tomcat的时候sessionId就会自动的写在cookie当中, 携带着sessionId就能找到session, 所以不需要返回用户凭证 每一个进入tomcat的请求都是有一个独立的线程来处理…...

Golang Channel 使用详解、注意事项与死锁分析

#作者:西门吹雪 文章目录 一、引言:Channel 在 Go 并发编程中的关键地位二、Channel 基础概念深度剖析2.1 独特特性2.2 类型与分类细解 三、Channel 基本使用实操指南3.1 声明与初始化3.3 单向 Channel 的运用 四、Channel 典型使用场景实战案例4.1 协程…...

CSS 入门指南(一):基本概念 选择器 常用元素属性

一、初识 CSS 1, CSS 定义 层叠样式表(Cascading Style Sheets,缩写为 CSS),是一种 样式表 语言,用来描述 HTML 文档的呈现(美化内容) CSS 能够对网页中元素位置的排版进行 像素级 精确控制,实现美化页面…...

c_cpp_properties.json等三个文件解释

不建议太小白的人看啊 在 Visual Studio Code 中使用 C 语言进行编程时,通常会看到一些特定的配置文件。这些文件是用来帮助你配置开发环境、调试程序等 就是这三个文件 首先是c_cpp_properties.json: 这是 Visual Studio Code 配置 C/C 开发环境的文件。…...

G-Star 公益行起航,挥动开源技术点亮公益!

公益组织,一直是社会温暖的传递者,但在数字化浪潮中,也面临着诸多比大众想象中复杂的挑战:项目管理如何更高效?志愿者管理又该如何创新?宣传推广怎么才能更有影响力?内部管理和技术支持又该如何…...

Jetson Xavier NX安装CUDA加速的OpenCV

我们使用SDKManager刷机完成后,使用jtop查看,发现OpenCV 是不带CUDA加速的,因此,我们需要安装CUDA加速的OpenCV,这样后续在使用的时候速度会快很多。 首先我们先卸载默认OpenCV sudo apt purge libopencv* -y sudo …...

用android studio模拟器,模拟安卓手机访问网页,使用Chrome 开发者工具查看控制台信息

web 网页项目在安卓手机打开时出现问题,想要查看控制台调试信息。记录一下使用android studio 模拟器访问的方式。 步骤如下: 1.安装android studio,新增虚拟设备(VDM- virtual device manager) 点击Virtual Device Manager后会…...

基于Transformer的医学文本分类:从BERT到BioBERT

随着自然语言处理(NLP)技术的快速发展,Transformer模型在文本分类、情感分析、机器翻译等任务中取得了显著成果。在医学领域,文本数据(如电子病历、医学文献、临床报告)具有高度的专业性和复杂性,传统的NLP方法往往难以处理。Transformer模型,尤其是BERT及其变体,通过…...

【Python】Django 中的算法应用与实现

Django 中的算法应用与实现 在 Django 开发中,算法的应用可以极大地扩展 Web 应用的功能和性能。从简单的数据处理到复杂的机器学习模型,Django 都可以作为一个强大的后端框架来支持这些算法的实现。本文将介绍几种常见的算法及其在 Django 中的使用方法…...

vs code配置 c/C++

1、下载VSCode Visual Studio Code - Code Editing. Redefined 安装目录可改 勾选创建桌面快捷方式 安装即可 2、汉化VSCode 点击确定 下载MinGW 由于vsCode 只是一个编辑器,他没有自带编译器,所以需要下载一个编译器"MinGW". https://…...

YOLO11 环境安装

1.安装Anaconda/Miniconda 在Ubuntu中安装Miniconda Anaconda/Miniconda pip 配置清华镜像源 Anaconda/Miniconda 基本操作命令 2.创建python虚拟环境 # 创建 conda create -n yolo11_env python3.12# 激活 conda activate yolo11_env 3.安装pytorch # Pytorch https://…...

BLEU评估指标

一、介绍 用于评估模型生成的句子和实际句子差异的指标,取值在[0,1],匹配度高就距离1近,反之距离0近。这个指标计算代价小,容易理解,与语言无关,与人类评价结果高度相关。 BLEU主要基于n-gram匹配&#x…...

学习路之TP6 --重写vendor目录下的文件(新建命令)

[TOC](学习路之TP6 --重写vendor目录下的文件(新建命令)) 一、新建命令文件 php think make:command CustomWorker二、修改 复制vendor\topthink\think-worker\src\command\Server.php 内容到app\command\CustomWorker.php 修改继承类:class CustomWorker exten…...

[Linux] 3588开发准备工作

背景需求 在3588上开发软件系统,用于视频流读取,处理,推流等操作。一般来说,会先买对应型号的开发板进行开发测试。同步制作硬件,等到硬件回来之后,可将代码进行烧录到嵌入式板端,能够执行相应…...

小程序网络大文件缓存方案

分享一个小程序网络大图加载慢的解决方案 用到的相关api getSavedFileList 获取已保存的文件列表;getStorageSync 获取本地缓存;downloadFile 下载网络图片;saveFile 保存文件到本地;setStorage 将数据储存到小程序本地缓存&…...

在 Windows 上快速部署 OpenManus:从安装到运行

在当今快速发展的 AI 领域,OpenManus 作为一个强大的开源工具,为开发者提供了便捷的 AI 应用开发体验。本文将详细介绍如何在 Windows 系统上安装并运行 OpenManus,帮助你快速搭建一个本地的 AI 开发环境。 一、安装 Anaconda Anaconda 是一…...

Spring Boot 3.3.4 升级导致 Logback 之前回滚策略配置不兼容问题解决

前言 在将 Spring Boot 项目升级至 3.3.4 版本后&#xff0c;遇到 Logback 配置的兼容性问题。本文将详细描述该问题的错误信息、原因分析&#xff0c;并提供调整日志回滚策略的解决方案。 错误描述 这是SpringBoot 3.3.3版本之前的回滚策略的配置 <!-- 日志记录器的滚动…...

快速集成1688商品API:10分钟实现跨境选品数据自动化

要快速集成 1688 商品 API 以实现跨境选品数据自动化&#xff0c;可参考以下步骤&#xff1a; 注册并申请 API 权限&#xff1a;注册账号创建应用并申请所需的 API 权限&#xff0c;如商品搜索、筛选、获取详情等相关权限。获取 API Key 和 Secret&#xff1a;在应用管理页面获…...

21天 - 说说 TCP 的四次挥手?TCP 的粘包和拆包能说说吗?说说 TCP 拥塞控制的步骤?

说说 TCP 的四次挥手&#xff1f; TCP 协议是一种面向连接的、可靠的、基于字节流的传输层通信协议&#xff0c;它通过著名的 “三次握手” 来建立连接。相对地&#xff0c;TCP 协议通过四次挥手来断开连接。以下是四次挥手的详细过程&#xff1a; 第一次挥手&#xff08;Clien…...

LeetCode:93. 复原 IP 地址(DFS Java)

目录 93. 复原 IP 地址 题目描述&#xff1a; 实现代码与解析&#xff1a; DFS 原理思路&#xff1a; 93. 复原 IP 地址 题目描述&#xff1a; 有效 IP 地址 正好由四个整数&#xff08;每个整数位于 0 到 255 之间组成&#xff0c;且不能含有前导 0&#xff09;&#xf…...

Flutter_学习记录_device_info_plus 插件获取设备信息

引入三方库device_info_plus导入头文件 import package:device_info_plus/device_info_plus.dart;获取设备信息的主要代码 DeviceInfoPlugin deviceInfoPlugin DeviceInfoPlugin(); BaseDeviceInfo deviceInfo await deviceInfoPlugin.deviceInfo;完整案例 import package…...

详解CISC与RISC及其区别

CISC&#xff08;Complex Instruction Set Computing&#xff0c;复杂指令集计算机&#xff09;和RISC&#xff08;Reduced Instruction Set Computing&#xff0c;精简指令集计算机&#xff09;是两种不同的计算机架构理念&#xff0c;主要区别在于指令集的设计和处理方式&…...

偶然发现了 setTimeout 的隐藏彩蛋

最近在看《JavaScript高级程序设计&#xff08;第4版&#xff09;》&#xff0c;运行书中的一个代码示例时&#xff0c;偶然发现了 setTimeout 的一些之前没注意到的特性&#xff0c;觉得挺有意思的&#xff0c;就来记录一下。 书中代码如下&#xff1a; for (var i 0; i &l…...

zerotier搭建免费moon服务器

&#x1f31f; 前言 ZeroTier是一种基于P2P的虚拟组网工具&#xff0c;通过搭建‌Moon服务器‌可大幅提升跨运营商/跨国节点的连接质量。本文使用云服务演示部署流程。 &#x1f4cb; 准备工作 ‌注册三丰云账号‌ ‌创建CentOS 8.5实例‌ &#xff08;这里选择centos8以上&a…...

Unity Timeline 扩展

这里认为大家已经会timeline的基本使用了&#xff0c;只介绍怎么自定义扩展。 第一步.自定义Track 首先要自定义一条轨道。剪辑是要在轨道里跑的&#xff0c;系统自带的轨道我们加不了自定义剪辑&#xff0c;得新建自己用的。这个很简单。 [TrackClipType(typeof(TransformTw…...

HarmonyOS第21天:解锁分布式技术,开启跨设备协同新体验

一、HarmonyOS 分布式技术&#xff1a;开启万物互联新时代 在物联网蓬勃发展的今天&#xff0c;设备之间的互联互通不再是遥不可及的梦想&#xff0c;而是真切融入日常生活的现实。从智能家居设备的联动控制&#xff0c;到智能办公场景中的高效协作&#xff0c;再到智能出行中的…...

BUUCTF Pwn [ZJCTF 2019]EasyHeap unlink+freehook做法

checksec exeinfo &#xff1a; IDA64打开&#xff1a; delete_heap函数已经将指针清零 无UAF edit_heap允许自己输入读取字节 存在堆溢出 同时 存储的指针位于bss段 那接下来就想到unlink方法&#xff1a; 图示&#xff1a; 后续修改0x6020E0的位置为freehook 再修改一次 让其…...

【解决方案】RAGFlow部分问题清单及解决方案备忘1

一、长时间显示&#xff1a;Task is queued 多半是因为模型确实在队列中排队的原因&#xff0c;要么是内存一直在被占用中&#xff0c;要么是CPU或GPU一直在被占用中&#xff0c;可以首先检查硬件利用率&#xff1a; 如果是内存导致的队列缓慢&#xff0c;可以将.env文件中的M…...

Linux笔记---文件系统硬件部分

1. 文件系统 文件系统是操作系统用于明确存储设备&#xff08;常见的是磁盘&#xff0c;也有基于NAND Flash的固态硬盘&#xff09;或分区上的文件的方法和数据结构&#xff0c;即在存储设备上组织文件的方法。 1.1 基本组成 索引节点&#xff08;inode&#xff09;&#xff…...

低成本抗衡DeepSeek-R1!QwQ-32B本地部署教程:消费级硬件可部署

QwQ-32B是阿里通义千问团队在3月6日发布的开源大模型&#xff0c;这款仅有320亿参数的模型&#xff0c;在数学、代码、通用能力等核心场景里&#xff0c;几乎跟满血版DeepSeek-R1&#xff08;6710亿参数&#xff09;不相上下。可以说实现了开源领域的降维打击。 参数规模与性能…...

二叉树中堆的实现

1 堆的声明和定义 typedef int HPDateType; typedef struct Heap {HPDateType* arr;int size;int capcity; }HP; 与顺序表相似&#xff0c;我们需要一个数组&#xff0c;有效空间大小&#xff0c;有效元素个数 2 堆的初始化 void HPInit(HP*php) {assert(php);php->arr …...

概率论的基本知识

逆概率还不懂&#xff0c;改天再想想。 联合概率 联合概率&#xff08;Joint Probability&#xff09; 是概率论中的一个重要概念&#xff0c;用于描述多个随机变量同时取某些值的概率。联合概率可以帮助我们理解多个变量之间的关系。...

LVDS(Low Voltage Differential Signaling)电平详解

一、LVDS的定义与核心特性 LVDS&#xff08;低压差分信号&#xff09;是一种 低功耗、高速、抗干扰 的差分信号传输技术&#xff0c;通过一对互补的电压信号&#xff08;正负端差值&#xff09;传递数据。其核心特性包括&#xff1a; 电气特性 电压摆幅&#xff1a;差分电压约…...

2024年第十五届蓝桥杯软件C/C++大学A组——五子棋对弈

蓝桥杯原题&#xff1a; 题目描述&#xff1a; “在五子棋的对弈中&#xff0c;友谊的小船说翻就翻&#xff1f; ” 不&#xff01;对小蓝和小桥来说&#xff0c;五子棋不仅是棋盘上的较量&#xff0c;更是心与心之间的沟通。这两位挚友秉承着 “ 友谊第一&#xff0c;比赛第二…...

OpenRewrite配方之import语句的顺序——org.openrewrite.java.OrderImports

org.openrewrite.java.OrderImports 是 OpenRewrite 工具库中的一个重要规则(Recipe),专为 Java 项目设计,用于自动化调整 import 语句的顺序,使其符合预定义的代码规范。从而提高代码的一致性和可读性。 核心功能 排序规则: 静态导入优先:默认将静态导入(import stati…...

数字电子技术基础(二十八)——TTL门电路的静态功耗和动态功耗

1 静态功耗 门电路的工作需要直流电压源的支持&#xff0c;无论在模拟电路还是在数字电路中&#xff0c;只有在外加直流电源的作用下&#xff0c;半导体二极管具有单向导电性&#xff0c;晶体管的放大能力以及开关特性才能体现出来芯片的电源端正负级。芯片的电源端正负极如果…...

RISC-V汇编学习(四)—— RISCV QEMU平台搭建(基于芯来平台)

RISCV汇编学习系列&#xff1a; RISC-V汇编学习&#xff08;一&#xff09;—— 基础认识 RISC-V汇编学习&#xff08;二&#xff09;—— 汇编语法 RISC-V汇编学习&#xff08;三&#xff09;—— RV指令集 RISC-V汇编学习&#xff08;四&#xff09;—— RISCV QEMU平台搭建…...

链表的定义、节点结构、基本操作(C++)

1. 链表的基本概念 链表是一种动态数据结构&#xff0c;它的元素&#xff08;节点&#xff09;在内存中不一定是连续存储的。每个节点通过指针连接到下一个节点&#xff0c;形成一个链式结构。链表分为单向链表、双向链表和循环链表等&#xff0c;这里主要介绍单向链表。 2. …...