数据集概览
Ultralytics 支持多种数据集,以辅助计算机视觉任务,例如检测、实例分割、语义分割、姿态估计、分类和多目标跟踪。以下是主要的 Ultralytics 数据集列表,随后是每项计算机视觉任务及其对应数据集的摘要。
Watch: Ultralytics Datasets Overview
目标检测
边界框目标检测是一种计算机视觉技术,通过在每个对象周围绘制边界框来检测并定位图像中的对象。
- African-wildlife:一个包含非洲野生动物图像的数据集,包括水牛、大象、犀牛和斑马。
- Argoverse:一个包含来自城市环境的 3D 跟踪和运动预测数据的数据集,具有丰富的标注。
- Brain-tumor:一个用于检测脑肿瘤的数据集,包含 MRI 或 CT 扫描图像,并提供肿瘤的存在情况、位置和特征详情。
- COCO:Common Objects in Context (COCO) 是一个大规模目标检测、分割和字幕生成数据集,包含 80 个对象类别。
- COCO8:COCO 训练集和验证集前 4 张图片组成的小型子集,适用于快速测试。
- COCO8-Grayscale:通过将 RGB 转换为灰度而创建的 COCO8 灰度版本,适用于单通道模型评估。
- COCO8-Multispectral:通过插值 RGB 波长创建的 COCO8 10 通道多光谱版本,适用于光谱感知模型评估。
- COCO128:COCO 训练集和验证集前 128 张图片组成的小型子集,适用于测试。
- Construction-PPE:一个建筑工地图像数据集,标注了头盔、背心、手套、靴子和护目镜等关键安全装备,并包含缺失设备的标签,支持用于合规性和工人保护的 AI 模型开发。
- Global Wheat 2020:一个包含 2020 年全球小麦挑战赛麦穗图像的数据集。
- HomeObjects-3K:一个包含 12 种常见家居用品标注室内场景的数据集,非常适合在智能家居系统、机器人和增强现实中开发和测试计算机视觉模型。
- KITTI 新增:一个知名自动驾驶数据集,具有立体视觉、LiDAR 和 GPS/IMU 输入,用于多样化道路场景中的 2D 目标检测。
- LVIS:一个包含 1203 个对象类别的大规模目标检测、分割和字幕生成数据集。
- Medical-pills:一个包含药丸标注图像的数据集,旨在辅助药品质量控制、分类和确保符合行业标准等任务。
- Objects365:一个高质量的大规模目标检测数据集,拥有 365 个对象类别和超过 60 万张标注图像。
- OpenImagesV7:由 Google 提供的综合数据集,包含 170 万张训练图像和 4.2 万张验证图像。
- RF100:一个多样化的目标检测基准,包含跨越七个图像领域的 100 个数据集,用于全面模型评估。
- Signature:一个包含带标注签名的各类文档图像数据集,支持文档验证和欺诈检测研究。
- SKU-110K:一个零售环境中密集目标检测的数据集,包含超过 1.1 万张图像和 170 万个边界框。
- VisDrone:一个包含无人机拍摄图像中的目标检测和多目标跟踪数据的数据集,具有超过 1 万张图像和视频序列。
- VOC:Pascal Visual Object Classes (VOC) 数据集,用于目标检测和分割,包含 20 个对象类别和超过 1.1 万张图像。
- xView:一个高空图像目标检测数据集,包含 60 个对象类别和超过 100 万个标注对象。
实例分割
实例分割是一种计算机视觉技术,涉及在像素级别识别和定位图像中的对象。与仅对每个像素进行分类的语义分割不同,实例分割可以区分同一类别的不同实例。
- Carparts-seg:专为识别车辆部件而构建的数据集,满足设计、制造和研究需求。它适用于目标检测和分割任务。
- COCO:一个为目标检测、分割和字幕生成任务设计的大规模数据集,包含超过 20 万张标注图像。
- COCO8-seg:一个用于实例分割任务的小型数据集,包含 8 张带有分割标注的 COCO 图像子集。
- COCO128-seg:一个用于实例分割任务的小型数据集,包含 128 张带有分割标注的 COCO 图像子集。
- Crack-seg:专门为检测道路和墙壁裂缝而制作的数据集,适用于目标检测和分割任务。
- Package-seg:为识别仓库或工业环境中的包裹而定制的数据集,适用于目标检测和分割应用。
语义分割
语义分割为图像中的每个像素分配一个类标签,从而生成密集的场景地图,适用于自动驾驶、场景解析和土地覆盖绘图等应用。
- Cityscapes:城市街道场景语义分割数据集,包含 19 个训练类别。
- Cityscapes8:一个紧凑的 8 图像 Cityscapes 子集,用于快速检查语义分割流水线。
- ADE20K:包含 150 个语义类别的场景解析数据集。
姿态估计
姿态估计是一种用于确定对象相对于相机或世界坐标系的姿态的技术。这涉及识别对象(特别是人类或动物)上的关键点或关节。
- COCO:一个包含人体姿态标注的大规模数据集,专为姿态估计任务设计。
- COCO8-pose:一个用于姿态估计任务的小型数据集,包含 8 张带有人体姿态标注的 COCO 图像子集。
- Dog-pose:一个包含约 6000 张以狗为中心图像的综合数据集,每只狗标注了 24 个关键点,专为姿态估计任务定制。
- Hand-Keypoints:一个简洁的数据集,包含超过 2.6 万张以人手为中心的图像,每只手标注了 21 个关键点,专为姿态估计任务设计。
- Tiger-pose:一个包含 263 张以老虎为中心图像的紧凑数据集,每只老虎标注了 12 个关键点,用于姿态估计任务。
分类
图像分类是一种计算机视觉任务,涉及根据视觉内容将图像归类为预定义的一个或多个类或类别。
- Caltech 101:一个包含 101 个对象类别的图像数据集,用于图像分类任务。
- Caltech 256:Caltech 101 的扩展版本,包含 256 个对象类别和更具挑战性的图像。
- CIFAR-10:一个包含 10 个类别、每类 6000 张 32x32 彩色图像的数据集,总计 6 万张。
- CIFAR-100:CIFAR-10 的扩展版本,包含 100 个对象类别,每类 600 张图像。
- Fashion-MNIST:一个包含 10 个时尚类别、共 7 万张灰度图像的数据集,用于图像分类任务。
- ImageNet:一个大规模目标检测和图像分类数据集,拥有超过 1400 万张图像和 2 万个类别。
- ImageNet-10:ImageNet 的一个较小 10 类子集,用于更快的实验和测试。
- Imagenette:ImageNet 的一个较小子集,包含 10 个易于区分的类别,用于更快的训练和测试。
- Imagewoof:ImageNet 的一个更具挑战性的子集,包含 10 个狗品种类别,用于图像分类任务。
- MNIST:一个包含 7 万张手写数字灰度图像的数据集,用于图像分类任务。
- MNIST160:MNIST 数据集中每个类别的前 8 张图像。数据集总共包含 160 张图像。
旋转边界框 (OBB)
旋转边界框 (OBB) 是一种计算机视觉方法,用于通过旋转框检测图像中的倾斜对象,通常应用于航空和卫星图像。与传统边界框不同,OBB 能更好地贴合处于各种方向的对象。
- DOTA-v2:一个流行的 OBB 航空图像数据集,包含 170 万个实例和 11268 张图像。
- DOTA8:DOTAv1 分割集中前 8 张图片的小型子集,4 张用于训练,4 张用于验证,适用于快速测试。
- DOTA128:DOTA 数据集的 128 张图片子集,包含 128 张用于训练和验证的图片,为测试 OBB 模型提供了规模和多样性之间的良好平衡。
多目标跟踪
多目标跟踪是一种计算机视觉技术,涉及在视频序列中随时间检测和跟踪多个对象。此任务扩展了目标检测,在帧间保持一致的对象标识。
- Argoverse:一个包含来自城市环境的 3D 跟踪和运动预测数据的数据集,具有丰富的多目标跟踪任务标注。
- VisDrone:一个包含无人机拍摄图像中的目标检测和多目标跟踪数据的数据集,具有超过 1 万张图像和视频序列。
贡献新数据集
贡献新数据集涉及多个步骤,以确保其与现有基础设施良好对接。以下是必要步骤:
Watch: How to Contribute to Ultralytics Datasets
贡献新数据集的步骤
-
收集图像:收集属于数据集的图像。这些可以从各种来源收集,例如公共数据库或你自己的收藏。
-
标注图像:根据任务,使用边界框、分割或关键点对这些图像进行标注。
-
导出标注:将这些标注转换为 Ultralytics 支持的 YOLO
*.txt文件格式。 -
组织数据集:将你的数据集整理成正确的文件夹结构。你应该拥有顶级的
images/和labels/目录,并在每个目录下包含train/和val/子目录。dataset/ ├── images/ │ ├── train/ │ └── val/ └── labels/ ├── train/ └── val/ -
创建
data.yaml文件:在数据集的根目录下,创建一个data.yaml文件,用于描述数据集、类别和其他必要信息。 -
优化图像(可选):如果你想减小数据集大小以提高处理效率,可以使用以下代码优化图像。这不是必须的,但对于较小的数据集规模和更快的下载速度,建议这样做。
-
压缩数据集:将整个数据集文件夹压缩为 zip 文件。
-
文档和 PR:创建一个描述你的数据集及其如何融入现有框架的文档页面。之后,提交一个合并请求 (PR)。有关如何提交 PR 的更多详细信息,请参阅 Ultralytics 贡献指南。
优化和压缩数据集的示例代码
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)通过遵循这些步骤,你可以贡献一个能与 Ultralytics 现有结构良好集成的优质数据集。
常见问题 (FAQ)
Ultralytics 支持哪些目标检测数据集?
Ultralytics 支持多种目标检测数据集,包括:
- COCO:一个大规模目标检测、分割和字幕生成数据集,包含 80 个对象类别。
- LVIS:一个包含 1203 个对象类别的广泛数据集,专为更细粒度的目标检测和分割而设计。
- Argoverse:一个包含来自城市环境的 3D 跟踪和运动预测数据的数据集,具有丰富的标注。
- VisDrone:一个包含来自无人机拍摄图像的目标检测和多目标跟踪数据的数据集。
- SKU-110K:在零售环境中进行密集目标检测,包含超过 1.1 万张图像。
这些数据集有助于为各种目标检测应用训练强大的 Ultralytics YOLO 模型。
我该如何向 Ultralytics 贡献新数据集?
贡献新数据集涉及多个步骤:
- 收集图像:从公共数据库或个人收藏中收集图像。
- 标注图像:根据任务应用边界框、分割或关键点。
- 导出标注:将标注转换为 YOLO
*.txt格式。 - 组织数据集:使用包含
train/和val/目录的文件夹结构,每个目录下包含images/和labels/子目录。 - 创建
data.yaml文件:包含数据集描述、类别和其他相关信息。 - 优化图像(可选):减小数据集大小以提高效率。
- 压缩数据集:将数据集压缩为 zip 文件。
- 文档和 PR:描述你的数据集并按照 Ultralytics 贡献指南提交合并请求。
请访问 贡献新数据集 获取完整指南。
为什么我应该为我的数据集使用 Ultralytics 平台?
Ultralytics Platform 提供了用于数据集管理和分析的强大功能,包括:
- 无缝数据集管理:在一个地方上传、组织和管理你的数据集。
- 即时训练集成:直接使用上传的数据集进行模型训练,无需额外设置。
- 可视化工具:探索并可视化你的数据集图像和标注。
- 数据集分析:深入了解你的数据集分布和特征。
该平台简化了从数据集管理到模型训练的过渡,使整个流程更加高效。了解更多关于 Ultralytics Platform Datasets 的信息。
Ultralytics YOLO 模型在计算机视觉方面有哪些独特功能?
Ultralytics YOLO 模型为 computer vision 任务提供了多项独特功能:
- 实时性能:为时间敏感型应用提供高速推理和训练能力。
- 多功能性:在统一框架中支持检测、实例分割、语义分割、分类和姿态估计任务。
- 预训练模型:访问高性能的预训练模型以应对各种应用,从而减少训练时间。
- 广泛的社区支持:拥有活跃的社区和全面的文档,便于故障排除和开发。
- 易于集成:简单的 API,可与现有项目和工作流集成。
在 Ultralytics Models 页面探索更多关于 YOLO 模型的内容。
如何使用 Ultralytics 工具优化并压缩数据集?
要使用 Ultralytics 工具优化并压缩数据集,请参考以下示例代码:
from pathlib import Path
from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory
# Define dataset directory
path = Path("path/to/dataset")
# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
compress_one_image(f)
# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)此过程有助于减小数据集大小,从而实现更高效的存储和更快的下载速度。了解更多关于 优化和压缩数据集 的信息。