跳转至内容

ImageNet10 数据集

The ImageNet10数据集是ImageNet数据库的小规模子集,由Ultralytics开发,专为 CI 测试、健全性检查和训练管道的快速测试而设计。该数据集由 ImageNet 中前 10 个类别的训练集中的第一张图像和验证集中的第一张图像组成。尽管尺寸显著缩小,但它保留了原始 ImageNet 数据集的结构和多样性。

主要功能

  • ImageNet10 是 ImageNet 的一个精简版本,包含 20 张图像,代表原始数据集中的前 10 个类别。
  • 该数据集按照WordNet层次结构组织,与完整的ImageNet数据集结构相呼应。
  • 它非常适合 CI 测试、完整性检查以及在计算机视觉任务中快速测试训练管道。
  • 虽然它不是为模型基准测试而设计的,但它可以快速指示模型的基本功能和正确性。

数据集结构

ImageNet10 数据集与原始ImageNet一样,使用 WordNet 层次结构进行组织。ImageNet10 中的 10 个类别都由一个同义词集(一组同义词)描述。ImageNet10 中的图像带有一个或多个同义词集标注,为测试模型识别各种物体及其关系提供了紧凑的资源。

应用

ImageNet10 数据集有助于快速测试和调试计算机视觉模型和管道。其小尺寸允许快速迭代,使其非常适合持续集成测试和健全性检查。它还可以用于对新模型或现有模型的更改进行快速初步测试,然后再使用完整的ImageNet 数据集进行全面测试。

用法

要在 ImageNet10 数据集上测试图像大小为 224x224 的深度学习模型,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

测试示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Sample Images 和注释

ImageNet10 数据集包含原始 ImageNet 数据集中的图像子集。这些图像被选来代表数据集中的前 10 个类别,提供了一个多样化但紧凑的数据集,用于快速测试和评估。

数据集 sample_images

该示例展示了 ImageNet10 数据集中图像的多样性和复杂性,突出了它在健全性检查和计算机视觉模型快速测试中的实用性。

引用和致谢

如果您在研究或开发工作中使用 ImageNet10 数据集,请引用原始 ImageNet 论文:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

我们感谢由 Olga Russakovsky、贾登和李飞飞领导的 ImageNet 团队,他们创建并维护了 ImageNet 数据集。ImageNet10 数据集虽然是一个紧凑的子集,但它是机器学习和计算机视觉研究社区进行快速测试和调试的宝贵资源。有关 ImageNet 数据集及其创建者的更多信息,请访问 ImageNet 网站

常见问题

什么是ImageNet10数据集,它与完整的ImageNet数据集有何不同?

The ImageNet10数据集是原始ImageNet数据库的紧凑子集,由 Ultralytics 创建,用于快速 CI 测试、健全性检查和训练管道评估。ImageNet10 仅包含 20 张图像,代表 ImageNet 中前 10 个类别的训练集和验证集中的第一张图像。尽管尺寸很小,但它保持了完整数据集的结构和多样性,使其非常适合快速测试,但不适合基准测试模型。

如何使用 ImageNet10 数据集来测试我的深度学习模型?

要在 ImageNet10 数据集上测试图像大小为 224x224 的深度学习模型,请使用以下代码片段。

测试示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

有关可用参数的完整列表,请参阅训练页面。

为什么我应该使用 ImageNet10 数据集进行 CI 测试和完整性检查?

ImageNet10 数据集专为深度学习管道中的 CI 测试、健全性检查和快速评估而设计。其小尺寸允许快速迭代和测试,使其非常适合速度至关重要的持续集成过程。通过保持原始 ImageNet 数据集的结构复杂性和多样性,ImageNet10 在不增加处理大型数据集的开销的情况下,提供了模型基本功能和正确性的可靠指示。

ImageNet10 数据集的主要特点是什么?

ImageNet10 数据集具有以下几个关键特性:

  • 尺寸紧凑: 仅包含 20 张图像,可以进行快速测试和调试。
  • 结构化组织:遵循 WordNet 层次结构,类似于完整的 ImageNet 数据集。
  • CI 和健全性检查: 非常适合持续集成测试和健全性检查。
  • 不适用于基准测试: 虽然对于快速模型评估很有用,但它并非设计用于广泛的基准测试。

ImageNet10 与 ImageNette 等其他小型数据集相比如何?

尽管 ImageNet10ImageNette 都是 ImageNet 的子集,但它们服务于不同的目的。ImageNet10 仅包含 ImageNet 前 10 个类别中的 20 张图像(每个类别 2 张),这使其非常轻量级,适用于 CI 测试和快速健全性检查。相比之下,ImageNette 包含数千张图像,涵盖 10 个易于区分的类别,使其更适合实际模型训练和开发。ImageNet10 旨在验证管道功能,而 ImageNette 更适合有意义但比完整 ImageNet 训练更快的实验。



📅 创建于 2 年前 ✏️ 9 个月前更新
glenn-jocherUltralyticsAssistantMatthewNoyceRizwanMunawarjk4e

评论