ImageNet10 数据集
ImageNet10数据集是ImageNet数据库的一个小规模子集,由 Ultralytics开发的一个小规模子集,设计用于 CI 测试、正确性检查和训练管道的快速测试。该数据集由 ImageNet 前 10 个类别的训练集中的第一张图像和验证集中的第一张图像组成。虽然规模小了很多,但它保留了原始 ImageNet 数据集的结构和多样性。
主要功能
- ImageNet10 是 ImageNet 的精简版,由 20 幅图像组成,代表原始数据集的前 10 个类别。
- 该数据集按照 WordNet 层次结构组织,与整个 ImageNet 数据集的结构如出一辙。
- It is ideally suited for CI tests, sanity checks, and rapid testing of training pipelines in computer vision tasks.
- 虽然它不是为模型基准测试而设计的,但可以快速显示模型的基本功能和正确性。
数据集结构
与最初的 ImageNet 一样,ImageNet10 数据集也是采用 WordNet 层次结构组织的。ImageNet10 中的 10 个类别分别由一个同义词集(同义词的集合)来描述。ImageNet10 中的图像都标注了一个或多个同义词集,为测试识别各种对象及其关系的模型提供了紧凑的资源。
应用
ImageNet10 数据集可用于快速测试和调试计算机视觉模型和管道。该数据集体积小,可快速迭代,是持续集成测试和正确性检查的理想之选。在使用完整的 ImageNet 数据集进行全面测试之前,它还可用于对新模型或现有模型的更改进行快速初步测试。
使用方法
要在图像大小为 224x224 的 ImageNet10 数据集上测试深度学习模型,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。
测试示例
图片和注释示例
ImageNet10 数据集包含原始 ImageNet 数据集中的一个图像子集。这些图像被选来代表数据集中的前 10 个类别,为快速测试和评估提供了一个多样而紧凑的数据集。
该示例展示了 ImageNet10 数据集中图像的多样性和复杂性,凸显了该数据集对计算机视觉模型的正确性检查和快速测试的有用性。
引文和致谢
如果您在研究或开发工作中使用 ImageNet10 数据集,请引用原始 ImageNet 论文:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
We would like to acknowledge the ImageNet team, led by Olga Russakovsky, Jia Deng, and Li Fei-Fei, for creating and maintaining the ImageNet dataset. The ImageNet10 dataset, while a compact subset, is a valuable resource for quick testing and debugging in the machine learning and computer vision research community. For more information about the ImageNet dataset and its creators, visit the ImageNet website.
常见问题
什么是 ImageNet10 数据集,它与完整的 ImageNet 数据集有何不同?
ImageNet10数据集是原始ImageNet数据库的一个精简子集,由Ultralytics 创建,用于快速 CI 测试、正确性检查和训练管道评估。ImageNet10 仅包含 20 幅图像,代表 ImageNet 前 10 个类别的训练集和验证集中的第一幅图像。尽管规模较小,但它保持了完整数据集的结构和多样性,因此非常适合快速测试,但不适合作为模型的基准。
如何使用 ImageNet10 数据集测试我的深度学习模型?
要在图像大小为 224x224 的 ImageNet10 数据集上测试深度学习模型,请使用以下代码片段。
测试示例
有关可用参数的完整列表,请参阅 "培训"页面。
为什么要使用 ImageNet10 数据集进行 CI 测试和正确性检查?
The ImageNet10 dataset is designed specifically for CI tests, sanity checks, and quick evaluations in deep learning pipelines. Its small size allows for rapid iteration and testing, making it perfect for continuous integration processes where speed is crucial. By maintaining the structural complexity and diversity of the original ImageNet dataset, ImageNet10 provides a reliable indication of a model's basic functionality and correctness without the overhead of processing a large dataset.
ImageNet10 数据集有哪些主要特点?
ImageNet10 数据集有几个主要特点:
- 体积小巧:仅有 20 幅图像,便于快速测试和调试。
- 结构化组织:遵循 WordNet 层次结构,类似于完整的 ImageNet 数据集。
- CI 和合理性检查:非常适合持续集成测试和合理性检查。
- 不用于基准测试:虽然可用于快速模型评估,但不适合广泛的基准测试。
在哪里下载 ImageNet10 数据集?
您可以从Ultralytics GitHub 发布页面下载 ImageNet10 数据集。有关其结构和应用的详细信息,请参阅ImageNet10 数据集页面。