Link to this sectionImageNet 数据集#

Name: ImageNet 图像分类数据集
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, 图像分类, 深度学习, 计算机视觉, 预训练模型, YOLO, 数据集, WordNet

Ultralytics ImageNet 数据集 (data="imagenet") 是用于训练和基准测试图像分类模型的 ImageNet-1k / ILSVRC-2012 子集。它包含 1,000 个对象类别，拥有 1,281,167 张训练图像 和 50,000 张验证图像，图像大小为 224x224，下载大小约为 144 GB。更广泛的 ImageNet 数据库规模要大得多——拥有超过 1400 万张高分辨率图像，并标注了超过 20,000 个类别的 WordNet 同义词集 (synsets)——但 Ultralytics 使用标准化的 1,000 类 ILSVRC 子集进行训练，该子集已成为深度学习在计算机视觉领域的基准事实标准。

Link to this sectionImageNet 预训练模型#

模型	尺寸 ^(像素)	准确率 ^top1	准确率 ^top5	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	参数量 ^(M)	FLOPs ^{(B) at 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Link to this section主要特性#

Ultralytics imagenet 数据集提供 1,000 个类别，包含 1,281,167 张训练图像和 50,000 张验证图像 (ILSVRC-2012)，这是图像分类的标准预训练基准。
类别按照 WordNet 层级结构组织，每个类别对应一个同义词集 (synset，即一组同义词)。
图像在 224x224 尺寸下进行训练，完整数据集的下载大小约为 ~144 GB。
年度 ImageNet 大规模视觉识别挑战赛 (ILSVRC) 在推动计算机视觉研究方面发挥了重要作用。

Link to this section数据集结构#

Ultralytics ImageNet 数据集使用 ILSVRC-2012 划分：

拆分	图像	类别
训练	1,281,167	1,000
验证	50,000	1,000

图像存储在按 WordNet 同义词集 ID 命名的文件夹中（例如 n01440764），这是 Ultralytics 分类训练所要求的布局。1,000 个类别中的每一个都映射到一个 WordNet 同义词集，并且没有单独的测试集划分，因此使用 50,000 张图像的验证集来衡量准确率。

下载大小

ImageNet-1k 下载大小约为 ~144 GB，因此在训练前请确保你有足够的磁盘空间。对于快速实验，较小的 ImageNette 和 ImageNet10 子集使用相同的文件夹格式，并且训练时间仅需极短时间。

Link to this sectionImageNet 大规模视觉识别挑战赛 (ILSVRC)#

一年一度的 ImageNet 大规模视觉识别挑战赛 (ILSVRC) 让研究人员可以在具有一致评估指标的大规模标准化数据集上对算法进行基准测试。它推动了图像分类、对象检测以及其他视觉任务深度学习领域的重大进步——最著名的是 AlexNet 在 2012 年的获胜，这有助于开启现代深度学习时代。

Link to this section应用#

ImageNet 数据集被广泛用于训练和评估用于图像分类、对象检测和对象定位的深度学习模型。像 AlexNet、VGG 和 ResNet 等标志性架构都是在 ImageNet 上开发和进行基准测试的，而 ImageNet 预训练权重仍然是跨视觉任务进行迁移学习的常用起点。

Link to this section用法#

若要在 ImageNet 上以 224x224 图像尺寸训练 YOLO 分类模型 100 个 epoch，请使用下方的代码片段。有关可用参数的完整列表，请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

你也可以使用 Ultralytics Platform 在云端管理分类数据集并进行训练。

Link to this section样本图像和标注#

ImageNet 数据集涵盖了 1,000 个 ILSVRC-2012 类别，为训练和评估计算机视觉模型提供了多样且广泛的资源。以下是数据集中的一些图像示例：

ImageNet 分类数据集样本图像

Link to this section引用与致谢#

如果你在研究或开发工作中使用 ImageNet 数据集，请引用以下论文：

引用

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

我们衷心感谢由 Olga Russakovsky、Jia Deng 和 Li Fei-Fei 领导的 ImageNet 团队，他们创建并维护了 ImageNet 数据集，使其成为机器学习和计算机视觉研究社区的宝贵资源。欲了解有关 ImageNet 数据集及其创建者的更多信息，请访问 ImageNet 网站。

Link to this section常见问题解答#

Link to this section什么是 ImageNet 数据集？它在计算机视觉中是如何使用的？#

ImageNet 数据集是一个大规模图像数据库，其更广泛的集合包含超过 1400 万张标注有 WordNet 同义词集的高分辨率图像。在 Ultralytics 中，data="imagenet" 在标准化的 1,000 类 ILSVRC-2012 子集上进行训练，该子集是图像分类预训练的事实标准基准。像 AlexNet、VGG 和 ResNet 等标志性模型都是在 ImageNet 上训练和进行基准测试的，这凸显了它在推动计算机视觉方面的重要作用。