Link to this sectionImageNetデータセット#

Name: ImageNet 画像分類データセット
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, 画像分類, ディープラーニング, コンピュータビジョン, 事前学習済みモデル, YOLO, データセット, WordNet

The Ultralytics ImageNet dataset (data="imagenet") is the ImageNet-1k / ILSVRC-2012 subset used to train and benchmark image classification models. It contains 1,000 object classes with 1,281,167 training images and 50,000 validation images at a 224x224 image size, and downloads to roughly 144 GB of data. The broader ImageNet database is far larger — over 14 million high-resolution images annotated with WordNet synsets across more than 20,000 categories — but Ultralytics trains on the standardized 1,000-class ILSVRC subset that became the de-facto benchmark for deep learning in computer vision.

Link to this sectionImageNet事前学習済みモデル#

モデル	サイズ ^{(ピクセル)}	精度 ^top1	精度 ^top5	速度 ^{CPU ONNX (ms)}	速度 ^{T4 TensorRT10 (ms)}	パラメータ ^(M)	FLOPs ^{(B) at 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Link to this section主な特徴#

Ultralytics imagenet データセットは、画像分類の標準的な事前学習ベンチマークである1,000クラス、1,281,167枚のトレーニング画像および50,000枚の検証画像 (ILSVRC-2012) を提供します。
クラスはWordNetの階層に従って構成されており、各クラスはシンセット（同義語の集合）に対応しています。
画像は224x224でトレーニングされ、データセット全体は約144 GBの大きなダウンロードサイズとなります。
毎年開催されるImageNet Large Scale Visual Recognition Challenge (ILSVRC)は、コンピュータビジョン研究の進歩に貢献してきました。

Link to this sectionデータセットの構造#

Ultralytics ImageNet データセットは、ILSVRC-2012の分割を使用します:

分割	画像	クラス
トレーニング	1,281,167	1,000
バリデーション	50,000	1,000

画像は、WordNetシンセットID（例：n01440764）で命名されたクラスごとのフォルダに格納されており、これがUltralyticsの分類トレーニングで想定されるレイアウトです。1,000クラスのそれぞれはWordNetシンセットに対応しており、個別のテスト用分割は存在しないため、50,000枚の画像からなる検証セットを使用して精度を測定します。

ダウンロードサイズ

ImageNet-1kは約144 GBのダウンロードとなるため、トレーニング前に十分なディスク容量があることを確認してください。簡単な実験には、同じフォルダ形式を使用し、より短時間でトレーニング可能な小規模な ImageNette および ImageNet10 サブセットをご利用ください。

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

毎年開催される ImageNet Large Scale Visual Recognition Challenge (ILSVRC) により、研究者は一貫した評価指標を備えた大規模な標準化データセット上でアルゴリズムをベンチマークできるようになりました。これは、画像分類、物体検出、およびその他のビジョンタスクにおけるディープラーニングの大きな進歩を促進しました。特に2012年のAlexNetの勝利は、現代のディープラーニング時代の幕開けを支援しました。

Link to this sectionアプリケーション#

ImageNet データセットは、画像分類、物体検出、および物体ローカリゼーションのためのディープラーニングモデルのトレーニングと評価に広く使用されています。AlexNet、VGG、ResNet といった代表的なアーキテクチャはすべてImageNet上で開発・ベンチマークされており、ImageNetで事前学習された重みは、ビジョンタスク全体にわたる転移学習の一般的な出発点であり続けています。

Link to this section使用方法#

ImageNet 上で YOLO 分類モデルを 224x224 の画像サイズで 100 エポックトレーニングするには、以下のコードスニペットを使用してください。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Ultralytics Platform を使用すると、分類データセットの管理やクラウドでのトレーニング実行も可能です。

Link to this sectionサンプル画像とアノテーション#

ImageNet データセットは1,000の ILSVRC-2012 クラスにまたがっており、コンピュータビジョンモデルのトレーニングと評価のための多様で広範なリソースを提供します。以下はデータセットの画像例です:

ImageNet分類データセットのサンプル画像

Link to this section引用と謝辞#

研究や開発活動でImageNetデータセットを使用する場合は、以下の論文を引用してください。

引用

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

私たちは、機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースとしてImageNetデータセットを作成・維持している、Olga Russakovsky、Jia Deng、Li Fei-Feiらが率いるImageNetチームに感謝の意を表します。ImageNetデータセットとその作成者に関する詳細については、ImageNetウェブサイトをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionImageNetデータセットとは何ですか？また、どのようにコンピュータビジョンで使用されますか？#

ImageNet データセットは、WordNetシンセットで注釈付けされた1,400万枚以上の高解像度画像を保持する大規模な画像データベースです。Ultralyticsでは、data="imagenet" が画像分類事前学習の事実上のベンチマークである、標準化された1,000クラスの ILSVRC-2012 サブセットでトレーニングを行います。AlexNet、VGG、ResNetなどの代表的なモデルはImageNet上でトレーニングおよびベンチマークされ、コンピュータビジョンの進歩におけるその役割が強調されています。

Link to this sectionImageNet データセットにはいくつのクラスと画像がありますか？#

Ultralytics imagenet データセットは、1,000クラス、1,281,167枚のトレーニング画像、および224x224画像サイズでの 50,000枚の検証画像 を持つ ILSVRC-2012 サブセットを使用し、合計で約144 GBのダウンロードとなります。ImageNet データベース全体ははるかに巨大（20,000以上のWordNetシンセットにわたる1,400万枚以上の画像）ですが、1,000クラスのサブセットが分類のトレーニングとベンチマークに使用されます。

Link to this sectionImageNet データセットで画像分類を行うために YOLO モデルをトレーニングするにはどうすればよいですか？#

Ultralytics YOLO モデルを ImageNet でトレーニングするには、事前学習済みの分類モデルをロードし、data に imagenet を指定します:

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

詳細なトレーニング手順については、トレーニングページを参照してください。

Link to this sectionImageNetデータセットプロジェクトにUltralytics YOLO26事前学習済みモデルを使用すべき理由は何ですか？#

Ultralytics YOLO26事前学習済みモデルは、さまざまなコンピュータビジョンタスクにおいて、速度と精度の面で最先端のパフォーマンスを提供します。例えば、Top-1精度71.4%、Top-5精度90.1%を誇るYOLO26n-clsモデルは、リアルタイムアプリケーション向けに最適化されています。事前学習済みモデルは、ゼロからトレーニングするために必要な計算リソースを削減し、開発サイクルを加速させます。YOLO26モデルのパフォーマンス指標に関する詳細は、ImageNet事前学習済みモデルセクションで確認してください。

Link to this sectionImageNet Large Scale Visual Recognition Challenge (ILSVRC)は、コンピュータビジョンにおいてどのような役割を果たしていますか？#

毎年開催される ImageNet Large Scale Visual Recognition Challenge (ILSVRC) は、大規模で標準化されたデータセット上でアルゴリズムを評価するための競争力のあるプラットフォームを提供することで、コンピュータビジョンの進歩を促進しました。その一貫した評価指標は、画像分類、物体検出、および画像セグメンテーションにおける革新を促進し、ディープラーニングとコンピュータビジョンの限界を継続的に押し広げています。

貢献者

GLglenn-jocher¹⁶ RIRizwanMunawar² RAraimbekovm¹ AMambitious-octopus¹ MAMatthewNoyce¹ JKjk4e¹

作成日 2023年11月12日更新日一昨日