ImageNet10データセット
The ImageNet10データセットは、ImageNetデータベースの小規模なサブセットであり、Ultralyticsによって開発され、CIテスト、健全性チェック、およびトレーニングパイプラインの高速テスト用に設計されています。このデータセットは、ImageNetの最初の10クラスにおけるトレーニングセットの最初の画像とバリデーションセットの最初の画像で構成されています。大幅に小さいながらも、元のImageNetデータセットの構造と多様性を保持しています。
主な特徴
- ImageNet10はImageNetのコンパクト版であり、元のデータセットの最初の10クラスを表す20枚の画像で構成されています。
- このデータセットは、完全なImageNetデータセットの構造を反映し、WordNet階層に従って整理されています。
- CIテスト、健全性チェック、およびコンピュータビジョンタスクにおけるトレーニングパイプラインの迅速なテストに最適です。
- モデルのベンチマーク用に設計されたものではありませんが、モデルの基本的な機能と正確さを簡単に確認できます。
データセットの構造
The ImageNet10データセットは、元のImageNetと同様に、WordNet階層を使用して整理されています。ImageNet10の10クラスそれぞれは、synset(同義語の集合)によって記述されます。ImageNet10の画像には1つ以上のsynsetがアノテーションされており、様々なオブジェクトとその関係を認識するモデルをテストするためのコンパクトなリソースを提供します。
アプリケーション
The ImageNet10データセットは、コンピュータビジョンモデルやパイプラインの迅速なテストとデバッグに役立ちます。その小さなサイズは迅速な反復を可能にし、継続的インテグレーションテストや健全性チェックに最適です。また、完全なImageNet datasetを用いた本格的なテストに移行する前に、新しいモデルや既存モデルへの変更の高速な予備テストにも使用できます。
使用法
画像サイズが224x224のImageNet10データセットで深層学習モデルをテストするには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
テスト例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo26n-cls.pt epochs=5 imgsz=224
サンプル画像とアノテーション
The ImageNet10データセットには、元のImageNetデータセットからの画像サブセットが含まれています。これらの画像は、データセット内の最初の10クラスを代表するように選択されており、迅速なテストと評価のための多様でありながらコンパクトなデータセットを提供します。

この例は、ImageNet10データセット内の画像の多様性と複雑さを示しており、健全性チェックやコンピュータビジョンモデルの迅速なテストに役立つことを強調しています。
引用と謝辞
研究または開発作業でImageNet10データセットを使用する場合は、元のImageNet論文を引用してください。
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
ImageNetデータセットの作成と維持に尽力された、Olga Russakovsky、Jia Deng、Li Fei-Feiが率いるImageNetチームに感謝いたします。The ImageNet10データセットは、コンパクトなサブセットではありますが、機械学習およびコンピュータビジョン研究コミュニティにおける迅速なテストとデバッグのための貴重なリソースです。ImageNetデータセットとその作成者に関する詳細については、ImageNet websiteをご覧ください。
よくある質問
ImageNet10データセットとは何ですか?また、完全なImageNetデータセットとどのように異なりますか?
The ImageNet10データセットは、元のImageNetデータベースのコンパクトなサブセットであり、Ultralyticsによって迅速なCIテスト、健全性チェック、およびトレーニングパイプライン評価のために作成されました。ImageNet10は、ImageNetの最初の10クラスのトレーニングセットとバリデーションセットの最初の画像を表すわずか20枚の画像で構成されています。その小さなサイズにもかかわらず、完全なデータセットの構造と多様性を維持しており、迅速なテストには理想的ですが、モデルのベンチマークには適していません。
ImageNet10 データセットを使用して、深層学習モデルをテストするにはどうすればよいですか?
画像サイズ224x224でImageNet10データセット上で深層学習モデルをテストするには、以下のコードスニペットを使用してください。
テスト例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo26n-cls.pt epochs=5 imgsz=224
利用可能な引数の包括的なリストについては、トレーニングページを参照してください。
CIテストと健全性チェックにImageNet10データセットを使用する理由は何ですか?
The ImageNet10データセットは、deep learningパイプラインにおけるCIテスト、健全性チェック、および迅速な評価のために特別に設計されています。その小さなサイズは迅速な反復とテストを可能にし、速度が重要となる継続的インテグレーションプロセスに最適です。元のImageNetデータセットの構造的複雑さと多様性を維持することで、ImageNet10は、大規模なデータセットを処理するオーバーヘッドなしに、モデルの基本的な機能と正確性に関する信頼性の高い指標を提供します。
ImageNet10データセットの主な特徴は何ですか?
ImageNet10データセットには、いくつかの重要な機能があります。
- コンパクトサイズ: わずか20枚の画像で、迅速なテストとデバッグが可能です。
- Structured Organization: 完全なImageNetデータセットと同様に、WordNet階層に従っています。
- CIとサニティチェック: 継続的インテグレーションテストとサニティチェックに最適です。
- ベンチマーク用ではありません: クイックモデル評価には役立ちますが、広範なベンチマーク用に設計されていません。
ImageNet10はImageNetteのような他の小規模データセットと比べてどうですか?
While both ImageNet10とImageNetteはどちらもImageNetのサブセットですが、それぞれ異なる目的を持っています。ImageNet10はImageNetの最初の10クラスからわずか20枚の画像(クラスあたり2枚)しか含まれておらず、CIテストや迅速な健全性チェックに非常に軽量です。対照的に、ImageNetteは10の容易に区別できるクラスにわたる数千枚の画像を含んでおり、実際のモデルトレーニングや開発により適しています。ImageNet10はパイプライン機能の検証のために設計されており、ImageNetteは意味のある、しかしImageNet全体よりも高速なトレーニング実験に適しています。