ImageNet10 データセット
ImageNet10 データセットは、ImageNet データベースの小規模なサブセットであり、Ultralytics によって開発されました。CI テスト、サニティチェック、およびトレーニングパイプラインの高速なテストを目的として設計されています。このデータセットは、ImageNet の最初の 10 クラスにおけるトレーニングセットの最初の 1 画像と、検証セットの最初の 1 画像で構成されています。規模は大幅に小さいものの、元の ImageNet データセットの構造と多様性を維持しています。
主な特徴
- ImageNet10 は ImageNet のコンパクトなバージョンであり、元のデータセットの最初の 10 クラスを表す 20 枚の画像で構成されています。
- このデータセットは WordNet の階層に従って整理されており、フルスケールの ImageNet データセットの構造を反映しています。
- これは、コンピュータビジョン タスクにおける CI テスト、サニティチェック、およびトレーニングパイプラインの迅速なテストに最適です。
- モデルのベンチマーク用に設計されたものではありませんが、モデルの基本的な機能と正確性を素早く確認する指標を提供できます。
データセットの構造
ImageNet10 データセットは、元の ImageNet と同様に、WordNet の階層を使用して整理されています。ImageNet10 の 10 クラスのそれぞれは、シンセット(同義語の集合)によって記述されます。ImageNet10 内の画像には 1 つ以上のシンセットがアノテーションされており、さまざまなオブジェクトとその関係を認識するモデルをテストするためのコンパクトなリソースを提供します。
アプリケーション
ImageNet10 データセットは、コンピュータビジョンモデルやパイプラインの迅速なテストやデバッグに役立ちます。その小さいサイズにより迅速な反復が可能であり、CI (継続的インテグレーション) テストやサニティチェックに理想的です。また、完全な ImageNet データセット を使用したフルスケールのテストに移行する前に、新しいモデルや既存モデルへの変更の予備的なテストを高速に行うためにも使用できます。
使用方法
画像サイズ 224x224 で ImageNet10 データセットを使用してディープラーニングモデルをテストするには、以下のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルの トレーニング ページを参照してください。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)サンプル画像とアノテーション
ImageNet10 データセットには、元の ImageNet データセットからの画像のサブセットが含まれています。これらの画像はデータセットの最初の 10 クラスを表すように選択されており、迅速なテストと評価のための多様かつコンパクトなデータセットを提供します。

この例では、ImageNet10 データセットに含まれる画像の多様性と複雑さを示しており、コンピュータビジョンモデルのサニティチェックや迅速なテストにおける有用性を強調しています。
引用と謝辞
研究や開発作業で ImageNet10 データセットを使用する場合は、オリジナルの ImageNet 論文を引用してください。
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}ImageNet データセットを作成および維持している Olga Russakovsky、Jia Deng、Li Fei-Fei が率いる ImageNet チームに感謝いたします。ImageNet10 データセットはコンパクトなサブセットではありますが、機械学習 およびコンピュータビジョン研究コミュニティにおける迅速なテストとデバッグのための貴重なリソースです。ImageNet データセットとその作成者の詳細については、ImageNet ウェブサイト をご覧ください。
FAQ
ImageNet10 データセットとは何ですか。また、フルスケールの ImageNet データセットとどのように異なりますか?
ImageNet10 データセットは、ImageNet データベースのコンパクトなサブセットであり、迅速な CI テスト、サニティチェック、トレーニングパイプラインの評価のために Ultralytics が作成しました。ImageNet10 はわずか 20 枚の画像で構成されており、ImageNet の最初の 10 クラスのトレーニングセットと検証セットの最初の画像を表しています。サイズは小さいものの、フルスケールのデータセットの構造と多様性を維持しているため、迅速なテストには理想的ですが、モデルのベンチマークには適していません。
ImageNet10 データセットを使用してディープラーニングモデルをテストするにはどうすればよいですか?
画像サイズ 224x224 で ImageNet10 データセットを使用してディープラーニングモデルをテストするには、以下のコードスニペットを使用します。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)利用可能な引数の包括的なリストについては、トレーニングページを参照してください。
CI テストやサニティチェックに ImageNet10 データセットを使用すべき理由は何ですか?
ImageNet10 データセットは、ディープラーニング パイプラインにおける CI テスト、サニティチェック、および迅速な評価専用に設計されています。その小さいサイズにより迅速な反復とテストが可能であり、スピードが不可欠な継続的インテグレーションプロセスに最適です。元の ImageNet データセットの構造的な複雑さと多様性を維持することで、ImageNet10 は大規模なデータセットを処理するオーバーヘッドなしに、モデルの基本的な機能と正確性に関する信頼できる指標を提供します。
ImageNet10 データセットの主な特徴は何ですか?
ImageNet10 データセットにはいくつかの主要な特徴があります。
- コンパクトなサイズ: わずか 20 枚の画像で構成されており、迅速なテストとデバッグが可能です。
- 構造化された整理: フルスケールの ImageNet データセットと同様に、WordNet の階層に従っています。
- CI およびサニティチェック: 継続的インテグレーションテストおよびサニティチェックに最適です。
- ベンチマーク用ではない: モデルの迅速な評価には役立ちますが、広範なベンチマーク用に設計されたものではありません。
ImageNet10 は ImageNette などの他の小さなデータセットとどのように比較されますか?
ImageNet10 と ImageNette はどちらも ImageNet のサブセットですが、目的が異なります。ImageNet10 は ImageNet の最初の 10 クラスからわずか 20 枚の画像(クラスごとに 2 枚)しか含んでおらず、CI テストや迅速なサニティチェックのために非常に軽量化されています。対照的に、ImageNette は 10 の容易に識別可能なクラスにまたがる数千枚の画像を含んでおり、実際のモデルのトレーニングや開発により適しています。ImageNet10 はパイプラインの機能検証のために設計されていますが、ImageNette は完全な ImageNet よりも高速で有意義なトレーニング実験に適しています。