コンテンツにスキップ

ImageNet10データセット

<a href="https://github.com/ultralytics/assets/releases/download/v0.0.0/imagenet10.zip">ImageNet10データセットは、<a href="https://www.image-net.org/">ImageNetデータベースの小規模なサブセットであり、<a href="https://www.ultralytics.com/">Ultralyticsによって開発され、CIテスト、健全性チェック、およびトレーニングパイプラインの高速テスト用に設計されています。このデータセットは、ImageNetの最初の10クラスのトレーニングセットの最初の画像と、検証セットの最初の画像で構成されています。大幅に小さいながらも、元のImageNetデータセットの構造と多様性を保持しています。

主な特徴

  • ImageNet10は、ImageNetのコンパクト版であり、元のデータセットの最初の10クラスを表す20枚の画像が含まれています。
  • データセットはWordNet階層に従って編成されており、完全なImageNetデータセットの構造を反映しています。
  • CIテスト、健全性チェック、およびコンピュータビジョンタスクにおけるトレーニングパイプラインの迅速なテストに最適です。
  • モデルのベンチマーク用に設計されたものではありませんが、モデルの基本的な機能と正確さを簡単に確認できます。

データセットの構造

ImageNet10データセットは、元のImageNetと同様に、WordNet階層を使用して編成されています。ImageNet10の10個のクラスはそれぞれ、シノニムのコレクションであるシノセットによって記述されます。ImageNet10の画像には、1つ以上のシノセットでアノテーションが付けられており、さまざまなオブジェクトとその関係を認識するためのモデルをテストするためのコンパクトなリソースを提供します。

アプリケーション

ImageNet10データセットは、コンピュータビジョンモデルとパイプラインを迅速にテストおよびデバッグするのに役立ちます。その小さなサイズにより、迅速な反復が可能になり、継続的インテグレーションテストと健全性チェックに最適です。また、完全なImageNetデータセットを使用したフルスケールテストに進む前に、新しいモデルや既存のモデルへの変更を迅速に予備テストするためにも使用できます。

使用法

画像サイズが224x224のImageNet10データセットで深層学習モデルをテストするには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

テスト例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

サンプル画像とアノテーション

ImageNet10データセットには、元のImageNetデータセットからの画像のサブセットが含まれています。これらの画像は、データセットの最初の10個のクラスを表すように選択されており、迅速なテストと評価のための多様でありながらコンパクトなデータセットを提供します。

データセットのサンプル画像

この例は、ImageNet10データセット内の画像の多様性と複雑さを示しており、健全性チェックやコンピュータビジョンモデルの迅速なテストに役立つことを強調しています。

引用と謝辞

ImageNet10データセットを研究または開発にご利用の際は、オリジナルのImageNet論文を引用してください。

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Olga Russakovsky、Jia Deng、Li Fei-Feiが率いるImageNetチームがImageNetデータセットを作成および管理していることに感謝いたします。コンパクトなサブセットであるImageNet10データセットは、機械学習とコンピュータビジョン研究コミュニティにおける迅速なテストとデバッグに役立つ貴重なリソースです。ImageNetデータセットとその作成者の詳細については、ImageNetのWebサイトをご覧ください。

よくある質問

ImageNet10データセットとは何ですか?また、完全なImageNetデータセットとどのように異なりますか?

ImageNet10データセットは、Ultralyticsによって作成された、元のImageNetデータベースのコンパクトなサブセットであり、迅速なCIテスト、サニティチェック、およびトレーニングパイプラインの評価に使用されます。ImageNet10は、ImageNetの最初の10クラスのトレーニングおよび検証セットの最初の画像を表す、わずか20枚の画像で構成されています。サイズは小さいですが、完全なデータセットの構造と多様性を維持しているため、迅速なテストには最適ですが、モデルのベンチマークには適していません。

ImageNet10 データセットを使用して、深層学習モデルをテストするにはどうすればよいですか?

画像サイズ224x224でImageNet10データセット上で深層学習モデルをテストするには、以下のコードスニペットを使用してください。

テスト例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

利用可能な引数の包括的なリストについては、トレーニングページを参照してください。

CIテストと健全性チェックにImageNet10データセットを使用する理由は何ですか?

ImageNet10データセットは、特に深層学習パイプラインにおけるCIテスト、サニティチェック、および迅速な評価のために設計されています。その小さなサイズにより、迅速な反復とテストが可能になり、速度が重要な継続的インテグレーションプロセスに最適です。元のImageNetデータセットの構造的な複雑さと多様性を維持することにより、ImageNet10は、大規模なデータセットを処理するオーバーヘッドなしに、モデルの基本的な機能と正確さの信頼できる指標を提供します。

ImageNet10データセットの主な特徴は何ですか?

ImageNet10データセットには、いくつかの重要な機能があります。

  • コンパクトサイズ: わずか20枚の画像で、迅速なテストとデバッグが可能です。
  • 構造化された構成: 完全なImageNetデータセットと同様に、WordNetの階層に従います。
  • CIとサニティチェック: 継続的インテグレーションテストとサニティチェックに最適です。
  • ベンチマーク用ではありません: クイックモデル評価には役立ちますが、広範なベンチマーク用に設計されていません。

ImageNet10はImageNetteのような他の小規模データセットと比べてどうですか?

ImageNet10ImageNetteはどちらもImageNetのサブセットですが、異なる目的で使用されます。ImageNet10には、ImageNetの最初の10クラスからの画像がわずか20枚(クラスごとに2枚)しか含まれていないため、CIテストと簡単な健全性チェックに非常に軽量です。対照的に、ImageNetteには、簡単に区別できる10個のクラスにわたって数千枚の画像が含まれているため、実際のモデルのトレーニングと開発に適しています。ImageNet10はパイプライン機能の検証用に設計されており、ImageNetteは意味のある、ただしフルImageNetよりも高速なトレーニング実験に適しています。



📅 1年前に作成 ✏️ 5ヶ月前に更新

コメント