コンテンツへスキップ

ImageNet10データセット

ImageNet10データセットは、ImageNetデータベースの小規模なサブセットである。 Ultralyticsによって開発されたImageNetデータベースの小規模なサブセットであり、CIテスト、サニティチェック、トレーニングパイプラインの高速テスト用に設計されている。このデータセットは、トレーニングセットの最初の画像と、ImageNetの最初の10クラスの検証セットの最初の画像で構成されています。かなり小さいが、オリジナルのImageNetデータセットの構造と多様性を保持している。

主な特徴

  • ImageNet10はImageNetのコンパクト版で、オリジナルデータセットの最初の10クラスを20枚の画像で表現している。
  • データセットはWordNetの階層に従って構成されており、ImageNetデータセットの構造を反映している。
  • CIテスト、サニティチェック、コンピュータビジョンタスクのトレーニングパイプラインの迅速なテストに最適です。
  • モデルのベンチマーク用に設計されたものではないが、モデルの基本的な機能と正しさを素早く示すことができる。

データセット構造

ImageNet10 データセットは、オリジナルの ImageNet と同様、WordNet の階層構造を用いて構成されている。ImageNet10 の 10 のクラスはそれぞれ、シンセット(同義語の集まり)によって記述される。ImageNet10 の画像は、1 つまたは複数の synset で注釈されており、さまざまなオブジェクトとその関係を認識するモデルをテストするためのコンパクトなリソースを提供します。

アプリケーション

ImageNet10データセットは、コンピュータビジョンモデルとパイプラインの迅速なテストとデバッグに役立ちます。サイズが小さいため、迅速な反復が可能で、継続的インテグレーションテストやサニティチェックに最適です。また、完全なImageNetデータセットを使った本格的なテストに移行する前に、新しいモデルの予備テストや既存モデルの変更を迅速に行うためにも使用できます。

使用方法

画像サイズ224x224のImageNet10データセットでディープラーニング・モデルをテストするには、以下のコード・スニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

テスト例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

サンプル画像と注釈

ImageNet10データセットには、オリジナルのImageNetデータセットから画像のサブセットが含まれている。これらの画像は、データセットの最初の10クラスを表すように選択され、迅速なテストと評価のための多様かつコンパクトなデータセットを提供します。

データセットサンプル画像 この例では、ImageNet10データセットの画像の多様性と複雑さを紹介し、サニティチェックやコンピュータビジョンモデルの迅速なテストに有用であることを強調しています。

引用と謝辞

研究または開発で ImageNet10 データセットを使用する場合は、元の ImageNet 論文を引用してください:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

我々は、Olga Russakovsky、Jia Deng、Li Fei-Feiが率いるImageNetチームがImageNetデータセットの作成と保守を行っていることに感謝したい。ImageNet10データセットは、コンパクトなサブセットではあるが、機械学習とコンピュータビジョンの研究コミュニティにおける迅速なテストとデバッグのための貴重なリソースである。ImageNetデータセットとその作成者の詳細については、ImageNetのウェブサイトをご覧ください。

よくあるご質問

ImageNet10データセットとはどのようなもので、フルImageNetデータセットとどのように違うのですか?

ImageNet10データセットは、オリジナルのImageNetデータベースのコンパクトなサブセットで、迅速なCIテスト、サニティチェック、トレーニングパイプラインの評価のためにUltralytics 。ImageNet10はわずか20枚の画像から構成され、ImageNetの最初の10クラスのトレーニングセットと検証セットの最初の画像を表しています。その小さなサイズにもかかわらず、完全なデータセットの構造と多様性を維持しているため、迅速なテストには最適ですが、モデルのベンチマークには適していません。

ディープラーニングモデルのテストにImageNet10データセットを使用するにはどうすればよいですか?

画像サイズ224x224のImageNet10データセットでディープラーニング・モデルをテストするには、以下のコード・スニペットを使用する。

テスト例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

利用可能な引数の包括的なリストについては、トレーニングのページを参照してください。

なぜImageNet10データセットをCIテストやサニティチェックに使う必要があるのですか?

ImageNet10データセットは、CIテスト、サニティチェック、ディープラーニングパイプラインの迅速な評価のために特別に設計されています。サイズが小さいため、迅速な反復とテストが可能で、スピードが重要な継続的インテグレーションプロセスに最適です。オリジナルのImageNetデータセットの構造の複雑さと多様性を維持することで、ImageNet10は、大規模なデータセットを処理するオーバーヘッドなしに、モデルの基本的な機能と正しさの信頼できる指標を提供します。

ImageNet10データセットの主な特徴は?

ImageNet10データセットにはいくつかの重要な特徴がある:

  • コンパクトサイズ:わずか20枚の画像で、迅速なテストとデバッグが可能です。
  • 構造化された組織:ImageNetデータセットと同様に、WordNetの階層構造に従っている。
  • CIとサニティチェック:継続的インテグレーションテストとサニティチェックに最適です。
  • ベンチマーク用ではありません:迅速なモデル評価には役立ちますが、大規模なベンチマークには適していません。

ImageNet10データセットはどこでダウンロードできますか?

ImageNet10 データセットは、Ultralytics GitHub リリースページからダウンロードできます。ImageNet10データセットの構造とアプリケーションの詳細については、ImageNet10データセットのページを参照してください。



作成日:2023-11-12 更新日:2024-07-10
作成者:glenn-jocher(8)

コメント