CIFAR-100データセット
CIFAR-100(Canadian Institute For Advanced Research)データセットは、CIFAR-10データセットの重要な拡張であり、100種類のクラスの60,000枚の32x32カラー画像で構成されています。CIFAR研究所の研究者によって開発され、より複雑な機械学習およびコンピュータビジョンタスクのための、より挑戦的なデータセットを提供します。
見る: CIFAR-100でUltralytics YOLO11を学習する方法 | ステップバイステップ画像分類チュートリアル 🚀
主な特徴
- CIFAR-100データセットは、60,000枚の画像で構成され、100のクラスに分類されています。
- 各クラスには600枚の画像が含まれており、トレーニング用に500枚、テスト用に100枚に分割されています。
- 画像はカラーで、サイズは32x32ピクセルです。
- 100種類のクラスは、より高度な分類のために20の粗いカテゴリにグループ化されています。
- CIFAR-100は、機械学習およびコンピュータビジョンの分野におけるトレーニングおよびテストで一般的に使用されます。
データセットの構造
CIFAR-100データセットは、2つのサブセットに分割されています。
- Training Set: このサブセットには、機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
- テストセット:このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。
アプリケーション
CIFAR-100データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)をはじめとするさまざまな機械学習アルゴリズムなど、画像分類タスクにおける深層学習モデルのトレーニングと評価に広く使用されています。クラスの多様性とカラー画像の存在により、機械学習とコンピュータビジョンの分野における研究開発にとって、より挑戦的で包括的なデータセットとなっています。
使用法
画像サイズ32x32でCIFAR-100データセットのYOLOモデルを100エポックトレーニングするには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32
サンプル画像とアノテーション
CIFAR-100データセットには、さまざまなオブジェクトのカラー画像が含まれており、画像分類タスクに適した構造化されたデータセットを提供します。データセットからの画像の例をいくつか示します。
この例は、CIFAR-100データセット内のオブジェクトの多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。
引用と謝辞
CIFAR-100データセットを研究または開発で使用する場合は、次の論文を引用してください。
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるCIFAR-100データセットを作成および維持しているAlex Krizhevskyに感謝します。CIFAR-100データセットとその作成者の詳細については、CIFAR-100データセットのWebサイトをご覧ください。
よくある質問
CIFAR-100データセットとは何ですか?また、なぜ重要ですか?
CIFAR-100データセットは、100個のクラスに分類された60,000枚の32x32カラー画像の大規模なコレクションです。Canadian Institute For Advanced Research (CIFAR) によって開発され、複雑な機械学習およびコンピュータビジョンタスクに最適な、挑戦的なデータセットを提供します。その重要性は、クラスの多様性と画像の小さいサイズにあり、Ultralytics YOLOなどのフレームワークを使用して、Convolutional Neural Networks (CNN) のような深層学習モデルをトレーニングおよびテストするための貴重なリソースとなっています。
CIFAR-100 データセットで YOLO モデルをトレーニングするにはどうすればよいですか?
pythonまたはCLIコマンドのいずれかを使用して、CIFAR-100データセットでYOLOモデルをトレーニングできます。方法は次のとおりです。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32
利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
CIFAR-100データセットの主な応用例は何ですか?
CIFAR-100データセットは、画像分類のための深層学習モデルのトレーニングと評価に広く使用されています。20の粗いカテゴリにグループ化された100クラスの多様なセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、およびその他のさまざまな機械学習アプローチなどのアルゴリズムをテストするための、やりがいのある環境を提供します。このデータセットは、特に物体認識および分類タスクにおいて、機械学習およびコンピュータビジョンの分野における研究開発の重要なリソースです。
CIFAR-100データセットはどのように構成されていますか?
CIFAR-100データセットは、主に2つのサブセットに分割されています。
- Training Set: 機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
- Testing Set: トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。
100個のクラスのそれぞれに600枚の画像が含まれており、トレーニング用に500枚、テスト用に100枚の画像があるため、厳密な学術および産業研究に最適です。
CIFAR-100データセットのサンプル画像とアノテーションはどこにありますか?
CIFAR-100データセットには、さまざまなオブジェクトのカラー画像が含まれており、画像分類タスクに適した構造化されたデータセットとなっています。サンプル画像とアノテーションについては、ドキュメントページを参照してください。これらの例は、データセットの多様性と複雑さを強調しており、堅牢な画像分類モデルのトレーニングに重要です。分類タスクに適したデータセットの詳細については、Ultralyticsの分類データセットの概要をご覧ください。