コンテンツにスキップ

CIFAR-100データセット

CIFAR-100(Canadian Institute For Advanced Research)データセットは、CIFAR-10データセットの重要な拡張であり、100種類のクラスの60,000枚の32x32カラー画像で構成されています。CIFAR研究所の研究者によって開発され、より複雑な機械学習およびコンピュータビジョンタスクのための、より挑戦的なデータセットを提供します。



見る: CIFAR-100でUltralytics YOLO11を学習する方法 | ステップバイステップ画像分類チュートリアル 🚀

主な特徴

  • CIFAR-100データセットは、60,000枚の画像で構成され、100のクラスに分類されています。
  • 各クラスには600枚の画像が含まれており、トレーニング用に500枚、テスト用に100枚に分割されています。
  • 画像はカラーで、サイズは32x32ピクセルです。
  • 100種類のクラスは、より高度な分類のために20の粗いカテゴリにグループ化されています。
  • CIFAR-100は、機械学習およびコンピュータビジョンの分野におけるトレーニングおよびテストで一般的に使用されます。

データセットの構造

CIFAR-100データセットは、2つのサブセットに分割されています。

  1. Training Set: このサブセットには、機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
  2. テストセット:このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。

アプリケーション

CIFAR-100データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)をはじめとするさまざまな機械学習アルゴリズムなど、画像分類タスクにおける深層学習モデルのトレーニングと評価に広く使用されています。クラスの多様性とカラー画像の存在により、機械学習とコンピュータビジョンの分野における研究開発にとって、より挑戦的で包括的なデータセットとなっています。

使用法

画像サイズ32x32でCIFAR-100データセットのYOLOモデルを100エポックトレーニングするには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

学習の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

サンプル画像とアノテーション

CIFAR-100データセットには、さまざまなオブジェクトのカラー画像が含まれており、画像分類タスクに適した構造化されたデータセットを提供します。データセットからの画像の例をいくつか示します。

データセットのサンプル画像

この例は、CIFAR-100データセット内のオブジェクトの多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。

引用と謝辞

CIFAR-100データセットを研究または開発で使用する場合は、次の論文を引用してください。

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるCIFAR-100データセットを作成および維持しているAlex Krizhevskyに感謝します。CIFAR-100データセットとその作成者の詳細については、CIFAR-100データセットのWebサイトをご覧ください。

よくある質問

CIFAR-100データセットとは何ですか?また、なぜ重要ですか?

CIFAR-100データセットは、100個のクラスに分類された60,000枚の32x32カラー画像の大規模なコレクションです。Canadian Institute For Advanced Research (CIFAR) によって開発され、複雑な機械学習およびコンピュータビジョンタスクに最適な、挑戦的なデータセットを提供します。その重要性は、クラスの多様性と画像の小さいサイズにあり、Ultralytics YOLOなどのフレームワークを使用して、Convolutional Neural Networks (CNN) のような深層学習モデルをトレーニングおよびテストするための貴重なリソースとなっています。

CIFAR-100 データセットで YOLO モデルをトレーニングするにはどうすればよいですか?

pythonまたはCLIコマンドのいずれかを使用して、CIFAR-100データセットでYOLOモデルをトレーニングできます。方法は次のとおりです。

学習の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

CIFAR-100データセットの主な応用例は何ですか?

CIFAR-100データセットは、画像分類のための深層学習モデルのトレーニングと評価に広く使用されています。20の粗いカテゴリにグループ化された100クラスの多様なセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、およびその他のさまざまな機械学習アプローチなどのアルゴリズムをテストするための、やりがいのある環境を提供します。このデータセットは、特に物体認識および分類タスクにおいて、機械学習およびコンピュータビジョンの分野における研究開発の重要なリソースです。

CIFAR-100データセットはどのように構成されていますか?

CIFAR-100データセットは、主に2つのサブセットに分割されています。

  1. Training Set: 機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
  2. Testing Set: トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。

100個のクラスのそれぞれに600枚の画像が含まれており、トレーニング用に500枚、テスト用に100枚の画像があるため、厳密な学術および産業研究に最適です。

CIFAR-100データセットのサンプル画像とアノテーションはどこにありますか?

CIFAR-100データセットには、さまざまなオブジェクトのカラー画像が含まれており、画像分類タスクに適した構造化されたデータセットとなっています。サンプル画像とアノテーションについては、ドキュメントページを参照してください。これらの例は、データセットの多様性と複雑さを強調しており、堅牢な画像分類モデルのトレーニングに重要です。分類タスクに適したデータセットの詳細については、Ultralyticsの分類データセットの概要をご覧ください。



📅 1年前に作成 ✏️ 5ヶ月前に更新

コメント