CIFAR-100 データセット

CIFAR-100 (カナダ先端研究所) データセットは、CIFAR-10 データセットを大幅に拡張したもので、100種類の異なるクラスに分類された60,000枚の32x32ピクセルカラー画像で構成されています。このデータセットはCIFAR研究所の研究者によって開発され、より複雑な機械学習およびコンピュータビジョンタスクに向けた、より難易度の高いデータセットを提供します。



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

主な特徴

  • CIFAR-100 データセットは、100のクラスに分類された60,000枚の画像で構成されています。
  • 各クラスには600枚の画像が含まれており、トレーニング用に500枚、テスト用に100枚が割り当てられています。
  • 画像はカラーで、サイズは32x32ピクセルです。
  • 100種類のクラスは、より高度な分類のために20個の粗いカテゴリにグループ化されています。
  • CIFAR-100 は、機械学習およびコンピュータビジョンの分野におけるトレーニングやテストによく使用されます。

データセットの構造

CIFAR-100 データセットは、以下の2つのサブセットに分割されています。

  1. トレーニングセット: このサブセットには、機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
  2. テストセット: このサブセットは、トレーニング済みモデルのテストおよびベンチマークに使用される10,000枚の画像で構成されています。

アプリケーション

CIFAR-100 データセットは、画像分類タスクにおける深層学習モデルのトレーニングおよび評価に広く使用されています。これには畳み込みニューラルネットワーク (CNN)、サポートベクターマシン (SVM)、その他さまざまな機械学習アルゴリズムが含まれます。クラスの多様性とカラー画像の存在により、このデータセットは機械学習およびコンピュータビジョン分野の研究開発において、より困難で包括的なデータセットとなっています。

使用方法

CIFAR-100 データセットで 100 エポック、画像サイズ 32x32 で YOLO モデルをトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

サンプル画像とアノテーション

CIFAR-100 データセットにはさまざまな物体のカラー画像が含まれており、画像分類タスクに適した構造化されたデータセットを提供します。以下にデータセットの画像例をいくつか示します。

CIFAR-100 画像分類データセットのサンプル

この例では、CIFAR-100 データセットに含まれる物体の多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。

引用と謝辞

研究や開発の業務で CIFAR-100 データセットを使用する場合は、以下の論文を引用してください。

引用
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

機械学習およびコンピュータビジョン研究コミュニティにとって価値あるリソースである CIFAR-100 データセットを作成し、維持管理している Alex Krizhevsky 氏に感謝の意を表します。CIFAR-100 データセットとその作成者に関する詳細については、CIFAR-100 データセットのウェブサイトをご覧ください。

FAQ

CIFAR-100 データセットとは何であり、なぜ重要なのでしょうか?

The CIFAR-100 dataset is a large collection of 60,000 32x32 color images classified into 100 classes. Developed by the Canadian Institute For Advanced Research (CIFAR), it provides a challenging dataset ideal for complex machine learning and computer vision tasks. Its significance lies in the diversity of classes and the small size of the images, making it a valuable resource for training and testing deep learning models, like Convolutional Neural Networks (CNNs), using frameworks such as Ultralytics YOLO.

CIFAR-100 データセットで YOLO モデルをトレーニングするにはどうすればよいですか?

Python または CLI コマンドを使用して、CIFAR-100 データセットで YOLO モデルをトレーニングできます。手順は以下の通りです。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

利用可能な引数の詳細なリストについては、モデルのトレーニングページを参照してください。

CIFAR-100 データセットの主な用途は何ですか?

CIFAR-100 データセットは、画像分類のための深層学習モデルのトレーニングと評価に広く使用されています。100のクラスを20の粗いカテゴリにグループ化したその多様なセットは、畳み込みニューラルネットワーク (CNN)、サポートベクターマシン (SVM)、およびその他のさまざまな機械学習アプローチなどのアルゴリズムをテストするための挑戦的な環境を提供します。このデータセットは、機械学習およびコンピュータビジョン分野、特に物体認識および分類タスクの研究開発における主要なリソースです。

CIFAR-100 データセットはどのように構成されていますか?

CIFAR-100 データセットは、主に2つのサブセットに分割されています。

  1. トレーニングセット: 機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
  2. テストセット: トレーニング済みモデルのテストおよびベンチマークに使用される 10,000 枚の画像で構成されています。

100のクラスそれぞれには600枚の画像が含まれており、トレーニング用に500枚、テスト用に100枚が割り当てられているため、厳密な学術研究および産業研究に特に適しています。

CIFAR-100 データセットのサンプル画像やアノテーションはどこで確認できますか?

CIFAR-100 データセットには、さまざまな物体の多様なカラー画像が含まれており、画像分類タスクに適した構造化されたデータセットです。サンプル画像とアノテーションについては、ドキュメントページを参照してください。これらの例は、堅牢な画像分類モデルをトレーニングするために重要な、データセットの多様性と複雑さを強調しています。分類タスクに適したその他のデータセットについては、Ultralytics の分類データセット概要をご確認ください。

コメント