CIFAR-100 データセット

Q: How is the CIFAR-100 dataset structured?

CIFAR-100データセットは主に2つのサブセットに分かれている：各100クラスには600枚の画像が含まれ、500枚がトレーニング用、100枚がテスト用である。

CIFAR-100（CanadianInstitute For Advanced Research）データセットは、CIFAR-10データセットを大幅に拡張したもので、100の異なるクラスに分類された60,000枚の32x32カラー画像で構成されている。CIFAR研究所の研究者によって開発され、より複雑な機械学習とコンピュータビジョンのタスクのための、より挑戦的なデータセットを提供する。

主な特徴

CIFAR-100データセットは60,000枚の画像からなり、100のクラスに分類されている。
各クラスには600枚の画像が含まれ、トレーニング用に500枚、テスト用に100枚に分けられる。
画像はカラーで、サイズは32x32ピクセル。
100の異なるクラスは、より高度な分類のために20の粗いカテゴリーに分類される。
CIFAR-100は、機械学習やコンピュータビジョンの分野でのトレーニングやテストによく使用される。

データセット構造

CIFAR-100データセットは2つのサブセットに分かれている：

トレーニングセット：このサブセットには、機械学習モデルの学習に使用される50,000枚の画像が含まれている。
テストセット：このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。

アプリケーション

CIFAR-100データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、画像分類タスクにおけるディープラーニングモデルの学習や評価に広く利用されている。このデータセットのクラスの多様性とカラー画像の存在により、機械学習とコンピュータビジョンの分野における研究開発にとって、より挑戦的で包括的なデータセットとなっている。

使用方法

CIFAR-100データセットでYOLO モデルを画像サイズ32x32で100エポック学習させるには、以下のコードスニペットを使用します。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

列車の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

サンプル画像と注釈

CIFAR-100データセットには様々な物体のカラー画像が含まれており、画像分類タスクに適したデータセットとなっている。以下に、このデータセットに含まれる画像の例を示します：

データセットサンプル画像

この例は、CIFAR-100データセットに含まれるオブジェクトの多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

CIFAR-100データセットを研究開発で使用する場合は、以下の論文を引用してください：

ビブテックス

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

CIFAR-100データセットを機械学習とコンピュータビジョンの研究コミュニティのための貴重なリソースとして作成し、維持しているAlex Krizhevsky氏に感謝したい。CIFAR-100データセットとその作成者についての詳細は、CIFAR-100データセットのウェブサイトをご覧ください。

よくあるご質問

CIFAR-100データセットとは何ですか？

CIFAR-100データセットは、100のクラスに分類された60,000の32x32カラー画像の大規模なコレクションです。Canadian Institute For Advanced Research (CIFAR)によって開発されたこのデータセットは、複雑な機械学習やコンピュータビジョンのタスクに理想的な、チャレンジングなデータセットを提供します。その意義は、クラスの多様性と画像のサイズの小ささにあり、Ultralytics YOLO のようなフレームワークを使用して、畳み込みニューラルネットワーク（CNN）のような深層学習モデルを訓練およびテストするための貴重なリソースとなっています。

CIFAR-100 データセットでYOLO モデルをトレーニングするには？

CIFAR-100データセットに対して、Python またはCLI コマンドを使って、YOLO モデルを学習することができます。以下はその方法です：

列車の例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

CIFAR-100データセットの主な用途は？

CIFAR-100データセットは、画像分類のためのディープラーニングモデルのトレーニングと評価に広く使用されています。20の粗いカテゴリに分類された100のクラスからなる多様なセットは、畳み込みニューラルネットワーク（CNN）、サポートベクターマシン（SVM）、その他の様々な機械学習アプローチなどのアルゴリズムをテストするための挑戦的な環境を提供します。このデータセットは、機械学習やコンピュータビジョン分野の研究開発において重要なリソースとなっている。