コンテンツへスキップ

CIFAR-10 データセット

CIFAR-10(CanadianInstitute For Advanced Research)データセットは、機械学習やコンピュータビジョンのアルゴリズムに広く使われている画像のコレクションである。CIFAR研究所の研究者によって開発されたもので、10種類のクラスからなる60,000枚の32x32カラー画像から構成されている。

主な特徴

  • CIFAR-10データセットは60,000枚の画像から構成され、10クラスに分類されている。
  • 各クラスには6,000枚の画像が含まれ、トレーニング用に5,000枚、テスト用に1,000枚に分けられる。
  • 画像はカラーで、サイズは32x32ピクセル。
  • 10種類のクラスは、飛行機、車、鳥、猫、鹿、犬、カエル、馬、船、トラックを表している。
  • CIFAR-10は、機械学習やコンピュータビジョンの分野でのトレーニングやテストによく使用される。

データセット構造

CIFAR-10データセットは2つのサブセットに分かれている:

  1. トレーニングセット:このサブセットには、機械学習モデルの学習に使用される50,000枚の画像が含まれている。
  2. テストセット:このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。

アプリケーション

CIFAR-10データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)、その他様々な機械学習アルゴリズムなど、画像分類タスクにおけるディープラーニングモデルの学習や評価に広く利用されています。このデータセットのクラスの多様性とカラー画像の存在により、機械学習とコンピュータビジョンの分野における研究開発のための充実したデータセットとなっています。

使用方法

CIFAR-10データセットのYOLO モデルを、画像サイズ32x32で100エポック学習させるには、以下のコード・スニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar10', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

サンプル画像と注釈

CIFAR-10データセットには様々な物体のカラー画像が含まれており、画像分類タスクに適したデータセットとなっている。このデータセットに含まれる画像の例をいくつか示します:

データセットサンプル画像

この例は、CIFAR-10データセットに含まれるオブジェクトの多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

CIFAR-10データセットを研究開発で使用する場合は、以下の論文を引用してください:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるCIFAR-10データセットを作成し、維持しているAlex Krizhevsky氏に謝意を表します。CIFAR-10データセットとその作成者についての詳細は、CIFAR-10データセットのウェブサイトをご覧ください。



作成日:2023-11-12 更新日:2023-11-22
作成者:glenn-jocher(3)

コメント