CIFAR-10データセット
CIFAR-10(Canadian Institute For Advanced Research)データセットは、機械学習およびコンピュータビジョンアルゴリズムで広く使用されている画像のコレクションです。CIFAR研究所の研究者によって開発され、10種類のクラスの60,000枚の32x32カラー画像で構成されています。
見る: トレーニング方法 画像分類 Ultralytics YOLO11 を使用した CIFAR-10 データセットによるモデル
主な特徴
- CIFAR-10データセットは、10個のクラスに分割された60,000枚の画像で構成されています。
- 各クラスには6,000枚の画像が含まれており、トレーニング用に5,000枚、テスト用に1,000枚に分割されています。
- 画像はカラーで、サイズは32x32ピクセルです。
- 10種類のクラスは、飛行機、車、鳥、猫、鹿、犬、カエル、馬、船、トラックを表しています。
- CIFAR-10は、機械学習とコンピュータビジョンの分野におけるトレーニングとテストによく使用されます。
データセットの構造
CIFAR-10データセットは、2つのサブセットに分割されています。
- Training Set: このサブセットには、機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
- テストセット:このサブセットは、トレーニング済みモデルのテストとベンチマークに使用される10,000枚の画像で構成されています。
アプリケーション
CIFAR-10データセットは、畳み込みニューラルネットワーク(CNN)、サポートベクターマシン(SVM)をはじめとするさまざまな機械学習アルゴリズムなど、画像分類タスクにおける深層学習モデルのトレーニングと評価に広く使用されています。クラスの多様性とカラー画像の存在により、機械学習とコンピュータビジョンの分野における研究開発に適した、バランスの取れたデータセットとなっています。
使用法
画像サイズが32x32のCIFAR-10データセットでYOLOモデルを100エポック学習させるには、次のコードスニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。
学習の例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
サンプル画像とアノテーション
CIFAR-10データセットには、さまざまなオブジェクトのカラー画像が含まれており、画像分類タスクのための構造化されたデータセットを提供します。以下は、データセットからの画像の例です。
この例では、CIFAR-10データセット内のオブジェクトの多様性と複雑さを紹介し、堅牢な画像分類モデルをトレーニングするための多様なデータセットの重要性を強調しています。
引用と謝辞
CIFAR-10 データセットを研究または開発で使用する場合は、次の論文を引用してください。
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
機械学習とコンピュータビジョンの研究コミュニティにとって貴重なリソースであるCIFAR-10データセットを作成および管理しているAlex Krizhevsky氏に感謝いたします。CIFAR-10データセットとその作成者の詳細については、CIFAR-10データセットのWebサイトをご覧ください。
よくある質問
CIFAR-10データセットでYOLOモデルをトレーニングするにはどうすればよいですか?
Ultralyticsを使用してCIFAR-10データセットでYOLOモデルを学習させるには、pythonとCLIの両方について提供されている例に従うことができます。次に、画像サイズが32x32ピクセルのモデルを100エポック学習させるための基本的な例を示します。
例
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
詳細については、モデルのTrainingページを参照してください。
CIFAR-10データセットの主な特徴は何ですか?
CIFAR-10データセットは、10個のクラスに分割された60,000枚のカラー画像で構成されています。各クラスには6,000枚の画像が含まれており、5,000枚がトレーニング用、1,000枚がテスト用です。画像サイズは32x32ピクセルで、次のカテゴリに分類されます。
- 航空機
- Cars
- 鳥
- 猫
- 鹿
- 犬
- Frogs
- 馬
- 船舶
- トラック
この多様なデータセットは、機械学習やコンピュータビジョンなどの分野における画像分類モデルのトレーニングに不可欠です。詳細については、データセット構造およびアプリケーションに関する CIFAR-10 のセクションをご覧ください。
画像分類タスクにCIFAR-10データセットを使用する理由
CIFAR-10データセットは、その多様性と構造により、画像分類のための優れたベンチマークです。10個の異なるカテゴリにわたる60,000枚のラベル付き画像のバランスの取れた組み合わせが含まれており、堅牢で汎用的なモデルのトレーニングに役立ちます。畳み込みニューラルネットワーク(CNN)やその他の機械学習アルゴリズムを含む、深層学習モデルの評価に広く使用されています。データセットは比較的小さいため、迅速な実験とアルゴリズム開発に適しています。アプリケーションセクションで、その多数のアプリケーションをご覧ください。
CIFAR-10データセットはどのように構成されていますか?
CIFAR-10データセットは、主に2つのサブセットで構成されています。
- Training Set: 機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
- テストセット:トレーニング済みモデルのテストとベンチマーク用の10,000枚の画像で構成されています。
各サブセットは10個のクラスに分類された画像で構成されており、モデルのトレーニングと評価にすぐに利用できるアノテーションが付いています。詳細については、データセット構造のセクションを参照してください。
研究でCIFAR-10データセットを引用するにはどうすればよいですか?
CIFAR-10 データセットを研究または開発プロジェクトで使用する場合は、必ず次の論文を引用してください。
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
データセットの作成者に謝意を表することは、この分野における継続的な研究開発を支援することにつながります。詳細については、引用と謝辞のセクションをご覧ください。
CIFAR-10データセットを使用する実用的な例は何ですか?
CIFAR-10データセットは、畳み込みニューラルネットワーク(CNN)やサポートベクターマシン(SVM)などの画像分類モデルのトレーニングによく使用されます。これらのモデルは、物体検出、画像認識、自動タグ付けなど、さまざまなコンピュータビジョンタスクに利用できます。具体的な例については、使用方法セクションのコードスニペットをご覧ください。