CIFAR-10データセット

CIFAR-10 (Canadian Institute For Advanced Research) データセットは、機械学習やコンピュータビジョンのアルゴリズムで広く使用されている画像コレクションです。CIFAR研究所の研究者によって開発され、10種類のクラスに分類された60,000枚の32x32ピクセルのカラー画像で構成されています。



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

主な特徴

  • CIFAR-10データセットは、10個のクラスに分類された60,000枚の画像で構成されています。
  • 各クラスには6,000枚の画像が含まれており、トレーニング用に5,000枚、テスト用に1,000枚に分けられています。
  • 画像はカラーで、サイズは32x32ピクセルです。
  • 10種類のクラスは、飛行機、自動車、鳥、猫、鹿、犬、カエル、馬、船、トラックを表しています。
  • CIFAR-10は、機械学習やコンピュータビジョンの分野におけるトレーニングおよびテストに一般的に使用されます。

データセットの構造

CIFAR-10データセットは、以下の2つのサブセットに分けられています:

  1. トレーニングセット: このサブセットには、機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
  2. テストセット: このサブセットは、トレーニング済みモデルのテストおよびベンチマークに使用される10,000枚の画像で構成されています。

アプリケーション

The CIFAR-10 dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The diversity of the dataset in terms of classes and the presence of color images make it a well-rounded dataset for research and development in the field of machine learning and computer vision.

使用方法

CIFAR-10データセットを使用して100 エポック分、画像サイズ32x32でYOLOモデルをトレーニングするには、以下のコードスニペットを使用できます。利用可能な引数の詳細なリストについては、モデルのトレーニングページを参照してください。

トレーニングの例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

サンプル画像とアノテーション

CIFAR-10データセットにはさまざまなオブジェクトのカラー画像が含まれており、画像分類タスクのための適切に構造化されたデータセットを提供しています。データセットに含まれる画像の例をいくつか示します:

CIFAR-10画像分類データセットサンプル

この例では、CIFAR-10データセットに含まれるオブジェクトの多様性と複雑さを示しており、堅牢な画像分類モデルをトレーニングするために多様なデータセットが重要であることを強調しています。

引用と謝辞

研究や開発作業でCIFAR-10データセットを使用する場合は、以下の論文を引用してください:

引用
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

機械学習およびコンピュータビジョン研究コミュニティにとって貴重なリソースであるCIFAR-10データセットを作成・維持してくださったAlex Krizhevsky氏に感謝いたします。CIFAR-10データセットとその作成者についての詳細は、CIFAR-10データセットのウェブサイトをご覧ください。

FAQ

CIFAR-10データセットでYOLOモデルをトレーニングするにはどうすればよいですか?

Ultralyticsを使用してCIFAR-10データセットでYOLOモデルをトレーニングするには、PythonおよびCLIの両方で提供されている例に従うことができます。以下は、画像サイズ32x32ピクセルで100エポック分モデルをトレーニングするための基本的な例です:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

詳細については、モデルのトレーニングページを参照してください。

CIFAR-10データセットの主な特徴は何ですか?

CIFAR-10データセットは、10個のクラスに分類された60,000枚のカラー画像で構成されています。各クラスには6,000枚の画像が含まれ、そのうち5,000枚がトレーニング用、1,000枚がテスト用です。画像は32x32ピクセルで、以下のカテゴリーに分類されます:

  • 飛行機
  • 自動車
  • 鹿
  • カエル
  • トラック

この多様なデータセットは、機械学習やコンピュータビジョンなどの分野で画像分類モデルをトレーニングするために不可欠です。詳細については、データセット構造およびアプリケーションのセクションをご覧ください。

なぜ画像分類タスクにCIFAR-10データセットを使用するのですか?

CIFAR-10データセットは、その多様性と構造から画像分類のための優れたベンチマークとなっています。10種類のカテゴリーにわたる60,000枚のラベル付き画像がバランスよく含まれており、堅牢で汎用性の高いモデルのトレーニングに役立ちます。これは、畳み込みニューラルネットワーク (CNN) やその他の機械学習アルゴリズムを含む、ディープラーニングモデルの評価に広く使用されています。データセットの規模が比較的小さいため、迅速な実験やアルゴリズム開発に適しています。その多くのアプリケーションについては、アプリケーションセクションをご覧ください。

CIFAR-10データセットはどのように構成されていますか?

CIFAR-10データセットは、主に2つのサブセットで構成されています:

  1. トレーニングセット: 機械学習モデルのトレーニングに使用される50,000枚の画像が含まれています。
  2. テストセット: トレーニング済みモデルのテストおよびベンチマーク用である10,000枚の画像で構成されています。

各サブセットは10個のクラスに分類された画像で構成されており、アノテーションはモデルのトレーニングや評価にすぐに使用できます。詳細については、データセット構造セクションを参照してください。

研究でCIFAR-10データセットを引用するにはどうすればよいですか?

研究や開発プロジェクトでCIFAR-10データセットを使用する場合は、必ず以下の論文を引用してください:

引用
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

データセットの作成者を明記することは、この分野における継続的な研究開発を支援することにつながります。詳細については、引用と謝辞セクションをご覧ください。

CIFAR-10データセットを使用する実用的な例にはどのようなものがありますか?

CIFAR-10データセットは、畳み込みニューラルネットワーク (CNN) やサポートベクターマシン (SVM) などの画像分類モデルのトレーニングによく使用されます。これらのモデルは、物体検出画像認識、自動タグ付けなど、さまざまなコンピュータビジョンタスクに応用できます。実用的な例を見るには、使用方法セクションのコードスニペットを確認してください。

コメント