No license

Link to this sectionCIFAR-10 データセット#

CIFAR-10 (Canadian Institute For Advanced Research) データセットは、60,000枚の32x32カラー画像を10のクラス（飛行機、自動車、鳥、猫、鹿、犬、カエル、馬、船、トラック）に均等に分類した、標準的な画像分類のベンチマークです。このデータセットには、50,000枚のトレーニング用画像と10,000枚のテスト用画像（各クラス6,000枚）があらかじめ用意されており、分類モデルのトレーニングやベンチマークを開始するための軽量でバランスの取れたデータセットとなっています。より細かな分類に挑戦したい場合は、関連するCIFAR-100データセットを参照してください。

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this section主な特徴#

CIFAR-10には、32x32ピクセルのカラー画像が60,000枚含まれており、10のクラスに均等に分割されています。
各クラスには正確に6,000枚の画像（トレーニング用に5,000枚、テスト用に1,000枚）が含まれており、データセットは完全にバランスが取れています。
10のクラスは、飛行機、自動車、鳥、猫、鹿、犬、カエル、馬、船、トラックです。
このデータセットにはあらかじめトレーニング用とテスト用の分割が設定されているため、手動または自動で分割を行う必要はありません。
CIFAR-10は、画像分類および物体認識研究のための標準的なベンチマークです。

Link to this sectionデータセットの構造#

CIFAR-10には公式にあらかじめ設定された分割が含まれているため、自動または手動でのパーティション設定は不要です。

クラス: 10（飛行機、自動車、鳥、猫、鹿、犬、カエル、馬、船、トラック）
合計画像数: 60,000枚（32x32カラー）
トレーニングセット: 50,000枚（各クラス5,000枚）
テストセット: 10,000枚（各クラス1,000枚）

検証用データセット

CIFAR-10には個別の検証用フォルダがないため、Ultralyticsではデフォルトで10,000枚のテストセットをトレーニング時の検証用データとして使用します。

Link to this sectionアプリケーション#

CIFAR-10 is widely used to train and evaluate image classification models, from classic Convolutional Neural Networks (CNNs) and Support Vector Machines (SVMs) to modern deep architectures. Its small image size and balanced classes make it ideal for rapid experimentation, benchmarking new algorithms, and teaching computer vision fundamentals.

Link to this section使用方法#

CIFAR-10でYOLOモデルを32の画像サイズで100エポックトレーニングします。利用可能な引数の全リストについては、トレーニングページおよび画像分類タスクガイドを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionサンプル画像とアノテーション#

CIFAR-10データセットにはさまざまな物体のカラー画像が含まれており、画像分類タスクのための十分に構成されたデータセットを提供します。以下にデータセットに含まれる画像例をいくつか示します。

CIFAR-10 画像分類データセットのサンプル

これらのサンプルは、CIFAR-10データセットに含まれる物体の多様性を示しており、堅牢な画像分類モデルをトレーニングするために多様なデータセットが重要であることを裏付けています。

Link to this section引用と謝辞#

研究や開発の成果物で CIFAR-10 データセットを使用する場合は、次の論文を引用してください。

引用

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

機械学習およびコンピュータビジョンの研究コミュニティにとって貴重なリソースであるCIFAR-10データセットを作成・維持してくださったAlex Krizhevsky氏に感謝いたします。CIFAR-10データセットとその作成者に関する詳細については、CIFAR-10データセットのウェブサイトをご覧ください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionCIFAR-10データセットは機械学習において何に使用されますか？#

CIFAR-10データセットは、画像分類および物体認識モデルのトレーニングやベンチマークに広く使用されています。60,000枚の32x32カラー画像が10のクラスに均等に配置されており、その小さなサイズとバランスの取れたクラス構成により、畳み込みニューラルネットワーク (CNN) やサポートベクターマシン (SVM) などのアルゴリズムを評価するための高速で信頼性の高いベンチマークとなっています。

Link to this sectionCIFAR-10データセットでUltralytics YOLOモデルをトレーニングするにはどうすればよいですか？#

CIFAR-10でUltralytics YOLOモデルをトレーニングするには、以下のコードスニペットを使用してください。データセットは初回使用時に自動的にダウンロードされます。引数の完全なリストについては、モデルのトレーニングページを参照してください。

学習例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionCIFAR-10データセットにはいくつのクラスがありますか？#

CIFAR-10には10のクラス（飛行機、自動車、鳥、猫、鹿、犬、カエル、馬、船、トラック）があり、各クラスに正確に6,000枚、合計で60,000枚の画像が含まれています。各クラスは相互排他的で、カテゴリ間に重なりはなく、完全にバランスが取れています。

Link to this sectionCIFAR-10データセットはどのようにトレーニングセットとテストセットに分割されていますか？#

CIFAR-10には、50,000枚のトレーニング画像と10,000枚のテスト画像（各クラス5,000枚のトレーニング用、1,000枚のテスト用）というあらかじめ定義された分割が含まれています。Ultralyticsが自動的に分割を行うフォルダベースの分類データセットとは異なり、CIFAR-10の公式パーティションはそのまま使用され、デフォルトでテストセットがトレーニング中の検証用データとして機能します。

Link to this sectionCIFAR-10データセットでのモデルトレーニングにUltralytics Platformを使用できますか？#

はい。Ultralytics Platformを使用すると、データセットの管理、画像分類モデルのトレーニング、および広範なコーディングなしでのデプロイが可能です。クラウドでCIFAR-10の実験を実行する便利な方法であり、詳細については分類データセットの概要からその他のオプションをご覧ください。

貢献者

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

作成日 2023年11月12日更新日 3 日前