コンテンツへスキップ

CIFAR-10 データセット

The CIFAR-10 (Canadian Institute For Advanced Research) dataset is a collection of images used widely for machine learning and computer vision algorithms. It was developed by researchers at the CIFAR institute and consists of 60,000 32x32 color images in 10 different classes.



見るんだ: How to Train an 画像分類 Model with CIFAR-10 Dataset using Ultralytics YOLO11

主な特徴

  • CIFAR-10データセットは60,000枚の画像から構成され、10クラスに分類されている。
  • 各クラスには6,000枚の画像が含まれ、トレーニング用に5,000枚、テスト用に1,000枚に分けられる。
  • 画像はカラーで、サイズは32x32ピクセル。
  • 10種類のクラスは、飛行機、車、鳥、猫、鹿、犬、カエル、馬、船、トラックを表している。
  • CIFAR-10は、機械学習やコンピュータビジョンの分野でのトレーニングやテストによく使用される。

データセット構造

CIFAR-10データセットは2つのサブセットに分かれている:

  1. トレーニングセット:このサブセットには、機械学習モデルの学習に使用される50,000枚の画像が含まれている。
  2. テストセット:このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。

アプリケーション

The CIFAR-10 dataset is widely used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The diversity of the dataset in terms of classes and the presence of color images make it a well-rounded dataset for research and development in the field of machine learning and computer vision.

使用方法

CIFAR-10データセットのYOLO モデルを、画像サイズ32x32で100エポック学習させるには、以下のコード・スニペットを使用できます。利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

サンプル画像と注釈

CIFAR-10データセットには様々な物体のカラー画像が含まれており、画像分類タスクに適したデータセットとなっている。以下に、このデータセットに含まれる画像の例を示します:

データセットサンプル画像

この例は、CIFAR-10データセットに含まれるオブジェクトの多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

CIFAR-10データセットを研究開発で使用する場合は、以下の論文を引用してください:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We would like to acknowledge Alex Krizhevsky for creating and maintaining the CIFAR-10 dataset as a valuable resource for the machine learning and computer vision research community. For more information about the CIFAR-10 dataset and its creator, visit the CIFAR-10 dataset website.

よくあるご質問

CIFAR-10データセットでYOLO モデルをトレーニングするには?

To train a YOLO model on the CIFAR-10 dataset using Ultralytics, you can follow the examples provided for both Python and CLI. Here is a basic example to train your model for 100 epochs with an image size of 32x32 pixels:

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

詳しくは、モデルトレーニングのページをご覧ください。

CIFAR-10データセットの主な特徴は?

CIFAR-10データセットは60,000枚のカラー画像を10のクラスに分類したものである。各クラスには6,000枚の画像が含まれ、5,000枚がトレーニング用、1,000枚がテスト用である。画像のサイズは32x32ピクセルであり、以下のカテゴリで異なる:

  • 飛行機
  • 自動車
  • 鳥類
  • 鹿
  • カエル
  • 船舶
  • トラック

この多様なデータセットは、機械学習やコンピュータビジョンなどの分野で画像分類モデルの学習に不可欠です。詳細については、CIFAR-10のデータセット構造とアプリケーションのセクションをご覧ください。

なぜCIFAR-10データセットを画像分類タスクに使うのか?

The CIFAR-10 dataset is an excellent benchmark for image classification due to its diversity and structure. It contains a balanced mix of 60,000 labeled images across 10 different categories, which helps in training robust and generalized models. It is widely used for evaluating deep learning models, including Convolutional Neural Networks (CNNs) and other machine learning algorithms. The dataset is relatively small, making it suitable for quick experimentation and algorithm development. Explore its numerous applications in the applications section.

CIFAR-10データセットの構造は?

CIFAR-10データセットは2つのサブセットに分かれている:

  1. トレーニングセット:機械学習モデルの学習に使用される50,000枚の画像を含む。
  2. テストセット:学習済みモデルのテストとベンチマーク用に10,000枚の画像から構成される。

各サブセットは10クラスに分類された画像で構成され、そのアノテーションはモデルの学習と評価にすぐに利用できる。より詳細な情報については、データセットの構造のセクションを参照してください。

研究においてCIFAR-10データセットを引用するにはどうすればよいですか?

CIFAR-10データセットを研究または開発プロジェクトで使用する場合は、必ず以下の論文を引用してください:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

データセットの作成者に謝意を表することで、この分野における継続的な研究開発を支援することができる。詳しくは、引用と謝辞のセクションをご覧ください。

CIFAR-10データセットの実用例は?

The CIFAR-10 dataset is often used for training image classification models, such as Convolutional Neural Networks (CNNs) and Support Vector Machines (SVMs). These models can be employed in various computer vision tasks including object detection, image recognition, and automated tagging. To see some practical examples, check the code snippets in the usage section.

📅 Created 11 months ago ✏️ Updated 22 days ago

コメント