コンテンツへスキップ

CIFAR-100 データセット

The CIFAR-100 (Canadian Institute For Advanced Research) dataset is a significant extension of the CIFAR-10 dataset, composed of 60,000 32x32 color images in 100 different classes. It was developed by researchers at the CIFAR institute, offering a more challenging dataset for more complex machine learning and computer vision tasks.

主な特徴

  • CIFAR-100データセットは60,000枚の画像からなり、100のクラスに分類されている。
  • 各クラスには600枚の画像が含まれ、トレーニング用に500枚、テスト用に100枚に分けられる。
  • 画像はカラーで、サイズは32x32ピクセル。
  • 100の異なるクラスは、より高度な分類のために20の粗いカテゴリーに分類される。
  • CIFAR-100は、機械学習やコンピュータビジョンの分野でのトレーニングやテストによく使用される。

データセット構造

CIFAR-100データセットは2つのサブセットに分かれている:

  1. トレーニングセット:このサブセットには、機械学習モデルの学習に使用される50,000枚の画像が含まれている。
  2. テストセット:このサブセットは、学習済みモデルのテストとベンチマークに使用される10,000枚の画像で構成される。

アプリケーション

The CIFAR-100 dataset is extensively used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The diversity of the dataset in terms of classes and the presence of color images make it a more challenging and comprehensive dataset for research and development in the field of machine learning and computer vision.

使用方法

To train a YOLO model on the CIFAR-100 dataset for 100 epochs with an image size of 32x32, you can use the following code snippets. For a comprehensive list of available arguments, refer to the model Training page.

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

サンプル画像と注釈

The CIFAR-100 dataset contains color images of various objects, providing a well-structured dataset for image classification tasks. Here are some examples of images from the dataset:

データセットサンプル画像

この例は、CIFAR-100データセットに含まれるオブジェクトの多様性と複雑性を示しており、ロバストな画像分類モデルを学習するための多様なデータセットの重要性を強調している。

引用と謝辞

CIFAR-100データセットを研究開発で使用する場合は、以下の論文を引用してください:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

We would like to acknowledge Alex Krizhevsky for creating and maintaining the CIFAR-100 dataset as a valuable resource for the machine learning and computer vision research community. For more information about the CIFAR-100 dataset and its creator, visit the CIFAR-100 dataset website.

よくあるご質問

CIFAR-100データセットとは何ですか?

The CIFAR-100 dataset is a large collection of 60,000 32x32 color images classified into 100 classes. Developed by the Canadian Institute For Advanced Research (CIFAR), it provides a challenging dataset ideal for complex machine learning and computer vision tasks. Its significance lies in the diversity of classes and the small size of the images, making it a valuable resource for training and testing deep learning models, like Convolutional Neural Networks (CNNs), using frameworks such as Ultralytics YOLO.

CIFAR-100 データセットでYOLO モデルをトレーニングするには?

CIFAR-100データセットに対して、Python またはCLI コマンドを使って、YOLO モデルを学習することができます。以下はその方法です:

列車の例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

利用可能な引数の包括的なリストについては、モデルのトレーニングページを参照してください。

CIFAR-100データセットの主な用途は?

The CIFAR-100 dataset is extensively used in training and evaluating deep learning models for image classification. Its diverse set of 100 classes, grouped into 20 coarse categories, provides a challenging environment for testing algorithms such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning approaches. This dataset is a key resource in research and development within machine learning and computer vision fields.

CIFAR-100データセットの構造は?

CIFAR-100データセットは主に2つのサブセットに分かれている:

  1. トレーニングセット:機械学習モデルの学習に使用される50,000枚の画像を含む。
  2. テストセット:学習済みモデルのテストとベンチマークに使用される10,000枚の画像から構成される。

各100クラスには600枚の画像が含まれ、500枚がトレーニング用、100枚がテスト用となっている。

CIFAR-100データセットのサンプル画像とアノテーションはどこで見ることができますか?

CIFAR-100データセットには様々な物体のカラー画像が含まれており、画像分類タスクのための構造化されたデータセットとなっています。ドキュメントのページでサンプル画像と注釈を見ることができます。これらの例は、ロバストな画像分類モデルを学習するために重要な、データセットの多様性と複雑性を強調しています。

📅 Created 11 months ago ✏️ Updated 22 days ago

コメント