CIFAR-100 数据集

CIFAR-100(加拿大高级研究院)数据集是 CIFAR-10 数据集的重要扩展,包含 60,000 张 32x32 的彩色图像,分为 100 个不同的类别。它由 CIFAR 研究院的研究人员开发,为更复杂的机器学习和计算机视觉任务提供了一个更具挑战性的数据集。



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

主要特性

  • CIFAR-100 数据集由 60,000 张图像组成,分为 100 个类别。
  • 每个类别包含 600 张图像,分为 500 张用于训练,100 张用于测试。
  • 这些图像是彩色的,尺寸为 32x32 像素。
  • 这 100 个不同的类别被归类为 20 个粗粒度类别,以便进行更高层次的分类。
  • CIFAR-100 常用于机器学习和计算机视觉领域的训练与测试。

数据集结构

CIFAR-100 数据集被分为两个子集:

  1. 训练集:此子集包含 50,000 张图像,用于训练机器学习模型。
  2. 测试集:此子集包含 10,000 张图像,用于测试和评估已训练的模型。

应用场景

The CIFAR-100 dataset is extensively used for training and evaluating deep learning models in image classification tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. The diversity of the dataset in terms of classes and the presence of color images make it a more challenging and comprehensive dataset for research and development in the field of machine learning and computer vision.

使用方法

要使用 32x32 的图像尺寸在 CIFAR-100 数据集上训练 YOLO 模型 100 个 epoch,你可以使用以下代码片段。有关可用参数的全面列表,请参阅模型训练页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

样本图像和标注

CIFAR-100 数据集包含各种物体的彩色图像,为图像分类任务提供了一个结构良好的数据集。以下是该数据集中的一些图像示例:

CIFAR-100 图像分类数据集样本

该示例展示了 CIFAR-100 数据集中物体的多样性和复杂性,强调了多样化数据集对于训练稳健的图像分类模型的重要性。

引文与致谢

如果你在研究或开发工作中使用 CIFAR-100 数据集,请引用以下论文:

引用
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

我们要感谢 Alex Krizhevsky 创建并维护了 CIFAR-100 数据集,作为机器学习和计算机视觉研究社区的宝贵资源。有关 CIFAR-100 数据集及其创建者的更多信息,请访问 CIFAR-100 数据集网站

常见问题 (FAQ)

什么是 CIFAR-100 数据集,为什么它很重要?

CIFAR-100 数据集是一个大型集合,包含 60,000 张 32x32 的彩色图像,分为 100 个类别。它由加拿大高级研究院(CIFAR)开发,提供了一个理想的、具有挑战性的数据集,适用于复杂的机器学习和计算机视觉任务。它的重要性在于类别的多样性和较小的图像尺寸,使其成为训练和测试深度学习模型(如卷积神经网络 (CNNs))的宝贵资源,并可使用 Ultralytics YOLO 等框架。

如何使用 CIFAR-100 数据集训练 YOLO 模型?

你可以使用 Python 或 CLI 命令在 CIFAR-100 数据集上训练 YOLO 模型。方法如下:

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

有关可用参数的全面列表,请参阅模型训练页面。

CIFAR-100 数据集的主要应用是什么?

CIFAR-100 数据集被广泛用于训练和评估图像分类的深度学习模型。它包含 100 个类别,分为 20 个粗粒度类别,为测试卷积神经网络 (CNNs)、支持向量机 (SVMs) 和各种其他机器学习方法提供了具有挑战性的环境。该数据集是机器学习和计算机视觉领域研究与开发的关键资源,特别适用于目标识别和分类任务。

CIFAR-100 数据集是如何构建的?

CIFAR-100 数据集分为两个主要子集:

  1. 训练集:包含 50,000 张图像,用于训练机器学习模型。
  2. 测试集:由 10,000 张图像组成,用于测试和评估已训练的模型。

100 个类别中的每一个都包含 600 张图像,其中 500 张用于训练,100 张用于测试,使其非常适合严谨的学术和工业研究。

我在哪里可以找到 CIFAR-100 数据集的样本图像和标注?

CIFAR-100 数据集包含了各种物体的多种彩色图像,使其成为图像分类任务的结构化数据集。你可以参考文档页面查看样本图像和标注。这些示例突显了数据集的多样性和复杂性,这对于训练稳健的图像分类模型非常重要。如需了解更多适用于分类任务的数据集,请查看 Ultralytics 分类数据集概览

评论