跳转至内容

CIFAR-100 数据集

CIFAR-100(加拿大高级研究院)数据集是 CIFAR-10 数据集的重要扩展,由 60,000 张 32x32 像素的彩色图像组成,分为 100 个不同的类别。它由 CIFAR 研究所的研究人员开发,为更复杂的机器学习和计算机视觉任务提供了一个更具挑战性的数据集。



观看: 如何在 CIFAR-100 上训练 Ultralytics YOLO11 | 逐步图像分类教程 🚀

主要功能

  • CIFAR-100 数据集由 60,000 张图像组成,分为 100 个类别。
  • 每个类别包含 600 张图像,其中 500 张用于训练,100 张用于测试。
  • 图像是彩色的,大小为 32x32 像素。
  • 这 100 个不同的类别被分为 20 个粗略的类别,用于更高级别的分类。
  • CIFAR-100 常用于机器学习和计算机视觉领域的训练和测试。

数据集结构

CIFAR-100 数据集分为两个子集:

  1. 训练集:此子集包含 50,000 张用于训练机器学习模型的图像。
  2. 测试集:此子集包含 10,000 张用于测试和评估已训练模型的图像。

应用

CIFAR-100 数据集广泛用于训练和评估图像分类任务中的深度学习模型,例如卷积神经网络 (CNN)、支持向量机 (SVM) 和各种其他机器学习算法。该数据集在类别方面的多样性以及彩色图像的存在使其成为机器学习和计算机视觉领域研究和开发的更具挑战性和更全面的数据集。

用法

要在 CIFAR-100 数据集上训练 YOLO 模型 100 个epochs,图像大小为 32x32,您可以使用以下代码片段。 有关可用参数的完整列表,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Sample Images 和注释

CIFAR-100 数据集包含各种对象的彩色图像,为图像分类任务提供了一个结构良好的数据集。以下是数据集中图像的一些示例:

数据集样本图像

该示例展示了 CIFAR-100 数据集中对象的多样性和复杂性,突出了多样化数据集对于训练稳健的图像分类模型的重要性。

引用和致谢

如果您在研究或开发工作中使用 CIFAR-100 数据集,请引用以下论文:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

我们要感谢 Alex Krizhevsky 创建和维护 CIFAR-100 数据集,使其成为机器学习和计算机视觉研究社区的宝贵资源。有关 CIFAR-100 数据集及其创建者的更多信息,请访问 CIFAR-100 数据集网站

常见问题

什么是CIFAR-100数据集,为什么它很重要?

CIFAR-100 数据集是一个大型集合,包含 60,000 张 32x32 像素的彩色图像,分为 100 个类别。它由加拿大高级研究院 (CIFAR) 开发,提供了一个具有挑战性的数据集,非常适合复杂的机器学习和计算机视觉任务。它的重要性在于类别的多样性和图像的小尺寸,使其成为训练和测试深度学习模型(如卷积神经网络 (CNN))的宝贵资源,使用的框架包括 Ultralytics YOLO

如何在CIFAR-100数据集上训练YOLO模型?

您可以使用 python 或 CLI 命令在 CIFAR-100 数据集上训练 YOLO 模型。方法如下:

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

有关可用参数的完整列表,请参阅模型训练页面。

CIFAR-100数据集的主要应用有哪些?

CIFAR-100 数据集广泛用于训练和评估用于图像分类的深度学习模型。它包含 100 个类别的多样化集合,分为 20 个粗略类别,为测试卷积神经网络 (CNN)、支持向量机 (SVM) 和各种其他机器学习方法等算法提供了一个具有挑战性的环境。该数据集是机器学习和计算机视觉领域研究和开发的关键资源,特别是对于对象识别和分类任务。

CIFAR-100数据集是如何构建的?

CIFAR-100 数据集分为两个主要子集:

  1. 训练集:包含 50,000 张用于训练机器学习模型的图像。
  2. 测试集:包含 10,000 张用于测试和评估训练模型的图像。

100 个类别中的每一个都包含 600 张图像,其中 500 张用于训练,100 张用于测试,这使其非常适合严格的学术和工业研究。

在哪里可以找到CIFAR-100数据集的sample_images和注释?

CIFAR-100 数据集包含各种对象的各种彩色图像,使其成为图像分类任务的结构化数据集。您可以参考文档页面查看sample_images 和注释。这些示例突出了数据集的多样性和复杂性,这对于训练强大的图像分类模型非常重要。有关适合分类任务的更多数据集,请查看 Ultralytics 的分类数据集概述



📅 创建于 1 年前 ✏️ 更新于 5 个月前

评论