CIFAR-10 数据集

CIFAR-10(加拿大高级研究院)数据集是一个广泛用于 机器学习 和计算机视觉算法的图像集合。它由 CIFAR 研究所的研究人员开发,包含 60,000 张 32x32 的彩色图像,分为 10 个不同的类别。



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

主要特性

  • CIFAR-10 数据集包含 60,000 张图像,分为 10 个类别。
  • 每个类别包含 6,000 张图像,其中 5,000 张用于训练,1,000 张用于测试。
  • 这些图像是彩色的,尺寸为 32x32 像素。
  • 这 10 个不同的类别分别代表飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。
  • CIFAR-10 常用于机器学习和计算机视觉领域的训练与测试。

数据集结构

CIFAR-10 数据集分为两个子集:

  1. 训练集:此子集包含 50,000 张图像,用于训练机器学习模型。
  2. 测试集:此子集包含 10,000 张图像,用于测试和评估已训练的模型。

应用场景

CIFAR-10 数据集被广泛用于训练和评估图像分类任务中的 深度学习 模型,例如 卷积神经网络 (CNN)、支持向量机 (SVM) 以及其他各种机器学习算法。该数据集在类别方面的多样性以及彩色图像的存在,使其成为机器学习和计算机视觉领域研究与开发的全面数据集。

使用方法

要在 CIFAR-10 数据集上训练 YOLO 模型 100 个 epoch,图像尺寸为 32x32,你可以使用以下代码片段。有关可用参数的完整列表,请参阅模型 训练 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

样本图像和标注

CIFAR-10 数据集包含各种物体的彩色图像,为图像分类任务提供了结构良好的数据集。以下是该数据集中的一些图像示例:

CIFAR-10 图像分类数据集样本

该示例展示了 CIFAR-10 数据集中物体的多样性和复杂性,强调了多样化数据集对于训练稳健图像分类模型的重要性。

引文与致谢

如果你在研究或开发工作中使用 CIFAR-10 数据集,请引用以下论文:

引用
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

我们要感谢 Alex Krizhevsky 创建并维护了 CIFAR-10 数据集,使其成为机器学习和 计算机视觉 研究社区的宝贵资源。有关 CIFAR-10 数据集及其创建者的更多信息,请访问 CIFAR-10 数据集网站

常见问题 (FAQ)

我该如何在 CIFAR-10 数据集上训练 YOLO 模型?

要使用 Ultralytics 在 CIFAR-10 数据集上训练 YOLO 模型,你可以按照 Python 和 CLI 提供的示例进行操作。这是一个将模型训练 100 个 epoch,图像大小为 32x32 像素的基础示例:

示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

更多详细信息,请参阅模型 训练 页面。

CIFAR-10 数据集的主要特点是什么?

CIFAR-10 数据集包含 60,000 张彩色图像,分为 10 个类别。每个类别包含 6,000 张图像,其中 5,000 张用于训练,1,000 张用于测试。图像大小为 32x32 像素,涵盖以下类别:

  • 飞机
  • 汽车
  • 鸟类
  • 鹿
  • 青蛙
  • 卡车

这个多样化的数据集对于在机器学习和计算机视觉等领域训练图像分类模型至关重要。更多信息,请访问 数据集结构应用 的 CIFAR-10 部分。

为什么要使用 CIFAR-10 数据集进行图像分类任务?

由于其多样性和结构,CIFAR-10 数据集是一个极好的图像分类基准。它包含 60,000 张平衡混合的标注图像,分为 10 个不同的类别,这有助于训练稳健且泛化能力强的模型。它被广泛用于评估深度学习模型,包括卷积 神经网络 (CNN) 和其他机器学习算法。该数据集相对较小,适合快速实验和算法开发。你可以在 应用 部分探索其众多用途。

CIFAR-10 数据集是如何组织的?

CIFAR-10 数据集组织为两个主要子集:

  1. 训练集:包含 50,000 张图像,用于训练机器学习模型。
  2. 测试集:包含 10,000 张图像,用于测试和评估已训练的模型。

每个子集都包含分类为 10 个类别的图像,其标注可直接用于模型训练和评估。更详细的信息,请参阅 数据集结构 部分。

我该如何在研究中引用 CIFAR-10 数据集?

如果你在研究或开发项目中使用 CIFAR-10 数据集,请务必引用以下论文:

引用
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

感谢数据集的创建者有助于支持该领域的持续研究和发展。更多详情,请查看 引用和致谢 部分。

使用 CIFAR-10 数据集有哪些实际示例?

CIFAR-10 数据集常用于训练图像分类模型,如卷积神经网络 (CNN) 和支持向量机 (SVM)。这些模型可应用于各种计算机视觉任务,包括 目标检测图像识别 和自动标注。要查看一些实际示例,请查看 使用 部分的代码片段。

评论