Link to this sectionCIFAR-10 数据集#
CIFAR-10(加拿大高等研究院)数据集是一个被广泛用于机器学习和计算机视觉算法的图像集合。它由 CIFAR 研究所的研究人员开发,包含 60,000 张 32x32 的彩色图像,分为 10 个不同的类别。
Link to this section主要特性#
- CIFAR-10 数据集包含 60,000 张图像,分为 10 个类别。
- 每个类别包含 6,000 张图像,其中 5,000 张用于训练,1,000 张用于测试。
- 这些图像为彩色,大小为 32x32 像素。
- 这 10 个不同的类别代表飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。
- CIFAR-10 常用于机器学习和计算机视觉领域的训练与测试。
Link to this section数据集结构#
CIFAR-10 数据集被分为两个子集:
- 训练集:该子集包含 50,000 张图像,用于训练机器学习模型。
- 测试集:该子集包含 10,000 张用于测试和基准评估已训练模型的图像。
Link to this section应用#
CIFAR-10 数据集广泛用于在图像分类任务中训练和评估深度学习模型,例如卷积神经网络 (CNN)、支持向量机 (SVM) 以及各种其他机器学习算法。该数据集在类别方面的多样性以及彩色图像的存在,使其成为机器学习和计算机视觉领域研究与开发的全面数据集。
Link to this section用法#
若要使用 32x32 的图像大小在 CIFAR-10 数据集上训练 YOLO 模型 100 个周期,你可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)Link to this section样本图像和标注#
CIFAR-10 数据集包含各种物体的彩色图像,为图像分类任务提供了一个结构良好的数据集。以下是来自该数据集的一些图像示例:

该示例展示了 CIFAR-10 数据集中物体的多样性和复杂性,突显了多样化数据集对于训练稳健图像分类模型的重要性。
Link to this section引用与致谢#
如果你在研究或开发工作中使用了 CIFAR-10 数据集,请引用以下论文:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}我们要感谢 Alex Krizhevsky 创建并维护了 CIFAR-10 数据集,将其作为机器学习和计算机视觉研究社区的宝贵资源。有关 CIFAR-10 数据集及其创建者的更多信息,请访问 CIFAR-10 数据集网站。
Link to this section常见问题解答#
Link to this section我该如何训练一个 YOLO 模型来使用 CIFAR-10 数据集?#
要使用 Ultralytics 在 CIFAR-10 数据集上训练 YOLO 模型,你可以按照 Python 和 CLI 提供的示例进行操作。以下是一个基础示例,用于以 32x32 像素的图像大小训练你的模型 100 个周期:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)欲了解更多详细信息,请参考模型训练页面。
Link to this sectionCIFAR-10 数据集的关键特征是什么?#
CIFAR-10 数据集包含 60,000 张彩色图像,分为 10 个类别。每个类别包含 6,000 张图像,其中 5,000 张用于训练,1,000 张用于测试。图像大小为 32x32 像素,并涵盖以下类别:
- 飞机
- 汽车
- 鸟类
- 猫
- 鹿
- 狗
- 青蛙
- 马
- 船
- 卡车
这一多元化的数据集对于训练机器学习和计算机视觉等领域的图像分类模型至关重要。如需更多信息,请访问 数据集结构 和 应用 部分。
Link to this section为什么要将 CIFAR-10 数据集用于图像分类任务?#
得益于其多样性和结构,CIFAR-10 数据集是一个出色的图像分类基准。它包含 60,000 张跨越 10 个不同类别的平衡混合标注图像,有助于训练稳健且泛化的模型。它被广泛用于评估深度学习模型,包括卷积神经网络 (CNN) 和其他机器学习算法。该数据集相对较小,适合进行快速实验和算法开发。你可以在 应用 部分探索其众多用途。
Link to this sectionCIFAR-10 数据集是如何构成的?#
CIFAR-10 数据集分为两个主要子集:
- 训练集:包含 50,000 张图像,用于训练机器学习模型。
- 测试集:由 10,000 张图像组成,用于测试和评估已训练的模型。
每个子集都包含归类为 10 个类别的图像,其注释可直接用于模型训练和评估。更多详细信息,请参阅 数据集结构 部分。
Link to this section我该如何在研究中引用 CIFAR-10 数据集?#
如果你在研究或开发项目中使用 CIFAR-10 数据集,请确保引用以下论文:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}感谢数据集的创建者有助于支持该领域的持续研究与开发。更多详情,请参见 引用与致谢 部分。
Link to this section使用 CIFAR-10 数据集有哪些实际示例?#
CIFAR-10 数据集通常用于训练图像分类模型,如卷积神经网络 (CNN) 和支持向量机 (SVM)。这些模型可应用于各种计算机视觉任务,包括目标检测、图像识别和自动标注。若要查看一些实际示例,请查看 用法 部分的代码片段。