跳至内容

CIFAR-10 数据集

CIFAR-10(加拿大高级研究所)数据集是一个广泛用于机器学习和计算机视觉算法的图像集合。它由 CIFAR 研究所的研究人员开发,包含 10 个不同类别的 60,000 张 32x32 彩色图像。



观看: 如何使用 CIFAR-10 数据集训练图像分类模型Ultralytics YOLOv8

主要功能

  • CIFAR-10 数据集由 60,000 张图像组成,分为 10 个等级。
  • 每个类别包含 6000 张图像,其中 5000 张用于训练,1000 张用于测试。
  • 图像是彩色的,大小为 32x32 像素。
  • 10 个不同的类别分别代表飞机、汽车、鸟、猫、鹿、狗、青蛙、马、船和卡车。
  • CIFAR-10 通常用于机器学习和计算机视觉领域的训练和测试。

数据集结构

CIFAR-10 数据集分为两个子集:

  1. 训练集:该子集包含 50,000 张图像,用于训练机器学习模型。
  2. 测试集:该子集由 10,000 张图像组成,用于测试和基准测试训练有素的模型。

应用

CIFAR-10 数据集广泛用于训练和评估图像分类任务中的深度学习模型,如卷积神经网络(CNN)、支持向量机(SVM)和其他各种机器学习算法。该数据集在类别方面的多样性和彩色图像的存在使其成为机器学习和计算机视觉领域研究和开发的全面数据集。

使用方法

要在图像大小为 32x32 的 CIFAR-10 数据集上训练YOLO 模型 100 次,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

图片和注释示例

CIFAR-10 数据集包含各种物体的彩色图像,为图像分类任务提供了一个结构良好的数据集。下面是该数据集中的一些图像示例:

数据集样本图像

该示例展示了 CIFAR-10 数据集中对象的多样性和复杂性,突出了多样化数据集对训练强大图像分类模型的重要性。

引文和致谢

如果您在研究或开发工作中使用 CIFAR-10 数据集,请引用以下论文:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

亚历克斯-克里热夫斯基(Alex Krizhevsky)创建并维护了 CIFAR-10 数据集,为机器学习和计算机视觉研究界提供了宝贵的资源,在此一并致谢。有关 CIFAR-10 数据集及其创建者的更多信息,请访问CIFAR-10 数据集网站

常见问题

如何在 CIFAR-10 数据集上训练YOLO 模型?

要使用Ultralytics 在 CIFAR-10 数据集上训练YOLO 模型,您可以按照Python 和CLI 提供的示例进行训练。以下是一个基本示例,可以在图像大小为 32x32 像素的情况下训练模型 100 次:

示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

更多详情,请参阅型号培训页面。

CIFAR-10 数据集有哪些主要特点?

CIFAR-10 数据集由 60,000 张彩色图像组成,分为 10 个等级。每个类别包含 6000 张图像,其中 5000 张用于训练,1000 张用于测试。图像大小为 32x32 像素,分为以下不同类别:

  • 飞机
  • 汽车
  • 鸟类
  • 鹿
  • 狗类
  • 青蛙
  • 马匹
  • 船舶
  • 卡车

这个多样化的数据集对于机器学习和计算机视觉等领域的图像分类模型训练至关重要。更多信息,请访问 CIFAR-10数据集结构应用部分。

为什么使用 CIFAR-10 数据集执行图像分类任务?

CIFAR-10 数据集因其多样性和结构而成为图像分类的绝佳基准。它包含 10 个不同类别的 60,000 张标签图像的均衡组合,有助于训练稳健的通用模型。它被广泛用于评估深度学习模型,包括卷积神经网络(CNN)和其他机器学习算法。该数据集相对较小,适合快速实验和算法开发。请在应用部分探索其众多应用。

CIFAR-10 数据集的结构是怎样的?

CIFAR-10 数据集分为两个主要子集:

  1. 训练集:包含 50,000 张图像,用于训练机器学习模型。
  2. 测试集:由 10,000 张图像组成,用于对训练有素的模型进行测试和基准测试。

每个子集由分为 10 个类别的图像组成,其注释可随时用于模型训练和评估。更多详细信息,请参阅数据集结构部分。

如何在研究中引用 CIFAR-10 数据集?

如果您在研究或开发项目中使用 CIFAR-10 数据集,请务必引用以下论文:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

感谢数据集的创建者有助于支持该领域的持续研究和发展。更多详情,请参阅引用和致谢部分。

使用 CIFAR-10 数据集的实例有哪些?

CIFAR-10 数据集通常用于训练图像分类模型,如卷积神经网络(CNN)和支持向量机(SVM)。这些模型可用于各种计算机视觉任务,包括物体检测、图像识别和自动标记。要查看一些实际案例,请查看使用部分的代码片段。



创建于 2023-11-12,更新于 2024-07-12
作者:RizwanMunawar(1),glenn-jocher(6)

评论