Skip to content

Caltech-256 数据集

Caltech-256数据集是用于对象分类任务的广泛图像集合。它包含大约30,000张图像,分为257个类别(256个对象类别和1个背景类别)。这些图像经过精心策划和注释,为对象识别算法提供了一个具有挑战性和多样性的基准。



观看: 如何训练 图像分类 使用 Caltech-256 数据集和 Ultralytics HUB 的模型

自动数据分割

所提供的 Caltech-256 数据集没有预定义的训练/验证分割。但是,当您使用下面用法示例中提供的训练命令时,Ultralytics 框架将自动为您分割数据集。使用的默认分割是 80% 用于训练集,20% 用于验证集。

主要功能

  • Caltech-256 数据集包含大约 30,000 张彩色图像,分为 257 个类别。
  • 每个类别至少包含 80 张图像。
  • 这些类别涵盖了各种各样的真实世界对象,包括动物、车辆、家居用品和人物。
  • 图像具有可变的大小和分辨率。
  • Caltech-256 广泛应用于机器学习领域的训练和测试,尤其是在对象识别任务中。

数据集结构

Caltech-101类似,Caltech-256数据集没有训练集和测试集之间的正式划分。用户通常会根据自己的特定需求创建自己的划分。一种常见的做法是使用图像的随机子集进行训练,并使用剩余的图像进行测试。

应用

Caltech-256 数据集广泛用于训练和评估对象识别任务中的深度学习模型,例如卷积神经网络 (CNN)、支持向量机 (SVM) 和各种其他机器学习算法。其多样化的类别和高质量的图像使其成为机器学习和计算机视觉领域研究和开发的宝贵数据集。

用法

要在 Caltech-256 数据集上训练 YOLO 模型 100 个 epochs,您可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Sample Images 和注释

Caltech-256 数据集包含各种对象的高质量彩色图像,为对象识别任务提供了全面的数据集。以下是数据集中图像的一些示例(来源):

数据集样本图像

该示例展示了 Caltech-256 数据集中对象的多样性和复杂性,强调了使用多样化数据集来训练稳健的对象识别模型的重要性。

引用和致谢

如果您在研究或开发工作中使用 Caltech-256 数据集,请引用以下论文:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

我们要感谢 Gregory Griffin、Alex Holub 和 Pietro Perona 创建和维护 Caltech-256 数据集,使其成为 机器学习 和计算机视觉研究社区的宝贵资源。有关 Caltech-256 数据集及其创建者的更多信息,请访问 Caltech-256 数据集网站

常见问题

什么是Caltech-256数据集,为什么它对机器学习很重要?

Caltech-256 数据集是一个大型图像数据集,主要用于机器学习和计算机视觉中的对象分类任务。 它由大约 30,000 张彩色图像组成,分为 257 个类别,涵盖了广泛的真实世界对象。 该数据集多样化且高质量的图像使其成为评估对象识别算法的绝佳基准,这对于开发稳健的机器学习模型至关重要。

如何使用Python或CLI在Caltech-256数据集上训练YOLO模型?

要在 Caltech-256 数据集上训练 YOLO 模型 100 个 epochs,您可以使用以下代码片段。有关其他选项,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Caltech-256数据集最常见的用例是什么?

Caltech-256 数据集广泛用于各种对象识别任务,例如:

  • 训练卷积神经网络 (CNN)
  • 评估支持向量机 (SVM) 的性能
  • 对新的深度学习算法进行基准测试
  • 使用 Ultralytics YOLO 等框架开发对象检测模型

其多样性和全面的注释使其成为机器学习和计算机视觉研究和开发的理想选择。

Caltech-256数据集是如何构建的,以及如何进行训练集和测试集的划分?

Caltech-256数据集没有预定义的训练和测试集划分。用户通常根据自己的特定需求创建自己的划分。一种常见的方法是随机选择一部分图像用于训练,其余图像用于测试。这种灵活性允许用户根据其特定项目要求和实验设置定制数据集。

为什么我应该使用Ultralytics YOLO在Caltech-256数据集上训练模型?

Ultralytics YOLO 模型在 Caltech-256 数据集上进行训练具有以下几个优势:

  • 高精度:YOLO 模型以其在对象检测任务中的最先进性能而闻名。
  • 速度:它们提供实时推理能力,使其适用于需要快速预测的应用程序。
  • 易用性: 借助 Ultralytics HUB,用户无需大量编码即可训练、验证和部署模型。
  • 预训练模型:从预训练模型开始,例如 yolo11n-cls.pt,可以显著减少训练时间并提高模型 准确性.

有关更多详细信息,请浏览我们的综合训练指南,并了解使用 Ultralytics YOLO 进行图像分类



📅 创建于 1 年前 ✏️ 更新于 4 个月前

评论