Caltech-256 数据集

Caltech-256 数据集是一个用于目标分类任务的大型图像集合。它包含约 30,000 张图像,分为 257 个类别(256 个目标类别和 1 个背景类别)。这些图像经过精心挑选和标注,为目标识别算法提供了一个具有挑战性且多样的基准。



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
自动数据拆分

Caltech-256 数据集本身不提供预定义的训练集/验证集划分。但是,当你使用下文使用示例中提供的训练命令时,Ultralytics 框架会自动为你划分数据集。默认划分比例为 80% 的训练集和 20% 的验证集。

主要特性

  • Caltech-256 数据集包含约 30,000 张彩色图像,分为 257 个类别。
  • 每个类别包含至少 80 张图像。
  • 这些类别涵盖了广泛的现实世界物体,包括动物、车辆、家居用品和人物。
  • 图像的大小和分辨率各不相同。
  • Caltech-256 被广泛用于机器学习领域的训练和测试,特别是目标识别任务。

数据集结构

Caltech-101 一样,Caltech-256 数据集没有正式的训练集和测试集划分。用户通常根据自己的特定需求创建自己的划分。一种常见的做法是使用随机抽取的图像子集进行训练,并将剩余图像用于测试。

应用场景

Caltech-256 数据集被广泛用于在目标识别任务中训练和评估 深度学习 模型,例如 卷积神经网络 (CNNs)、支持向量机 (SVMs) 以及其他各种机器学习算法。其多样的类别和高质量图像使其成为机器学习和 计算机视觉 领域研发中不可或缺的数据集。

使用方法

若要使用 Caltech-256 数据集训练 YOLO 模型 100 个 epoch,你可以使用以下代码片段。有关可用参数的完整列表,请参阅模型 训练 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

样本图像和标注

Caltech-256 数据集包含各种物体的高质量彩色图像,为目标识别任务提供了全面的数据集。以下是该数据集中的一些图像示例(来源):

Caltech-256 图像分类数据集样本

该示例展示了 Caltech-256 数据集中物体的多样性和复杂性,强调了多样化数据集对于训练稳健的目标识别模型的重要性。

引文与致谢

如果你在研究或开发工作中使用 Caltech-256 数据集,请引用以下论文:

引用
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

我们要感谢 Gregory Griffin、Alex Holub 和 Pietro Perona 创建并维护了 Caltech-256 数据集,使其成为 机器学习 和计算机视觉研究界宝贵的资源。有关 Caltech-256 数据集及其创建者的更多信息,请访问 Caltech-256 数据集网站

常见问题 (FAQ)

什么是 Caltech-256 数据集,它为什么对机器学习很重要?

Caltech-256 数据集是一个主要用于机器学习和计算机视觉中目标分类任务的大型图像数据集。它由约 30,000 张彩色图像组成,分为 257 个类别,涵盖了广泛的现实世界物体。该数据集多样且高质量的图像使其成为评估目标识别算法的绝佳基准,这对于开发稳健的机器学习模型至关重要。

如何使用 Python 或 CLI 在 Caltech-256 数据集上训练 YOLO 模型?

若要使用 Caltech-256 数据集训练 YOLO 模型 100 个 epoch,你可以使用以下代码片段。有关更多选项,请参阅模型 训练 页面。

训练示例
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Caltech-256 数据集最常见的用例是什么?

Caltech-256 数据集被广泛用于各种目标识别任务,例如:

  • 训练卷积 神经网络 (CNNs)
  • 评估支持向量机 (SVMs) 的性能
  • 对新的深度学习算法进行基准测试
  • 使用 Ultralytics YOLO 等框架开发 目标检测 模型

其多样性和全面的标注使其非常适合机器学习和计算机视觉的研发。

Caltech-256 数据集是如何构建以及如何进行训练和测试划分的?

Caltech-256 数据集不附带预定义的训练和测试划分。用户通常根据自己的特定需求创建自己的划分。一种常见的做法是随机选择图像子集进行训练,并将剩余图像用于测试。这种灵活性允许用户根据项目的具体要求和实验设置来定制数据集。

为什么我应该使用 Ultralytics YOLO 在 Caltech-256 数据集上训练模型?

Ultralytics YOLO 模型在 Caltech-256 数据集上进行训练具有几个优势:

  • 高准确率:YOLO 模型以其在目标检测任务中的最先进性能而闻名。
  • 速度:它们提供实时推理能力,使其适用于需要快速预测的应用。
  • 易于使用:通过 Ultralytics 平台,用户无需进行大量编码即可训练、验证和部署模型。
  • 预训练模型:从 yolo26n-cls.pt 等预训练模型开始,可以显著减少训练时间并提高模型 准确率

欲了解更多详细信息,请浏览我们的 综合训练指南 并了解有关使用 Ultralytics YOLO 进行 图像分类 的知识。

评论