Caltech-256 数据集

Caltech-256 数据集是一个用于目标分类任务的大型图像集合。它包含约 30,000 张图像，分为 257 个类别（256 个目标类别和 1 个背景类别）。这些图像经过精心挑选和标注，为目标识别算法提供了一个具有挑战性且多样的基准。

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

自动数据拆分

Caltech-256 数据集本身不提供预定义的训练集/验证集划分。但是，当你使用下文使用示例中提供的训练命令时，Ultralytics 框架会自动为你划分数据集。默认划分比例为 80% 的训练集和 20% 的验证集。

主要特性

Caltech-256 数据集包含约 30,000 张彩色图像，分为 257 个类别。
每个类别包含至少 80 张图像。
这些类别涵盖了广泛的现实世界物体，包括动物、车辆、家居用品和人物。
图像的大小和分辨率各不相同。
Caltech-256 被广泛用于机器学习领域的训练和测试，特别是目标识别任务。

数据集结构

与 Caltech-101 一样，Caltech-256 数据集没有正式的训练集和测试集划分。用户通常根据自己的特定需求创建自己的划分。一种常见的做法是使用随机抽取的图像子集进行训练，并将剩余图像用于测试。

应用场景

Caltech-256 数据集被广泛用于在目标识别任务中训练和评估深度学习模型，例如卷积神经网络 (CNNs)、支持向量机 (SVMs) 以及其他各种机器学习算法。其多样的类别和高质量图像使其成为机器学习和计算机视觉领域研发中不可或缺的数据集。

使用方法

若要使用 Caltech-256 数据集训练 YOLO 模型 100 个 epoch，你可以使用以下代码片段。有关可用参数的完整列表，请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

样本图像和标注

Caltech-256 数据集包含各种物体的高质量彩色图像，为目标识别任务提供了全面的数据集。以下是该数据集中的一些图像示例（来源）：

Caltech-256 图像分类数据集样本

该示例展示了 Caltech-256 数据集中物体的多样性和复杂性，强调了多样化数据集对于训练稳健的目标识别模型的重要性。

引文与致谢

如果你在研究或开发工作中使用 Caltech-256 数据集，请引用以下论文：

引用

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

我们要感谢 Gregory Griffin、Alex Holub 和 Pietro Perona 创建并维护了 Caltech-256 数据集，使其成为机器学习和计算机视觉研究界宝贵的资源。有关 Caltech-256 数据集及其创建者的更多信息，请访问 Caltech-256 数据集网站。

常见问题 (FAQ)

什么是 Caltech-256 数据集，它为什么对机器学习很重要？

Caltech-256 数据集是一个主要用于机器学习和计算机视觉中目标分类任务的大型图像数据集。它由约 30,000 张彩色图像组成，分为 257 个类别，涵盖了广泛的现实世界物体。该数据集多样且高质量的图像使其成为评估目标识别算法的绝佳基准，这对于开发稳健的机器学习模型至关重要。

如何使用 Python 或 CLI 在 Caltech-256 数据集上训练 YOLO 模型？

若要使用 Caltech-256 数据集训练 YOLO 模型 100 个 epoch，你可以使用以下代码片段。有关更多选项，请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)