Link to this sectionCaltech-256 数据集#

Caltech-256 数据集是一个经典的图像分类基准，包含 30,607 张图像，涵盖了 256 个目标类别外加一个背景类。每个类别至少包含 80 张现实世界物体的图像——包括动物、车辆、家庭用品和人物——这使其成为比 Caltech-101 更大、更具挑战性的目标识别模型后续基准。

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

自动数据拆分

Caltech-256 在发布时没有预定义的训练/验证集划分。下方的训练命令会自动将其划分为 80% 训练 / 20% 验证，因此无需手动准备。

Link to this section主要特性#

Caltech-256 包含 30,607 张彩色图像，分布在 256 个目标类别外加一个 257.clutter 背景类中（总共 257 个类别文件夹）。
这些类别涵盖了各种现实世界的对象，包括动物、车辆、家居用品和人物。
每个类别至少有 80 张图像，最大的类别包含多达约 800 张，因此类别规模是不平衡的。
图像的大小和分辨率各不相同。
Caltech-256 被广泛用于对图像分类和目标识别算法进行基准测试。

Link to this section数据集结构#

Caltech-256 以 257 个文件夹的形式发布——每个类别一个，涵盖 256 个目标类别外加一个 257.clutter 背景类——且没有预定义的训练/验证划分。当你启动训练时，Ultralytics 会自动对图像进行分区，以便模型能够跨所有 257 个类别进行训练，无需任何手动设置：

类别: 257（256 个目标类别 + 1 个背景类）
图像总数: 30,607
训练/验证划分: 自动 80% / 20%（约 24,385 个训练集，约 6,222 个验证集）
每类图像数: 至少 80 张（不平衡，最多约 800 张）

Link to this section应用#

Caltech-256 数据集被广泛用于训练和评估图像分类和目标识别模型，包括卷积神经网络 (CNNs) 和支持向量机 (SVMs)。其庞大的类别数量和高质量图像使其成为机器学习和计算机视觉研究与原型设计的热门基准。

Link to this section用法#

在 Caltech-256 上训练 YOLO 模型，迭代 100 个 epoch，图像大小设为 416。有关可用参数的完整列表，请查看训练页面和图像分类任务指南。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this section样本图像和标注#

Caltech-256 数据集包含各种物体的高质量彩色图像，为图像分类任务提供了结构良好的数据集。以下是来自该数据集的图像示例（来源）：

Caltech-256 图像分类数据集样本

这些样本展示了 Caltech-256 数据集中物体的多样性和复杂性，凸显了多样化数据集对于训练鲁棒的目标识别模型的重要性。

Link to this section引用与致谢#

如果你在研究或开发工作中使用了 Caltech-256 数据集，请引用以下论文：

引用

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

我们感谢 Gregory Griffin、Alex Holub 和 Pietro Perona 创建并维护了 Caltech-256 数据集，使其成为机器学习和计算机视觉研究社区的宝贵资源。有关 Caltech-256 数据集及其创建者的更多信息，请访问 Caltech-256 数据集网站。

Link to this section常见问题解答#

Link to this section在机器学习中，Caltech-256 数据集有何用途？#

Caltech-256 数据集被广泛用于训练和基准测试图像分类和目标识别模型。它包含 30,607 张图像，涵盖 256 个目标类别外加一个背景类，为卷积神经网络 (CNNs) 和支持向量机 (SVMs) 等算法提供了比 Caltech-101 更大、更具挑战性的基准。

Link to this section我该如何在 Caltech-256 数据集上训练 Ultralytics YOLO 模型？#

要在 Caltech-256 上训练 Ultralytics YOLO 模型，请使用下方的代码片段。数据集在首次使用时会自动下载。有关参数的完整列表，请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)