Link to this sectionCaltech-101 数据集#

Caltech-101 数据集是一个经典的图像分类基准，包含 9,144 张图像，涵盖 101 个对象类别外加一个背景类。每个类别包含约 40 到 800 张现实世界的对象图像——动物、车辆、家居用品和人物——使其成为一个虽紧凑但具有挑战性的对象识别模型基准。

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

自动数据拆分

Caltech-101 不提供预定义的训练/验证集划分。下方的训练命令会自动将其划分为 80% 训练集 / 20% 验证集，因此无需手动准备。

Link to this section主要特性#

Caltech-101 包含分布在 101 个对象类别及一个 BACKGROUND_Google 类中的 9,144 张彩色图像（总共 102 个类别文件夹）。
这些类别涵盖了各种现实世界的对象，包括动物、车辆、家居用品和人物。
每个类别包含约 40 到 800 张图像，因此类别规模不平衡。
图像大小不一，大多数约为 300x200 像素（中等分辨率）。
Caltech-101 被广泛用于基准测试图像分类和对象识别算法。

Link to this section数据集结构#

Caltech-101 以 102 个文件夹的形式发布——每个类别一个，涵盖 101 个对象类别外加一个 BACKGROUND_Google 类——没有预定义的训练/验证集划分。当你启动训练时，Ultralytics 会自动对图像进行分区，以便模型在所有 102 个类别上进行训练，无需任何手动设置：

类别数：102（101 个对象类别 + 1 个背景类别）
图像总数：9,144
训练/验证集划分：自动 80% / 20%（约 7,280 张训练，约 1,864 张验证）
每个类别的图像数：约 40 到 800（不平衡）

Link to this section应用#

Caltech-101 被广泛用于训练和评估图像分类和对象识别模型，包括卷积神经网络 (CNNs) 和支持向量机 (SVMs)。其广泛的类别覆盖范围和干净的标注图像使其成为机器学习和计算机视觉研究与原型设计的热门基准。

Link to this section用法#

使用 416 的图像尺寸在 Caltech-101 上训练 YOLO 模型 100 个 epoch。有关可用参数的完整列表，请参阅训练页面和图像分类任务指南。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this section样本图像和标注#

Caltech-101 数据集包含各种对象的高质量彩色图像，为图像分类任务提供了结构良好的数据集。以下是来自该数据集的图像示例：

Caltech-101 图像分类数据集样本

这些样本展示了 Caltech-101 典型的类别多样性和自然、居中的构图，使其成为训练稳健对象识别模型的理想起点。

Link to this section引用与致谢#

如果你在研究或开发工作中使用了 Caltech-101 数据集，请引用以下论文：

引用

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

我们要感谢 Li Fei-Fei、Rob Fergus 和 Pietro Perona 创建并维护了 Caltech-101 数据集，将其作为机器学习和计算机视觉研究社区的宝贵资源。有关 Caltech-101 数据集及其创建者的更多信息，请访问 Caltech-101 数据集网站。

Link to this section常见问题解答#