Caltech-101 数据集

Q: What is the Caltech-101 dataset used for in machine learning?

Caltech-101数据集广泛应用于机器学习中的对象识别任务。它包含大约9,000张图片，涵盖101个类别，为评估对象识别算法提供了一个具有挑战性的基准。研究人员利用它来训练和测试模型，特别是在计算机视觉中的卷积神经网络（CNN）和支持向量机（SVM）。

Q: How can I train an Ultralytics YOLO model on the Caltech-101 dataset?

要在Caltech-101数据集上训练Ultralytics YOLO模型，您可以使用提供的代码片段。例如，要训练100个epoch，请执行以下操作：有关更详细的参数和选项，请参阅模型训练页面。

Q: What are the key features of the Caltech-101 dataset?

Caltech-101数据集包括：这些特性使其成为在机器学习和计算机视觉中训练和评估对象识别模型的绝佳选择。

Q: Why should I cite the Caltech-101 dataset in my research?

在您的研究中引用Caltech-101数据集，是对创建者贡献的认可，并为可能使用该数据集的其他人提供了参考。推荐的引文是：引用有助于维护学术工作的完整性，并帮助同行找到原始资源。

Caltech-101 数据集是一个广泛使用的对象识别任务数据集，包含来自 101 个对象类别的约 9,000 张图像。选择这些类别是为了反映各种真实世界的对象，并且对图像本身进行了精心选择和注释，从而为对象识别算法提供了一个具有挑战性的基准。

观看： 如何训练图像分类在 Ultralytics Platform 上使用 Caltech-256 数据集的模型

自动数据分割

所提供的 Caltech-101 数据集没有预定义的训练/验证分割。但是，当您使用下面用法示例中提供的训练命令时，Ultralytics 框架将自动为您分割数据集。使用的默认分割是 80% 用于训练集，20% 用于验证集。

主要功能

Caltech-101 数据集包含大约 9,000 张彩色图像，分为 101 个类别。
这些类别涵盖了各种各样的物体，包括动物、车辆、家居用品和人。
每个类别的图像数量各不相同，每个类别大约有 40 到 800 张图像。
图像大小不一，大多数图像为中等分辨率。
Caltech-101 广泛用于机器学习领域的训练和测试，尤其是在对象识别任务中。

数据集结构

与许多其他数据集不同，Caltech-101 数据集没有正式分为训练集和测试集。用户通常根据自己的特定需求创建自己的分割。然而，一种常见的做法是使用图像的随机子集进行训练（例如，每个类别 30 张图像），其余图像用于测试。

应用

Caltech-101 数据集广泛用于训练和评估对象识别任务中的深度学习模型，例如卷积神经网络 (CNN)、支持向量机 (SVM) 和各种其他机器学习算法。其种类繁多的类别和高质量的图像使其成为机器学习和计算机视觉领域研究和开发的绝佳数据集。

用法

要使用以下代码片段在 Caltech-101 数据集上训练 YOLO 模型 100 个 epochs。有关可用参数的完整列表，请参阅模型训练页面。

训练示例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo26n-cls.pt epochs=100 imgsz=416

Sample Images 和注释

Caltech-101 数据集包含各种对象的高质量彩色图像，为图像分类任务提供了一个结构良好的数据集。以下是数据集中图像的一些示例：

Caltech-101 图像分类数据集样本

该示例展示了 Caltech-101 数据集中对象的多样性和复杂性，强调了多样化数据集对于训练强大的对象识别模型的重要性。

引用和致谢

如果您在研究或开发工作中使用 Caltech-101 数据集，请引用以下论文：

BibTeX

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

我们要感谢李飞飞、Rob Fergus 和 Pietro Perona 创建并维护 Caltech-101 数据集，使其成为机器学习和计算机视觉研究社区的宝贵资源。有关 Caltech-101 数据集及其创建者的更多信息，请访问 Caltech-101 数据集网站。

常见问题