Link to this sectionCaltech-101 数据集#
Caltech-101 数据集是一个广泛用于目标识别任务的数据集,包含来自 101 个对象类别的约 9,000 张图像。这些类别旨在反映各种现实世界的对象,图像本身经过精心挑选和标注,为目标识别算法提供了具有挑战性的基准。
Caltech-101 数据集本身并未提供预定义的训练/验证拆分。不过,当你使用下述用法示例中提供的训练命令时,Ultralytics 框架会自动为你拆分数据集。默认拆分比例为 80% 用于训练集,20% 用于验证集。
Link to this section主要特性#
- Caltech-101 数据集包含约 9,000 张分为 101 个类别的彩色图像。
- 这些类别涵盖了各种各样的对象,包括动物、车辆、家居用品和人物。
- 每个类别的图像数量各不相同,每个类别大约有 40 到 800 张图像。
- 图像大小各异,大多数图像为中等分辨率。
- Caltech-101 被广泛用于机器学习领域的训练和测试,特别是针对目标识别任务。
Link to this section数据集结构#
与许多其他数据集不同,Caltech-101 数据集并未正式划分为训练集和测试集。用户通常根据自己的特定需求创建自己的拆分。不过,一种常见的做法是使用随机图像子集进行训练(例如,每个类别 30 张图像),并将剩余图像用于测试。
Link to this section应用#
Caltech-101 数据集被广泛用于训练和评估目标识别任务中的 深度学习 模型,例如 卷积神经网络 (CNNs)、支持向量机 (SVMs) 以及其他各种机器学习算法。其丰富的类别和高质量图像使其成为 机器学习 和 计算机视觉 领域科研与开发的绝佳数据集。
Link to this section用法#
若要使用 Caltech-101 数据集训练 YOLO 模型 100 个 epoch,你可以使用以下代码片段。有关可用参数的完整列表,请参阅模型 训练 页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this section样本图像和标注#
Caltech-101 数据集包含各种对象的高质量彩色图像,为 图像分类 任务提供了结构良好的数据集。以下是来自该数据集的图像示例:

该示例展示了 Caltech-101 数据集中对象的种类和复杂性,强调了多样化数据集对于训练稳健目标识别模型的重要性。
Link to this section引用与致谢#
如果你在研究或开发工作中使用了 Caltech-101 数据集,请引用以下论文:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}我们要感谢 Li Fei-Fei、Rob Fergus 和 Pietro Perona 创建并维护了 Caltech-101 数据集,将其作为机器学习和计算机视觉研究社区的宝贵资源。有关 Caltech-101 数据集及其创建者的更多信息,请访问 Caltech-101 数据集网站。
Link to this section常见问题解答#
Link to this sectionCaltech-101 数据集在机器学习中有什么用途?#
Caltech-101 数据集在机器学习中被广泛用于目标识别任务。它包含 101 个类别的约 9,000 张图像,为评估目标识别算法提供了具有挑战性的基准。研究人员利用它来训练和测试模型,尤其是在计算机视觉中的卷积 神经网络 (CNNs) 和支持向量机 (SVMs)。
Link to this section我该如何在 Caltech-101 数据集上训练 Ultralytics YOLO 模型?#
要在 Caltech-101 数据集上训练 Ultralytics YOLO 模型,你可以使用提供的代码片段。例如,训练 100 个 epoch:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)有关更详细的参数和选项,请参阅模型 训练 页面。
Link to this sectionCaltech-101 数据集的主要特点是什么?#
Caltech-101 数据集包括:
- 101 个类别的约 9,000 张彩色图像。
- 涵盖多种对象的类别,包括动物、车辆和家居用品。
- 每个类别的图像数量不固定,通常在 40 到 800 张之间。
- 图像尺寸各异,大多数为中等分辨率。
这些特点使其成为在机器学习和计算机视觉中训练与评估目标识别模型的绝佳选择。
Link to this section为什么我应该在研究中引用 Caltech-101 数据集?#
在你的研究中引用 Caltech-101 数据集既是对贡献者的认可,也为其他可能使用该数据集的人提供了参考。推荐的引用格式为:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}引用有助于保持学术工作的完整性,并协助同行定位原始资源。
Link to this section我可以使用 Ultralytics Platform 在 Caltech-101 数据集上训练模型吗?#
是的,你可以使用 Ultralytics Platform 在 Caltech-101 数据集上训练模型。Ultralytics Platform 提供了一个直观的平台,用于管理数据集、训练模型并进行部署,而无需大量编码。有关详细指南,请参阅如何使用 Ultralytics Platform 训练自定义模型的博客文章。