Link to this sectionCaltech-101 数据集#
Caltech-101 数据集是一个广泛用于对象识别任务的数据集,包含来自 101 个对象类别的约 9,000 张图像。这些类别旨在反映各种现实世界中的对象,图像本身经过精心挑选和标注,为对象识别算法提供了一个具有挑战性的基准。
提供的 Caltech-101 数据集并未预先定义训练集/验证集拆分。但是,当你使用下述用法示例中提供的训练命令时,Ultralytics 框架会自动为你拆分数据集。默认拆分比例为 80% 的训练集和 20% 的验证集。
Link to this section主要特性#
- Caltech-101 数据集包含约 9,000 张分为 101 个类别的彩色图像。
- 这些类别涵盖了多种多样的对象,包括动物、车辆、家用物品和人物。
- 每个类别的图像数量各不相同,每个类别大约有 40 到 800 张图像。
- 图像大小不一,大多数图像为中等分辨率。
- Caltech-101 被广泛用于机器学习领域的训练和测试,特别是在对象识别任务中。
Link to this section数据集结构#
与许多其他数据集不同,Caltech-101 数据集没有正式划分为训练集和测试集。用户通常根据自己的特定需求创建自己的拆分。然而,一种常见的做法是使用图像的随机子集进行训练(例如,每个类别 30 张图像),并将剩余的图像用于测试。
Link to this section应用#
Caltech-101 数据集被广泛用于训练和评估对象识别任务中的 深度学习 模型,例如 卷积神经网络 (CNNs)、支持向量机 (SVMs) 以及各种其他机器学习算法。其种类繁多的类别和高质量图像使其成为 机器学习 和 计算机视觉 领域研究与开发的绝佳数据集。
Link to this section用法#
要在 Caltech-101 数据集上训练 YOLO 模型 100 个 epoch,你可以使用以下代码片段。有关可用参数的完整列表,请参阅模型 训练 页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)Link to this section样本图像和标注#
Caltech-101 数据集包含各种对象的高质量彩色图像,为 图像分类 任务提供了结构良好的数据集。以下是来自该数据集的一些图像示例:

该示例展示了 Caltech-101 数据集中对象的多样性和复杂性,强调了多样化数据集对于训练稳健的对象识别模型的重要性。
Link to this section引用与致谢#
如果你在研究或开发工作中使用 Caltech-101 数据集,请引用以下论文:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}我们要感谢李飞飞 (Li Fei-Fei)、Rob Fergus 和 Pietro Perona 创建并维护了 Caltech-101 数据集,使其成为机器学习和计算机视觉研究界的宝贵资源。有关 Caltech-101 数据集及其创建者的更多信息,请访问 Caltech-101 数据集网站。
Link to this section常见问题解答#
Link to this sectionCaltech-101 数据集在机器学习中有什么用途?#
Caltech-101 数据集在机器学习中被广泛用于对象识别任务。它包含 101 个类别的约 9,000 张图像,为评估对象识别算法提供了一个具有挑战性的基准。研究人员利用它来训练和测试模型,特别是在计算机视觉中的卷积 神经网络 (CNNs) 和支持向量机 (SVMs)。
Link to this section我该如何使用 Caltech-101 数据集训练 Ultralytics YOLO 模型?#
要在 Caltech-101 数据集上训练 Ultralytics YOLO 模型,你可以使用提供的代码片段。例如,训练 100 个 epoch:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)有关更详细的参数和选项,请参阅模型 训练 页面。
Link to this sectionCaltech-101 数据集的主要特点是什么?#
Caltech-101 数据集包括:
- 涵盖 101 个类别的约 9,000 张彩色图像。
- 类别涵盖了多种多样的对象,包括动物、车辆和家用物品。
- 每个类别的图像数量各不相同,通常在 40 到 800 张之间。
- 图像大小不一,大多数为中等分辨率。
这些特点使其成为在机器学习和计算机视觉中训练和评估对象识别模型的绝佳选择。
Link to this section为什么我应该在研究中引用 Caltech-101 数据集?#
在你的研究中引用 Caltech-101 数据集是对创建者贡献的认可,并为可能使用该数据集的其他人提供了参考。建议的引用方式为:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}引用有助于保持学术工作的完整性,并协助同行定位原始资源。
Link to this section我可以使用 Ultralytics Platform 在 Caltech-101 数据集上训练模型吗?#
是的,你可以使用 Ultralytics Platform 在 Caltech-101 数据集上训练模型。Ultralytics Platform 提供了一个直观的平台,用于管理数据集、训练模型并进行部署,而无需大量编码。有关详细指南,请参阅如何使用 Ultralytics Platform 训练你的自定义模型博文。