Caltech-101 数据集
Caltech-101 数据集是一个广泛用于目标识别任务的数据集,包含来自 101 个目标类别的约 9,000 张图像。这些类别旨在反映各种现实世界的物体,图像本身经过精心挑选和标注,为目标识别算法提供了具有挑战性的基准。
所提供的 Caltech-101 数据集并未预先定义训练集/验证集拆分。然而,当你使用下方使用示例中提供的训练命令时,Ultralytics 框架将为你自动拆分数据集。默认的拆分比例为 80% 的训练集和 20% 的验证集。
主要特性
- Caltech-101 数据集包含约 9,000 张分为 101 个类别的彩色图像。
- 这些类别涵盖了多种物体,包括动物、车辆、家居用品和人物。
- 每个类别的图像数量不等,大约在 40 到 800 张之间。
- 图像大小各异,大多数图像为中等分辨率。
- Caltech-101 被广泛用于机器学习领域的训练和测试,特别是针对目标识别任务。
数据集结构
与许多其他数据集不同,Caltech-101 数据集没有正式划分为训练集和测试集。用户通常根据自己的特定需求创建拆分。不过,一种常见的做法是使用图像的随机子集进行训练(例如,每个类别 30 张图像),并使用剩余的图像进行测试。
应用场景
Caltech-101 数据集被广泛用于训练和评估目标识别任务中的 深度学习 模型,例如 卷积神经网络 (CNN)、支持向量机 (SVM) 以及各种其他机器学习算法。其丰富的类别和高质量图像使其成为 机器学习 和 计算机视觉 领域研究与开发的优秀数据集。
使用方法
要使用 YOLO 模型在 Caltech-101 数据集上进行 100 个 epoch 的训练,你可以使用以下代码片段。有关可用参数的完整列表,请参阅模型 训练 页面。
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)样本图像和标注
Caltech-101 数据集包含各种物体的高质量彩色图像,为 图像分类 任务提供了结构良好的数据集。以下是来自该数据集的图像示例:

该示例展示了 Caltech-101 数据集中物体的多样性和复杂性,强调了多样化数据集对于训练鲁棒目标识别模型的重要性。
引文与致谢
如果你在研究或开发工作中使用了 Caltech-101 数据集,请引用以下论文:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}我们要感谢李飞飞 (Li Fei-Fei)、Rob Fergus 和 Pietro Perona 创建并维护了 Caltech-101 数据集,使其成为机器学习和计算机视觉研究界宝贵的资源。有关 Caltech-101 数据集及其创建者的更多信息,请访问 Caltech-101 数据集网站。
常见问题 (FAQ)
Caltech-101 数据集在机器学习中有什么用途?
Caltech-101 数据集在机器学习中被广泛用于目标识别任务。它包含 101 个类别中的约 9,000 张图像,为评估目标识别算法提供了具有挑战性的基准。研究人员利用它来训练和测试模型,特别是在计算机视觉中的卷积 神经网络 (CNN) 和支持向量机 (SVM)。
如何使用 Ultralytics YOLO 模型在 Caltech-101 数据集上进行训练?
要使用 Ultralytics YOLO 模型在 Caltech-101 数据集上进行训练,你可以使用提供的代码片段。例如,进行 100 个 epoch 的训练:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)有关更详细的参数和选项,请参阅模型 训练 页面。
Caltech-101 数据集的主要特点是什么?
Caltech-101 数据集包括:
- 涵盖 101 个类别的约 9,000 张彩色图像。
- 类别涵盖多种物体,包括动物、车辆和家居用品。
- 每个类别的图像数量不固定,通常在 40 到 800 张之间。
- 图像尺寸各异,大多数为中等分辨率。
这些特性使其成为在机器学习和计算机视觉中训练和评估目标识别模型的绝佳选择。
为什么我在研究中应该引用 Caltech-101 数据集?
在你的研究中引用 Caltech-101 数据集是对创建者贡献的认可,并为可能使用该数据集的其他人提供了参考。推荐的引用方式是:
@article{fei2007learning,
title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
journal={Computer vision and Image understanding},
volume={106},
number={1},
pages={59--70},
year={2007},
publisher={Elsevier}
}引用有助于保持学术工作的完整性,并协助同行定位原始资源。
我可以使用 Ultralytics Platform 在 Caltech-101 数据集上训练模型吗?
是的,你可以使用 Ultralytics Platform 在 Caltech-101 数据集上训练模型。Ultralytics Platform 提供了一个直观的平台,用于管理数据集、训练模型并进行部署,无需大量的编码。有关详细指南,请参阅 如何使用 Ultralytics Platform 训练自定义模型 的博客文章。