跳至内容

Caltech-101 数据集

Caltech-101数据集是一个广泛用于物体识别任务的数据集,包含来自 101 个物体类别的约 9000 张图像。选择这些类别是为了反映现实世界中的各种物体,而图像本身也是经过精心挑选和注释的,为物体识别算法提供了一个具有挑战性的基准。

主要功能

  • Caltech-101 数据集包含约 9,000 张彩色图像,分为 101 个类别。
  • 这些类别涵盖了各种各样的物品,包括动物、车辆、家庭用品和人物。
  • 每个类别的图片数量各不相同,每个类别约有 40 至 800 张图片。
  • 图片大小不一,大多数为中等分辨率。
  • Caltech-101 广泛用于机器学习领域的训练和测试,特别是物体识别任务。

数据集结构

与许多其他数据集不同,Caltech-101 数据集没有正式拆分为训练集和测试集。用户通常会根据自己的具体需求创建自己的分割集。不过,常见的做法是使用随机的图像子集进行训练(例如,每个类别使用 30 幅图像),其余图像用于测试。

应用

Caltech-101 数据集广泛用于训练和评估物体识别任务中的深度学习模型,如卷积神经网络(CNN)、支持向量机(SVM)和其他各种机器学习算法。该数据集类别繁多,图像质量高,是机器学习和计算机视觉领域研究与开发的绝佳数据集。

使用方法

要在 Caltech-101 数据集上训练YOLO 模型 100 次,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech101', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

图片和注释示例

Caltech-101 数据集包含各种物体的高质量彩色图像,为物体识别任务提供了一个结构良好的数据集。下面是该数据集中的一些图像示例:

数据集样本图像

该示例展示了 Caltech-101 数据集中物体的多样性和复杂性,强调了多样化数据集对于训练强大的物体识别模型的重要性。

引文和致谢

如果您在研究或开发工作中使用 Caltech-101 数据集,请引用以下论文:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

李飞飞、罗布-弗格斯和皮埃特罗-佩罗纳创建并维护了 Caltech-101 数据集,为机器学习和计算机视觉研究界提供了宝贵资源,在此一并致谢。有关 Caltech-101 数据集及其创建者的更多信息,请访问Caltech-101 数据集网站。



创建于 2023-11-12,更新于 2023-11-22
作者:glenn-jocher(3)

评论