跳转至内容

Caltech-101 数据集

Caltech-101 数据集是一个广泛使用的对象识别任务数据集,包含来自 101 个对象类别的约 9,000 张图像。选择这些类别是为了反映各种真实世界的对象,并且对图像本身进行了精心选择和注释,从而为对象识别算法提供了一个具有挑战性的基准。



观看: 如何训练 图像分类 使用 Caltech-256 数据集和 Ultralytics HUB 的模型

自动数据分割

所提供的 Caltech-101 数据集没有预定义的训练/验证分割。但是,当您使用下面用法示例中提供的训练命令时,Ultralytics 框架将自动为您分割数据集。使用的默认分割是 80% 用于训练集,20% 用于验证集。

主要功能

  • Caltech-101 数据集包含大约 9,000 张彩色图像,分为 101 个类别。
  • 这些类别涵盖了各种各样的物体,包括动物、车辆、家居用品和人。
  • 每个类别的图像数量各不相同,每个类别大约有 40 到 800 张图像。
  • 图像大小不一,大多数图像为中等分辨率。
  • Caltech-101 广泛用于机器学习领域的训练和测试,尤其是在对象识别任务中。

数据集结构

与许多其他数据集不同,Caltech-101 数据集没有正式分为训练集和测试集。 用户通常根据自己的特定需求创建自己的分割。 然而,一种常见的做法是使用图像的随机子集进行训练(例如,每个类别 30 张图像),其余图像用于测试。

应用

Caltech-101 数据集广泛用于训练和评估对象识别任务中的深度学习模型,例如卷积神经网络 (CNN)、支持向量机 (SVM) 和各种其他机器学习算法。其种类繁多的类别和高质量的图像使其成为机器学习计算机视觉领域研究和开发的绝佳数据集。

用法

要使用以下代码片段在 Caltech-101 数据集上训练 YOLO 模型 100 个 epochs。有关可用参数的完整列表,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Sample Images 和注释

Caltech-101 数据集包含各种对象的高质量彩色图像,为图像分类任务提供了一个结构良好的数据集。以下是数据集中图像的一些示例:

数据集样本图像

该示例展示了 Caltech-101 数据集中对象的多样性和复杂性,强调了多样化数据集对于训练强大的对象识别模型的重要性。

引用和致谢

如果您在研究或开发工作中使用 Caltech-101 数据集,请引用以下论文:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

我们要感谢李飞飞、Rob Fergus 和 Pietro Perona 创建并维护 Caltech-101 数据集,使其成为机器学习和计算机视觉研究社区的宝贵资源。有关 Caltech-101 数据集及其创建者的更多信息,请访问 Caltech-101 数据集网站

常见问题

Caltech-101 数据集在机器学习中有什么用途?

Caltech-101 数据集广泛应用于机器学习中的目标识别任务。它包含 101 个类别中约 9,000 张图像,为评估目标识别算法提供了一个具有挑战性的基准。研究人员利用它来训练和测试模型,尤其是在计算机视觉中的卷积神经网络 (CNN) 和支持向量机 (SVM)。

如何在 Caltech-101 数据集上训练 Ultralytics YOLO 模型?

要在 Caltech-101 数据集上训练 Ultralytics YOLO 模型,您可以使用提供的代码片段。例如,要训练 100 个 epochs:

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

有关更详细的参数和选项,请参阅模型训练页面。

Caltech-101 数据集的主要特征是什么?

Caltech-101 数据集包括:

  • 大约 9,000 张彩色图像,涵盖 101 个类别。
  • 涵盖各种对象的类别,包括动物、车辆和家居用品。
  • 每个类别的图像数量可变,通常在 40 到 800 之间。
  • 可变的图像尺寸,大多数为中等分辨率。

这些特性使其成为在机器学习和计算机视觉中训练和评估对象识别模型的绝佳选择。

为什么我应该在我的研究中引用 Caltech-101 数据集?

在您的研究中引用 Caltech-101 数据集是对创建者贡献的认可,并为可能使用该数据集的其他人提供参考。推荐的引用是:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

引用有助于维护学术工作的完整性,并帮助同行找到原始资源。

我可以使用 Ultralytics HUB 在 Caltech-101 数据集上训练模型吗?

是的,您可以使用 Ultralytics HUB 在 Caltech-101 数据集上训练模型。Ultralytics HUB 提供了一个直观的平台,用于管理数据集、训练模型和部署它们,而无需大量的编码。有关详细指南,请参阅如何使用 Ultralytics HUB 训练您的自定义模型博客文章。



📅 创建于 1 年前 ✏️ 更新于 4 个月前

评论