跳至内容

Caltech-101 数据集

Caltech-101数据集是一个广泛用于物体识别任务的数据集,包含来自 101 个物体类别的约 9000 张图像。选择这些类别是为了反映现实世界中的各种物体,而图像本身也是经过精心挑选和注释的,为物体识别算法提供了一个具有挑战性的基准。

主要功能

  • Caltech-101 数据集包含约 9,000 张彩色图像,分为 101 个类别。
  • 这些类别涵盖了各种各样的物品,包括动物、车辆、家庭用品和人物。
  • 每个类别的图片数量各不相同,每个类别约有 40 至 800 张图片。
  • 图片大小不一,大多数为中等分辨率。
  • Caltech-101 广泛用于机器学习领域的训练和测试,特别是物体识别任务。

数据集结构

与许多其他数据集不同,Caltech-101 数据集没有正式拆分为训练集和测试集。用户通常会根据自己的具体需求创建自己的分割集。不过,常见的做法是使用随机的图像子集进行训练(例如,每个类别使用 30 幅图像),其余图像用于测试。

应用

Caltech-101 数据集广泛用于训练和评估物体识别任务中的深度学习模型,如卷积神经网络(CNN)、支持向量机(SVM)和其他各种机器学习算法。该数据集类别繁多,图像质量高,是机器学习和计算机视觉领域研究与开发的绝佳数据集。

使用方法

要在 Caltech-101 数据集上训练YOLO 模型 100 次,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

图片和注释示例

Caltech-101 数据集包含各种物体的高质量彩色图像,为物体识别任务提供了一个结构良好的数据集。下面是该数据集中的一些图像示例:

数据集样本图像

该示例展示了 Caltech-101 数据集中物体的多样性和复杂性,强调了多样化数据集对于训练强大的物体识别模型的重要性。

引文和致谢

如果您在研究或开发工作中使用 Caltech-101 数据集,请引用以下论文:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

李飞飞、罗布-弗格斯和皮埃特罗-佩罗纳创建并维护了 Caltech-101 数据集,为机器学习和计算机视觉研究界提供了宝贵资源,在此一并致谢。有关 Caltech-101 数据集及其创建者的更多信息,请访问Caltech-101 数据集网站

常见问题

Caltech-101 数据集在机器学习中的用途是什么?

Caltech-101数据集广泛应用于机器学习中的物体识别任务。该数据集包含 101 个类别的约 9,000 张图像,为评估物体识别算法提供了一个具有挑战性的基准。研究人员利用它来训练和测试计算机视觉中的模型,特别是卷积神经网络(CNN)和支持向量机(SVM)。

如何在 Caltech-101 数据集上训练Ultralytics YOLO 模型?

要在 Caltech-101 数据集上训练Ultralytics YOLO 模型,可以使用提供的代码片段。例如,训练 100 个历元:

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

有关更详细的参数和选项,请参阅模型培训页面。

Caltech-101 数据集有哪些主要特点?

Caltech-101 数据集包括 - 约 9,000 张彩色图像,涵盖 101 个类别。 - 类别涵盖各种物体,包括动物、车辆和家庭用品。 - 每个类别的图像数量不一,通常在 40 到 800 张之间。 - 图像大小不一,大多数为中等分辨率。

这些特点使其成为机器学习和计算机视觉中训练和评估物体识别模型的绝佳选择。

为什么要在研究中引用加州理工学院 101 数据集?

在您的研究中引用 Caltech-101 数据集,既是对创建者贡献的认可,也为其他可能使用该数据集的人提供了参考。推荐的引用方式是

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

引用有助于保持学术成果的完整性,并帮助同行找到原始资源。

我可以使用Ultralytics HUB 在 Caltech-101 数据集上训练模型吗?

是的,您可以使用Ultralytics HUB 在 Caltech-101 数据集上训练模型。Ultralytics HUB 为管理数据集、训练模型和部署模型提供了一个直观的平台,无需大量编码。有关详细指南,请参阅如何使用Ultralytics HUB训练自定义模型的博文。



创建于 2023-11-12,更新于 2024-07-04
作者:glenn-jocher(6)

评论