跳至内容

加州理工学院-256 数据集

Caltech-256数据集是用于物体分类任务的大量图像集合。它包含约 30,000 张图像,分为 257 个类别(256 个物体类别和 1 个背景类别)。这些图像经过精心策划和注释,为物体识别算法提供了一个具有挑战性和多样性的基准。

主要功能

  • Caltech-256 数据集包含约 30,000 张彩色图像,分为 257 个类别。
  • 每个类别至少包含 80 张图片。
  • 这些类别涵盖了现实世界中的各种物品,包括动物、车辆、家庭用品和人。
  • 图片大小和分辨率各不相同。
  • Caltech-256 广泛用于机器学习领域的训练和测试,特别是物体识别任务。

数据集结构

与 Caltech-101 数据集一样,Caltech-256 数据集也没有对训练集和测试集进行正式拆分。用户通常会根据自己的具体需求创建自己的分集。常见的做法是使用随机的图像子集进行训练,其余图像用于测试。

应用

Caltech-256 数据集广泛用于训练和评估物体识别任务中的深度学习模型,如卷积神经网络(CNN)、支持向量机(SVM)和其他各种机器学习算法。该数据集类别多样,图像质量高,是机器学习和计算机视觉领域研究与开发的宝贵数据集。

使用方法

要在 Caltech-256 数据集上训练YOLO 模型 100 次,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech256', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

图片和注释示例

Caltech-256 数据集包含各种物体的高质量彩色图像,为物体识别任务提供了一个全面的数据集。以下是该数据集中的一些图像示例(信用):

数据集样本图像

该示例展示了 Caltech-256 数据集中物体的多样性和复杂性,强调了多样化数据集对训练强大的物体识别模型的重要性。

引文和致谢

如果您在研究或开发工作中使用 Caltech-256 数据集,请引用以下论文:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

格雷戈里-格里芬(Gregory Griffin)、亚历克斯-霍卢布(Alex Holub)和皮埃特罗-佩罗纳(Pietro Perona)创建并维护了加州理工学院-256 数据集,为机器学习和计算机视觉研究界提供了宝贵的资源,在此一并致谢。有关

如需了解 Caltech-256 数据集及其创建者,请访问Caltech-256 数据集网站



创建于 2023-11-12,更新于 2023-11-22
作者:glenn-jocher(3)

评论