跳至内容

ImageWoof 数据集

ImageWoof数据集是 ImageNet 的一个子集,由 10 个类别组成,这些类别都是狗的品种,因此分类难度很大。创建该数据集的目的是让图像分类算法解决难度更大的任务,鼓励开发更先进的模型。

主要功能

  • ImageWoof 包含 10 种不同犬种的图片:澳大利亚梗犬、边境梗犬、萨摩耶犬、比格犬、西施犬、English 猎狐犬、罗得西亚脊背犬、丁戈犬、金毛寻回犬和老English 牧羊犬。
  • 数据集提供不同分辨率(全尺寸、320px、160px)的图像,以满足不同的计算能力和研究需要。
  • 它还包括一个带噪声标签的版本,提供了一个更真实的场景,即标签可能并不总是可靠的。

数据集结构

ImageWoof 数据集的结构基于狗的品种类别,每个品种都有自己的图像目录。

应用

ImageWoof 数据集被广泛用于训练和评估图像分类任务中的深度学习模型,尤其是在涉及更复杂和相似的类别时。该数据集的挑战在于狗种之间的细微差别,挑战着模型性能和泛化的极限。

使用方法

要在图像大小为 224x224 的 ImageWoof 数据集上对 CNN 模型进行 100 次训练,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

数据集变体

ImageWoof 数据集有三种不同大小,可满足不同的研究需求和计算能力:

  1. 全尺寸 (imagewoof):这是 ImageWoof 数据集的原始版本。它包含全尺寸图像,是最终培训和性能基准测试的理想选择。

  2. 中等大小(imagewoof320):该版本包含经过调整的图像,最大边缘长度为 320 像素。该版本适合在不明显影响模型性能的情况下加快训练速度。

  3. 小尺寸(imagewoof160):该版本包含经过调整的图像,最大边缘长度为 160 像素。它专为快速原型设计和实验而设计,训练速度是其优先考虑的因素。

要在训练中使用这些变体,只需将数据集参数中的 "imagewoof "替换为 "imagewoof320 "或 "imagewoof160 "即可。例如

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

值得注意的是,使用较小的图像可能会降低分类准确性。不过,在模型开发和原型设计的早期阶段,这是一种快速迭代的绝佳方法。

图片和注释示例

ImageWoof 数据集包含各种犬种的彩色图像,为图像分类任务提供了一个具有挑战性的数据集。下面是该数据集中的一些图像示例:

数据集样本图像

该示例展示了 ImageWoof 数据集中不同犬种之间的细微差别和相似之处,凸显了分类任务的复杂性和难度。

引文和致谢

如果您在研究或开发工作中使用 ImageWoof 数据集,请务必通过链接到官方数据集存储库,向数据集创建者致谢。

FastAI团队创建并维护了ImageWoof数据集,为机器学习和计算机视觉研究界提供了宝贵的资源,在此表示感谢。有关 ImageWoof 数据集的更多信息,请访问ImageWoof 数据集资源库。



创建于 2023-11-12,更新于 2023-12-03
作者:glenn-jocher(3)

评论