跳至内容

ImageWoof 数据集

ImageWoof数据集是 ImageNet 的一个子集,由 10 个类别组成,这些类别都是狗的品种,因此分类难度很大。创建该数据集的目的是让图像分类算法解决难度更大的任务,鼓励开发更先进的模型。

主要功能

  • ImageWoof 包含 10 种不同犬种的图片:澳大利亚梗犬、边境梗犬、萨摩耶犬、比格犬、西施犬、English 猎狐犬、罗得西亚脊背犬、丁戈犬、金毛寻回犬和老English 牧羊犬。
  • 数据集提供不同分辨率(全尺寸、320px、160px)的图像,以满足不同的计算能力和研究需要。
  • 它还包括一个带噪声标签的版本,提供了一个更真实的场景,即标签可能并不总是可靠的。

数据集结构

ImageWoof 数据集的结构基于狗的品种类别,每个品种都有自己的图像目录。

应用

ImageWoof 数据集被广泛用于训练和评估图像分类任务中的深度学习模型,尤其是在涉及更复杂和相似的类别时。该数据集的挑战在于狗种之间的细微差别,挑战着模型性能和泛化的极限。

使用方法

要在图像大小为 224x224 的 ImageWoof 数据集上对 CNN 模型进行 100 次训练,可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

列车示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

数据集变体

ImageWoof 数据集有三种不同大小,可满足不同的研究需求和计算能力:

  1. 全尺寸 (imagewoof):这是 ImageWoof 数据集的原始版本。它包含全尺寸图像,是最终培训和性能基准测试的理想选择。

  2. 中等大小(imagewoof320):该版本包含经过调整的图像,最大边缘长度为 320 像素。该版本适合在不明显影响模型性能的情况下加快训练速度。

  3. 小尺寸(imagewoof160):该版本包含经过调整的图像,最大边缘长度为 160 像素。它专为快速原型设计和实验而设计,训练速度是其优先考虑的因素。

要在训练中使用这些变体,只需将数据集参数中的 "imagewoof "替换为 "imagewoof320 "或 "imagewoof160 "即可。例如

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

值得注意的是,使用较小的图像可能会降低分类准确性。不过,在模型开发和原型设计的早期阶段,这是一种快速迭代的绝佳方法。

图片和注释示例

ImageWoof 数据集包含各种犬种的彩色图像,为图像分类任务提供了一个具有挑战性的数据集。下面是该数据集中的一些图像示例:

数据集样本图像

该示例展示了 ImageWoof 数据集中不同犬种之间的细微差别和相似之处,凸显了分类任务的复杂性和难度。

引文和致谢

如果您在研究或开发工作中使用 ImageWoof 数据集,请务必通过链接到官方数据集存储库,向数据集创建者致谢。

FastAI团队创建并维护了ImageWoof数据集,为机器学习和计算机视觉研究界提供了宝贵的资源,在此表示感谢。有关 ImageWoof 数据集的更多信息,请访问ImageWoof 数据集资源库

常见问题

Ultralytics 中的 ImageWoof 数据集是什么?

ImageWoof数据集是 ImageNet 的一个具有挑战性的子集,主要针对 10 个特定的狗品种。该数据集以比格犬、西施犬和金毛寻回犬等犬种为特色,旨在挑战图像分类模型的极限。该数据集包括各种分辨率的图像(全尺寸、320px、160px),甚至还包括噪声标签,以获得更真实的训练场景。这种复杂性使 ImageWoof 成为开发更高级深度学习模型的理想选择。

如何通过Ultralytics YOLO 使用 ImageWoof 数据集训练模型?

要在图像大小为 224x224 的 ImageWoof 数据集上使用Ultralytics YOLO 训练卷积神经网络 (CNN) 模型 100 次,可以使用以下代码:

列车示例

from ultralytics import YOLO

model = YOLO("yolov8n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

有关可用培训论点的更多详情,请参阅培训页面。

ImageWoof 数据集有哪些版本?

ImageWoof 数据集有三种尺寸:

  1. 全尺寸(imagewoof):是最终培训和基准测试的理想选择,包含全尺寸图像。
  2. 中等大小 (imagewoof320):重新调整后的图像,最大边缘长度为 320 像素,适合快速训练。
  3. 小尺寸(imagewoof160):调整后的图像最大边缘长度为 160 像素,非常适合快速原型制作。

将数据集参数中的 "imagewoof "替换为这些版本即可。不过请注意,较小的图像可能会降低分类准确率,但对于快速迭代很有用。

ImageWoof 数据集中的噪声标签对训练有何益处?

ImageWoof 数据集中的噪声标签模拟了现实世界中标签不一定准确的情况。使用这些数据训练模型有助于开发图像分类任务的鲁棒性和泛化能力。这使模型能够有效处理实际应用中经常遇到的模糊或错误标签数据。

使用 ImageWoof 数据集的主要挑战是什么?

ImageWoof 数据集的主要挑战在于它所包含的狗品种之间的细微差别。由于该数据集重点关注 10 个密切相关的犬种,因此区分这些犬种需要更先进、更微调的图像分类模型。这使得 ImageWoof 成为测试深度学习模型能力和改进的绝佳基准。



创建于 2023-11-12,更新于 2024-07-04
作者:glenn-jocher(6)

评论