跳转至内容

ImageWoof 数据集

ImageWoof 数据集是 ImageNet 的一个子集,包含 10 个难以分类的类别,因为它们都是犬种。它的创建旨在为图像分类算法提供更具挑战性的任务,以鼓励开发更高级的模型。

主要功能

  • ImageWoof 包含 10 种不同犬种的图像:澳大利亚梗犬、Border 梗犬、萨摩耶犬、比格犬、西施犬、English 猎狐犬、罗德西亚脊背犬、澳洲野狗、金毛寻回犬和古English 牧羊犬。
  • 该数据集提供各种分辨率的图像(全尺寸、320px、160px),以适应不同的计算能力和研究需求。
  • 它还包括一个带有噪声标签的版本,提供了一个更真实的场景,其中标签可能并不总是可靠的。

数据集结构

ImageWoof数据集结构基于犬种类别,每个犬种都有自己的图像目录。与其他分类数据集类似,它遵循拆分目录格式,其中训练集和验证集分别位于不同的文件夹中。

应用

ImageWoof数据集广泛用于训练和评估图像分类任务中的深度学习模型,尤其是在涉及更复杂和相似的类别时。该数据集的挑战在于犬种之间的细微差别,从而推动了模型性能和泛化的极限。它对于以下方面尤其有价值:

  • 对细粒度类别的分类模型性能进行基准测试
  • 测试模型对相似类别的鲁棒性
  • 开发能够区分细微视觉差异的算法
  • 评估从一般领域到特定领域的迁移学习能力

用法

要在 ImageWoof 数据集上训练 CNN 模型 100 个 epochs,图像大小为 224x224,您可以使用以下代码片段。有关可用参数的完整列表,请参阅模型训练页面。

训练示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

数据集变体

ImageWoof 数据集有三种不同的尺寸,以适应各种研究需求和计算能力:

  1. 完整尺寸 (imagewoof): 这是 ImageWoof 数据集的原始版本。它包含完整尺寸的图像,非常适合最终训练和性能基准测试。

  2. 中等大小 (imagewoof320): 此版本包含调整大小的图像,最大边缘长度为 320 像素。它适合更快的训练,而不会显着牺牲模型性能。

  3. 小尺寸 (imagewoof160): 此版本包含调整大小的图像,最大边缘长度为 160 像素。它专为快速原型设计和实验而设计,在这些情况下,训练速度是首要任务。

要在训练中使用这些变体,只需在数据集参数中将“imagewoof”替换为“imagewoof320”或“imagewoof160”即可。例如:

示例

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

重要的是要注意,使用较小的图像可能会降低分类准确性。但是,这是一种在模型开发的早期阶段和原型设计中快速迭代的绝佳方法。

Sample Images 和注释

ImageWoof 数据集包含各种犬种的彩色图像,为图像分类任务提供了一个具有挑战性的数据集。以下是数据集中图像的一些示例:

数据集样本图像

该示例展示了 ImageWoof 数据集中不同犬种之间的细微差异和相似之处,突出了分类任务的复杂性和难度。

引用和致谢

如果您在研究或开发工作中使用 ImageWoof 数据集,请务必通过链接到官方数据集存储库来感谢数据集的创建者。

我们要感谢 FastAI 团队创建和维护 ImageWoof 数据集,使其成为 机器学习计算机视觉 研究社区的宝贵资源。有关 ImageWoof 数据集的更多信息,请访问 ImageWoof 数据集存储库

常见问题

Ultralytics 中的 ImageWoof 数据集是什么?

ImageWoof数据集是ImageNet的一个具有挑战性的子集,专注于10个特定的犬种。它的创建旨在突破图像分类模型的极限,其特点是包含比格犬、西施犬和金毛寻回犬等品种。该数据集包括各种分辨率(全尺寸、320px、160px)的图像,甚至包括带有噪声的标签,以实现更真实的训练场景。这种复杂性使得ImageWoof成为开发更高级深度学习模型的理想选择。

如何使用 Ultralytics YOLO 通过 ImageWoof 数据集训练模型?

要使用 Ultralytics YOLO 在 ImageWoof 数据集上训练卷积神经网络 (CNN) 模型,训练 100 个 epoch,图像大小为 224x224,您可以使用以下代码:

训练示例

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

有关可用训练参数的更多详细信息,请参阅训练页面。

有哪些可用的 ImageWoof 数据集版本?

ImageWoof 数据集有三种尺寸:

  1. 完整尺寸 (imagewoof): 包含完整尺寸的图像,非常适合最终训练和基准测试。
  2. 中等大小 (imagewoof320): 调整大小的图像,最大边缘长度为 320 像素,适合更快的训练。
  3. 小尺寸 (imagewoof160): 调整大小的图像,最大边缘长度为 160 像素,非常适合快速原型设计。

通过相应地替换数据集参数中的 'imagewoof' 来使用这些版本。但是请注意,较小的图像可能会降低分类准确性,但对于更快的迭代可能很有用。

ImageWoof 数据集中的噪声标签如何有益于训练?

ImageWoof 数据集中的噪声标签模拟了真实世界的条件,在真实世界中,标签可能并不总是准确的。使用此数据训练模型有助于提高图像分类任务的鲁棒性和泛化能力。这使模型能够有效地处理模糊或标记错误的数据,而这些数据在实际应用中经常遇到。

使用 ImageWoof 数据集的主要挑战是什么?

ImageWoof 数据集的主要挑战在于其包含的犬种之间的细微差异。由于它侧重于 10 个密切相关的品种,因此区分它们需要更高级和更精细的图像分类模型。这使得 ImageWoof 成为测试深度学习模型能力和改进的绝佳基准。



📅 创建于 1 年前 ✏️ 更新于 5 个月前

评论