ImageWoof 数据集

Q: What is the ImageWoof dataset in Ultralytics?

ImageWoof 数据集是 ImageNet 的一个具有挑战性的子集，专注于 10 种特定犬种。它旨在突破图像分类模型的极限，包含比格犬、西施犬和金毛寻回犬等犬种。该数据集包含各种分辨率（全尺寸、320 像素、160 像素）的图像，甚至还有带噪声的标签，以实现更真实的训练场景。这种复杂性使得 ImageWoof 成为开发更高级深度学习模型的理想选择。

Q: What versions of the ImageWoof dataset are available?

ImageWoof 数据集有三种尺寸：通过相应地替换数据集参数中的“imagewoof”来使用这些版本。但是请注意，较小的图像可能会降低分类准确性，但对于更快的迭代可能很有用。

The ImageWoof数据集是ImageNet的一个子集，由10个难以分类的类别组成，因为它们都是犬种。它的创建是为了给图像分类算法提供一个更具挑战性的任务，旨在鼓励开发更先进的模型。

主要功能

ImageWoof 包含 10 种不同犬种的图像：澳大利亚梗犬、Border 梗犬、萨摩耶犬、比格犬、西施犬、English 猎狐犬、罗德西亚脊背犬、澳洲野狗、金毛寻回犬和古English 牧羊犬。
该数据集提供各种分辨率的图像（全尺寸、320px、160px），以适应不同的计算能力和研究需求。
它还包括一个带有噪声标签的版本，提供了一个更真实的场景，其中标签可能并不总是可靠的。

数据集结构

ImageWoof数据集结构基于犬种类别，每个犬种都有自己的图像目录。与其他分类数据集类似，它遵循拆分目录格式，其中训练集和验证集分别位于不同的文件夹中。

应用

ImageWoof数据集在图像分类任务中被广泛用于训练和评估深度学习模型，尤其适用于处理更复杂且相似度高的类别。该数据集的挑战在于犬种间的细微差异，这不断挑战着模型性能与泛化能力的极限。其特别适用于：

对细粒度类别的分类模型性能进行基准测试
测试模型对相似类别的鲁棒性
开发能够区分细微视觉差异的算法
评估从一般领域到特定领域的迁移学习能力

用法

要在 ImageWoof 数据集上训练 CNN 模型 100 个 epochs，图像大小为 224x224，您可以使用以下代码片段。有关可用参数的完整列表，请参阅模型训练页面。

训练示例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo26n-cls.pt epochs=100 imgsz=224

数据集变体

ImageWoof 数据集有三种不同的尺寸，以适应各种研究需求和计算能力：

完整尺寸 (imagewoof): 这是 ImageWoof 数据集的原始版本。它包含完整尺寸的图像，非常适合最终训练和性能基准测试。
中等大小 (imagewoof320): 此版本包含调整大小的图像，最大边缘长度为 320 像素。它适合更快的训练，而不会显着牺牲模型性能。
小尺寸 (imagewoof160): 此版本包含调整大小的图像，最大边缘长度为 160 像素。它专为快速原型设计和实验而设计，在这些情况下，训练速度是首要任务。

要在训练中使用这些变体，只需在数据集参数中将“imagewoof”替换为“imagewoof320”或“imagewoof160”即可。例如：

示例

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo26n-cls.pt data=imagewoof320 epochs=100 imgsz=224

重要的是要注意，使用较小的图像可能会降低分类准确性。但是，这是一种在模型开发的早期阶段和原型设计中快速迭代的绝佳方法。

Sample Images 和注释

ImageWoof 数据集包含各种犬种的彩色图像，为图像分类任务提供了一个具有挑战性的数据集。以下是数据集中图像的一些示例：

ImageWoof犬种分类数据集样本

该示例展示了 ImageWoof 数据集中不同犬种之间的细微差异和相似之处，突出了分类任务的复杂性和难度。

引用和致谢

如果您在研究或开发工作中使用 ImageWoof 数据集，请务必通过链接到官方数据集存储库来感谢数据集的创建者。

我们要感谢 FastAI 团队创建和维护 ImageWoof 数据集，使其成为机器学习和计算机视觉研究社区的宝贵资源。有关 ImageWoof 数据集的更多信息，请访问 ImageWoof 数据集存储库。

常见问题

Ultralytics 中的 ImageWoof 数据集是什么？

The ImageWoof数据集是ImageNet中一个具有挑战性的子集，专注于10种特定犬种。它旨在突破图像分类模型的极限，包含比格犬、西施犬和金毛寻回犬等犬种。该数据集包含各种分辨率（全尺寸、320像素、160像素）的图像，甚至还有带噪声的标签，以模拟更真实的训练场景。这种复杂性使得ImageWoof成为开发更先进深度学习模型的理想选择。

如何使用 Ultralytics YOLO 通过 ImageWoof 数据集训练模型？

要使用 Ultralytics YOLO 在 ImageWoof 数据集上训练卷积神经网络 (CNN) 模型，训练 100 个 epoch，图像大小为 224x224，您可以使用以下代码：

训练示例

PythonCLI

from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

yolo classify train data=imagewoof model=yolo26n-cls.pt epochs=100 imgsz=224

有关可用训练参数的更多详细信息，请参阅训练页面。

有哪些可用的 ImageWoof 数据集版本？

ImageWoof 数据集有三种尺寸：

完整尺寸 (imagewoof): 包含完整尺寸的图像，非常适合最终训练和基准测试。
中等大小 (imagewoof320): 调整大小的图像，最大边缘长度为 320 像素，适合更快的训练。
小尺寸 (imagewoof160): 调整大小的图像，最大边缘长度为 160 像素，非常适合快速原型设计。

通过相应地替换数据集参数中的 'imagewoof' 来使用这些版本。但是请注意，较小的图像可能会降低分类准确性，但对于更快的迭代可能很有用。