Перейти к содержимому

Набор данных ImageWoof

Набор данных ImageWoof - это подмножество ImageNet, состоящее из 10 классов, которые сложно классифицировать, так как все они - породы собак. Он был создан как более сложная задача для алгоритмов классификации изображений, чтобы стимулировать разработку более совершенных моделей.

Основные характеристики

  • ImageWoof содержит изображения 10 различных пород собак: Австралийский терьер, бордер-терьер, самоед, бигль, ши-тцу, фоксхаунд English , родезийский риджбек, динго, золотистый ретривер и старая English овчарка.
  • В наборе данных представлены изображения в различных разрешениях (полноразмерное, 320px, 160px), что позволяет использовать различные вычислительные возможности и исследовательские потребности.
  • В него также входит версия с зашумленными ярлыками, обеспечивающая более реалистичный сценарий, в котором ярлыки не всегда могут быть надежными.

Структура набора данных

Структура набора данных ImageWoof основана на классах пород собак, причем для каждой породы существует своя директория изображений.

Приложения

Набор данных ImageWoof широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, особенно когда речь идет о более сложных и похожих классах. Сложность датасета заключается в тонких различиях между породами собак, что расширяет границы производительности и обобщения модели.

Использование

Чтобы обучить модель CNN на наборе данных ImageWoof в течение 100 эпох с размером изображения 224x224, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов смотри на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Варианты набора данных

Набор данных ImageWoof выпускается в трех разных размерах, чтобы удовлетворить различные исследовательские потребности и вычислительные возможности:

  1. Полный размер (imagewoof): Это оригинальная версия набора данных ImageWoof. Он содержит полноразмерные изображения и идеально подходит для финального обучения и бенчмаркинга производительности.

  2. Средний размер (imagewoof320): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 320 пикселей. Она подходит для более быстрого обучения без существенного снижения производительности модели.

  3. Маленький размер (imagewoof160): Эта версия содержит изображения, размер которых изменен так, чтобы максимальная длина края составляла 160 пикселей. Она предназначена для быстрого создания прототипов и экспериментов, где скорость обучения является приоритетом.

Чтобы использовать эти варианты в тренировке, просто замени 'imagewoof' в аргументе dataset на 'imagewoof320' или 'imagewoof160'. Например:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Важно отметить, что использование изображений меньшего размера, скорее всего, даст более низкую производительность в плане точности классификации. Однако это отличный способ быстрой итерации на ранних этапах разработки модели и создания прототипа.

Примеры изображений и аннотаций

Набор данных ImageWoof содержит красочные изображения различных пород собак, представляя собой сложный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует тонкие различия и сходства между разными породами собак в наборе данных ImageWoof, подчеркивая сложность и трудность задачи классификации.

Цитаты и благодарности

Если ты используешь набор данных ImageWoof в своих исследованиях или разработках, не забудь отметить создателей набора данных, поставив ссылку на официальный репозиторий данных.

Мы хотели бы поблагодарить команду FastAI за создание и поддержку набора данных ImageWoof как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Чтобы узнать больше о наборе данных ImageWoof, посети репозиторий данных ImageWoof.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (5)

Комментарии