Перейти к содержанию

Набор данных ImageWoof

Набор данных ImageWoof - это подмножество ImageNet, состоящее из 10 классов, которые сложно классифицировать, поскольку все они относятся к породам собак. Он был создан как более сложная задача для алгоритмов классификации изображений, чтобы стимулировать разработку более совершенных моделей.

Основные характеристики

  • ImageWoof содержит изображения 10 различных пород собак: Австралийский терьер, бордер-терьер, самоед, бигль, ши-тцу, фоксхаунд English , родезийский риджбек, динго, золотистый ретривер и старая English овчарка.
  • В наборе данных представлены изображения в различных разрешениях (полноразмерное, 320px, 160px), что позволяет использовать различные вычислительные возможности и исследовательские потребности.
  • В него также входит версия с зашумленными метками, обеспечивающая более реалистичный сценарий, в котором метки могут быть не всегда надежными.

Структура набора данных

Структура набора данных ImageWoof основана на классах пород собак, причем каждая порода имеет свой собственный каталог изображений. Как и в других классификационных наборах данных, в нем используется формат разделенных каталогов с отдельными папками для обучающих и проверочных наборов.

Приложения

Набор данных ImageWoof широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, особенно когда речь идет о более сложных и похожих классах. Сложность набора данных заключается в тонких различиях между породами собак, что расширяет границы производительности и обобщения модели. Он особенно ценен для:

  • Сравнительный анализ производительности моделей классификации на тонких категориях
  • Проверка устойчивости модели к схожим классам
  • Разработка алгоритмов, способных различать тонкие визуальные различия
  • Оценка возможностей переноса обучения из общих областей в конкретные

Использование

Для обучения CNN-модели на наборе данных ImageWoof в течение 100 эпох при размере изображения 224x224 можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Варианты набора данных

Набор данных ImageWoof выпускается в трех различных размерах, чтобы удовлетворить различные исследовательские потребности и вычислительные возможности:

  1. Полный размер (imagewoof): Это оригинальная версия набора данных ImageWoof. Он содержит полноразмерные изображения и идеально подходит для окончательного обучения и тестирования производительности.

  2. Средний размер (imagewoof320): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 320 пикселей. Она подходит для ускоренного обучения без существенного снижения производительности модели.

  3. Малый размер (imagewoof160): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 160 пикселей. Она предназначена для быстрого создания прототипов и экспериментов, где скорость обучения является приоритетом.

Чтобы использовать эти варианты в обучении, просто замените 'imagewoof' в аргументе dataset на 'imagewoof320' или 'imagewoof160'. Например:

Пример

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

Важно отметить, что использование изображений меньшего размера, скорее всего, приведет к снижению точности классификации. Однако это отличный способ быстрой итерации на ранних этапах разработки модели и создания прототипа.

Образцы изображений и аннотаций

Набор данных ImageWoof содержит красочные изображения различных пород собак, представляя собой сложный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует тонкие различия и сходства между различными породами собак в наборе данных ImageWoof, подчеркивая сложность и трудность задачи классификации.

Цитаты и благодарности

Если вы используете набор данных ImageWoof в своих исследованиях или разработках, пожалуйста, не забудьте отметить создателей набора данных, поставив ссылку на официальный репозиторий данных.

Мы хотели бы выразить благодарность команде FastAI за создание и поддержку набора данных ImageWoof как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных ImageWoof посетите репозиторий данных ImageWoof.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Что представляет собой набор данных ImageWoof на сайте Ultralytics?

Набор данных ImageWoof - это сложное подмножество ImageNet, посвященное 10 конкретным породам собак. Созданный для того, чтобы расширить возможности моделей классификации изображений, он включает такие породы, как бигль, ши-тцу и золотистый ретривер. Набор данных включает изображения с различным разрешением (полноразмерные, 320px, 160px) и даже зашумленные метки для более реалистичных сценариев обучения. Такая сложность делает ImageWoof идеальным инструментом для разработки более продвинутых моделей глубокого обучения.

Как обучить модель на наборе данных ImageWoof с помощью Ultralytics YOLO ?

Чтобы обучить модель конволюционной нейронной сети (CNN) на наборе данных ImageWoof с помощью Ultralytics YOLO в течение 100 эпох при размере изображения 224x224, можно использовать следующий код:

Пример поезда

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Более подробную информацию о доступных аргументах для обучения можно найти на странице Обучение.

Какие версии набора данных ImageWoof доступны?

Набор данных ImageWoof выпускается в трех размерах:

  1. Полный размер (imagewoof): Идеально подходит для финального обучения и бенчмаркинга, содержит полноразмерные изображения.
  2. Средний размер (imagewoof320): Измененные изображения с максимальной длиной края 320 пикселей, подходящие для более быстрого обучения.
  3. Маленький размер (imagewoof160): Измененные изображения с максимальной длиной края 160 пикселей, идеально подходящие для быстрого создания прототипов.

Используйте эти версии, заменив 'imagewoof' в аргументе dataset соответствующим образом. Обратите внимание, что изображения меньшего размера могут дать меньшую точность классификации, но могут быть полезны для более быстрых итераций.

Как шумные метки в наборе данных ImageWoof помогают обучению?

Зашумленные метки в наборе данных ImageWoof имитируют реальные условия, в которых метки не всегда могут быть точными. Обучение моделей на этих данных помогает развить устойчивость и обобщенность в задачах классификации изображений. Это позволяет подготовить модели к эффективной работе с неоднозначными или неправильно помеченными данными, которые часто встречаются в практических приложениях.

Какие основные проблемы возникают при использовании набора данных ImageWoof?

Основная проблема набора данных ImageWoof заключается в тонких различиях между породами собак, которые в него входят. Поскольку в нем представлены 10 близкородственных пород, для их различения требуются более совершенные и тонко настроенные модели классификации изображений. Это делает ImageWoof отличным эталоном для проверки возможностей и усовершенствования моделей глубокого обучения.

📅 Создано 1 год назад ✏️ Обновлено 8 дней назад

Комментарии