Набор данных ImageWoof
Набор данных ImageWoof — это подмножество ImageNet, состоящее из 10 классов, которые сложно классифицировать, так как все они являются породами собак. Он был создан как более трудная задача для алгоритмов классификации изображений, чтобы стимулировать разработку более совершенных моделей.
Основные характеристики
- ImageWoof содержит изображения 10 различных пород собак: австралийский терьер, бордер-терьер, самоед, бигль, ши-тцу, английский фоксхаунд, родезийский риджбек, динго, золотистый ретривер и староанглийская овчарка.
- Набор данных предоставляет изображения в различных разрешениях (полный размер, 320px, 160px), что подходит для разных вычислительных возможностей и исследовательских задач.
- Он также включает версию с зашумленными метками, что обеспечивает более реалистичный сценарий, когда метки не всегда могут быть надежными.
Структура набора данных
Структура набора данных ImageWoof основана на классах пород собак, при этом каждая порода имеет собственную папку с изображениями. Как и другие наборы данных для классификации, он использует формат с разделением каталогов на обучающую и валидационную выборки.
Приложения
Набор данных ImageWoof широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, особенно когда речь идет о более сложных и похожих классах. Сложность набора данных заключается в тонких различиях между породами собак, что проверяет пределы производительности и обобщающей способности модели. Он особенно ценен для:
- Бенчмаркинга производительности моделей классификации на мелкозернистых категориях
- Тестирования устойчивости моделей к похожим классам
- Разработки алгоритмов, способных различать тонкие визуальные отличия
- Оценки возможностей обучения с переносом (transfer learning) от общих доменов к специфическим
Использование
Чтобы обучить CNN модель на наборе данных ImageWoof в течение 100 эпох с размером изображения 224x224, ты можешь использовать следующие фрагменты кода. Для получения полного списка доступных аргументов обратись к странице Обучение.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)Варианты набора данных
Набор данных ImageWoof поставляется в трех разных размерах, чтобы удовлетворить различные исследовательские потребности и вычислительные возможности:
-
Полный размер (imagewoof): Это оригинальная версия набора данных ImageWoof. Она содержит полноразмерные изображения и идеально подходит для финального обучения и оценки производительности.
-
Средний размер (imagewoof320): Эта версия содержит изображения, измененные до максимальной длины стороны в 320 пикселей. Она подходит для более быстрого обучения без значительной потери производительности модели.
-
Малый размер (imagewoof160): Эта версия содержит изображения, измененные до максимальной длины стороны в 160 пикселей. Она предназначена для быстрого прототипирования и экспериментов, где скорость обучения является приоритетом.
Чтобы использовать эти варианты в своем обучении, просто замени 'imagewoof' в аргументе набора данных на 'imagewoof320' или 'imagewoof160'. Например:
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)
# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)Важно отметить, что использование меньших изображений, скорее всего, приведет к более низкой точности классификации. Однако это отличный способ быстро выполнять итерации на ранних этапах разработки модели и прототипирования.
Примеры изображений и аннотаций
Набор данных ImageWoof содержит цветные изображения различных пород собак, предоставляя сложный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Пример демонстрирует тонкие различия и сходства между разными породами собак в наборе данных ImageWoof, подчеркивая сложность и трудность задачи классификации.
Цитирование и благодарности
Если ты используешь набор данных ImageWoof в своей исследовательской или проектной работе, пожалуйста, не забудь выразить признательность создателям набора данных, добавив ссылку на официальный репозиторий набора данных.
Мы хотели бы поблагодарить команду FastAI за создание и поддержку набора данных ImageWoof как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных ImageWoof посети репозиторий набора данных ImageWoof.
Часто задаваемые вопросы (FAQ)
Что такое набор данных ImageWoof в Ultralytics?
Набор данных ImageWoof — это сложное подмножество ImageNet, фокусирующееся на 10 конкретных породах собак. Созданный для проверки пределов возможностей моделей классификации изображений, он включает такие породы, как бигль, ши-тцу и золотистый ретривер. Набор данных включает изображения в различных разрешениях (полный размер, 320px, 160px) и даже зашумленные метки для более реалистичных сценариев обучения. Такая сложность делает ImageWoof идеальным для разработки более совершенных моделей глубокого обучения.
Как я могу обучить модель, используя набор данных ImageWoof с Ultralytics YOLO?
Чтобы обучить модель сверточной нейронной сети (CNN) на наборе данных ImageWoof с использованием Ultralytics YOLO в течение 100 эпох при размере изображения 224x224, ты можешь использовать следующий код:
from ultralytics import YOLO
model = YOLO("yolo26n-cls.pt") # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)Для получения более подробной информации о доступных аргументах обучения обратись к странице Обучение.
Какие версии набора данных ImageWoof доступны?
Набор данных ImageWoof поставляется в трех размерах:
- Полный размер (imagewoof): Идеально подходит для финального обучения и бенчмаркинга, содержит полноразмерные изображения.
- Средний размер (imagewoof320): Изображения с измененным размером до максимальной длины стороны в 320 пикселей, подходит для более быстрого обучения.
- Малый размер (imagewoof160): Изображения с измененным размером до максимальной длины стороны в 160 пикселей, отлично подходит для быстрого прототипирования.
Используй эти версии, соответствующим образом заменив 'imagewoof' в аргументе набора данных. Однако обрати внимание, что меньшие изображения могут дать более низкую точность классификации, но могут быть полезны для более быстрых итераций.
Как зашумленные метки в наборе данных ImageWoof помогают при обучении?
Зашумленные метки в наборе данных ImageWoof имитируют реальные условия, где метки не всегда могут быть точными. Обучение моделей на таких данных помогает развивать устойчивость и обобщающую способность в задачах классификации изображений. Это подготавливает модели к эффективной работе с неоднозначными или неверно помеченными данными, что часто встречается в практических приложениях.
Каковы основные сложности использования набора данных ImageWoof?
Основная сложность набора данных ImageWoof заключается в тонких различиях между включенными в него породами собак. Поскольку он фокусируется на 10 тесно связанных породах, их различение требует более продвинутых и точно настроенных моделей классификации изображений. Это делает ImageWoof отличным бенчмарком для тестирования возможностей и улучшений моделей глубокого обучения.