ImageWoof Dataset
Датасет ImageWoof является подмножеством ImageNet, состоящим из 10 классов, которые сложно классифицировать, поскольку все они являются породами собак. Он был создан как более сложная задача для решения алгоритмами классификации изображений, направленная на стимулирование разработки более продвинутых моделей.
Основные характеристики
- ImageWoof содержит изображения 10 различных пород собак: австралийский терьер, бордер-терьер, самоед, бигль, ши-тцу, английский фоксхаунд, родезийский риджбек, динго, золотистый ретривер и староанглийская овчарка.
- Набор данных предоставляет изображения с различным разрешением (полный размер, 320px, 160px), что позволяет учитывать различные вычислительные возможности и исследовательские потребности.
- Он также включает версию с зашумленными метками, предоставляя более реалистичный сценарий, в котором метки не всегда могут быть надежными.
Структура набора данных
Структура набора данных ImageWoof основана на классах пород собак, причем каждая порода имеет свой собственный каталог изображений. Как и другие наборы данных классификации, он следует формату разделенных каталогов с отдельными папками для обучающих и проверочных наборов.
Приложения
Набор данных ImageWoof широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, особенно когда речь идет о более сложных и похожих классах. Сложность набора данных заключается в тонких различиях между породами собак, что расширяет границы производительности и обобщения модели. Он особенно ценен для:
- Бенчмаркинг производительности модели классификации по категориям с высокой детализацией
- Тестирование устойчивости модели к похожим классам
- Разработка алгоритмов, которые могут различать тонкие визуальные различия
- Оценка возможностей передачи обучения от общих к конкретным областям
Использование
Чтобы обучить модель CNN на наборе данных ImageWoof в течение 100 эпох с размером изображения 224x224, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.
Пример обучения
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224
Варианты набора данных
Набор данных ImageWoof поставляется в трех различных размерах для удовлетворения различных исследовательских потребностей и вычислительных возможностей:
-
Полный размер (imagewoof): Это оригинальная версия набора данных ImageWoof. Он содержит полноразмерные изображения и идеально подходит для окончательного обучения и сравнительного анализа производительности.
-
Средний размер (imagewoof320): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 320 пикселей. Она подходит для более быстрой тренировки без значительного снижения производительности модели.
-
Малый размер (imagewoof160): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 160 пикселей. Она предназначена для быстрого прототипирования и экспериментов, где скорость обучения является приоритетом.
Чтобы использовать эти варианты в своем обучении, просто замените 'imagewoof' в аргументе набора данных на 'imagewoof320' или 'imagewoof160'. Например:
Пример
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)
# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224
Важно отметить, что использование изображений меньшего размера, скорее всего, приведет к снижению производительности с точки зрения точности классификации. Тем не менее, это отличный способ для быстрой итерации на ранних этапах разработки и прототипирования модели.
Примеры изображений и аннотации
Набор данных ImageWoof содержит красочные изображения различных пород собак, представляя собой сложный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:
В примере демонстрируются тонкие различия и сходства между различными породами собак в наборе данных ImageWoof, что подчеркивает сложность и трудность задачи классификации.
Цитирование и благодарности
Если вы используете набор данных ImageWoof в своих исследованиях или разработках, пожалуйста, не забудьте отметить создателей набора данных, предоставив ссылку на официальный репозиторий набора данных.
Мы хотели бы выразить признательность команде FastAI за создание и поддержку набора данных ImageWoof в качестве ценного ресурса для сообщества машинного обучения и исследований в области компьютерного зрения. Для получения дополнительной информации о наборе данных ImageWoof посетите репозиторий набора данных ImageWoof.
Часто задаваемые вопросы
Что такое набор данных ImageWoof в Ultralytics?
Набор данных ImageWoof — это сложная подвыборка ImageNet, ориентированная на 10 конкретных пород собак. Созданный для расширения границ моделей классификации изображений, он включает в себя такие породы, как бигль, ши-тцу и золотистый ретривер. Набор данных включает изображения с различным разрешением (полный размер, 320px, 160px) и даже шумные метки для более реалистичных сценариев обучения. Эта сложность делает ImageWoof идеальным для разработки более продвинутых моделей глубокого обучения.
Как я могу обучить модель, используя набор данных ImageWoof с Ultralytics YOLO?
Чтобы обучить модель сверточной нейронной сети (CNN) на наборе данных ImageWoof с использованием Ultralytics YOLO в течение 100 эпох при размере изображения 224x224, вы можете использовать следующий код:
Пример обучения
from ultralytics import YOLO
model = YOLO("yolo11n-cls.pt") # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224
Для получения более подробной информации о доступных аргументах обучения обратитесь к странице Обучение.
Какие версии набора данных ImageWoof доступны?
Датасет ImageWoof поставляется в трех размерах:
- Полный размер (imagewoof): Идеально подходит для финального обучения и бенчмаркинга, содержит полноразмерные изображения.
- Средний размер (imagewoof320): Измененные изображения с максимальной длиной края 320 пикселей, подходят для более быстрого обучения.
- Малый размер (imagewoof160): Изображения, измененные по размеру с максимальной длиной края 160 пикселей, идеально подходят для быстрого прототипирования.
Используйте эти версии, соответственно заменяя 'imagewoof' в аргументе датасета. Однако обратите внимание, что изображения меньшего размера могут привести к снижению точности классификации, но могут быть полезны для более быстрой итерации.
Какую пользу приносит обучение с зашумленными метками в наборе данных ImageWoof?
Шумные метки в датасете ImageWoof имитируют реальные условия, когда метки не всегда могут быть точными. Обучение моделей с использованием этих данных помогает развить устойчивость и обобщение в задачах классификации изображений. Это подготавливает модели к эффективной обработке неоднозначных или неправильно маркированных данных, которые часто встречаются в практических приложениях.
Каковы основные проблемы использования набора данных ImageWoof?
Основная сложность датасета ImageWoof заключается в незначительных различиях между породами собак, которые он включает. Поскольку он фокусируется на 10 близкородственных породах, различение между ними требует более продвинутых и точно настроенных моделей классификации изображений. Это делает ImageWoof отличным эталоном для проверки возможностей и улучшений моделей глубокого обучения.