Набор данных ImageWoof
Набор данных ImageWoof - это подмножество ImageNet, состоящее из 10 классов, которые сложно классифицировать, поскольку все они относятся к породам собак. Он был создан как более сложная задача для алгоритмов классификации изображений, чтобы стимулировать разработку более совершенных моделей.
Основные характеристики
- ImageWoof содержит изображения 10 различных пород собак: Австралийский терьер, бордер-терьер, самоед, бигль, ши-тцу, фоксхаунд English , родезийский риджбек, динго, золотистый ретривер и старая English овчарка.
- В наборе данных представлены изображения в различных разрешениях (полноразмерное, 320px, 160px), что позволяет использовать различные вычислительные возможности и исследовательские потребности.
- В него также входит версия с зашумленными метками, обеспечивающая более реалистичный сценарий, в котором метки могут быть не всегда надежными.
Структура набора данных
Структура набора данных ImageWoof основана на классах пород собак, причем каждая порода имеет свой собственный каталог изображений. Как и в других классификационных наборах данных, в нем используется формат разделенных каталогов с отдельными папками для обучающих и проверочных наборов.
Приложения
Набор данных ImageWoof широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, особенно когда речь идет о более сложных и похожих классах. Сложность набора данных заключается в тонких различиях между породами собак, что расширяет границы производительности и обобщения модели. Он особенно ценен для:
- Сравнительный анализ производительности моделей классификации на тонких категориях
- Проверка устойчивости модели к схожим классам
- Разработка алгоритмов, способных различать тонкие визуальные различия
- Оценка возможностей переноса обучения из общих областей в конкретные
Использование
Для обучения CNN-модели на наборе данных ImageWoof в течение 100 эпох при размере изображения 224x224 можно использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице обучения модели.
Пример поезда
Варианты набора данных
Набор данных ImageWoof выпускается в трех различных размерах, чтобы удовлетворить различные исследовательские потребности и вычислительные возможности:
-
Полный размер (imagewoof): Это оригинальная версия набора данных ImageWoof. Он содержит полноразмерные изображения и идеально подходит для окончательного обучения и тестирования производительности.
-
Средний размер (imagewoof320): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 320 пикселей. Она подходит для ускоренного обучения без существенного снижения производительности модели.
-
Малый размер (imagewoof160): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 160 пикселей. Она предназначена для быстрого создания прототипов и экспериментов, где скорость обучения является приоритетом.
Чтобы использовать эти варианты в обучении, просто замените 'imagewoof' в аргументе dataset на 'imagewoof320' или 'imagewoof160'. Например:
Пример
Важно отметить, что использование изображений меньшего размера, скорее всего, приведет к снижению точности классификации. Однако это отличный способ быстрой итерации на ранних этапах разработки модели и создания прототипа.
Образцы изображений и аннотаций
Набор данных ImageWoof содержит красочные изображения различных пород собак, представляя собой сложный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:
Этот пример демонстрирует тонкие различия и сходства между различными породами собак в наборе данных ImageWoof, подчеркивая сложность и трудность задачи классификации.
Цитаты и благодарности
Если вы используете набор данных ImageWoof в своих исследованиях или разработках, пожалуйста, не забудьте отметить создателей набора данных, поставив ссылку на официальный репозиторий данных.
Мы хотели бы выразить благодарность команде FastAI за создание и поддержку набора данных ImageWoof как ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных ImageWoof посетите репозиторий данных ImageWoof.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Что представляет собой набор данных ImageWoof на сайте Ultralytics?
Набор данных ImageWoof - это сложное подмножество ImageNet, посвященное 10 конкретным породам собак. Созданный для того, чтобы расширить возможности моделей классификации изображений, он включает такие породы, как бигль, ши-тцу и золотистый ретривер. Набор данных включает изображения с различным разрешением (полноразмерные, 320px, 160px) и даже зашумленные метки для более реалистичных сценариев обучения. Такая сложность делает ImageWoof идеальным инструментом для разработки более продвинутых моделей глубокого обучения.
Как обучить модель на наборе данных ImageWoof с помощью Ultralytics YOLO ?
Чтобы обучить модель конволюционной нейронной сети (CNN) на наборе данных ImageWoof с помощью Ultralytics YOLO в течение 100 эпох при размере изображения 224x224, можно использовать следующий код:
Пример поезда
Более подробную информацию о доступных аргументах для обучения можно найти на странице Обучение.
Какие версии набора данных ImageWoof доступны?
Набор данных ImageWoof выпускается в трех размерах:
- Полный размер (imagewoof): Идеально подходит для финального обучения и бенчмаркинга, содержит полноразмерные изображения.
- Средний размер (imagewoof320): Измененные изображения с максимальной длиной края 320 пикселей, подходящие для более быстрого обучения.
- Маленький размер (imagewoof160): Измененные изображения с максимальной длиной края 160 пикселей, идеально подходящие для быстрого создания прототипов.
Используйте эти версии, заменив 'imagewoof' в аргументе dataset соответствующим образом. Обратите внимание, что изображения меньшего размера могут дать меньшую точность классификации, но могут быть полезны для более быстрых итераций.
Как шумные метки в наборе данных ImageWoof помогают обучению?
Зашумленные метки в наборе данных ImageWoof имитируют реальные условия, в которых метки не всегда могут быть точными. Обучение моделей на этих данных помогает развить устойчивость и обобщенность в задачах классификации изображений. Это позволяет подготовить модели к эффективной работе с неоднозначными или неправильно помеченными данными, которые часто встречаются в практических приложениях.
Какие основные проблемы возникают при использовании набора данных ImageWoof?
Основная проблема набора данных ImageWoof заключается в тонких различиях между породами собак, которые в него входят. Поскольку в нем представлены 10 близкородственных пород, для их различения требуются более совершенные и тонко настроенные модели классификации изображений. Это делает ImageWoof отличным эталоном для проверки возможностей и усовершенствования моделей глубокого обучения.