ImageWoof Dataset

Q: What is the ImageWoof dataset in Ultralytics?

Набор данных ImageWoof — это сложный поднабор ImageNet, ориентированный на 10 конкретных пород собак. Созданный для расширения границ моделей классификации изображений, он включает в себя такие породы, как бигль, ши-тцу и золотистый ретривер. Набор данных включает изображения с различным разрешением (полный размер, 320px, 160px) и даже шумные метки для более реалистичных сценариев обучения. Эта сложность делает ImageWoof идеальным для разработки более продвинутых моделей глубокого обучения.

Q: How can I train a model using the ImageWoof dataset with Ultralytics YOLO?

Чтобы обучить модель Convolutional Neural Network (CNN) на датасете ImageWoof с использованием Ultralytics YOLO в течение 100 эпох при размере изображения 224x224, вы можете использовать следующий код: Для получения более подробной информации о доступных аргументах обучения обратитесь к странице Training.

Q: What versions of the ImageWoof dataset are available?

Датасет ImageWoof поставляется в трех размерах: Используйте эти версии, соответственно заменяя 'imagewoof' в аргументе датасета. Однако обратите внимание, что изображения меньшего размера могут привести к снижению точности классификации, но могут быть полезны для более быстрой итерации.

Q: What are the key challenges of using the ImageWoof dataset?

Основная сложность набора данных ImageWoof заключается в незначительных различиях между породами собак, которые он включает. Поскольку он фокусируется на 10 близкородственных породах, для различения между ними требуются более продвинутые и точно настроенные модели классификации изображений. Это делает ImageWoof отличным эталоном для проверки возможностей и улучшений моделей глубокого обучения.

Датасет ImageWoof — это подмножество ImageNet, состоящее из 10 классов, которые сложно classify, поскольку все они являются породами собак. Он был создан как более сложная задача для решения алгоритмами image classification, направленная на стимулирование разработки более продвинутых моделей.

Основные характеристики

ImageWoof содержит изображения 10 различных пород собак: австралийский терьер, бордер-терьер, самоед, бигль, ши-тцу, английский фоксхаунд, родезийский риджбек, динго, золотистый ретривер и староанглийская овчарка.
Набор данных предоставляет изображения с различным разрешением (полный размер, 320px, 160px), что позволяет учитывать различные вычислительные возможности и исследовательские потребности.
Он также включает версию с зашумленными метками, предоставляя более реалистичный сценарий, в котором метки не всегда могут быть надежными.

Структура набора данных

Структура набора данных ImageWoof основана на классах пород собак, причем каждая порода имеет свой собственный каталог изображений. Как и другие наборы данных классификации, он следует формату разделенных каталогов с отдельными папками для обучающих и проверочных наборов.

Приложения

Набор данных ImageWoof широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, особенно когда речь идет о более сложных и схожих классах. Сложность набора данных заключается в тонких различиях между породами собак, что ставит под угрозу производительность и обобщаемость модели. Он особенно ценен для:

Бенчмаркинг производительности модели классификации по категориям с высокой детализацией
Тестирование устойчивости модели к похожим классам
Разработка алгоритмов, которые могут различать тонкие визуальные различия
Оценка возможностей передачи обучения от общих к конкретным областям

Использование

Чтобы обучить модель CNN на наборе данных ImageWoof в течение 100 эпох с размером изображения 224x224, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице Обучение модели.

Пример обучения

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo26n-cls.pt epochs=100 imgsz=224

Варианты набора данных

Набор данных ImageWoof поставляется в трех различных размерах для удовлетворения различных исследовательских потребностей и вычислительных возможностей:

Полный размер (imagewoof): Это оригинальная версия набора данных ImageWoof. Он содержит полноразмерные изображения и идеально подходит для окончательного обучения и сравнительного анализа производительности.
Средний размер (imagewoof320): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 320 пикселей. Она подходит для более быстрой тренировки без значительного снижения производительности модели.
Малый размер (imagewoof160): Эта версия содержит изображения, размер которых изменен таким образом, чтобы максимальная длина края составляла 160 пикселей. Она предназначена для быстрого прототипирования и экспериментов, где скорость обучения является приоритетом.

Чтобы использовать эти варианты в своем обучении, просто замените 'imagewoof' в аргументе набора данных на 'imagewoof320' или 'imagewoof160'. Например:

Пример

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo26n-cls.pt data=imagewoof320 epochs=100 imgsz=224

Важно отметить, что использование изображений меньшего размера, скорее всего, приведет к снижению производительности с точки зрения точности классификации. Тем не менее, это отличный способ для быстрой итерации на ранних этапах разработки и прототипирования модели.

Примеры изображений и аннотации

Набор данных ImageWoof содержит красочные изображения различных пород собак, представляя собой сложный набор данных для задач классификации изображений. Вот несколько примеров изображений из набора данных:

Образцы набора данных по классификации пород собак ImageWoof

В примере демонстрируются тонкие различия и сходства между различными породами собак в наборе данных ImageWoof, что подчеркивает сложность и трудность задачи классификации.

Цитирование и благодарности

Если вы используете набор данных ImageWoof в своих исследованиях или разработках, пожалуйста, не забудьте отметить создателей набора данных, предоставив ссылку на официальный репозиторий набора данных.

Мы хотели бы выразить признательность команде FastAI за создание и поддержку набора данных ImageWoof в качестве ценного ресурса для сообщества машинного обучения и исследований в области компьютерного зрения. Для получения дополнительной информации о наборе данных ImageWoof посетите репозиторий набора данных ImageWoof.

Часто задаваемые вопросы

Что такое набор данных ImageWoof в Ultralytics?

Датасет ImageWoof — это сложный поднабор ImageNet, ориентированный на 10 конкретных пород собак. Созданный для расширения возможностей моделей image classification, он включает такие породы, как бигль, ши-тцу и золотистый ретривер. Датасет включает изображения с различным разрешением (полный размер, 320px, 160px) и даже шумные метки для более реалистичных сценариев обучения. Эта сложность делает ImageWoof идеальным для разработки более продвинутых моделей deep learning.

Как я могу обучить модель, используя набор данных ImageWoof с Ultralytics YOLO?

Чтобы обучить модель сверточной нейронной сети (CNN) на наборе данных ImageWoof с использованием Ultralytics YOLO в течение 100 эпох при размере изображения 224x224, вы можете использовать следующий код:

Пример обучения

PythonCLI

from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

yolo classify train data=imagewoof model=yolo26n-cls.pt epochs=100 imgsz=224

Для получения более подробной информации о доступных аргументах обучения обратитесь к странице Обучение.

Какие версии набора данных ImageWoof доступны?

Датасет ImageWoof поставляется в трех размерах:

Полный размер (imagewoof): Идеально подходит для финального обучения и бенчмаркинга, содержит полноразмерные изображения.
Средний размер (imagewoof320): Измененные изображения с максимальной длиной края 320 пикселей, подходят для более быстрого обучения.
Малый размер (imagewoof160): Изображения, измененные по размеру с максимальной длиной края 160 пикселей, идеально подходят для быстрого прототипирования.

Используйте эти версии, соответственно заменяя 'imagewoof' в аргументе датасета. Однако обратите внимание, что изображения меньшего размера могут привести к снижению точности классификации, но могут быть полезны для более быстрой итерации.

Какую пользу приносит обучение с зашумленными метками в наборе данных ImageWoof?

Шумные метки в датасете ImageWoof имитируют реальные условия, когда метки не всегда могут быть точными. Обучение моделей с использованием этих данных помогает развить устойчивость и обобщение в задачах классификации изображений. Это подготавливает модели к эффективной обработке неоднозначных или неправильно маркированных данных, которые часто встречаются в практических приложениях.

Каковы основные проблемы использования набора данных ImageWoof?

Основная сложность датасета ImageWoof заключается в незначительных различиях между породами собак, которые он включает. Поскольку он фокусируется на 10 близкородственных породах, различение между ними требует более продвинутых и точно настроенных моделей классификации изображений. Это делает ImageWoof отличным эталоном для проверки возможностей и улучшений моделей глубокого обучения.

📅 Создано 2 лет назад ✏️ Обновлено 17 дней назад

ImageWoof Dataset

Основные характеристики

Структура набора данных

Приложения

Использование

Варианты набора данных

Примеры изображений и аннотации

Цитирование и благодарности

Часто задаваемые вопросы

Что такое набор данных ImageWoof в Ultralytics?

Как я могу обучить модель, используя набор данных ImageWoof с Ultralytics YOLO?

Какие версии набора данных ImageWoof доступны?

Какую пользу приносит обучение с зашумленными метками в наборе данных ImageWoof?

Каковы основные проблемы использования набора данных ImageWoof?

Комментарии