Перейти к содержимому

Набор данных ImageNette

Набор данных ImageNette - это подмножество более крупного набора данных Imagenet, но в него входят только 10 легко различимых классов. Он был создан, чтобы предоставить более быструю и простую в использовании версию Imagenet для разработки программного обеспечения и образования.

Основные характеристики

  • ImageNette содержит изображения из 10 различных классов, таких как линь, спрингер English , кассетный плеер, бензопила, церковь, валторна, мусоровоз, бензонасос, мяч для гольфа, парашют.
  • Набор данных состоит из цветных изображений разного размера.
  • ImageNette широко используется для обучения и тестирования в области машинного обучения, особенно для задач классификации изображений.

Структура набора данных

Набор данных ImageNette разбит на два подмножества:

  1. Обучающий набор: Это подмножество содержит несколько тысяч изображений, используемых для обучения моделей машинного обучения. Точное количество варьируется в зависимости от класса.
  2. Набор для проверки: Это подмножество состоит из нескольких сотен изображений, которые используются для проверки и бенчмаркинга обученных моделей. Опять же, точное количество варьируется в зависимости от класса.

Приложения

Набор данных ImageNette широко используется для обучения и оценки моделей глубокого обучения в задачах классификации изображений, таких как конволюционные нейронные сети (CNN) и различные другие алгоритмы машинного обучения. Простой формат набора данных и хорошо подобранные классы делают его удобным ресурсом как для начинающих, так и для опытных практиков в области машинного обучения и компьютерного зрения.

Использование

Чтобы обучить модель на наборе данных ImageNette в течение 100 эпох со стандартным размером изображения 224x224, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов ты найдешь на странице обучения модели.

Пример поезда

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenette', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagenette model=yolov8n-cls.pt epochs=100 imgsz=224

Примеры изображений и аннотаций

Набор данных ImageNette содержит цветные изображения различных объектов и сцен, предоставляя разнообразный набор данных для задач классификации изображений. Вот несколько примеров изображений из этого набора:

Образец изображения из набора данных

Этот пример демонстрирует разнообразие и сложность изображений в наборе данных ImageNette, подчеркивая важность разнообразных наборов данных для обучения надежных моделей классификации изображений.

ImageNette160 и ImageNette320

Для более быстрого создания прототипов и обучения набор данных ImageNette также доступен в двух уменьшенных размерах: ImageNette160 и ImageNette320. Эти наборы данных сохраняют те же классы и структуру, что и полный набор данных ImageNette, но изображения в них уменьшены до меньшего размера. Таким образом, эти версии набора данных особенно полезны для предварительного тестирования моделей или при ограниченных вычислительных ресурсах.

Чтобы использовать эти наборы данных, просто замени в команде обучения 'imagenette' на 'imagenette160' или 'imagenette320'. Следующие фрагменты кода иллюстрируют это:

Пример тренировки с ImageNette160

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette160
results = model.train(data='imagenette160', epochs=100, imgsz=160)
# Start training from a pretrained *.pt model with ImageNette160
yolo detect train data=imagenette160 model=yolov8n-cls.pt epochs=100 imgsz=160

Пример тренировки с ImageNette320

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model with ImageNette320
results = model.train(data='imagenette320', epochs=100, imgsz=320)
# Start training from a pretrained *.pt model with ImageNette320
yolo detect train data=imagenette320 model=yolov8n-cls.pt epochs=100 imgsz=320

Эти уменьшенные версии набора данных позволяют быстро проводить итерации в процессе разработки и при этом решать ценные и реалистичные задачи по классификации изображений.

Цитаты и благодарности

Если ты используешь набор данных ImageNette в своих исследованиях или разработках, пожалуйста, отметь это соответствующим образом. Чтобы узнать больше о наборе данных ImageNette, посети страницу ImageNette dataset на GitHub.



Создано 2023-11-12, Обновлено 2024-01-12
Авторы: glenn-jocher (3)

Комментарии