Перейти к содержанию

Набор данных ImageNet10

Набор данных ImageNet10 - это небольшое подмножество базы данных ImageNet, разработанное Ultralytics и предназначен для CI-тестирования, проверки правильности и быстрого тестирования обучающих конвейеров. Этот набор данных состоит из первого изображения из обучающего набора и первого изображения из валидационного набора первых 10 классов ImageNet. Хотя он значительно меньше, в нем сохранилась структура и разнообразие оригинального набора данных ImageNet.

Основные характеристики

  • ImageNet10 - это компактная версия ImageNet, состоящая из 20 изображений, представляющих первые 10 классов оригинального набора данных.
  • Набор данных организован в соответствии с иерархией WordNet, повторяя структуру полного набора данных ImageNet.
  • Он идеально подходит для CI-тестирования, проверки правильности и быстрого тестирования обучающих конвейеров в задачах компьютерного зрения.
  • Хотя он не предназначен для сравнительного анализа моделей, он может дать быстрое представление о базовой функциональности и корректности модели.

Структура набора данных

Набор данных ImageNet10, как и оригинальный ImageNet, организован с использованием иерархии WordNet. Каждый из 10 классов в ImageNet10 описывается синсетами (коллекцией синонимичных терминов). Изображения в ImageNet10 аннотированы одним или несколькими синсетами, что обеспечивает компактный ресурс для тестирования моделей распознавания различных объектов и их отношений.

Приложения

Набор данных ImageNet10 полезен для быстрого тестирования и отладки моделей и конвейеров компьютерного зрения. Его небольшой размер позволяет быстро проводить итерации, что делает его идеальным для тестов непрерывной интеграции и проверки на вменяемость. Его также можно использовать для быстрого предварительного тестирования новых моделей или изменений в существующих моделях, прежде чем переходить к полномасштабному тестированию с полным набором данных ImageNet.

Использование

Чтобы протестировать модель глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224, вы можете использовать следующие фрагменты кода. Полный список доступных аргументов см. на странице "Обучение модели".

Пример теста

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Образцы изображений и аннотаций

Набор данных ImageNet10 содержит подмножество изображений из оригинального набора данных ImageNet. Эти изображения отобраны для представления первых 10 классов в наборе данных, что позволяет получить разнообразный, но компактный набор данных для быстрого тестирования и оценки.

Образцы изображений из набора данных Этот пример демонстрирует разнообразие и сложность изображений в наборе данных ImageNet10, подчеркивая его полезность для проверки правильности и быстрого тестирования моделей компьютерного зрения.

Цитаты и благодарности

Если вы используете набор данных ImageNet10 в своих исследованиях или разработках, пожалуйста, ссылайтесь на оригинальный документ ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Мы хотели бы выразить благодарность команде ImageNet под руководством Ольги Руссаковской, Цзя Денга и Ли Фей-Фея за создание и поддержку набора данных ImageNet. Набор данных ImageNet10, хотя и является компактным подмножеством, представляет собой ценный ресурс для быстрого тестирования и отладки в сообществе исследователей машинного обучения и компьютерного зрения. Более подробную информацию о наборе данных ImageNet и его создателях можно найти на сайте ImageNet.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Что такое набор данных ImageNet10 и чем он отличается от полного набора данных ImageNet?

Набор данных ImageNet10 - это компактное подмножество оригинальной базы данных ImageNet, созданное на сайте Ultralytics для быстрого CI-тестирования, проверки работоспособности и оценки обучающего конвейера. ImageNet10 состоит всего из 20 изображений, представляющих собой первые изображения в обучающих и проверочных наборах первых 10 классов ImageNet. Несмотря на небольшой размер, он сохраняет структуру и разнообразие полного набора данных, что делает его идеальным для быстрого тестирования, но не для бенчмаркинга моделей.

Как использовать набор данных ImageNet10 для тестирования модели глубокого обучения?

Чтобы протестировать модель глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224, используйте следующие фрагменты кода.

Пример теста

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Полный список доступных аргументов см. на странице "Обучение".

Почему следует использовать набор данных ImageNet10 для CI-тестирования и проверки правильности?

Набор данных ImageNet10 разработан специально для CI-тестов, проверки правильности и быстрых оценок в конвейерах глубокого обучения. Его небольшой размер позволяет быстро проводить итерации и тестирование, что делает его идеальным для процессов непрерывной интеграции, где скорость имеет решающее значение. Сохраняя структурную сложность и разнообразие оригинального набора данных ImageNet, ImageNet10 позволяет получить надежное представление о базовой функциональности и корректности модели без лишних затрат на обработку большого набора данных.

Каковы основные особенности набора данных ImageNet10?

Набор данных ImageNet10 имеет несколько ключевых особенностей:

  • Компактный размер: Всего 20 изображений позволяют быстро проводить тестирование и отладку.
  • Структурированная организация: Следуйте иерархии WordNet, подобно полному набору данных ImageNet.
  • CI и проверки санитарных норм: Идеально подходит для тестов непрерывной интеграции и проверок санитарных норм.
  • Не для бенчмаркинга: Хотя он полезен для быстрой оценки моделей, он не предназначен для обширного бенчмаркинга.

Где можно скачать набор данных ImageNet10?

Набор данных ImageNet10 можно загрузить со страницы релизовUltralytics GitHub. Более подробную информацию о его структуре и применении можно найти на странице ImageNet10 Dataset.

📅 Создано 1 год назад ✏️ Обновлено 2 месяца назад

Комментарии