Перейти к содержимому

Набор данных ImageNet10

Набор данных ImageNet10 - это небольшое подмножество базы данных ImageNet, разработанное Ultralytics и предназначен для CI-тестов, проверки на вменяемость и быстрого тестирования обучающих конвейеров. Этот набор данных состоит из первого изображения из обучающего набора и первого изображения из валидационного набора первых 10 классов ImageNet. Хотя он значительно меньше, в нем сохранилась структура и разнообразие оригинального набора данных ImageNet.

Основные характеристики

  • ImageNet10 - это компактная версия ImageNet, в которой 20 изображений представляют первые 10 классов оригинального набора данных.
  • Набор данных организован в соответствии с иерархией WordNet, зеркально отражая структуру полного набора данных ImageNet.
  • It is ideally suited for CI tests, sanity checks, and rapid testing of training pipelines in computer vision tasks.
  • Хотя он не предназначен для бенчмаркинга моделей, он может дать быстрое представление о базовой функциональности и корректности модели.

Структура набора данных

Набор данных ImageNet10, как и оригинальный ImageNet, организован с использованием иерархии WordNet. Каждый из 10 классов в ImageNet10 описывается синсетами (коллекцией синонимичных терминов). Изображения в ImageNet10 аннотированы одним или несколькими синсетами, что обеспечивает компактный ресурс для тестирования моделей распознавания различных объектов и их отношений.

Приложения

Набор данных ImageNet10 полезен для быстрого тестирования и отладки моделей и конвейеров компьютерного зрения. Его небольшой размер позволяет быстро проводить итерации, что делает его идеальным для тестов непрерывной интеграции и проверок на вменяемость. Его также можно использовать для быстрого предварительного тестирования новых моделей или изменений в существующих моделях, прежде чем переходить к полномасштабному тестированию с полным набором данных ImageNet.

Использование

Чтобы протестировать модель глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224, ты можешь воспользоваться следующими фрагментами кода. Полный список доступных аргументов смотри на странице " Обучение модели".

Пример теста

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Примеры изображений и аннотаций

Набор данных ImageNet10 содержит подмножество изображений из оригинального набора данных ImageNet. Эти изображения выбраны таким образом, чтобы представлять первые 10 классов в наборе данных, обеспечивая разнообразный, но компактный набор данных для быстрого тестирования и оценки.

Образцы изображений из набора данных Этот пример демонстрирует разнообразие и сложность изображений в наборе данных ImageNet10, подчеркивая его полезность для проверки на вменяемость и быстрого тестирования моделей компьютерного зрения.

Цитаты и благодарности

Если ты используешь набор данных ImageNet10 в своих исследованиях или разработках, пожалуйста, ссылайся на оригинальную статью ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

We would like to acknowledge the ImageNet team, led by Olga Russakovsky, Jia Deng, and Li Fei-Fei, for creating and maintaining the ImageNet dataset. The ImageNet10 dataset, while a compact subset, is a valuable resource for quick testing and debugging in the machine learning and computer vision research community. For more information about the ImageNet dataset and its creators, visit the ImageNet website.

ВОПРОСЫ И ОТВЕТЫ

Что такое набор данных ImageNet10 и чем он отличается от полного набора данных ImageNet?

Набор данных ImageNet10 - это компактное подмножество оригинальной базы данных ImageNet, созданное на сайте Ultralytics для быстрого CI-тестирования, проверки на вменяемость и оценки обучающих конвейеров. ImageNet10 включает в себя всего 20 изображений, представляющих собой первые изображения в обучающих и проверочных наборах первых 10 классов ImageNet. Несмотря на небольшой размер, он сохраняет структуру и разнообразие полного набора данных, что делает его идеальным для быстрого тестирования, но не для бенчмаркинга моделей.

Как я могу использовать набор данных ImageNet10 для тестирования своей модели глубокого обучения?

Чтобы протестировать свою модель глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224, используй следующие фрагменты кода.

Пример теста

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Полный список доступных аргументов смотри на странице " Обучение ".

Почему я должен использовать набор данных ImageNet10 для CI-тестов и проверки на вменяемость?

The ImageNet10 dataset is designed specifically for CI tests, sanity checks, and quick evaluations in deep learning pipelines. Its small size allows for rapid iteration and testing, making it perfect for continuous integration processes where speed is crucial. By maintaining the structural complexity and diversity of the original ImageNet dataset, ImageNet10 provides a reliable indication of a model's basic functionality and correctness without the overhead of processing a large dataset.

Каковы основные особенности набора данных ImageNet10?

Набор данных ImageNet10 имеет несколько ключевых особенностей:

  • Компактный размер: В нем всего 20 изображений, что позволяет быстро проводить тестирование и отладку.
  • Структурированная организация: Она соответствует иерархии WordNet, как и полный набор данных ImageNet.
  • CI и Sanity Checks: Идеально подходит для тестов непрерывной интеграции и проверок на вменяемость.
  • Не для бенчмаркинга: Хотя он полезен для быстрой оценки моделей, он не предназначен для масштабного бенчмаркинга.

Где можно скачать набор данных ImageNet10?

Ты можешь скачать набор данных ImageNet10 со страницы релизовUltralytics GitHub. Более подробную информацию о его структуре и применении ты найдешь на странице ImageNet10 Dataset.

📅 Created 11 months ago ✏️ Updated 23 days ago

Комментарии