Meet YOLO26: next-gen vision AI.

Link to this sectionНабор данных ImageNet10#

Набор данных ImageNet10 — это маломасштабное подмножество базы данных ImageNet, разработанное Ultralytics и предназначенное для CI-тестов, экспресс-проверок и быстрого тестирования конвейеров обучения. Этот набор данных состоит из первого изображения в обучающем наборе и первого изображения из проверочного набора первых 10 классов ImageNet. Несмотря на значительно меньший размер, он сохраняет структуру и разнообразие исходного набора данных ImageNet.

Link to this sectionОсновные характеристики#

  • ImageNet10 — это компактная версия ImageNet, содержащая 20 изображений, представляющих первые 10 классов исходного набора данных.
  • Набор данных организован в соответствии с иерархией WordNet, повторяя структуру полного набора данных ImageNet.
  • Он идеально подходит для CI-тестов, экспресс-проверок и быстрого тестирования конвейеров обучения в задачах computer vision.
  • Хотя он не предназначен для бенчмаркинга моделей, он может дать быстрое представление о базовой функциональности и корректности работы модели.

Link to this sectionСтруктура набора данных#

Набор данных ImageNet10, как и оригинальный ImageNet, организован с использованием иерархии WordNet. Каждый из 10 классов в ImageNet10 описывается синсетом (набором синонимичных терминов). Изображения в ImageNet10 аннотированы одним или несколькими синсетами, предоставляя компактный ресурс для тестирования способности моделей распознавать различные объекты и их взаимосвязи.

Link to this sectionПриложения#

Набор данных ImageNet10 полезен для быстрого тестирования и отладки моделей компьютерного зрения и конвейеров. Его небольшой размер позволяет проводить быструю итерацию, что делает его идеальным для тестов continuous integration и экспресс-проверок. Его также можно использовать для быстрого предварительного тестирования новых моделей или изменений в существующих моделях перед переходом к полномасштабному тестированию с полным ImageNet dataset.

Link to this sectionИспользование#

Чтобы протестировать модель глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице Training модели.

Пример теста
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

Link to this sectionПримеры изображений и аннотаций#

Набор данных ImageNet10 содержит подмножество изображений из оригинального набора данных ImageNet. Эти изображения выбраны так, чтобы представлять первые 10 классов в наборе данных, обеспечивая разнообразный, но компактный набор данных для быстрого тестирования и оценки.

Примеры изображений из набора данных классификации ImageNet-10

Этот пример демонстрирует разнообразие и сложность изображений в наборе данных ImageNet10, подчеркивая его полезность для экспресс-проверок и быстрого тестирования моделей компьютерного зрения.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных ImageNet10 в своей исследовательской или разработческой работе, пожалуйста, сошлися на оригинальную статью об ImageNet:

Цитата
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Мы хотели бы выразить благодарность команде ImageNet во главе с Ольгой Руссаковской, Цзя Дэном и Ли Фэй-Фэй за создание и поддержку набора данных ImageNet. Набор данных ImageNet10, будучи компактным подмножеством, является ценным ресурсом для быстрого тестирования и отладки в сообществе исследователей machine learning и компьютерного зрения. Дополнительную информацию о наборе данных ImageNet и его создателях ты найдешь на ImageNet website.

Link to this sectionЧасто задаваемые вопросы (FAQ)#

Link to this sectionЧто такое набор данных ImageNet10 и чем он отличается от полного набора данных ImageNet?#

Набор данных ImageNet10 — это компактное подмножество оригинальной базы данных ImageNet, созданное Ultralytics для быстрых CI-тестов, экспресс-проверок и оценки конвейеров обучения. ImageNet10 состоит всего из 20 изображений, представляющих первые изображения в обучающем и проверочном наборах первых 10 классов ImageNet. Несмотря на малый размер, он сохраняет структуру и разнообразие полного набора данных, что делает его идеальным для быстрой проверки, но не для бенчмаркинга моделей.

Link to this sectionКак мне использовать набор данных ImageNet10 для тестирования моей модели глубокого обучения?#

Для тестирования твоей модели глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224 используй следующие фрагменты кода.

Пример теста
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)

Обратись к странице обучения для получения полного списка доступных аргументов.

Link to this sectionЗачем мне использовать набор данных ImageNet10 для CI-тестов и экспресс-проверок?#

Набор данных ImageNet10 разработан специально для CI-тестов, экспресс-проверок и быстрой оценки конвейеров deep learning. Его небольшой размер позволяет проводить быструю итерацию и тестирование, что делает его идеальным для процессов непрерывной интеграции, где важна скорость. Сохраняя структурную сложность и разнообразие оригинального набора данных ImageNet, ImageNet10 обеспечивает надежное представление о базовой функциональности и правильности работы модели без затрат на обработку большого набора данных.

Link to this sectionКаковы основные особенности набора данных ImageNet10?#

Набор данных ImageNet10 обладает несколькими ключевыми особенностями:

  • Компактный размер: Содержит всего 20 изображений, что позволяет быстро проводить тестирование и отладку.
  • Структурированная организация: Следует иерархии WordNet, аналогично полному набору данных ImageNet.
  • CI-тесты и экспресс-проверки: Идеально подходит для тестов непрерывной интеграции и экспресс-проверок.
  • Не для бенчмаркинга: Хотя он полезен для быстрой оценки моделей, он не предназначен для обширного бенчмаркинга.

Link to this sectionКак ImageNet10 соотносится с другими небольшими наборами данных, такими как ImageNette?#

Хотя и ImageNet10, и ImageNette являются подмножествами ImageNet, они служат разным целям. ImageNet10 содержит всего 20 изображений (по 2 на класс) из первых 10 классов ImageNet, что делает его чрезвычайно легким для CI-тестирования и быстрых экспресс-проверок. В отличие от него, ImageNette содержит тысячи изображений из 10 легко различимых классов, что делает его более подходящим для реального обучения и разработки моделей. ImageNet10 предназначен для верификации функциональности конвейера, в то время как ImageNette лучше подходит для содержательных, но более быстрых по сравнению с полным ImageNet экспериментов по обучению.

Комментарии