Набор данных ImageNet10
Набор данных ImageNet10 — это маломасштабное подмножество базы данных ImageNet, разработанное Ultralytics и предназначенное для CI-тестов, экспресс-проверок и быстрого тестирования конвейеров обучения. Этот набор данных состоит из первого изображения в обучающем наборе и первого изображения из проверочного набора первых 10 классов ImageNet. Несмотря на значительно меньший размер, он сохраняет структуру и разнообразие исходного набора данных ImageNet.
Основные характеристики
- ImageNet10 — это компактная версия ImageNet, содержащая 20 изображений, представляющих первые 10 классов исходного набора данных.
- Набор данных организован в соответствии с иерархией WordNet, повторяя структуру полного набора данных ImageNet.
- Он идеально подходит для CI-тестов, экспресс-проверок и быстрого тестирования конвейеров обучения в задачах computer vision.
- Хотя он не предназначен для бенчмаркинга моделей, он может дать быстрое представление о базовой функциональности и корректности работы модели.
Структура набора данных
Набор данных ImageNet10, как и оригинальный ImageNet, организован с использованием иерархии WordNet. Каждый из 10 классов в ImageNet10 описывается синсетом (набором синонимичных терминов). Изображения в ImageNet10 аннотированы одним или несколькими синсетами, предоставляя компактный ресурс для тестирования способности моделей распознавать различные объекты и их взаимосвязи.
Приложения
Набор данных ImageNet10 полезен для быстрого тестирования и отладки моделей компьютерного зрения и конвейеров. Его небольшой размер позволяет проводить быструю итерацию, что делает его идеальным для тестов continuous integration и экспресс-проверок. Его также можно использовать для быстрого предварительного тестирования новых моделей или изменений в существующих моделях перед переходом к полномасштабному тестированию с полным ImageNet dataset.
Использование
Чтобы протестировать модель глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице Training модели.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Примеры изображений и аннотаций
Набор данных ImageNet10 содержит подмножество изображений из оригинального набора данных ImageNet. Эти изображения выбраны так, чтобы представлять первые 10 классов в наборе данных, обеспечивая разнообразный, но компактный набор данных для быстрого тестирования и оценки.

Этот пример демонстрирует разнообразие и сложность изображений в наборе данных ImageNet10, подчеркивая его полезность для экспресс-проверок и быстрого тестирования моделей компьютерного зрения.
Цитирование и благодарности
Если ты используешь набор данных ImageNet10 в своей исследовательской или разработческой работе, пожалуйста, сошлися на оригинальную статью об ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}Мы хотели бы выразить благодарность команде ImageNet во главе с Ольгой Руссаковской, Цзя Дэном и Ли Фэй-Фэй за создание и поддержку набора данных ImageNet. Набор данных ImageNet10, будучи компактным подмножеством, является ценным ресурсом для быстрого тестирования и отладки в сообществе исследователей machine learning и компьютерного зрения. Дополнительную информацию о наборе данных ImageNet и его создателях ты найдешь на ImageNet website.
Часто задаваемые вопросы (FAQ)
Что такое набор данных ImageNet10 и чем он отличается от полного набора данных ImageNet?
Набор данных ImageNet10 — это компактное подмножество оригинальной базы данных ImageNet, созданное Ultralytics для быстрых CI-тестов, экспресс-проверок и оценки конвейеров обучения. ImageNet10 состоит всего из 20 изображений, представляющих первые изображения в обучающем и проверочном наборах первых 10 классов ImageNet. Несмотря на малый размер, он сохраняет структуру и разнообразие полного набора данных, что делает его идеальным для быстрой проверки, но не для бенчмаркинга моделей.
Как мне использовать набор данных ImageNet10 для тестирования моей модели глубокого обучения?
Для тестирования твоей модели глубокого обучения на наборе данных ImageNet10 с размером изображения 224x224 используй следующие фрагменты кода.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)Обратись к странице обучения для получения полного списка доступных аргументов.
Зачем мне использовать набор данных ImageNet10 для CI-тестов и экспресс-проверок?
Набор данных ImageNet10 разработан специально для CI-тестов, экспресс-проверок и быстрой оценки конвейеров deep learning. Его небольшой размер позволяет проводить быструю итерацию и тестирование, что делает его идеальным для процессов непрерывной интеграции, где важна скорость. Сохраняя структурную сложность и разнообразие оригинального набора данных ImageNet, ImageNet10 обеспечивает надежное представление о базовой функциональности и правильности работы модели без затрат на обработку большого набора данных.
Каковы основные особенности набора данных ImageNet10?
Набор данных ImageNet10 обладает несколькими ключевыми особенностями:
- Компактный размер: Содержит всего 20 изображений, что позволяет быстро проводить тестирование и отладку.
- Структурированная организация: Следует иерархии WordNet, аналогично полному набору данных ImageNet.
- CI-тесты и экспресс-проверки: Идеально подходит для тестов непрерывной интеграции и экспресс-проверок.
- Не для бенчмаркинга: Хотя он полезен для быстрой оценки моделей, он не предназначен для обширного бенчмаркинга.
Как ImageNet10 соотносится с другими небольшими наборами данных, такими как ImageNette?
Хотя и ImageNet10, и ImageNette являются подмножествами ImageNet, они служат разным целям. ImageNet10 содержит всего 20 изображений (по 2 на класс) из первых 10 классов ImageNet, что делает его чрезвычайно легким для CI-тестирования и быстрых экспресс-проверок. В отличие от него, ImageNette содержит тысячи изображений из 10 легко различимых классов, что делает его более подходящим для реального обучения и разработки моделей. ImageNet10 предназначен для верификации функциональности конвейера, в то время как ImageNette лучше подходит для содержательных, но более быстрых по сравнению с полным ImageNet экспериментов по обучению.