Link to this sectionНабор данных ImageNet#

Name: Набор данных для классификации изображений ImageNet
Creator: ImageNet
License: https://www.image-net.org/download.php
Keywords: ImageNet, ILSVRC-2012, классификация изображений, глубокое обучение, компьютерное зрение, предобученные модели, YOLO, набор данных, WordNet

Набор данных Ultralytics ImageNet (data="imagenet") — это подмножество ImageNet-1k / ILSVRC-2012, используемое для обучения и оценки моделей классификации изображений. Он содержит 1 000 классов объектов, 1 281 167 обучающих изображений и 50 000 проверочных изображений с размером 224x224, а его размер при скачивании составляет около 144 ГБ. Более широкая база данных ImageNet значительно больше — более 14 миллионов изображений высокого разрешения, аннотированных с помощью синсетов WordNet в более чем 20 000 категорий, но Ultralytics обучается на стандартизированном подмножестве ILSVRC из 1 000 классов, которое стало де-факто эталоном для глубинного обучения в компьютерном зрении.

Link to this sectionПредобученные модели ImageNet#

Модель	размер ^{(пиксели)}	acc ^top1	acc ^top5	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(М)	FLOPs ^{(B) при 224}
YOLO26n-cls	224	71.4	90.1	5.0 ± 0.3	1.1 ± 0.0	2.8	0.5
YOLO26s-cls	224	76.0	92.9	7.9 ± 0.2	1.3 ± 0.0	6.7	1.6
YOLO26m-cls	224	78.1	94.2	17.2 ± 0.4	2.0 ± 0.0	11.6	4.9
YOLO26l-cls	224	79.0	94.6	23.2 ± 0.3	2.8 ± 0.0	14.1	6.2
YOLO26x-cls	224	79.9	95.0	41.4 ± 0.9	3.8 ± 0.0	29.6	13.6

Link to this sectionКлючевые особенности#

Набор данных Ultralytics imagenet предоставляет 1 000 классов, включая 1 281 167 обучающих и 50 000 проверочных изображений (ILSVRC-2012), что является стандартным эталоном предварительного обучения для классификации изображений.
Классы организованы в соответствии с иерархией WordNet, где каждый класс соответствует синсету (набору синонимичных терминов).
Изображения обучаются при размере 224x224, а полный набор данных требует загрузки около ~144 ГБ.
Ежегодный конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) сыграл важную роль в развитии исследований в области компьютерного зрения.

Link to this sectionСтруктура набора данных#

Набор данных Ultralytics ImageNet использует разделение ILSVRC-2012:

Split	Изображения	Классы
Обучение	1 281 167	1 000
Validation	50 000	1 000

Изображения хранятся в папках для каждого класса, названных по идентификатору синсета WordNet (например, n01440764), что соответствует структуре, ожидаемой при обучении классификации в Ultralytics. Каждый из 1 000 классов сопоставлен с синсетом WordNet, и отдельного тестового набора не предусмотрено, поэтому проверочный набор из 50 000 изображений используется для измерения точности.

Размер загрузки

ImageNet-1k требует загрузки около ~144 ГБ, поэтому убедись, что у тебя достаточно места на диске перед началом обучения. Для быстрых экспериментов меньшие подмножества ImageNette и ImageNet10 используют тот же формат папок и обучаются значительно быстрее.

Link to this sectionКонкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

Ежегодный конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) позволил исследователям сравнивать алгоритмы на крупномасштабном стандартизированном наборе данных с использованием последовательных метрик оценки. Это привело к значительным достижениям в глубоком обучении для классификации изображений, обнаружения объектов и других задач компьютерного зрения — особенно стоит отметить победу AlexNet в 2012 году, которая помогла начать современную эпоху глубинного обучения.

Link to this sectionПрименение#

Набор данных ImageNet широко используется для обучения и оценки моделей глубокого обучения для классификации, обнаружения и локализации объектов. Знаковые архитектуры, такие как AlexNet, VGG и ResNet, были разработаны и протестированы на ImageNet, а предобученные веса ImageNet остаются распространенной отправной точкой для трансферного обучения в задачах машинного зрения.

Link to this sectionИспользование#

Чтобы обучить модель классификации YOLO на ImageNet в течение 100 эпох с размером изображения 224x224, используй приведенные ниже фрагменты кода. Полный список доступных аргументов можно найти на странице Обучение модели.

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Ты также можешь управлять наборами данных для классификации и запускать обучение в облаке с помощью платформы Ultralytics.

Link to this sectionПримеры изображений и аннотации#

Набор данных ImageNet охватывает 1 000 классов ILSVRC-2012, предоставляя разнообразный и обширный ресурс для обучения и оценки моделей компьютерного зрения. Вот несколько примеров изображений из этого набора:

Примеры изображений из набора данных классификации ImageNet

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных ImageNet в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:

Цитата

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Мы хотели бы поблагодарить команду ImageNet под руководством Ольги Руссаковской, Цзя Дэна и Ли Фэй-Фэй за создание и поддержку набора данных ImageNet в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных ImageNet и его создателях посети веб-сайт ImageNet.

Link to this sectionFAQ#

Link to this sectionЧто такое набор данных ImageNet и как он используется в компьютерном зрении?#

Набор данных ImageNet — это крупномасштабная база изображений, общая коллекция которой содержит более 14 миллионов изображений высокого разрешения, аннотированных с помощью синсетов WordNet. В Ultralytics data="imagenet" используется для обучения на стандартизированном подмножестве ILSVRC-2012 из 1 000 классов, которое является де-факто эталоном для предобучения классификации изображений. Знаковые модели, такие как AlexNet, VGG и ResNet, обучались и оценивались на ImageNet, что подчеркивает его роль в развитии компьютерного зрения.

Link to this sectionСколько классов и изображений содержится в наборе данных ImageNet?#

Набор данных Ultralytics imagenet использует подмножество ILSVRC-2012 с 1 000 классов, 1 281 167 обучающих изображений и 50 000 проверочных изображений при размере изображения 224x224, что составляет около 144 ГБ загружаемых данных. Полная база данных ImageNet намного больше (более 14 миллионов изображений в более чем 20 000 синсетов WordNet), но подмножество из 1 000 классов — это именно то, что используется для обучения и оценки классификации.

Link to this sectionКак я могу обучить модель YOLO для классификации изображений на наборе данных ImageNet?#

Чтобы обучить модель Ultralytics YOLO на ImageNet, загрузи предобученную модель классификации и укажи data как imagenet:

Пример обучения

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Для получения более подробных инструкций по обучению обратись к нашей странице обучения.

Link to this sectionПочему стоит использовать предобученные модели Ultralytics YOLO26 для моих проектов с набором данных ImageNet?#

Предобученные модели Ultralytics YOLO26 предлагают передовую производительность с точки зрения скорости и точности для различных задач компьютерного зрения. Например, модель YOLO26n-cls с точностью top-1 71.4% и top-5 90.1% оптимизирована для приложений реального времени. Предобученные модели сокращают вычислительные ресурсы, необходимые для обучения с нуля, и ускоряют циклы разработки. Узнай больше о метриках производительности моделей YOLO26 в разделе Предобученные модели ImageNet.

Link to this sectionКакую роль играет конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) в компьютерном зрении?#

Ежегодный конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) стимулировал достижения в компьютерном зрении, предоставляя конкурентную платформу для оценки алгоритмов на крупномасштабном стандартизированном наборе данных. Его последовательные метрики оценки способствовали инновациям в области классификации изображений, обнаружения объектов и сегментации изображений, постоянно расширяя границы глубокого обучения и компьютерного зрения.

Участники

GLglenn-jocher¹⁶ RIRizwanMunawar² RAraimbekovm¹ AMambitious-octopus¹ MAMatthewNoyce¹ JKjk4e¹

Создано 12 нояб. 2023 г.Обновлено 3 дня назад