Meet YOLO26: next-gen vision AI.

Link to this sectionНабор данных ImageNet#

ImageNet — это масштабная база данных аннотированных изображений, предназначенная для исследований в области распознавания визуальных объектов. Она содержит более 14 миллионов изображений, каждое из которых аннотировано с использованием синсетов WordNet, что делает её одним из самых обширных ресурсов, доступных для обучения моделей глубокого обучения в задачах компьютерного зрения.

Link to this sectionПредобученные модели ImageNet#

Модельразмер
(пиксели)
acc
top1
acc
top5
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(B) при 224
YOLO26n-cls22471.490.15.0 ± 0.31.1 ± 0.02.80.5
YOLO26s-cls22476.092.97.9 ± 0.21.3 ± 0.06.71.6
YOLO26m-cls22478.194.217.2 ± 0.42.0 ± 0.011.64.9
YOLO26l-cls22479.094.623.2 ± 0.32.8 ± 0.014.16.2
YOLO26x-cls22479.995.041.4 ± 0.93.8 ± 0.029.613.6

Link to this sectionКлючевые особенности#

  • ImageNet содержит более 14 миллионов изображений высокого разрешения, охватывающих тысячи категорий объектов.
  • Набор данных организован в соответствии с иерархией WordNet, где каждый синсет представляет отдельную категорию.
  • ImageNet широко используется для обучения и оценки качества моделей в области компьютерного зрения, особенно в задачах классификации изображений и детекции объектов.
  • Ежегодный конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) сыграл важную роль в развитии исследований в области компьютерного зрения.

Link to this sectionСтруктура набора данных#

Набор данных ImageNet организован с использованием иерархии WordNet. Каждый узел в этой иерархии представляет категорию, описываемую синсетом (набором синонимичных терминов). Изображения в ImageNet аннотированы одним или несколькими синсетами, что предоставляет богатый ресурс для обучения моделей распознаванию различных объектов и их взаимосвязей.

Link to this sectionКонкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC)#

Ежегодный конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) стал важным событием в сфере компьютерного зрения. Он предоставил исследователям и разработчикам платформу для оценки своих алгоритмов и моделей на крупномасштабном наборе данных со стандартизированными метриками. ILSVRC привел к значительным достижениям в разработке моделей глубокого обучения для классификации изображений, детекции объектов и других задач компьютерного зрения.

Link to this sectionПриложения#

Набор данных ImageNet широко используется для обучения и оценки моделей глубокого обучения в различных задачах компьютерного зрения, таких как классификация изображений, детекция объектов и локализация объектов. Некоторые популярные архитектуры глубокого обучения, такие как AlexNet, VGG и ResNet, были разработаны и протестированы на наборе данных ImageNet.

Link to this sectionИспользование#

Чтобы обучить модель глубокого обучения на наборе данных ImageNet в течение 100 эпох с размером изображения 224x224, ты можешь использовать следующие фрагменты кода. Полный список доступных аргументов смотри на странице обучения.

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Link to this sectionПримеры изображений и аннотации#

Набор данных ImageNet содержит изображения высокого разрешения, охватывающие тысячи категорий объектов, что обеспечивает разнообразный и обширный набор данных для обучения и оценки моделей компьютерного зрения. Вот несколько примеров изображений из этого набора:

Примеры изображений из набора данных классификации ImageNet

Этот пример демонстрирует разнообразие и сложность изображений в наборе данных ImageNet, подчеркивая важность разнообразного набора данных для обучения надежных моделей компьютерного зрения.

Link to this sectionЦитирование и благодарности#

Если ты используешь набор данных ImageNet в своих исследованиях или разработках, пожалуйста, сошлися на следующую статью:

Цитата
@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Мы хотели бы поблагодарить команду ImageNet под руководством Ольги Руссаковской, Цзя Дэна и Ли Фэй-Фэй за создание и поддержку набора данных ImageNet в качестве ценного ресурса для сообщества исследователей машинного обучения и компьютерного зрения. Для получения дополнительной информации о наборе данных ImageNet и его создателях посети веб-сайт ImageNet.

Link to this sectionЧасто задаваемые вопросы (FAQ)#

Link to this sectionЧто такое набор данных ImageNet и как он используется в компьютерном зрении?#

Набор данных ImageNet — это масштабная база данных, состоящая из более чем 14 миллионов изображений высокого разрешения, классифицированных с использованием синсетов WordNet. Он широко используется в исследованиях по визуальному распознаванию объектов, включая классификацию изображений и детекцию объектов. Аннотации и огромный объем данных делают его богатым ресурсом для обучения моделей глубокого обучения. Примечательно, что такие модели, как AlexNet, VGG и ResNet, обучались и оценивались с использованием ImageNet, что доказывает его роль в развитии компьютерного зрения.

Link to this sectionКак использовать предобученную модель YOLO для классификации изображений на наборе данных ImageNet?#

Чтобы использовать предобученную модель Ultralytics YOLO для классификации изображений на наборе данных ImageNet, выполни следующие шаги:

Пример обучения
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet", epochs=100, imgsz=224)

Для получения более подробных инструкций по обучению обратись к нашей странице обучения.

Link to this sectionПочему стоит использовать предобученные модели Ultralytics YOLO26 для моих проектов с набором данных ImageNet?#

Предобученные модели Ultralytics YOLO26 предлагают передовую производительность с точки зрения скорости и точности для различных задач компьютерного зрения. Например, модель YOLO26n-cls с точностью top-1 71.4% и top-5 90.1% оптимизирована для приложений реального времени. Предобученные модели сокращают вычислительные ресурсы, необходимые для обучения с нуля, и ускоряют циклы разработки. Узнай больше о метриках производительности моделей YOLO26 в разделе Предобученные модели ImageNet.

Link to this sectionКак структурирован набор данных ImageNet и почему он важен?#

Набор данных ImageNet организован с использованием иерархии WordNet, где каждый узел в иерархии представляет категорию, описанную синсетом (набором синонимичных терминов). Эта структура позволяет проводить детальное аннотирование, что делает его идеальным для обучения моделей распознаванию широкого спектра объектов. Разнообразие и богатство аннотаций ImageNet делают его ценным набором данных для разработки надежных и универсальных моделей глубокого обучения. Подробнее об этой организации можно узнать в разделе Структура набора данных.

Link to this sectionКакую роль играет конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) в компьютерном зрении?#

Ежегодный конкурс ImageNet Large Scale Visual Recognition Challenge (ILSVRC) сыграл ключевую роль в стимулировании достижений в области компьютерного зрения, предоставив конкурентную платформу для оценки алгоритмов на крупномасштабном стандартизированном наборе данных. Он предлагает стандартизированные метрики оценки, способствуя инновациям и разработкам в таких областях, как классификация изображений, детекция объектов и сегментация изображений. Конкурс постоянно расширяет границы возможного в технологиях глубокого обучения и компьютерного зрения.

Комментарии