Ultralytics YOLO11

Обзор

YOLO11 был выпущен компанией Ultralytics 10 сентября 2024 года, обеспечивая превосходную точность, скорость и эффективность. Развивая впечатляющие достижения предыдущих версий YOLO, YOLO11 представляет значительные улучшения в архитектуре и методах обучения, что делает его универсальным выбором для широкого спектра задач компьютерного зрения. Ознакомься с YOLO26 для использования новейшей модели Ultralytics с инференсом без NMS и оптимизированным развертыванием на периферийных устройствах.

Графики сравнения Ultralytics YOLO11

Ultralytics YOLO11 🚀 Podcast generated by NotebookLM



Watch: How to Use Ultralytics YOLO11 for Object Detection and Tracking | How to Benchmark | YOLO11 RELEASED🚀
Попробуй на платформе Ultralytics

Изучай и запускай модели YOLO11 прямо на Ultralytics Platform.

Основные характеристики

  • Улучшенное извлечение признаков: YOLO11 использует улучшенную архитектуру backbone и neck, что повышает возможности извлечения признаков для более точного обнаружения объектов и выполнения сложных задач.
  • Оптимизировано для эффективности и скорости: YOLO11 внедряет доработанные архитектурные решения и оптимизированные конвейеры обучения, обеспечивая более высокую скорость обработки при сохранении оптимального баланса между точностью и производительностью.
  • Более высокая точность при меньшем количестве параметров: Благодаря достижениям в проектировании моделей, YOLO11m достигает более высокой средней точности (mAP) на наборе данных COCO, используя при этом на 22% меньше параметров, чем YOLOv8m, что делает его вычислительно эффективным без ущерба для точности.
  • Адаптивность к различным средам: YOLO11 можно легко развернуть в различных средах, включая периферийные устройства, облачные платформы и системы, поддерживающие графические процессоры NVIDIA, что обеспечивает максимальную гибкость.
  • Широкий спектр поддерживаемых задач: Будь то обнаружение объектов, сегментация экземпляров, классификация изображений, оценка позы или ориентированное обнаружение объектов (OBB), YOLO11 разработан для решения разнообразных задач компьютерного зрения.

Поддерживаемые задачи и режимы

YOLO11 расширяет линейку универсальных моделей, заложенную ранними релизами Ultralytics YOLO, предлагая улучшенную поддержку для различных задач компьютерного зрения:

МодельИмена файловЗадачаЛогический выводВалидацияОбучениеЭкспорт (Export)
YOLO11yolo11n.pt yolo11s.pt yolo11m.pt yolo11l.pt yolo11x.ptДетекция
YOLO11-segyolo11n-seg.pt yolo11s-seg.pt yolo11m-seg.pt yolo11l-seg.pt yolo11x-seg.ptСегментация экземпляров
YOLO11-poseyolo11n-pose.pt yolo11s-pose.pt yolo11m-pose.pt yolo11l-pose.pt yolo11x-pose.ptПоза/Ключевые точки
YOLO11-obbyolo11n-obb.pt yolo11s-obb.pt yolo11m-obb.pt yolo11l-obb.pt yolo11x-obb.ptОриентированная детекция
YOLO11-clsyolo11n-cls.pt yolo11s-cls.pt yolo11m-cls.pt yolo11l-cls.pt yolo11x-cls.ptКлассификация

В этой таблице представлен обзор вариантов моделей YOLO11, демонстрирующий их применимость в конкретных задачах и совместимость с рабочими режимами, такими как Inference, Validation, Training и Export. Эта гибкость делает YOLO11 подходящим для широкого спектра приложений компьютерного зрения, от обнаружения в реальном времени до сложных задач сегментации.

Метрики производительности

Производительность

Смотри документацию по детекции для примеров использования этих моделей, обученных на COCO, которые включают 80 предобученных классов.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.1 ± 0.81.5 ± 0.02.66.5
YOLO11s64047.090.0 ± 1.22.5 ± 0.09.421.5
YOLO11m64051.5183.2 ± 2.04.7 ± 0.120.168.0
YOLO11l64053.4238.6 ± 1.46.2 ± 0.125.386.9
YOLO11x64054.7462.8 ± 6.711.3 ± 0.256.9194.9

Примеры использования

В этом разделе представлены простые примеры обучения и инференса YOLO11. Полную документацию по этим и другим режимам см. на страницах документации Predict, Train, Val и Export.

Обрати внимание, что приведенный ниже пример относится к моделям YOLO11 Detect для обнаружения объектов. Информацию о других поддерживаемых задачах см. в документации по сегментации, классификации, OBB и оценке позы.

Пример

Предобученные PyTorch модели в формате *.pt, а также конфигурационные файлы *.yaml, можно передавать в класс YOLO() для создания экземпляра модели в Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

Цитирование и благодарности

Публикация Ultralytics YOLO11

Ultralytics не публиковала официальную исследовательскую работу по YOLO11 из-за быстро развивающегося характера моделей. Мы фокусируемся на развитии технологий и повышении удобства их использования, а не на создании статической документации. Самую актуальную информацию об архитектуре, функциях и использовании YOLO см. в нашем репозитории GitHub и документации.

Если ты используешь YOLO11 или другое программное обеспечение из этого репозитория в своей работе, пожалуйста, сошлися на него, используя следующий формат:

Цитата
@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Пожалуйста, обрати внимание, что DOI находится на рассмотрении и будет добавлен в цитирование, как только станет доступен. Модели YOLO11 предоставляются по лицензиям AGPL-3.0 и Enterprise.

Часто задаваемые вопросы (FAQ)

В чем заключаются основные улучшения в Ultralytics YOLO11 по сравнению с YOLOv8?

Ultralytics YOLO11 представляет несколько значительных достижений по сравнению с YOLOv8. Ключевые улучшения включают:

  • Улучшенное извлечение признаков: YOLO11 использует улучшенную архитектуру бэкбона и неков, расширяя возможности извлечения признаков для более точного обнаружения объектов.
  • Оптимизированная эффективность и скорость: Усовершенствованный архитектурный дизайн и оптимизированные конвейеры обучения обеспечивают более высокую скорость обработки при сохранении баланса между точностью и производительностью.
  • Более высокая точность при меньшем количестве параметров: YOLO11m достигает более высокого среднего средней точности (mAP) на наборе данных COCO, используя на 22% меньше параметров, чем YOLOv8m, что делает его вычислительно эффективным без ущерба для точности.
  • Адаптивность к различным средам: YOLO11 можно развертывать в различных средах, включая граничные (edge) устройства, облачные платформы и системы, поддерживающие GPU NVIDIA.
  • Широкий спектр поддерживаемых задач: YOLO11 поддерживает разнообразные задачи компьютерного зрения, такие как обнаружение объектов, сегментация экземпляров, классификация изображений, оценка позы и ориентированное обнаружение объектов (OBB).

Как обучить модель YOLO11 для обнаружения объектов?

Обучение модели YOLO11 для обнаружения объектов можно выполнить с помощью Python или CLI команд. Ниже приведены примеры для обоих методов:

Пример
from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Для получения более подробных инструкций обратись к документации Train.

Какие задачи могут выполнять модели YOLO11?

Модели YOLO11 универсальны и поддерживают широкий спектр задач компьютерного зрения, включая:

  • Обнаружение объектов: Идентификация и определение местоположения объектов на изображении.
  • Сегментация экземпляров: Обнаружение объектов и очерчивание их границ.
  • Классификация изображений: Категоризация изображений по заранее определенным классам.
  • Оценка позы: Обнаружение и отслеживание ключевых точек на теле человека.
  • Ориентированное обнаружение объектов (OBB): Обнаружение объектов с учетом вращения для более высокой точности.

Для получения дополнительной информации о каждой задаче см. документацию Detection, Instance Segmentation, Classification, Pose Estimation и Oriented Detection.

Как YOLO11 достигает более высокой точности при меньшем количестве параметров?

YOLO11 достигает более высокой точности при меньшем количестве параметров благодаря достижениям в дизайне моделей и методах оптимизации. Улучшенная архитектура позволяет эффективно извлекать и обрабатывать признаки, что приводит к более высокому среднему среднему значению точности (mAP) на наборах данных, таких как COCO, при использовании на 22% меньшего количества параметров, чем в YOLOv8m. Это делает YOLO11 вычислительно эффективным без ущерба для точности, что позволяет развертывать его на устройствах с ограниченными ресурсами.

Можно ли развернуть YOLO11 на граничных устройствах?

Да, YOLO11 спроектирован для адаптивности к различным средам, включая граничные устройства. Его оптимизированная архитектура и эффективные возможности обработки делают его подходящим для развертывания на граничных устройствах, облачных платформах и системах, поддерживающих GPU NVIDIA. Эта гибкость гарантирует, что YOLO11 можно использовать в разнообразных приложениях, от обнаружения в реальном времени на мобильных устройствах до сложных задач сегментации в облачных средах. Для получения более подробной информации о вариантах развертывания обратись к документации Export.

Комментарии