Ultralytics YOLO11

Обзор

YOLO11 это последняя итерация в Ultralytics YOLO серии детекторов объектов в реальном времени, заново определяющая возможные возможности благодаря передовой точности, скорости и эффективности. Основываясь на впечатляющих достижениях предыдущих версий YOLO , YOLO11 вносит значительные улучшения в архитектуру и методы обучения, что делает его универсальным выбором для широкого спектра задач компьютерного зрения.

Ultralytics YOLO11 Сравнительные графики

Ultralytics YOLO11 🚀 Подкаст, созданный NotebookLM

Смотреть: Как использовать Ultralytics YOLO11 для обнаружения и отслеживания объектов | Как провести бенчмаркинг | YOLO11 RELEASED🚀

Основные характеристики

Улучшенное извлечение признаков: В YOLO11 используется улучшенная архитектура позвоночника и шеи, которая расширяет возможности извлечения признаков для более точного обнаружения объектов и выполнения сложных задач.
Оптимизирован для повышения эффективности и скорости: на сайте YOLO11 представлены усовершенствованные архитектурные решения и оптимизированные конвейеры обучения, обеспечивающие более высокую скорость обработки данных и оптимальный баланс между точностью и производительностью.
Большая точность при меньшем количестве параметров: Благодаря усовершенствованию конструкции модели, YOLO11m достигает более высокой средней точности (mAP) на наборе данных COCO, используя при этом на 22 % меньше параметров, чем YOLOv8m, что делает его эффективным с вычислительной точки зрения без ущерба для точности.
Адаптируемость к различным средам: YOLO11 можно легко развернуть в различных средах, включая пограничные устройства, облачные платформы и системы, поддерживающие графические процессоры NVIDIA , что обеспечивает максимальную гибкость.
Широкий спектр поддерживаемых задач: Будь то обнаружение объектов, сегментация экземпляров, классификация изображений, оценка позы или ориентированное обнаружение объектов (OBB), YOLO11 разработан для решения разнообразных задач компьютерного зрения.

Поддерживаемые задачи и режимы

YOLO11 Развивает универсальный модельный ряд, представленный на сайте YOLOv8, предлагая расширенную поддержку различных задач компьютерного зрения:

Модель	Имена файлов	Задание	Заключение	Валидация	Обучение	Экспорт
YOLO11	`yolo11n.pt` `yolo11s.pt` `yolo11m.pt` `yolo11l.pt` `yolo11x.pt`	Обнаружение	✅	✅	✅	✅
YOLO11-seg	`yolo11n-seg.pt` `yolo11s-seg.pt` `yolo11m-seg.pt` `yolo11l-seg.pt` `yolo11x-seg.pt`	Сегментация экземпляров	✅	✅	✅	✅
YOLO11-pose	`yolo11n-pose.pt` `yolo11s-pose.pt` `yolo11m-pose.pt` `yolo11l-pose.pt` `yolo11x-pose.pt`	Поза/ключевые точки	✅	✅	✅	✅
YOLO11-obb	`yolo11n-obb.pt` `yolo11s-obb.pt` `yolo11m-obb.pt` `yolo11l-obb.pt` `yolo11x-obb.pt`	Ориентированное обнаружение	✅	✅	✅	✅
YOLO11-cls	`yolo11n-cls.pt` `yolo11s-cls.pt` `yolo11m-cls.pt` `yolo11l-cls.pt` `yolo11x-cls.pt`	Классификация	✅	✅	✅	✅

В этой таблице представлен обзор вариантов модели YOLO11 , демонстрирующий их применимость в конкретных задачах и совместимость с такими режимами работы, как "Вывод", "Проверка", "Обучение" и "Экспорт". Такая гибкость делает YOLO11 подходящим для широкого спектра приложений в компьютерном зрении, от обнаружения в реальном времени до сложных задач сегментации.

Показатели производительности

Производительность

Обнаружение (COCO)Сегментация (COCO)Классификация (ImageNet)Поза (COCO)OBB (DOTAv1)

Примеры использования этих моделей, обученных на COCO и включающих 80 предварительно обученных классов, см. в Документах по обнаружению.

Модель	размер ^{(пикселей)}	mAPval^50-95	Скорость ^{CPU ONNX (мс)}	Скорость T4^{TensorRT10 (мс)}	params ^(M)	FLOPs ^(B)
YOLO11n	640	39.5	56.1 ± 0.8	1.5 ± 0.0	2.6	6.5
YOLO11s	640	47.0	90.0 ± 1.2	2.5 ± 0.0	9.4	21.5
YOLO11m	640	51.5	183.2 ± 2.0	4.7 ± 0.1	20.1	68.0
YOLO11l	640	53.4	238.6 ± 1.4	6.2 ± 0.1	25.3	86.9
YOLO11x	640	54.7	462.8 ± 6.7	11.3 ± 0.2	56.9	194.9

Примеры использования этих моделей, обученных на COCO и включающих 80 предварительно обученных классов, см. в разделе Segmentation Docs.

Модель	размер ^{(пикселей)}	mAPbox^50-95	mAPmask^50-95	Скорость ^{CPU ONNX (мс)}	Скорость T4^{TensorRT10 (мс)}	params ^(M)	FLOPs ^(B)
YOLO11n-seg	640	38.9	32.0	65.9 ± 1.1	1.8 ± 0.0	2.9	10.4
YOLO11s-seg	640	46.6	37.8	117.6 ± 4.9	2.9 ± 0.0	10.1	35.5
YOLO11m-seg	640	51.5	41.5	281.6 ± 1.2	6.3 ± 0.1	22.4	123.3
YOLO11l-seg	640	53.4	42.9	344.2 ± 3.2	7.8 ± 0.2	27.6	142.2
YOLO11x-seg	640	54.7	43.8	664.5 ± 3.2	15.8 ± 0.7	62.1	319.0

Примеры использования этих моделей, обученных на ImageNet и включающих 1000 предварительно обученных классов, см. в разделе Classification Docs.

Модель	размер ^{(пикселей)}	acc ^top1	акк ^топ5	Скорость ^{CPU ONNX (мс)}	Скорость T4^{TensorRT10 (мс)}	params ^(M)	FLOPs ^{(B) на 224}
YOLO11n-cls	224	70.0	89.4	5.0 ± 0.3	1.1 ± 0.0	1.6	0.5
YOLO11s-cls	224	75.4	92.7	7.9 ± 0.2	1.3 ± 0.0	5.5	1.6
YOLO11m-cls	224	77.3	93.9	17.2 ± 0.4	2.0 ± 0.0	10.4	5.0
YOLO11l-cls	224	78.3	94.3	23.2 ± 0.3	2.8 ± 0.0	12.9	6.2
YOLO11x-cls	224	79.5	94.9	41.4 ± 0.9	3.8 ± 0.0	28.4	13.7

Примеры использования этих моделей, обученных на COCO и включающих 1 предварительно обученный класс "человек", см. в Документах по оценке позы.

Модель	размер ^{(пикселей)}	mAPpose^50-95	mAPpose⁵⁰	Скорость ^{CPU ONNX (мс)}	Скорость T4^{TensorRT10 (мс)}	params ^(M)	FLOPs ^(B)
YOLO11n-pose	640	50.0	81.0	52.4 ± 0.5	1.7 ± 0.0	2.9	7.6
YOLO11s-pose	640	58.9	86.3	90.5 ± 0.6	2.6 ± 0.0	9.9	23.2
YOLO11m-pose	640	64.9	89.4	187.3 ± 0.8	4.9 ± 0.1	20.9	71.7
YOLO11l-pose	640	66.1	89.9	247.7 ± 1.1	6.4 ± 0.1	26.2	90.7
YOLO11x-pose	640	69.5	91.1	488.0 ± 13.9	12.1 ± 0.2	58.8	203.3

Примеры использования этих моделей, обученных на DOTAv1 и включающих 15 предварительно обученных классов, см. в Документах по ориентированному обнаружению.

Модель	размер ^{(пикселей)}	mAPtest⁵⁰	Скорость ^{CPU ONNX (мс)}	Скорость T4^{TensorRT10 (мс)}	params ^(M)	FLOPs ^(B)
YOLO11n-obb	1024	78.4	117.6 ± 0.8	4.4 ± 0.0	2.7	17.2
YOLO11s-obb	1024	79.5	219.4 ± 4.0	5.1 ± 0.0	9.7	57.5
YOLO11m-obb	1024	80.9	562.8 ± 2.9	10.1 ± 0.4	20.9	183.5
YOLO11l-obb	1024	81.0	712.5 ± 5.0	13.5 ± 0.6	26.2	232.0
YOLO11x-obb	1024	81.3	1408.6 ± 7.7	28.6 ± 1.0	58.8	520.2

Примеры использования

В этом разделе приведены простые примеры обучения и вывода YOLO11 . Полную документацию по этим и другим режимам можно найти на страницах Predict, Train, Val и Export docs.

Обратите внимание, что в приведенном ниже примере используются модели YOLO11 Detect для обнаружения объектов. Дополнительные поддерживаемые задачи см. в документах Segment, Classify, OBB и Pose.

Пример

PythonCLI

PyTorch предварительно обученный *.pt модели, а также конфигурации *.yaml файлы могут быть переданы в YOLO() класс для создания экземпляра модели в Python:

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with the YOLO11n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")

CLI Команды доступны для прямого запуска моделей:

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

# Load a COCO-pretrained YOLO11n model and run inference on the 'bus.jpg' image
yolo predict model=yolo11n.pt source=path/to/bus.jpg

Цитаты и благодарности

Ultralytics YOLO11 Публикация

Ultralytics из-за быстро развивающейся природы моделей не опубликовала ни одного официального научного документа по YOLO11 . Мы сосредоточены на развитии технологии и упрощении ее использования, а не на создании статической документации. Самую свежую информацию об архитектуре, возможностях и использовании YOLO вы можете найти в нашем репозитории на GitHub и в документации.

Если вы используете в своей работе YOLO11 или любое другое программное обеспечение из этого репозитория, пожалуйста, приведите ссылку на него в следующем формате:

BibTeX

@software{yolo11_ultralytics,
  author = {Glenn Jocher and Jing Qiu},
  title = {Ultralytics YOLO11},
  version = {11.0.0},
  year = {2024},
  url = {https://github.com/ultralytics/ultralytics},
  orcid = {0000-0001-5950-6979, 0000-0002-7603-6750, 0000-0003-3783-7069},
  license = {AGPL-3.0}
}

Обратите внимание, что DOI находится на рассмотрении и будет добавлено в цитату, как только оно станет доступно. Модели YOLO11 предоставляются под лицензиями AGPL-3.0 и лицензиями Enterprise.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Каковы основные улучшения в Ultralytics YOLO11 по сравнению с предыдущими версиями?

Ultralytics YOLO11 представляет собой несколько значительных усовершенствований по сравнению с предшественниками. К основным улучшениям относятся:

Улучшенное извлечение признаков: на сайте YOLO11 используется улучшенная архитектура "позвоночника" и "шеи", что расширяет возможности извлечения признаков для более точного обнаружения объектов.
Оптимизированная эффективность и скорость: Усовершенствованная архитектура и оптимизированные конвейеры обучения обеспечивают более высокую скорость обработки, сохраняя баланс между точностью и производительностью.
Большая точность при меньшем количестве параметров: YOLO11m достигает более высокой средней точности (mAP) на наборе данных COCO с 22 % меньшим количеством параметров, чем YOLOv8m, что делает его вычислительно эффективным без ущерба для точности.
Адаптируемость к различным средам: YOLO11 можно развернуть в различных средах, включая пограничные устройства, облачные платформы и системы, поддерживающие графические процессоры NVIDIA .
Широкий спектр поддерживаемых задач: YOLO11 поддерживает различные задачи компьютерного зрения, такие как обнаружение объектов, сегментация объектов, классификация изображений, оценка позы и ориентированное обнаружение объектов (OBB).

Как обучить модель YOLO11 для обнаружения объектов?

Обучение модели YOLO11 для обнаружения объектов может быть выполнено с помощью команд Python или CLI . Ниже приведены примеры для обоих методов:

Пример

PythonCLI

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a COCO-pretrained YOLO11n model and train it on the COCO8 example dataset for 100 epochs
yolo train model=yolo11n.pt data=coco8.yaml epochs=100 imgsz=640

Для получения более подробных инструкций обратитесь к документации Train.

Какие задачи могут выполнять модели YOLO11 ?

YOLO11 Модели универсальны и поддерживают широкий спектр задач компьютерного зрения, включая:

Обнаружение объектов: Идентификация и определение местоположения объектов на изображении.
Сегментация объектов: Обнаружение объектов и определение их границ.
Классификация изображений: Классификация изображений по заранее определенным классам.
Оценка позы: Обнаружение и отслеживание ключевых точек на теле человека.
Ориентированное обнаружение объектов (OBB): Обнаружение объектов с вращением для повышения точности.

Более подробную информацию о каждой задаче см. в документации по обнаружению, сегментации объектов, классификации, оценке позы и ориентированному обнаружению.

Как на сайте YOLO11 достигается большая точность при меньшем количестве параметров?

YOLO11 достигает большей точности при меньшем количестве параметров за счет усовершенствования конструкции модели и методов оптимизации. Усовершенствованная архитектура позволяет эффективно извлекать и обрабатывать признаки, в результате чего достигается более высокая средняя точность (mAP) на таких наборах данных, как COCO, при использовании на 22 % меньшего количества параметров по сравнению с YOLOv8m. Это делает YOLO11 вычислительно эффективным без ущерба для точности, что делает его пригодным для развертывания на устройствах с ограниченными ресурсами.

Можно ли развернуть YOLO11 на пограничных устройствах?

Да, YOLO11 разработан для адаптации к различным средам, включая пограничные устройства. Оптимизированная архитектура и эффективные вычислительные возможности делают его пригодным для развертывания на пограничных устройствах, облачных платформах и системах, поддерживающих графические процессоры NVIDIA . Такая гибкость обеспечивает возможность использования YOLO11 в различных приложениях, от обнаружения в реальном времени на мобильных устройствах до сложных задач сегментации в облачных средах. Более подробную информацию о вариантах развертывания см. в документации по экспорту.

📅 Создано 6 месяцев назад ✏️ Обновлено 1 месяц назад