Перейти к содержанию

YOLO11 YOLOv5: эволюция обнаружения объектов в реальном времени

Эволюция семейства YOLO You Only Look Once) отражает историю быстрого развития инноваций в области компьютерного зрения. YOLOv5, выпущенная в 2020 году компанией Ultralytics, произвела революцию в этой области, сделав высокопроизводительное обнаружение объектов доступным благодаря невероятно удобному API и надежной PyTorch . Перенесемся в конец 2024 года, когда YOLO11 появилась как усовершенствованная мощная система, основанная на многолетних отзывах и архитектурных усовершенствованиях, обеспечивающая превосходную эффективность и точность.

В этом сравнении рассматриваются технические достижения, достигнутые между этими двумя культовыми моделями, что помогает разработчикам понять, когда следует поддерживать устаревшие системы, а когда — переходить на новейшую архитектуру.

Анализ метрик производительности

Переход от YOLOv5 YOLO11 лучше всего YOLO11 с помощью их производительности на стандартных тестах. YOLO11 значительные оптимизации, которые позволяют ему достигать более высокой средней точности (mAP) при сохранении или снижении вычислительной нагрузки.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Основные выводы

  • Повышение точности: YOLO11n достигает впечатляющего показателя mAP 39,5%, что значительно превосходит результаты YOLOv5n (28,0% mAP). Это делает самую маленькую YOLO11 пригодной для сложных задач, которые ранее требовали использования более крупных и медленных моделей.
  • Вычислительная эффективность: несмотря на более высокую точность, YOLO11 обычно требуют меньшего количества FLOP. Например, YOLO11x использует примерно на 20 % меньше FLOP, чем YOLOv5x, при этом обеспечивая превосходные результаты обнаружения.
  • CPU :ONNX CPU ONNX для YOLO11 значительно выше, YOLO11 критически важным фактором для развертывания на периферийных устройствах, таких как Raspberry Pi.

YOLO11: Повышенная эффективность и универсальность

Выпущенный в сентябре 2024 года, YOLO11 кульминацию постепенных усовершенствованийYOLO Ultralytics YOLO . Он был разработан не только для обнаружения необработанных данных, но и для поддержки унифицированного конвейера обработки изображений, включающего сегментацию, оценку позы и ориентированные ограничительные рамки (OBB).

Технические характеристики:

Основные характеристики архитектуры

YOLO11 блок C3k2, усовершенствованную версию узкого места Cross Stage Partial (CSP), которая оптимизирует поток градиента. Кроме того, в его головке обнаружения используется C2PSA (Cross-Stage Partial with Spatial Attention), что улучшает способность модели фокусироваться на критически важных особенностях в запутанных сценах. В отличие от YOLOv5, YOLO11 архитектуру без якорей, что упрощает процесс обучения, устраняя необходимость вычислять якорные рамки для конкретных наборов данных, что приводит к лучшей обобщаемости.

Почему стоит выбрать YOLO11?

YOLO11 рекомендуемый выбор для большинства новых коммерческих приложений. Благодаря балансу высокой точности (mAP) и низкого потребления ресурсов он идеально подходит для аналитики в реальном времени в сфере розничной торговли, умных городов и здравоохранения.

Узнайте больше о YOLO11

YOLOv5: промышленный стандарт

YOLOv5, выпущенная в середине 2020 года, установила стандарт простоты использования в индустрии искусственного интеллекта. Это была первая модель, которая сделала «обучение, проверку и развертывание» бесшовным процессом в рамках одного репозитория, установив ориентированную на пользователя философию, которой сегодня Ultralytics .

Технические характеристики:

Основные характеристики архитектуры

YOLOv5 магистраль CSPDarknet и является детектором на основе якорей. Несмотря на высокую эффективность, подходы на основе якорей могут быть чувствительны к настройке гиперпараметров, касающихся размеров рамок. Несмотря на свой возраст, YOLOv5 надежным рабочим инструментом, особенно в сценариях, когда устаревшее оборудование или специальные сертификаты программного обеспечения ограничивают проекты более старыми версиями фреймворков.

Узнайте больше о YOLOv5

Архитектурные различия и обучение

Экосистема и простота использования

Одним из самых сильных преимуществ обеих моделей является их интеграция в Ultralytics . Независимо от того, используете ли вы YOLOv5 YOLO11, вы получаете преимущества от унифицированного API, обширной документации и поддержки бесшовного экспорта моделей в такие форматы, как TensorRT, CoreML и OpenVINO.

Однако YOLO11 преимущества последних обновлений в ultralytics Python , обеспечивающий более тесную интеграцию с такими инструментами, как Ultralytics Platform для облачного обучения и управления наборами данных.

Эффективность обучения

YOLO11 сходится быстрее во время обучения благодаря усовершенствованной архитектуре и функциям потерь. Требования к памяти также значительно оптимизированы. В отличие от массивных трансформаторных моделей, требующих значительного объема VRAM, YOLO11 и YOLOv5) можно эффективно обучать на потребительских графических процессорах.

Вот как можно обучить YOLO11 с помощьюPython Ultralytics Python :

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 example dataset
# fast, efficient, and low-memory usage
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Универсальность

В то время как YOLOv5 обновлен позже в своем жизненном цикле для поддержки сегментации и классификации, YOLO11 был создан с самого начала с учетом этих задач. Если ваш проект требует переключения между обнаружением объектов, сегментацией экземпляров, оценкой позы или ориентированными ограничивающими прямоугольниками (OBB), YOLO11 более согласованный и высокопроизводительный опыт во всех этих модальностях.

Заключение: какую модель использовать?

Для подавляющего большинства пользователей, начинающих проект сегодня, YOLO11 является явным победителем. Он предлагает улучшение «бесплатного обеда»: более высокую точность и аналогичную или более высокую скорость без увеличения сложности. YOLOv5 отличным ориентиром для исследований и обслуживания устаревшего оборудования, но отстает в сравнении с современными архитектурами по сырым метрикам.

Передовые технологии: YOLO26

Если вы ищете самые последние технологии в области компьютерного зрения (по состоянию на январь 2026 года), вам следует ознакомиться с YOLO26.

YOLO26 основан на YOLO11 имеет сквозную конструкцию NMS, что устраняет необходимость в постобработке с подавлением неактивных пиков. Это упрощает развертывание и ускоряет вычисления, особенно на периферийных устройствах CPU. Благодаря инновациям, таким как оптимизатор MuSGD и ProgLoss, YOLO26 обеспечивает ускорение CPU до 43 % по сравнению с предыдущими поколениями.

Узнайте больше о YOLO26

Другие модели для изучения

  • RT-DETR: детектор на основе трансформатора, который отличается высокой точностью, когда скорость в реальном времени не является критически важной.
  • YOLO: идеально подходит для обнаружения объектов с открытым словарем, когда необходимо detect , отсутствующие в обучающем наборе данных.

Комментарии