Перейти к содержанию

YOLO11 vs YOLOv5: Техническая эволюция в обнаружении объектов

Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает потребность в точности, скорости и простоте развертывания. На этой странице представлено всестороннее техническое сравнение двух знаковых моделей от Ultralytics: современной Ultralytics YOLO11 и широко используемой Ultralytics YOLOv5. В то время как YOLOv5 установила отраслевой стандарт своей производительностью и удобством использования, YOLO11 представляет собой следующий эволюционный шаг, обеспечивая превосходную точность, расширенную универсальность и новейшие архитектурные инновации, и все это в рамках надежной и удобной для пользователя экосистемы Ultralytics.

Ultralytics YOLO11: Новейший уровень техники

YOLO11, разработанная Гленном Джохером и Цзин Цю, является последней и самой передовой моделью в серии Ultralytics YOLO. Выпущенная в 2024 году, она опирается на прочный фундамент своих предшественников, таких как YOLOv8, чтобы установить новый эталон производительности и эффективности. Она разработана не только для обнаружения объектов, но и как комплексная структура для множества задач компьютерного зрения.

Архитектура и ключевые особенности

YOLO11 представляет значительные архитектурные усовершенствования, включая anchor-free detection head и оптимизированную структуру сети. Этот современный выбор конструкции упрощает процесс обучения, устраняя необходимость предварительного определения anchor boxes, что приводит к лучшему обобщению на различных наборах данных. Модель достигает более высокого среднего значения Average Precision (mAP), чем YOLOv5, с меньшим количеством параметров и вычислительных требований (FLOPs) во многих случаях, демонстрируя превосходную эффективность.

Отличительной особенностью YOLO11 является ее универсальность. Это унифицированный фреймворк, который изначально поддерживает детектирование объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Эта многозадачность делает его невероятно мощным и гибким инструментом для сложных AI-систем.

Сильные стороны

  • Современная точность: Обеспечивает значительно более высокие показатели mAP по сравнению с YOLOv5, устанавливая новый стандарт производительности.
  • Высокая эффективность: Достигает лучшей точности с более эффективной архитектурой, часто требующей меньшего количества параметров и FLOPs.
  • Anchor-Free Design: Упрощает обучение и повышает производительность, устраняя зависимость от конфигурации anchor box.
  • Универсальность в многозадачности: Единая платформа для широкого спектра задач компьютерного зрения, упрощающая разработку многогранных приложений.
  • Хорошо поддерживаемая экосистема: Преимущества непрерывной разработки, обширной документации, сильной поддержки сообщества и бесшовной интеграции с такими инструментами, как Ultralytics HUB, для MLOps.
  • Эффективность обучения: Предлагает эффективные процессы обучения с легкодоступными предварительно обученными весами и, как правило, требует меньше памяти, чем более сложные архитектуры, такие как трансформеры.

Слабые стороны

  • Будучи передовой моделью, более крупные варианты YOLO11 могут быть требовательны к вычислительным ресурсам, что требует современного оборудования с GPU для оптимальной производительности.

Идеальные варианты использования

YOLO11 — идеальный выбор для новых проектов, требующих высочайшей точности и гибкости:

Узнайте больше о YOLO11

YOLOv5: Устоявшаяся и универсальная рабочая лошадка

Выпущенная в 2020 году Гленном Джохером в Ultralytics, YOLOv5 быстро стала одной из самых популярных моделей обнаружения объектов в мире. Она получила признание за исключительный баланс скорости и точности, простоту использования и надежную, хорошо документированную реализацию на PyTorch.

Архитектура и ключевые особенности

YOLOv5 использует архитектуру, основанную на CSPDarknet53 backbone и PANet neck для эффективной агрегации признаков. Его detection head является anchor-based, что было стандартным и эффективным подходом на момент его выпуска. Одной из самых сильных сторон YOLOv5 является его масштабируемость, предлагающая ряд моделей от крошечной версии 'n' (nano) до большой версии 'x' (extra-large), что позволяет разработчикам легко находить компромисс между скоростью и точностью.

Сильные стороны

  • Исключительная скорость инференса: Высокая оптимизация для производительности в реальном времени, что делает его отличным выбором для приложений на периферийных устройствах, таких как NVIDIA Jetson.
  • Простота использования: Известный своим простым API, обширными руководствами и оптимизированными процессами обучения и развертывания.
  • Развитая экосистема: Поддерживается огромным сообществом, многолетним активным развитием и бесчисленными реальными развертываниями, что обеспечивает стабильность и надежность.
  • Гибкость: Широкий диапазон размеров моделей делает ее адаптируемой практически к любым аппаратным ограничениям.

Слабые стороны

  • Более низкая точность: Несмотря на то, что она все еще мощная, ее точность превосходит более новые модели, такие как YOLO11.
  • Детектирование на основе Anchor: Опирается на предопределенные anchor boxes, что иногда может потребовать ручной настройки для достижения оптимальной производительности на пользовательских наборах данных по сравнению с современными детекторами без anchor.

Идеальные варианты использования

YOLOv5 остается отличным выбором для конкретных сценариев:

  • Edge Computing: Развертывание на устройствах с ограниченными ресурсами, таких как Raspberry Pi, где скорость инференса является главным приоритетом.
  • Быстрое прототипирование: Его простота и скорость делают его идеальным для быстрой сборки и тестирования концептуальных приложений.
  • Устаревшие системы: Поддержание или обновление существующих проектов, построенных на базе YOLOv5.
  • Наблюдение в реальном времени: Обеспечение работы систем безопасности, где высокая частота кадров имеет решающее значение.

Узнайте больше о YOLOv5

Производительность и сравнительное тестирование: YOLO11 против YOLOv5

Метрики производительности наглядно иллюстрируют эволюцию от YOLOv5 к YOLO11. На наборе данных COCO модели YOLO11 стабильно достигают более высоких показателей mAP, чем их аналоги YOLOv5 аналогичного размера. Например, YOLO11m достигает 51.5 mAP, значительно превосходя 45.4 mAP у YOLOv5m. Кроме того, YOLO11 часто делает это с большей вычислительной эффективностью. Примечательно, что самая маленькая модель, YOLO11n, работает быстрее на CPU, чем YOLOv5n, обеспечивая при этом огромное увеличение mAP на 11.5 пунктов.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Заключение: какую модель вам следует выбрать?

Выбор между YOLO11 и YOLOv5 зависит от конкретных потребностей вашего проекта.

YOLOv5 — это проверенная, надежная и невероятно быстрая модель. Она остается отличным вариантом для приложений, где скорость является абсолютным приоритетом, особенно на устаревшем или ограниченном по ресурсам оборудовании. Ее зрелость и обширная поддержка сообщества обеспечивают стабильную основу для многих проектов.

Однако, почти для всех новых проектов YOLO11 является очевидным и рекомендуемым выбором. Это значительный шаг вперед, предлагающий передовую точность, превосходную эффективность и беспрецедентную универсальность. Его архитектура без привязки к якорям и встроенная поддержка множества задач компьютерного зрения делают его более мощным, гибким и перспективным решением. Выбирая YOLO11, разработчики используют новейшие достижения в области искусственного интеллекта для создания более функциональных и точных приложений компьютерного зрения, при этом пользуясь преимуществами оптимизированной и хорошо поддерживаемой экосистемы Ultralytics.

Изучите другие сравнения моделей

Если вам интересно, как эти модели соотносятся с другими ведущими архитектурами, ознакомьтесь с другими страницами сравнения:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии