YOLO11 vs YOLOv5: Техническая эволюция в обнаружении объектов
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает потребность в точности, скорости и простоте развертывания. На этой странице представлено всестороннее техническое сравнение двух знаковых моделей от Ultralytics: современной Ultralytics YOLO11 и широко используемой Ultralytics YOLOv5. В то время как YOLOv5 установила отраслевой стандарт своей производительностью и удобством использования, YOLO11 представляет собой следующий эволюционный шаг, обеспечивая превосходную точность, расширенную универсальность и новейшие архитектурные инновации, и все это в рамках надежной и удобной для пользователя экосистемы Ultralytics.
Ultralytics YOLO11: Новейший уровень техники
YOLO11, разработанная Гленном Джохером и Цзин Цю, является последней и самой передовой моделью в серии Ultralytics YOLO. Выпущенная в 2024 году, она опирается на прочный фундамент своих предшественников, таких как YOLOv8, чтобы установить новый эталон производительности и эффективности. Она разработана не только для обнаружения объектов, но и как комплексная структура для множества задач компьютерного зрения.
- Авторы: Гленн Джохер, Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Архитектура и ключевые особенности
YOLO11 представляет значительные архитектурные усовершенствования, включая anchor-free detection head и оптимизированную структуру сети. Этот современный выбор конструкции упрощает процесс обучения, устраняя необходимость предварительного определения anchor boxes, что приводит к лучшему обобщению на различных наборах данных. Модель достигает более высокого среднего значения Average Precision (mAP), чем YOLOv5, с меньшим количеством параметров и вычислительных требований (FLOPs) во многих случаях, демонстрируя превосходную эффективность.
Отличительной особенностью YOLO11 является ее универсальность. Это унифицированный фреймворк, который изначально поддерживает детектирование объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Эта многозадачность делает его невероятно мощным и гибким инструментом для сложных AI-систем.
Сильные стороны
- Современная точность: Обеспечивает значительно более высокие показатели mAP по сравнению с YOLOv5, устанавливая новый стандарт производительности.
- Высокая эффективность: Достигает лучшей точности с более эффективной архитектурой, часто требующей меньшего количества параметров и FLOPs.
- Anchor-Free Design: Упрощает обучение и повышает производительность, устраняя зависимость от конфигурации anchor box.
- Универсальность в многозадачности: Единая платформа для широкого спектра задач компьютерного зрения, упрощающая разработку многогранных приложений.
- Хорошо поддерживаемая экосистема: Преимущества непрерывной разработки, обширной документации, сильной поддержки сообщества и бесшовной интеграции с такими инструментами, как Ultralytics HUB, для MLOps.
- Эффективность обучения: Предлагает эффективные процессы обучения с легкодоступными предварительно обученными весами и, как правило, требует меньше памяти, чем более сложные архитектуры, такие как трансформеры.
Слабые стороны
- Будучи передовой моделью, более крупные варианты YOLO11 могут быть требовательны к вычислительным ресурсам, что требует современного оборудования с GPU для оптимальной производительности.
Идеальные варианты использования
YOLO11 — идеальный выбор для новых проектов, требующих высочайшей точности и гибкости:
- Продвинутая робототехника: Для точного взаимодействия с объектами и навигации в динамических средах.
- Промышленная автоматизация: Высокоточный контроль качества и обнаружение дефектов.
- Здравоохранение: Помощь в анализе медицинских изображений для таких задач, как обнаружение опухолей.
- Умные города: Поддержка сложных систем для управления дорожным движением и общественной безопасности.
YOLOv5: Устоявшаяся и универсальная рабочая лошадка
Выпущенная в 2020 году Гленном Джохером в Ultralytics, YOLOv5 быстро стала одной из самых популярных моделей обнаружения объектов в мире. Она получила признание за исключительный баланс скорости и точности, простоту использования и надежную, хорошо документированную реализацию на PyTorch.
- Автор: Гленн Джокер
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: https://github.com/ultralytics/yolov5
- Документация: https://docs.ultralytics.com/models/yolov5/
Архитектура и ключевые особенности
YOLOv5 использует архитектуру, основанную на CSPDarknet53 backbone и PANet neck для эффективной агрегации признаков. Его detection head является anchor-based, что было стандартным и эффективным подходом на момент его выпуска. Одной из самых сильных сторон YOLOv5 является его масштабируемость, предлагающая ряд моделей от крошечной версии 'n' (nano) до большой версии 'x' (extra-large), что позволяет разработчикам легко находить компромисс между скоростью и точностью.
Сильные стороны
- Исключительная скорость инференса: Высокая оптимизация для производительности в реальном времени, что делает его отличным выбором для приложений на периферийных устройствах, таких как NVIDIA Jetson.
- Простота использования: Известный своим простым API, обширными руководствами и оптимизированными процессами обучения и развертывания.
- Развитая экосистема: Поддерживается огромным сообществом, многолетним активным развитием и бесчисленными реальными развертываниями, что обеспечивает стабильность и надежность.
- Гибкость: Широкий диапазон размеров моделей делает ее адаптируемой практически к любым аппаратным ограничениям.
Слабые стороны
- Более низкая точность: Несмотря на то, что она все еще мощная, ее точность превосходит более новые модели, такие как YOLO11.
- Детектирование на основе Anchor: Опирается на предопределенные anchor boxes, что иногда может потребовать ручной настройки для достижения оптимальной производительности на пользовательских наборах данных по сравнению с современными детекторами без anchor.
Идеальные варианты использования
YOLOv5 остается отличным выбором для конкретных сценариев:
- Edge Computing: Развертывание на устройствах с ограниченными ресурсами, таких как Raspberry Pi, где скорость инференса является главным приоритетом.
- Быстрое прототипирование: Его простота и скорость делают его идеальным для быстрой сборки и тестирования концептуальных приложений.
- Устаревшие системы: Поддержание или обновление существующих проектов, построенных на базе YOLOv5.
- Наблюдение в реальном времени: Обеспечение работы систем безопасности, где высокая частота кадров имеет решающее значение.
Производительность и сравнительное тестирование: YOLO11 против YOLOv5
Метрики производительности наглядно иллюстрируют эволюцию от YOLOv5 к YOLO11. На наборе данных COCO модели YOLO11 стабильно достигают более высоких показателей mAP, чем их аналоги YOLOv5 аналогичного размера. Например, YOLO11m достигает 51.5 mAP, значительно превосходя 45.4 mAP у YOLOv5m. Кроме того, YOLO11 часто делает это с большей вычислительной эффективностью. Примечательно, что самая маленькая модель, YOLO11n, работает быстрее на CPU, чем YOLOv5n, обеспечивая при этом огромное увеличение mAP на 11.5 пунктов.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Заключение: какую модель вам следует выбрать?
Выбор между YOLO11 и YOLOv5 зависит от конкретных потребностей вашего проекта.
YOLOv5 — это проверенная, надежная и невероятно быстрая модель. Она остается отличным вариантом для приложений, где скорость является абсолютным приоритетом, особенно на устаревшем или ограниченном по ресурсам оборудовании. Ее зрелость и обширная поддержка сообщества обеспечивают стабильную основу для многих проектов.
Однако, почти для всех новых проектов YOLO11 является очевидным и рекомендуемым выбором. Это значительный шаг вперед, предлагающий передовую точность, превосходную эффективность и беспрецедентную универсальность. Его архитектура без привязки к якорям и встроенная поддержка множества задач компьютерного зрения делают его более мощным, гибким и перспективным решением. Выбирая YOLO11, разработчики используют новейшие достижения в области искусственного интеллекта для создания более функциональных и точных приложений компьютерного зрения, при этом пользуясь преимуществами оптимизированной и хорошо поддерживаемой экосистемы Ultralytics.
Изучите другие сравнения моделей
Если вам интересно, как эти модели соотносятся с другими ведущими архитектурами, ознакомьтесь с другими страницами сравнения:
- YOLO11 против YOLOv8
- YOLO11 против YOLOv10
- YOLOv5 против YOLOv8
- YOLOv5 против YOLOv7
- YOLOv5 против YOLOv9