YOLOv5 vs YOLO11: Техническое сравнение
Выбор подходящей модели обнаружения объектов — это критически важное решение, которое уравновешивает потребность в точности, скорости и эффективности использования ресурсов. На этой странице представлено подробное техническое сравнение двух знаковых моделей от Ultralytics: широко используемой Ultralytics YOLOv5 и современной Ultralytics YOLO11. В то время как YOLOv5 установила отраслевой стандарт производительности и простоты использования, YOLO11 представляет собой следующую эволюцию, предлагая превосходную точность, большую универсальность и повышенную эффективность в рамках той же мощной экосистемы Ultralytics.
Ultralytics YOLOv5: Устоявшийся отраслевой стандарт
Выпущенная в 2020 году, YOLOv5 быстро стала одной из самых популярных моделей обнаружения объектов в мире. Ее репутация основана на исключительном сочетании скорости, надежности и удобства использования, что делает ее оптимальным выбором для бесчисленного множества разработчиков и исследователей.
Технические детали:
- Авторы: Гленн Джокер
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: https://github.com/ultralytics/yolov5
- Документация: https://docs.ultralytics.com/models/yolov5/
Архитектура и ключевые особенности
YOLOv5 построен на PyTorch и имеет бэкбон CSPDarknet53 в сочетании с neck PANet для эффективного агрегирования признаков. Его архитектура обладает высокой масштабируемостью, предлагая ряд моделей от маленькой и быстрой YOLOv5n до большой и точной YOLOv5x. Ключевой характеристикой YOLOv5 является его head обнаружения на основе anchor-ов, который был очень эффективен на момент его выпуска.
Сильные стороны
- Исключительная скорость инференса: YOLOv5 высоко оптимизирована для быстрого инференса, что делает ее надежным выбором для приложений реального времени, особенно на оборудовании GPU.
- Развитая экосистема: Как хорошо зарекомендовавшая себя модель, YOLOv5 выигрывает от огромного сообщества, обширных учебных пособий и широкой поддержки третьих сторон. Она проверена в многочисленных производственных средах.
- Простота использования: YOLOv5, известный своим простым API и всесторонней документацией, позволяет быстро создавать прототипы и развертывать их. Модель легко интегрируется в экосистему Ultralytics, включая Ultralytics HUB для обучения без кода.
- Эффективность обучения: YOLOv5 предлагает эффективный процесс обучения с готовыми предварительно обученными весами, что обеспечивает эффективное трансферное обучение и более быстрые циклы разработки.
Слабые стороны
- Детектирование на основе Anchor: Его опора на предопределенные anchor boxes иногда может потребовать тщательной настройки для наборов данных с объектами необычной формы, ограничение, которое устраняется в новых детекторах без anchor.
- Потолок точности: Хотя он все еще очень точен, его производительность в бенчмарках, таких как COCO, была превзойдена более новыми архитектурами, такими как YOLO11.
Идеальные варианты использования
YOLOv5 остается отличным выбором для приложений, где скорость и стабильность имеют первостепенное значение:
- Edge Computing: Его уменьшенные варианты идеально подходят для развертывания на устройствах с ограниченными ресурсами, таких как Raspberry Pi и NVIDIA Jetson.
- Наблюдение в реальном времени: Обеспечение работы систем безопасности и приложений мониторинга, требующих высокой частоты кадров.
- Промышленная автоматизация: Используется для контроля качества и автоматизации процессов в производственной среде.
Ultralytics YOLO11: Следующая ступень эволюции в области Vision AI
YOLO11 — это новейшая современная модель от Ultralytics, разработанная для расширения границ возможного в компьютерном зрении. Она опирается на успехи своих предшественников, включая YOLOv8, чтобы обеспечить значительные улучшения в точности, скорости и универсальности.
Технические детали:
- Авторы: Гленн Джохер, Цзин Цю
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Архитектура и ключевые особенности
YOLO11 представляет усовершенствованную архитектуру сети с расширенными возможностями извлечения признаков и оптимизированной конструкцией. Основным достижением является его anchor-free detection head, который улучшает обобщение и упрощает процесс обучения. Эта современная конструкция позволяет YOLO11 достигать более высокой точности с более эффективным использованием параметров, что приводит к более высокой скорости инференса и снижению вычислительных требований.
Сильные стороны
- Передовая производительность: YOLO11 устанавливает новый стандарт точности, достигая более высоких показателей mAP, чем YOLOv5, для всех размеров моделей.
- Расширенная универсальность: YOLO11 — это настоящая многозадачная платформа, поддерживающая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой унифицированной модели.
- Превосходная эффективность: Модель очень эффективна, предлагая лучшее соотношение скорости и точности. Примечательно, что она демонстрирует значительно более быстрый вывод на CPU по сравнению с YOLOv5, что делает ее доступной для более широкого спектра оборудования. Она также требует меньше памяти для обучения и вывода, чем многие другие архитектуры.
- Оптимизированный пользовательский интерфейс: Как часть экосистемы Ultralytics, YOLO11 сохраняет ту же приверженность простоте использования с помощью простого Python API, мощного CLI и обширной документации.
Слабые стороны
- Вычислительные требования для больших моделей: Несмотря на высокую эффективность, самые большие модели YOLO11 (например, YOLO11x) по-прежнему требуют значительных вычислительных ресурсов для достижения максимальной точности.
- Развивающиеся интеграции: Будучи более новой моделью, экосистема сторонних инструментов и интеграций быстро растет, но может быть еще не такой обширной, как у давно зарекомендовавшей себя YOLOv5.
Идеальные варианты использования
YOLO11 — идеальный выбор для новых проектов, требующих высочайшего уровня точности и гибкости:
- Продвинутая робототехника: Обеспечение точного взаимодействия с объектами и навигации в сложных, динамических средах.
- Здравоохранение и медицинская визуализация: Поддержка таких задач, как обнаружение опухолей, где высокая точность имеет решающее значение.
- Умные города: Обеспечение работы сложных систем управления трафиком и общественной безопасности.
- Аналитика розничной торговли: Улучшение управления запасами и анализа поведения клиентов с большей точностью.
Прямое сравнение производительности: YOLOv5 против YOLO11
Метрики производительности наглядно иллюстрируют улучшения, внесенные в YOLO11. В целом, модели YOLO11 обеспечивают значительный прирост mAP, сохраняя или даже улучшая скорость инференса. Например, YOLO11s достигает 47.0 mAP, что сопоставимо с YOLOv5l, но с гораздо меньшим количеством параметров и значительно более быстрым инференсом на CPU. Аналогично, YOLO11m превосходит YOLOv5x по точности (51.5 против 50.7 mAP), будучи при этом более чем в 4 раза быстрее на CPU.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Заключение: какую модель вам следует выбрать?
Несмотря на то, что YOLOv5 остается надежной и проверенной моделью, YOLO11 является ее очевидным преемником и рекомендуемым выбором практически для всех новых проектов. Она предлагает значительный скачок в производительности, обеспечивая более высокую точность, большую универсальность задач и повышенную эффективность, не жертвуя при этом простотой использования, которая сделала ее предшественников такими популярными.
-
Выбирайте YOLOv5, если вы работаете над устаревшим проектом, в котором он уже используется, или если ваше основное ограничение — развертывание на оборудовании, где его конкретные оптимизации скорости GPU обеспечивают критическое преимущество.
-
Выбирайте YOLO11 для любого нового приложения. Его превосходная точность, безанкорная конструкция, многозадачные возможности и отличная производительность как на CPU, так и на GPU делают его более мощным, гибким и перспективным решением.
Обе модели поддерживаются надежной экосистемой Ultralytics, обеспечивающей плавную разработку с отличной поддержкой и документацией.
Изучите другие сравнения моделей
Если вам интересно, как эти модели соотносятся с другими ведущими архитектурами, ознакомьтесь с другими страницами сравнения:
- YOLO11 против YOLOv8
- YOLOv8 против YOLOv5
- YOLO11 против YOLOv10
- YOLOv5 против YOLOv7
- RT-DETR против YOLOv5