YOLO11 YOLOv5: эволюция обнаружения объектов в реальном времени
Эволюция семейства YOLO You Only Look Once) отражает историю быстрого развития инноваций в области компьютерного зрения. YOLOv5, выпущенная в 2020 году компанией Ultralytics, произвела революцию в этой области, сделав высокопроизводительное обнаружение объектов доступным благодаря невероятно удобному API и надежной PyTorch . Перенесемся в конец 2024 года, когда YOLO11 появилась как усовершенствованная мощная система, основанная на многолетних отзывах и архитектурных усовершенствованиях, обеспечивающая превосходную эффективность и точность.
В этом сравнении рассматриваются технические достижения, достигнутые между этими двумя культовыми моделями, что помогает разработчикам понять, когда следует поддерживать устаревшие системы, а когда — переходить на новейшую архитектуру.
Анализ метрик производительности
Переход от YOLOv5 YOLO11 лучше всего YOLO11 с помощью их производительности на стандартных тестах. YOLO11 значительные оптимизации, которые позволяют ему достигать более высокой средней точности (mAP) при сохранении или снижении вычислительной нагрузки.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Основные выводы
- Повышение точности: YOLO11n достигает впечатляющего показателя mAP 39,5%, что значительно превосходит результаты YOLOv5n (28,0% mAP). Это делает самую маленькую YOLO11 пригодной для сложных задач, которые ранее требовали использования более крупных и медленных моделей.
- Вычислительная эффективность: несмотря на более высокую точность, YOLO11 обычно требуют меньшего количества FLOP. Например, YOLO11x использует примерно на 20 % меньше FLOP, чем YOLOv5x, при этом обеспечивая превосходные результаты обнаружения.
- CPU :ONNX CPU ONNX для YOLO11 значительно выше, YOLO11 критически важным фактором для развертывания на периферийных устройствах, таких как Raspberry Pi.
YOLO11: Повышенная эффективность и универсальность
Выпущенный в сентябре 2024 года, YOLO11 кульминацию постепенных усовершенствованийYOLO Ultralytics YOLO . Он был разработан не только для обнаружения необработанных данных, но и для поддержки унифицированного конвейера обработки изображений, включающего сегментацию, оценку позы и ориентированные ограничительные рамки (OBB).
Технические характеристики:
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- Ссылки:GitHub, Документация
Основные характеристики архитектуры
YOLO11 блок C3k2, усовершенствованную версию узкого места Cross Stage Partial (CSP), которая оптимизирует поток градиента. Кроме того, в его головке обнаружения используется C2PSA (Cross-Stage Partial with Spatial Attention), что улучшает способность модели фокусироваться на критически важных особенностях в запутанных сценах. В отличие от YOLOv5, YOLO11 архитектуру без якорей, что упрощает процесс обучения, устраняя необходимость вычислять якорные рамки для конкретных наборов данных, что приводит к лучшей обобщаемости.
Почему стоит выбрать YOLO11?
YOLO11 рекомендуемый выбор для большинства новых коммерческих приложений. Благодаря балансу высокой точности (mAP) и низкого потребления ресурсов он идеально подходит для аналитики в реальном времени в сфере розничной торговли, умных городов и здравоохранения.
YOLOv5: промышленный стандарт
YOLOv5, выпущенная в середине 2020 года, установила стандарт простоты использования в индустрии искусственного интеллекта. Это была первая модель, которая сделала «обучение, проверку и развертывание» бесшовным процессом в рамках одного репозитория, установив ориентированную на пользователя философию, которой сегодня Ultralytics .
Технические характеристики:
- Авторы: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- Ссылки:GitHub, Документация
Основные характеристики архитектуры
YOLOv5 магистраль CSPDarknet и является детектором на основе якорей. Несмотря на высокую эффективность, подходы на основе якорей могут быть чувствительны к настройке гиперпараметров, касающихся размеров рамок. Несмотря на свой возраст, YOLOv5 надежным рабочим инструментом, особенно в сценариях, когда устаревшее оборудование или специальные сертификаты программного обеспечения ограничивают проекты более старыми версиями фреймворков.
Архитектурные различия и обучение
Экосистема и простота использования
Одним из самых сильных преимуществ обеих моделей является их интеграция в Ultralytics . Независимо от того, используете ли вы YOLOv5 YOLO11, вы получаете преимущества от унифицированного API, обширной документации и поддержки бесшовного экспорта моделей в такие форматы, как TensorRT, CoreML и OpenVINO.
Однако YOLO11 преимущества последних обновлений в ultralytics Python , обеспечивающий более тесную интеграцию с такими инструментами, как Ultralytics Platform для облачного обучения и управления наборами данных.
Эффективность обучения
YOLO11 сходится быстрее во время обучения благодаря усовершенствованной архитектуре и функциям потерь. Требования к памяти также значительно оптимизированы. В отличие от массивных трансформаторных моделей, требующих значительного объема VRAM, YOLO11 и YOLOv5) можно эффективно обучать на потребительских графических процессорах.
Вот как можно обучить YOLO11 с помощьюPython Ultralytics Python :
from ultralytics import YOLO
# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")
# Train the model on the COCO8 example dataset
# fast, efficient, and low-memory usage
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Универсальность
В то время как YOLOv5 обновлен позже в своем жизненном цикле для поддержки сегментации и классификации, YOLO11 был создан с самого начала с учетом этих задач. Если ваш проект требует переключения между обнаружением объектов, сегментацией экземпляров, оценкой позы или ориентированными ограничивающими прямоугольниками (OBB), YOLO11 более согласованный и высокопроизводительный опыт во всех этих модальностях.
Заключение: какую модель использовать?
Для подавляющего большинства пользователей, начинающих проект сегодня, YOLO11 является явным победителем. Он предлагает улучшение «бесплатного обеда»: более высокую точность и аналогичную или более высокую скорость без увеличения сложности. YOLOv5 отличным ориентиром для исследований и обслуживания устаревшего оборудования, но отстает в сравнении с современными архитектурами по сырым метрикам.
Передовые технологии: YOLO26
Если вы ищете самые последние технологии в области компьютерного зрения (по состоянию на январь 2026 года), вам следует ознакомиться с YOLO26.
YOLO26 основан на YOLO11 имеет сквозную конструкцию NMS, что устраняет необходимость в постобработке с подавлением неактивных пиков. Это упрощает развертывание и ускоряет вычисления, особенно на периферийных устройствах CPU. Благодаря инновациям, таким как оптимизатор MuSGD и ProgLoss, YOLO26 обеспечивает ускорение CPU до 43 % по сравнению с предыдущими поколениями.
Другие модели для изучения
- RT-DETR: детектор на основе трансформатора, который отличается высокой точностью, когда скорость в реальном времени не является критически важной.
- YOLO: идеально подходит для обнаружения объектов с открытым словарем, когда необходимо detect , отсутствующие в обучающем наборе данных.