Перейти к содержанию

YOLOv5 против YOLO11: всестороннее техническое сравнение

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. Двумя наиболее значимыми вехами в этой области являются YOLOv5 и недавно вышедший YOLO11. Если YOLOv5 установил легендарный стандарт простоты использования и скорости, то YOLO11 расширяет границы точности и эффективности, используя результаты многолетних исследований и разработок.

В данном руководстве представлен подробный технический анализ этих двух архитектур, который поможет разработчикам, исследователям и инженерам принять обоснованное решение для своих приложений ИИ.

Ultralytics YOLOv5: надежная рабочая лошадка

Выпущенный в 2020 году YOLOv5 произвел революцию в области доступности обнаружения объектов. Это была первая модель "You Only Look Once", реализованная нативно в PyTorchчто делает ее невероятно простой для обучения и внедрения разработчиками. Баланс скорости и точности сделал ее лучшим выбором для всех сфер - от промышленного контроля до автономных транспортных средств.

Технические детали:

Ключевые особенности и архитектура

В YOLOv5 используется архитектура на основе якорей. В ней появилась магистраль CSPDarknet, которая значительно улучшила градиентный поток и снизила вычислительные затраты по сравнению с предыдущими итерациями. В модели использована сеть Path Aggregation Network (PANet) для увеличения потока информации и интегрировано увеличение данных Mosaic во время обучения - техника, ставшая стандартом для повышения устойчивости модели к мелким объектам.

Сильные стороны

YOLOv5 славится своей стабильностью и зрелостью. Благодаря многолетнему тестированию в сообществе, экосистема учебников, сторонних интеграций и руководств по развертыванию очень обширна. Это отличный выбор для устаревших систем или граничных устройств, где уже имеются специальные аппаратные оптимизации для его архитектуры.

Узнайте больше о YOLOv5

Ultralytics YOLO11: современная эволюция

Запуск в конце 2024 года, YOLO11 представляет собой передовое достижение в области искусственного интеллекта. Он опирается на уроки, извлеченные из проектов YOLOv5 и YOLOv8 чтобы создать более быструю, точную и эффективную с точки зрения вычислений модель.

Технические детали:

Архитектура и ключевые особенности

В YOLO11 реализованы значительные архитектурные усовершенствования, включая блок C3k2 и модули C2PSA (Cross-Stage Partial with Spatial Attention). В отличие от YOLOv5, в YOLO11 используется безъякорная головка обнаружения, что упрощает процесс обучения, устраняя необходимость вручную рассчитывать якорные коробки. Это изменение дизайна улучшает обобщение и позволяет модели лучше адаптироваться к различным наборам данных.

Непревзойденная универсальность

Одной из определяющих характеристик YOLO11 является поддержка множества задач компьютерного зрения в рамках одного фреймворка. В то время как YOLOv5 в основном фокусировался на обнаружении (с последующей поддержкой сегментации), YOLO11 был создан с нуля, чтобы справиться с этой задачей:

Такая универсальность позволяет разработчикам решать сложные задачи робототехники и анализа без смены фреймворка.

Узнайте больше о YOLO11

Сравнение производительности

Переход от YOLOv5 к YOLO11 дает существенный прирост производительности. Показатели демонстрируют, что YOLO11 предлагает лучший компромисс между скоростью и точностью.

Точность против эффективности

YOLO11 стабильно достигает более высокой средней точности (mAP) на наборе данных COCO по сравнению с моделями YOLOv5 аналогичного размера. Например, модель YOLO11m превосходит по точности гораздо более крупную модель YOLOv5x (51,5 против 50,7 mAP), работая при этом с меньшим количеством параметров (20,1М против 97,2М). Такое резкое уменьшение размера модели приводит к снижению требований к памяти как при обучении, так и при выводе, что является критическим фактором для развертывания на ограниченном по ресурсам аппаратном обеспечении краевого ИИ.

Скорость инференса

Благодаря оптимизированным архитектурным решениям YOLO11 превосходит CPU по скорости вывода информации. Модель YOLO11n создает новый эталон для приложений реального времени, достигая всего 56,1 мс на CPU с ONNX, что значительно быстрее, чем у предшественника.

Эффективность памяти

Модели Ultralytics YOLO11 разработаны для оптимального использования памяти. По сравнению с детекторами на основе трансформаторов, такими как RT-DETRYOLO11 требует значительно меньше памяти CUDA во время обучения, что делает его доступным для разработчиков со стандартными потребительскими GPU.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Обучение и опыт разработчиков

Обе модели пользуются преимуществами комплексной экосистемыUltralytics , известной своей "простотой использования".

Бесшовная интеграция

YOLO11 интегрирован в современный ultralytics Пакет Python , объединяющий все задачи в рамках простого API. Это позволяет проводить обучение, проверку и развертывание всего за несколько строк кода.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Хотя у YOLOv5 есть собственный репозиторий, ее также можно легко загрузить через PyTorch Hub или использовать в более новой экосистеме для решения определенных задач. Надежная документация по обеим моделям гарантирует, что при выполнении настройки гиперпараметров или экспорте в OpenVINOпроцесс будет упрощен.

Экосистемные преимущества

Выбор модели Ultralytics означает получение доступа к хорошо поддерживаемому набору инструментов. Экосистема поддерживает весь жизненный цикл MLOps - от интеграции с Comet для отслеживания экспериментов до бесшовного управления наборами данных. Благодаря активному развитию регулярно выпускаются исправления для системы безопасности и улучшения производительности.

Идеальные варианты использования

Когда выбирать YOLOv5

  • Устаревшее оборудование: если у вас есть существующие граничные устройства (например, старые Raspberry Pis) с конвейерами, специально оптимизированными для архитектуры YOLOv5 .
  • Устоявшиеся рабочие процессы: Для проектов, находящихся в режиме сопровождения, где обновление архитектуры основной модели повлечет за собой значительные затраты на рефакторинг.
  • Специфические оптимизации GPU : В редких случаях, когда специфические движки TensorRT сильно настроены на точную структуру слоев YOLOv5.

Когда выбирать YOLO11

  • Новые разработки: Практически для всех новых проектов рекомендуется использовать YOLO11 , поскольку его соотношение точности и вычислений превосходит все остальные.
  • Приложения для CPU реального времени: Приложения, работающие на стандартных процессорах, например ноутбуки или облачные инстансы, получают огромную пользу от оптимизации скорости работы CPU в YOLO11.
  • Сложные задачи: Проекты, требующие сегментации объектов или оценки позы наряду с обнаружением.
  • Требования к высокой точности: Такие области, как медицинская визуализация или анализ спутниковых снимков, где обнаружение мелких объектов с высокой точностью имеет первостепенное значение.

Заключение

YOLOv5 остается свидетельством эффективного и доступного дизайна искусственного интеллекта, благодаря которому за последние несколько лет появилось множество инноваций. Однако YOLO11 - это будущее. Благодаря усовершенствованной безъякорной архитектуре, превосходным показателям mAP и повышенной универсальности он предоставляет разработчикам более мощный набор инструментов для решения современных задач компьютерного зрения.

Применяя YOLO11, вы не только повышаете производительность, но и обеспечиваете будущее своих приложений в процветающей экосистеме Ultralytics .

Изучите другие модели

Если вам интересно сравнить эти архитектуры с другими ведущими моделями, изучите наши подробные сравнения:


Комментарии