Перейти к содержанию

YOLOv5 vs YOLO11: Подробное техническое сравнение

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. Двумя наиболее значительными вехами в этой области являются YOLOv5 и недавно выпущенная YOLO11. В то время как YOLOv5 установила легендарный стандарт простоты использования и скорости, YOLO11 расширяет границы точности и эффективности, используя многолетний опыт исследований и разработок.

В этом руководстве представлен подробный технический анализ этих двух архитектур, помогающий разработчикам, исследователям и инженерам принимать обоснованные решения для своих AI applications.

Ultralytics YOLOv5: Надежная рабочая лошадка

YOLOv5, выпущенная в 2020 году, произвела революцию в доступности detectирования объектов. Это была первая модель "You Only Look Once", реализованная изначально на PyTorch, что значительно упростило обучение и развертывание для разработчиков. Ее баланс скорости и точности сделал ее идеальным выбором для всего, от промышленного контроля до автономных транспортных средств.

Технические детали:

Ключевые особенности и архитектура

YOLOv5 использует архитектуру на основе якорей. Он представил основу CSPDarknet, которая значительно улучшила поток градиента и снизила вычислительные затраты по сравнению с предыдущими итерациями. Модель использует Path Aggregation Network (PANet) neck для увеличения потока информации и интегрирует Mosaic data augmentation во время обучения, метод, который стал стандартом для повышения устойчивости модели к небольшим объектам.

Сильные стороны

YOLOv5 известен своей стабильностью и зрелостью. Благодаря многолетнему тестированию сообществом, экосистема учебных пособий, сторонних интеграций и руководств по развертыванию очень обширна. Это отличный выбор для устаревших систем или периферийных устройств, где уже имеются специальные аппаратные оптимизации для его архитектуры.

Узнайте больше о YOLOv5

Ultralytics YOLO11: Современная эволюция

Запуск запланирован на конец 2024 года, YOLO11 представляет собой передовую технологию в области vision AI. Она основана на уроках, извлеченных из YOLOv5 и YOLOv8, чтобы предоставить модель, которая является более быстрой, более точной и более вычислительно эффективной.

Технические детали:

Архитектура и ключевые особенности

YOLO11 представляет значительные архитектурные усовершенствования, включая блоки C3k2 и модули C2PSA (Cross-Stage Partial with Spatial Attention). В отличие от YOLOv5, YOLO11 использует anchor-free detection head, что упрощает процесс обучения, устраняя необходимость в ручном вычислении anchor box. Этот сдвиг в конструкции улучшает обобщение и позволяет модели лучше адаптироваться к различным наборам данных.

Непревзойденная универсальность

Одной из определяющих характеристик YOLO11 является встроенная поддержка нескольких задач компьютерного зрения в рамках единого фреймворка. В то время как YOLOv5 в основном ориентировалась на detect (с последующей поддержкой segment), YOLO11 изначально создавалась для решения следующих задач:

Эта универсальность позволяет разработчикам решать сложные задачи робототехники и анализа без переключения между фреймворками.

Узнайте больше о YOLO11

Сравнение производительности

Переход от YOLOv5 к YOLO11 дает существенный прирост производительности. Метрики показывают, что YOLO11 предлагает превосходный компромисс между скоростью и точностью.

Точность и эффективность

YOLO11 стабильно достигает более высокого Mean Average Precision (mAP) на наборе данных COCO по сравнению с моделями YOLOv5 аналогичного размера. Например, модель YOLO11m превосходит гораздо более крупную YOLOv5x по точности (51,5 против 50,7 mAP), работая при этом с меньшей частью параметров (20,1M против 97,2M). Это резкое уменьшение размера модели приводит к снижению требований к памяти во время обучения и выводов, что является критическим фактором для развертывания на периферийном AI оборудовании с ограниченными ресурсами.

Скорость инференса

Благодаря оптимизированным архитектурным решениям YOLO11 превосходно проявляет себя в скорости инференса на CPU. Модель YOLO11n создает новый эталон для приложений реального времени, показывая всего 56,1 мс на CPU с ONNX, что значительно быстрее, чем ее предшественник.

Эффективность памяти

Модели Ultralytics YOLO11 разработаны для оптимального использования памяти. По сравнению с детекторами на основе трансформеров, такими как RT-DETR, YOLO11 требует значительно меньше памяти CUDA во время обучения, что делает его доступным для разработчиков со стандартными потребительскими GPU.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Обучение и опыт разработчика

Обе модели выигрывают от всеобъемлющей экосистемы Ultralytics, известной своей "простотой использования".

Простая интеграция

YOLO11 интегрирован в современный ultralytics Пакет Python, который объединяет все задачи под простым API. Это позволяет обучать, проверять и развертывать модели всего несколькими строками кода.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Хотя YOLOv5 имеет свой собственный выделенный репозиторий, его также можно легко загрузить через PyTorch Hub или использовать в новой экосистеме для определенных задач. Надежная документация для обеих моделей гарантирует, что независимо от того, выполняете ли вы настройку гиперпараметров или экспортируете в OpenVINO, процесс будет оптимизирован.

Преимущества экосистемы

Выбор модели Ultralytics означает получение доступа к хорошо поддерживаемому набору инструментов. От интеграции с Comet для отслеживания экспериментов до бесшовного управления наборами данных, экосистема поддерживает весь жизненный цикл MLOps. Такая активная разработка гарантирует регулярную поставку патчей безопасности и улучшений производительности.

Идеальные варианты использования

Когда следует выбирать YOLOv5

  • Устаревшее оборудование (Legacy Hardware): Если у вас есть существующие edge-устройства (например, более старые Raspberry Pi) с конвейерами, специально оптимизированными для архитектуры YOLOv5.
  • Устоявшиеся рабочие процессы: Для проектов, находящихся в режиме глубокой поддержки, где обновление основной архитектуры модели повлечет за собой значительные затраты на рефакторинг.
  • Специфические оптимизации GPU: В редких случаях, когда конкретные движки TensorRT сильно настроены для точной структуры слоев YOLOv5.

Когда следует выбирать YOLO11

  • Новые разработки: Практически для всех новых проектов YOLO11 является рекомендуемой отправной точкой из-за превосходного соотношения точности и вычислительных затрат.
  • Приложения реального времени на CPU: Приложения, работающие на стандартных процессорах, таких как ноутбуки или облачные инстансы, получают огромную выгоду от оптимизации скорости CPU в YOLO11.
  • Сложные задачи: Проекты, требующие сегментацию экземпляров или оценку позы наряду с detect.
  • Требования к высокой точности: Такие области, как медицинская визуализация или анализ спутниковых изображений, где обнаружение небольших объектов с высокой точностью имеет первостепенное значение.

Заключение

YOLOv5 остается свидетельством эффективного и доступного дизайна ИИ, который за последние несколько лет обеспечил бесчисленные инновации. Однако YOLO11 представляет собой будущее. Благодаря своей передовой архитектуре без привязки к якорям, превосходным показателям mAP и расширенной универсальности, он предоставляет разработчикам более мощный набор инструментов для решения современных задач компьютерного зрения.

Принимая YOLO11, вы не только получаете лучшую производительность, но и обеспечиваете перспективность ваших приложений в рамках процветающей экосистемы Ultralytics.

Изучите другие модели

Если вам интересно сравнить эти архитектуры с другими ведущими моделями, изучите наши подробные сравнения:


Комментарии