Перейти к содержанию

YOLO11 против YOLOv5: эволюция современного обнаружения объектов

Эволюция системы обнаружения объектов в реальном времени в значительной степени определяется серией Ultralytics YOLO . YOLOv5выпущенная в 2020 году, установила мировые стандарты простоты использования, скорости и надежности, став одной из самых распространенных моделей искусственного интеллекта в истории. YOLO11последняя итерация, опирающаяся на этот легендарный фундамент, обеспечивает беспрецедентную точность, эффективность и универсальность.

В этом руководстве приводится подробное техническое сравнение этих двух мощных систем, помогающее разработчикам и исследователям понять архитектурные изменения, прирост производительности и идеальные варианты использования каждой из них.

Анализ производительности

Разрыв в производительности между YOLO11 и YOLOv5 свидетельствует о стремительном прогрессе в разработке нейронных сетей. В то время как YOLOv5 остается способной моделью, YOLO11 постоянно превосходит ее во всех масштабах модели, особенно по скорости вывода данных на CPU и точности обнаружения.

Ключевые показатели эффективности

В таблице ниже представлено сравнение между собой на наборе данныхCOCO . Важным моментом является эффективность YOLO11n, которая достигает 39,5 mAP, что значительно превосходит 28,0 mAP YOLOv5n, и при этом работает быстрее на CPU .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Точность против эффективности

YOLO11 представляет собой смену парадигмы в компромиссе "эффективность - точность".

  • Обнаружение мелких объектов: YOLO11 значительно улучшает обнаружение мелких объектов по сравнению с YOLOv5, благодаря усовершенствованным слоям извлечения признаков.
  • Эффективность вычислений: YOLO11l достигает 53,4 mAP , используя всего 25,3M параметров. Для сравнения, YOLOv5l требует 53,2 М параметров, чтобы достичь более низкого значения mAP 49,0. Сокращение количества параметров на 50 % для достижения более высокой точности приводит к снижению потребления памяти и ускорению времени обучения.

Без якорей и с якорями

Одно из самых существенных технических отличий - механизм головки детекции. YOLOv5 использует подход, основанный на якорях, который требует предопределенных якорных ящиков, которые должны быть настроены для конкретных наборов данных для достижения оптимальной производительности.

YOLO11 использует безъякорную конструкцию. Это устраняет необходимость в ручном расчете якорных ящиков, упрощает конвейер обучения и улучшает обобщение на различных наборах данных без настройки гиперпараметров.

Архитектура и дизайн модели

Архитектурные различия между этими двумя моделями отражают развитие исследований в области компьютерного зрения на протяжении нескольких лет.

YOLOv5: проверенный стандарт

YOLOv5 представила удобную реализацию PyTorch , которая сделала обнаружение объектов доступным для широких масс.

  • Магистраль: Используется модифицированный CSPDarknet53, который очень эффективен, но вычислительно тяжелее современных альтернатив.
  • Фокус: Приоритетом стал баланс скорости и точности, который был революционным при выпуске в 2020 году.
  • Legacy: Он остается "безопасным выбором" для систем, уже глубоко интегрированных с его специфическими форматами ввода/вывода.

Узнайте больше о YOLOv5

YOLO11: The Cutting Edge

YOLO11 объединяет новейшие методы глубокого обучения для максимального повторного использования функций и минимизации вычислительных затрат.

  • Блок C3k2: Являясь развитием узкого места CSP, этот блок позволяет более эффективно использовать градиентный поток и слияние функций.
  • Модуль C2PSA: Представляет механизмы пространственного внимания, позволяющие модели фокусироваться на критических областях изображения для лучшей локализации объекта.
  • Многозадачная голова: В отличие от YOLOv5, где для разных задач требуются отдельные форки моделей, YOLO11 поддерживает обнаружение объектов, сегментацию объектов, оценку позы, ориентированные граничные коробки (OBB) и классификацию в единой структуре.

Узнайте больше о YOLO11

Сравнительная таблица: Технические характеристики

ХарактеристикаYOLOv5YOLO11
АрхитектураМагистраль CSPDarknetУсовершенствованная основа с C3k2 и C2PSA
Обнаружение HeadОснованный на якореБезъякорный
ЗадачиОбнаружение, сегментация, классификацияОбнаружение, сегментация, классификация, поза, OBB, отслеживание
ЛицензияAGPL-3.0AGPL-3.0
Дата выходаИюнь 2020 годаСентябрь 2024 года
Простота использованияВысокий (командная строка и PyTorch Hub)Очень высокий (унифицированный Python SDK и CLI)

Обучение и экосистема

Обе модели пользуются преимуществами надежной экосистемыUltralytics , которая предоставляет удобные инструменты для управления данными, обучения и развертывания.

Эффективность обучения

YOLO11 разработан для более быстрого обучения и более быстрой сходимости, чем YOLOv5.

  • Интеллектуальные настройки по умолчанию: Механизм Ultralytics автоматически настраивает гиперпараметры в зависимости от набора данных и размера модели, снижая необходимость ручной настройки гиперпараметров.
  • Использование памяти: Благодаря уменьшенному количеству параметров модели YOLO11 в целом потребляют меньше VRAM GPU во время обучения, что позволяет использовать большие объемы партий на потребительском оборудовании.

Пример кода: Обучение YOLO11

Обучение YOLO11 упрощается с помощью ultralytics Пакет Python . В следующем примере показано, как обучить модель YOLO11n на наборе данных COCO8 .

from ultralytics import YOLO

# Load a pre-trained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model
# The device argument can be 'cpu', 0 for GPU, or [0, 1] for multi-GPU
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

Интеграция экосистем

В то время как YOLOv5 в силу своего возраста имеет обширную коллекцию сторонних учебников, YOLO11 встроен в современный пакет Ultralytics . Это обеспечивает немедленный доступ к расширенным возможностям:

  • Экспорт в один клик: Экспорт в ONNX, OpenVINO, TensorRT и CoreML с помощью одной команды.
  • Отслеживание: Встроенная поддержка отслеживания объектов (BoT-SORT, ByteTrack) без использования внешних репозиториев.
  • Explorer: Используйте API Ultralytics Explorer для визуализации и запросов к вашим наборам данных с помощью SQL и семантического поиска.

Идеальные варианты использования

Выбор подходящей модели зависит от конкретных ограничений и требований вашего проекта.

Когда выбирать YOLO11

YOLO11 рекомендуется для 95 % новых проектов.

  1. Новые разработки: Если вы начинаете с нуля, YOLO11 предлагает лучшие перспективы, точность и скорость.
  2. Развертывание наCPU : Для граничных устройств, работающих на CPU (например, Raspberry Pi, мобильные телефоны), YOLO11n значительно быстрее и точнее, чем YOLOv5n.
  3. Сложные задачи: Проекты, требующие оценки позы или OBB (например, аэрофотосъемка, анализ документов), изначально поддерживаются YOLO11.
  4. Облако и сервер: Высокая пропускная способность YOLO11 делает его идеальным для обработки огромных видеопотоков в режиме реального времени.

Когда стоит придерживаться YOLOv5

YOLOv5 остается жизнеспособным вариантом для специфических сценариев, связанных с наследием.

  1. Обслуживание наследия: Если у вас есть производственная система, сильно связанная с конкретной кодовой базой YOLOv5 или форматом вывода.
  2. Специфическая настройка оборудования: Некоторые старые встраиваемые ускорители могут иметь высоко оптимизированную прошивку, специально проверенную для слоев YOLOv5 (хотя большинство современных режимов выполнения, таких как OpenVINO , теперь предпочитают более новые архитектуры).
  3. Академический базис: Исследователи, проводящие сравнение с историческими эталонами, часто ссылаются на YOLOv5 из-за его давнего присутствия в литературе.

Миграция на YOLO11

Переход с YOLOv5 на YOLO11 очень прост. Формат наборов данныхYOLO TXT) остается идентичным, что означает, что вы можете использовать существующие аннотированные наборы данных без изменений. Структура Python API также очень похожа, часто требуется только изменить строку имени модели (например, с yolov5su.pt в yolo11n.pt в пределах ultralytics пакет).

Изучение других вариантов

Ultralytics поддерживает широкий спектр моделей, помимо YOLO11 и YOLOv5. В зависимости от ваших конкретных потребностей, вы можете рассмотреть:

  • YOLOv8: прямой предшественник YOLO11, предлагающий отличный баланс функций и широкое распространение в индустрии.
  • YOLOv10: архитектура, ориентированная на обучение NMS для снижения задержек в конкретных приложениях реального времени.
  • RT-DETR: Детектор на основе трансформатора, превосходящий по точности в случаях, когда скорость вывода не так важна, как максимальная точность.
  • YOLOv9: Известен своей концепцией программируемой градиентной информации (PGI), обеспечивающей высокую производительность при решении сложных задач обнаружения.

Заключение

Переход от YOLOv5 к YOLO11 знаменует собой важную веху в истории компьютерного зрения. YOLOv5 демократизировал ИИ, сделав обнаружение объектов доступным для всех. YOLO11 совершенствует это видение, предоставляя более быструю, легкую и точную модель.

Для разработчиков, которые ищут абсолютную производительность на ватт и самый универсальный набор функций, YOLO11 - несомненный победитель. Его интеграция в активную экосистему Ultralytics гарантирует, что вы получите доступ к новейшим инструментам, простым API и процветающему сообществу для поддержки вашего пути к ИИ.

Готовы к обновлению? Ознакомьтесь с документациейYOLO11 или изучите репозиторий GitHub, чтобы начать работу уже сегодня.


Комментарии