Перейти к содержанию

PP-YOLOE+ против YOLOv5: навигация по высокоточному обнаружению и готовности к производству

При выборе оптимальной модели обнаружения объектов часто приходится искать компромисс между академическими показателями и практическими возможностями развертывания. В данном техническом сравнении рассматривается PP-YOLOE+, развитый безъякорный детектор из экосистемы PaddlePaddle , и Ultralytics YOLOv5стандартная модель, известная своим балансом скорости, точности и простоты использования. В то время как PP-YOLOE+ расширяет границы средней точностиmAP), YOLOv5 остается доминирующей силой в приложениях для вывода данных в реальном времени благодаря непревзойденному опыту разработчиков и универсальности развертывания.

PP-YOLOE+: Точная инженерия в PaddlePaddle

PP-YOLOE+ - это обновленная версия PP-YOLOE, разработанная исследователями из Baidu в рамках пакета PaddleDetection. Он разработан как эффективный, современный промышленный детектор объектов, ориентированный на решение высокоточных задач. Благодаря использованию безъякорной архитектуры он упрощает конвейер обучения и уменьшает необходимость настройки гиперпараметров, часто связанную с методами, основанными на якорях.

Авторы: PaddlePaddle Authors
Organization: Baidu
Дата: 2022-04-02
Arxiv: https://arxiv.org/abs/2203.16250
GitHub: PaddlePaddle
Docs: https:PaddlePaddle

Архитектура и инновации

Архитектура PP-YOLOE+ включает в себя несколько усовершенствованных механизмов для улучшения представления и локализации признаков:

  • Магистраль: Используется CSPRepResNet, основа, которая сочетает в себе преимущества градиентного потока сетей Cross Stage Partial (CSP) с методами перепараметризации RepVGG.
  • Безъякорная головка: эффективная головка с выравниванием задач (ET-Head) используется для разделения задач классификации и регрессии, что повышает скорость и точность сходимости.
  • Стратегия обучения: Используется технология Task Alignment Learning (TAL) для динамического распределения положительных образцов, что обеспечивает приоритет наиболее качественных прогнозов в процессе обучения.
  • Функции потерь: Используются VariFocal Loss (VFL) и Distribution Focal Loss (DFL) для обработки дисбаланса классов и уточнения точности ограничительных рамок.

Сильные и слабые стороны

PP-YOLOE+ превосходно работает в сценариях, где важна максимальная точность. Его безъякорная конструкция устраняет необходимость в кластеризации якорных ящиков, что позволяет адаптировать его к наборам данных с объектами различной формы. Тем не менее, его сильная зависимость от PaddlePaddle может стать препятствием для команд, стандартизированных на PyTorch или TensorFlow. Хотя существуют инструменты для преобразования моделей, поддержка родной экосистемы не столь обширна, как у более распространенных фреймворков.

Экосистемные соображения

Хотя PP-YOLOE+ обладает впечатляющими теоретическими характеристиками, его использование часто требует знакомства со специфическим синтаксисом PaddlePaddle и инструментами развертывания, которые могут значительно отличаться от стандартных рабочих процессов PyTorch .

Узнайте больше о PP-YOLOE+

Ultralytics YOLOv5: глобальный стандарт для искусственного интеллекта зрения

Выпущено Гленом Джошером в 2020 году, Ultralytics YOLOv5 кардинально изменила ландшафт компьютерного зрения, сделав ультрасовременное обнаружение объектов доступным для разработчиков любого уровня подготовки. Созданный на PyTorch, YOLOv5 фокусируется на "эффективности обучения" и "простоте использования", обеспечивая беспрепятственный путь от создания набора данных до внедрения в производство.

Авторы: Гленн Джочер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: yolov5
Docs: https:yolov5

Архитектура и ключевые особенности

В YOLOv5 используется высокооптимизированная архитектура на основе якорей, которая обеспечивает баланс между глубиной и шириной для максимальной пропускной способности:

  • Магистраль CSPDarknet: Дизайн сети Cross Stage Partial сводит к минимуму избыточную информацию о градиенте, повышая способность к обучению при уменьшении параметров.
  • PANet Neck: Сеть агрегации путей (PANet) улучшает поток информации, помогая модели точно локализовать объекты в разных масштабах.
  • Мозаичное наращивание: Передовая техника увеличения данных, которая объединяет четыре учебных изображения в одно, что значительно улучшает способность модели detect мелкие объекты и адаптироваться к новым условиям.
  • Генетические алгоритмы: Автоматизированная эволюция гиперпараметров позволяет модели самонастраиваться для достижения оптимальной производительности на пользовательских наборах данных.

Сильные стороны и экосистема

YOLOv5 славится своей простотой использования. API интуитивно понятен, что позволяет пользователям загружать модель и проводить расчеты всего в нескольких строках кода на Python .

import torch

# Load a pretrained YOLOv5s model
model = torch.hub.load("ultralytics/yolov5", "yolov5s")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Print results
results.print()

Помимо кода, YOLOv5 отличает хорошо поддерживаемая экосистема. Пользователи получают преимущества от частых обновлений, обширного форума сообщества и бесшовной интеграции с такими инструментами MLOps, как Comet и ClearML. Универсальность модели выходит за рамки простого обнаружения, поддерживая задачи сегментации экземпляров и классификации изображений в рамках одного и того же фреймворка. Кроме того, модели YOLOv5 обычно требуют меньше памяти при обучении по сравнению с архитектурами на основе трансформаторов, что делает их доступными на графических процессорах потребительского класса.

Узнайте больше о YOLOv5

Сравнение технических характеристик

При сравнении двух моделей важно учитывать показатели, влияющие на реальную полезность, такие как скорость вывода и количество параметров, наряду со стандартными показателями точности, такими как mAP.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Анализ результатов

  • Точность против скорости: PP-YOLOE+ демонстрирует более высокие показатели mAP , особенно в больших вариантах (l и x), благодаря стратегии безъякорной головы и TAL. Однако YOLOv5 предлагает превосходный баланс производительности, обеспечивая высокую точность при значительно меньшей задержке (см. скорость TensorRT ). Это делает YOLOv5 особенно хорошо подходящим для краевых приложений ИИ, где важна каждая миллисекунда.
  • Ресурсоэффективность: YOLOv5n (Nano) имеет очень малый вес и всего 2,6 М параметров, что делает его идеальным для мобильных и IoT-устройств. Хотя PP-YOLOE+ имеет эффективные магистрали, сложность архитектуры может привести к увеличению использования памяти во время обучения по сравнению с оптимизированной конструкцией YOLOv5.
  • Эффективность обучения: YOLOv5 использует автоанкор и эволюцию гиперпараметров для достижения максимальной производительности с самого начала. Наличие высококачественных предварительно обученных весов обеспечивает быстрое обучение переносу, значительно сокращая время разработки.

Реальные примеры использования

Выбор между этими моделями часто зависит от конкретной среды развертывания.

Применение PP-YOLOE+

PP-YOLOE+ часто используется в академических исследованиях и промышленных сценариях, особенно на азиатском рынке, где широко распространена инфраструктура Baidu.

  • Автоматизированное обнаружение дефектов: Высокая точность помогает выявлять мельчайшие царапины на производственных линиях.
  • Наблюдение за дорожным движением: Способность различать схожие типы транспортных средств в плотном транспортном потоке.

Приложения YOLOv5

Универсальность YOLOv5 делает его лучшим решением для широкого спектра мировых отраслей.

  • Умное сельское хозяйство: Используется для мониторинга состояния посевов в режиме реального времени и роботов для сбора фруктов благодаря скорости работы с устройствами на границе.
  • Аналитика розничной торговли: Системы подсчета объектов и управления запасами, эффективно работающие на серверном оборудовании магазинов.
  • Автономная робототехника: Низкая задержка позволяет беспилотникам и роботам безопасно перемещаться по сложным средам.
  • Системы безопасности: Легко интегрируется в системы охранной сигнализации для обнаружения вторжения.

Гибкость развертывания

YOLOv5 легко экспортирует в многочисленные форматы, включая ONNX, TensorRT, CoreML и TFLite , используя export режим. Это гарантирует, что после обучения модели ее можно развернуть практически в любом месте - от iPhone до облачного сервера.

Заключение

В то время как PP-YOLOE+ представляет собой значительное достижение в обнаружении отсутствия якорей, демонстрируя впечатляющую точность на таких эталонах, как COCO, Ultralytics YOLOv5 остается лучшим выбором для большинства разработчиков и коммерческих приложений. Его выигрышное сочетание простоты использования, надежной экосистемы и отличного баланса производительности обеспечивает быстрое и надежное продвижение проектов от концепции к производству.

Для пользователей, которые ищут абсолютное последнее слово в технологии компьютерного зрения, Ultralytics также предлагает YOLO11которая опирается на наследие YOLOv5 и обладает еще большей эффективностью и возможностями в задачах обнаружения, сегментации и оценки позы.

Узнайте больше

Чтобы изучить современные альтернативы, предлагающие улучшенные характеристики, рассмотрите следующие варианты:

  • Ultralytics YOLO11: Новейшая современная модель, обеспечивающая передовую точность и скорость.
  • Ultralytics YOLOv8: Универсальная модель, представляющая единые рамки для обнаружения, сегментации и классификации.
  • RT-DETR: Трансформаторный детектор реального времени для высокоточных требований.

Посетите нашу страницу "Модели", чтобы ознакомиться с полным спектром решений на основе искусственного интеллекта зрения, доступных для вашего следующего проекта.


Комментарии