Перейти к содержанию

PP-YOLOE+ против YOLOv6.0: Подробное техническое сравнение

При выборе современной архитектуры обнаружения объектов часто приходится выбирать между моделями, оптимизированными для конкретных экосистем, и моделями, ориентированными на скорость работы в промышленности. В этом комплексном анализе сравниваются PP-YOLOE+, высокоточный безъякорный детектор из набора PaddlePaddle , и YOLOv6.0, модель, ориентированная на скорость, разработанная компанией Meituan для промышленных приложений реального времени. Изучив их архитектуры, показатели производительности и идеальные сценарии использования, разработчики смогут определить, какая модель лучше всего соответствует их ограничениям на развертывание.

PP-YOLOE+: Точность без анкеров

PP-YOLOE+ представляет собой эволюцию серии YOLO , разработанной исследователями Baidu с целью расширить границы точности в рамках PaddlePaddle экосистемы. Выпущенная в начале 2022 года, она ориентирована на безъякорную конструкцию, упрощающую конвейер обучения и обеспечивающую современную производительность для задач компьютерного зрения общего назначения.

Авторы: PaddlePaddle Authors
Organization:Baidu
Date: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
DocsPaddlePaddle

Архитектура и Ключевые Инновации

Архитектура PP-YOLOE+ построена на основе CSPRepResNet, которая сочетает в себе возможности извлечения признаков из остаточных сетей с эффективностью межэтапных частичных (CSP) соединений. Существенным отклонением от традиционных детекторов является безъякорная голова, которая устраняет необходимость в предопределенных якорных ящиках. Такое уменьшение гиперпараметров упрощает конфигурацию модели и улучшает обобщение на различных наборах данных.

В PP-YOLOE+ используется технология Task Alignment Learning (TAL) для решения проблемы несоответствия между задачами классификации и локализации - общей проблемы одноэтапных детекторов. Динамически присваивая метки на основе качества предсказаний, TAL гарантирует, что самые высокие баллы доверия соответствуют самым точным ограничительным рамкам.

Сильные и слабые стороны

Преимущества:

  • Высокая точность: Неизменно достигается превосходная mAP в таких бенчмарках, как COCO, особенно в больших вариантах моделей (например, PP-YOLOE+x).
  • Упрощенное обучение: Парадигма без якорей устраняет сложность анализа кластеризации для определения размера якоря.
  • Синергия экосистемы: Предлагает глубокую интеграцию для пользователей, уже освоивших фреймворк глубокого обучения PaddlePaddle .

Слабые стороны:

  • Латентность выводов: Как правило, демонстрирует более низкую скорость вычислений по сравнению с аппаратно-ориентированными моделями, такими как YOLOv6, особенно на GPU .
  • Зависимость от фреймворка: Перенос моделей в другие фреймворки, такие как PyTorch или ONNX , для развертывания может быть более затруднительным по сравнению с архитектурами, изначально не зависящими от фреймворков.

Идеальные варианты использования

PP-YOLOE+ часто является предпочтительным выбором там, где точность превалирует над сверхнизкой задержкой.

Узнайте больше о PP-YOLOE+

YOLOv6.0: Создан для промышленной скорости

YOLOv6.0 был представлен командой ИИ зрения в Meituan для решения жестких требований промышленных приложений. Уделяя первостепенное внимание компромиссу между скоростью и точностью выводов, YOLOv6 использует аппаратно-ориентированные принципы проектирования для достижения максимальной производительности на графических процессорах и пограничных устройствах.

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization:Meituan
Date: 2023-01-13
ArXiv:https://arxiv.org/abs/2301.05586
GitHubYOLOv6
Docsultralytics

Архитектура и ключевые особенности

В YOLOv6.0 реализована "Эффективная основа репараметризации", вдохновленная RepVGG, которая позволяет модели иметь сложную структуру во время обучения для изучения богатых возможностей и упрощенную структуру во время вывода для скорости. Эта техника репараметризации является ключевой для возможностей вывода в реальном времени.

В модели также используется самораспространение, когда большая модель учителя направляет обучение меньшей модели ученика, повышая точность без дополнительных вычислительных затрат во время выполнения. Кроме того, YOLOv6 поддерживает агрессивное квантование модели, что делает ее очень эффективной для развертывания на оборудовании с ограниченными вычислительными ресурсами.

Мобильная оптимизация

YOLOv6 включает в себя специальную серию моделей "Lite", оптимизированную для мобильных процессоров и использующую отдельные блоки для поддержания скорости там, где ускорение GPU недоступно.

Сильные и слабые стороны

Преимущества:

  • Исключительная скорость: Модель YOLOv6.0n разработана специально для обеспечения высокой пропускной способности: на графических процессорах T4 задержка составляет менее 2 мс.
  • Оптимизация аппаратного обеспечения: Архитектура дружественна к TensorRT оптимизация, обеспечивающая максимальную загрузку GPU .
  • Эффективное масштабирование: Обеспечивает хороший баланс между точностью и вычислительными затратами (FLOPs).

Слабые стороны:

  • Ограниченный круг задач: В первую очередь предназначен для обнаружения; отсутствует встроенная поддержка сложных задач, таких как оценка позы или ориентированные ограничительные рамки (OBB).
  • Поддержка сообщества: Несмотря на свою эффективность, экосистема менее активна в отношении сторонних интеграций и обучающих материалов сообщества по сравнению с моделями Ultralytics .

Идеальные варианты использования

YOLOv6.0 отлично подходит для работы в условиях, где время реакции имеет решающее значение.

Узнайте больше о YOLOv6

Сравнение производительности

Расхождение в философии разработки - ориентация на точность для PP-YOLOE+ и на скорость для YOLOv6четко прослеживается в метриках производительности. PP-YOLOE+ обычно получает более высокие оценки mAP в верхней части сложности модели, в то время как YOLOv6 доминирует в скорости вывода для более мелких и быстрых моделей.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

Примечание: Сравнение метрик сильно зависит от конкретного оборудования и используемого формата экспорта (например, ONNX против TensorRT).

Данные показывают, что для пограничных приложений с ограниченными ресурсами YOLOv6.0n предлагает самый низкий барьер для входа с точки зрения FLOPs и задержки. И наоборот, для серверных приложений, где требуется максимальная способность к обнаружению, PP-YOLOE+x обеспечивает максимальную точность.

Преимущество Ultralytics : YOLO11

В то время как PP-YOLOE+ и YOLOv6 предлагают сильные возможности в своих нишах, Ultralytics YOLO11 представляет собой целостное решение, преодолевающее разрыв между высокой точностью и простотой использования. YOLO11 - это не просто модель, а точка входа в хорошо поддерживаемую экосистему, призванную оптимизировать весь жизненный цикл машинного обучения.

Почему стоит выбрать Ultralytics?

  • Непревзойденная универсальность: В отличие от YOLOv6 , который в первую очередь является детектором, YOLO11 поддерживает сегментацию объектов, оценку позы, OBB и классификацию. Это позволяет разработчикам решать многогранные задачи компьютерного зрения с помощью одного API.
  • Простота использования: Пакет Ultralytics Python абстрагируется от сложного шаблонного кода. Загрузка модели, проведение расчетов и визуализация результатов могут быть выполнены в трех строках кода.
  • Эффективность и память: Модели Ultralytics оптимизированы для эффективного обучения и обычно требуют значительно меньше памяти GPU , чем архитектуры на основе трансформаторов, такие как RT-DETR.
  • Поддержка экосистемы: Благодаря частым обновлениям, обширной документации и таким инструментам, как Ultralytics HUB для обучения без кода, пользователи получают преимущества платформы, развивающейся вместе с отраслью.

Развертывание стало простым

Приоритетом Ultralytics является доступность. Вы можете сразу же запускать расширенные выводы:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Эта простота распространяется и на развертывание, благодаря возможности экспорта одной строкой в такие форматы, как ONNX, OpenVINOи CoreML, обеспечивая оптимальную работу модели на любом целевом оборудовании.

Узнайте больше о YOLO11

Заключение

Выбор между PP-YOLOE+ и YOLOv6.0 во многом зависит от конкретных ограничений вашего проекта. PP-YOLOE+ - надежный соперник для сценариев, требующих высокой точности в рамках PaddlePaddle , в то время как YOLOv6.0 предлагает неоспоримые преимущества в скорости для промышленных сред, сильно зависящих от выводов на GPU .

Однако для разработчиков, которые ищут универсальное, перспективное решение, сочетающее в себе современную производительность и опыт разработчиков, Ultralytics YOLO11 остается лучшим решением. Широкая поддержка задач, активное сообщество и легкая интеграция в современные рабочие процессы MLOps делают его стандартом для передового искусственного интеллекта зрения.

Сравнения с другими моделями

Изучите более подробные сравнения, чтобы найти модель, соответствующую вашим потребностям:


Комментарии