Перейти к содержанию

PP-YOLOE+ против YOLOv10: сравнение современных детекторов объектов

Область обнаружения объектов в реальном времени быстро развивается, чему способствует потребность в моделях, сочетающих высокую точность и низкую задержку. Двумя значительными вкладами в эту область являются PP-YOLOE+, разработанный Baidu как часть пакета PaddleDetection, и YOLOv10, академическая разработка Университета Цинхуа, в которой было внедрено обучение NMS.

В этом руководстве представлено подробное техническое сравнение этих архитектур с анализом их показателей производительности, методологий обучения и пригодности для различных приложений компьютерного зрения. Хотя обе модели обладают впечатляющими возможностями, мы также подчеркиваем, что Ultralytics и более новые модели, такие как YOLO26, обеспечивают более унифицированный и эффективный путь для развертывания.

Обзор модели и технические характеристики

Понимание происхождения и философии проектирования каждой модели помогает выбрать правильный инструмент для ваших конкретных инженерных задач.

PP-YOLOE+

PP-YOLOE+ — это обновленная версия PP-YOLOE, в которой основное внимание уделено усовершенствованию механизма без анкеров и повышению эффективности обучения. Она глубоко интегрирована в PaddlePaddle .

  • Авторы:PaddlePaddle
  • Организация:Baidu
  • Дата: апрель 2022 г.
  • Ссылка:arXiv:2203.16250
  • Ключевая архитектура: использует базовую структуру CSPRepResNet со стратегией присвоения меток Task Alignment Learning (TAL). Основана на стандартной конструкции головы без анкеров.

Узнайте больше о PP-YOLOE+

YOLOv10

YOLOv10 обозначил значительный сдвиг в YOLO , представив сквозную конструкцию, которая устраняет необходимость в немаксимальном подавлении (NMS) во время вывода.

  • Авторы: Ao Wang, Hui Chen и др.
  • Организация:Университет Цинхуа
  • Дата: Май 2024
  • Ссылка:arXiv:2405.14458
  • Ключевая архитектура: Обеспечивает последовательное двойное назначение для обучения NMS и целостный дизайн модели, ориентированный на эффективность и точность.

Узнайте больше о YOLOv10

Ориентиры производительности

В следующей таблице представлено сравнение моделей на COCO . Ключевые показатели включают среднюю среднюю точность (mAP) и скорость вывода на различных конфигурациях оборудования. Обратите внимание на значительное повышение эффективности YOLOv10 , особенно в количестве параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Анализ производительности

YOLOv10 превосходную эффективность, часто достигая аналогичной или даже более высокой точности при значительно меньшем количестве параметров. Например, YOLOv10x достигает почти такого же mAP PP-YOLOE+x, но с примерно на 42% меньшим количеством параметров, что делает его гораздо более подходящим для развертывания на периферии с ограниченным объемом памяти.

Углубленное изучение архитектуры

PP-YOLOE+ Дизайн

PP-YOLOE+ построен на прочном фундаменте PP-YOLOv2. Он использует масштабируемую магистраль под названием CSPRepResNet, которая сочетает в себе остаточные соединения с межэтапными частичными сетями для улучшения градиентного потока. Головка не имеет анкеров, что упрощает пространство поиска гиперпараметров по сравнению с предшественниками на основе анкеров, такими как YOLOv4.

Однако PP-YOLOE+ основан на сложных этапах постобработки. Несмотря на свою точность, зависимость от NMS приводить к возникновению задержек в перегруженных сценах, где пересекается много ограничительных рамок.

YOLOv10 : сквозная обработка

YOLOv10 парадигмальный сдвиг, NMS устраняя NMS . Это достигается за счет последовательных двойных назначений:

  1. Задание «один ко многим»: используется во время обучения для предоставления богатых сигналов контроля.
  2. Задание «один к одному»: используется для вывода, чтобы обеспечить уникальные прогнозы для каждого объекта.

Такое выравнивание позволяет развертывать модель без вычислительных затрат на сортировку и фильтрацию ячеек, что является значительным преимуществом для приложений, работающих в режиме реального времени.

Экосистема и простота использования

Экосистема, окружающая модель, часто бывает столь же важна, как и сама архитектура. Именно здесь наиболее очевидно проявляется разница между моделями PaddlePaddle и моделями, Ultralytics.

Преимущество Ultralytics

Как YOLOv10 более новая версия YOLO26 поддерживаются вPython Ultralytics Python , что обеспечивает разработчикам беспроблемную работу.

  • Унифицированный API: переключайтесь между моделями (например, с YOLOv8 YOLOv10 YOLO26), изменяя один строковый аргумент.
  • Интеграция платформы: пользователи могут использовать Ultralytics для управления наборами данных, визуализации процессов обучения и развертывания моделей в веб- и пограничных конечных точках с помощью нескольких щелчков мышью.
  • Широкая поддержка экспорта: хотя PP-YOLOE+ оптимизирован для инференции Paddle, Ultralytics экспортируются в исходном формате в ONNX, TensorRT, CoreMLи OpenVINO, что позволяет охватить более широкий спектр аппаратного обеспечения для развертывания.
from ultralytics import YOLO

# Load a pretrained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for broad compatibility
path = model.export(format="onnx")

Рабочий процесс PP-YOLOE+

PP-YOLOE+ обычно требует установки PaddlePaddle клонирования репозитория PaddleDetection. Эта экосистема является мощной, но может быть менее доступной для пользователей, привыкших к стандартным PyTorch . Процесс экспорта часто отдает приоритет движку Paddle Inference, что может потребовать дополнительных шагов преобразования для общего развертывания.

Будущее: YOLO26

В то время как YOLOv10 концепцию NMS, недавно выпущенный YOLO26 усовершенствует и расширяет эти инновации.

YOLO26 изначально NMS использует NMS, что обеспечивает максимально возможную скорость вывода без задержек постобработки. Он оснащен оптимизатором MuSGD, гибридом SGD Muon (вдохновленным обучением LLM), который обеспечивает стабильную конвергенцию. Кроме того, благодаря удалению Distribution Focal Loss (DFL) YOLO26 значительно проще экспортировать и запускать на маломощных пограничных устройствах.

Для разработчиков, стремящихся к максимальной скорости и точности, особенно при обнаружении небольших объектов с помощью ProgLoss и STAL, рекомендуется перейти на YOLO26.

Узнайте больше о YOLO26

Реальные примеры использования

Когда следует выбирать PP-YOLOE+

  • Развертывание в Baidu Cloud: если ваша инфраструктура уже построена на Baidu Cloud или использует Paddle serving, PP-YOLOE+ предлагает нативную оптимизацию.
  • Специальное оборудование: Некоторые чипы искусственного интеллекта, предназначенные для азиатского рынка, имеют специальную поддержку моделей PaddlePaddle .

Когда выбирать Ultralytics YOLOv10 YOLO26)

  • Edge Computing: благодаря ускорению CPU в YOLO26 до 43%, эти модели идеально подходят для Raspberry Pi, Jetson Nano или мобильных устройств.
  • Сложные задачи: помимо обнаружения, Ultralytics поддерживает оценку позы, сегментацию экземпляров и ориентированное обнаружение объектов (OBB), что позволяет решать различные задачи с помощью одного инструмента.
  • Быстрое прототипирование: простота обучения и проверки позволяет командам быстро выполнять итерации, что является решающим фактором в средах гибкой разработки.

Эффективность памяти

YOLO Ultralytics YOLO славятся своим низким потреблением памяти. В отличие от архитектур с большим количеством трансформаторов, которые потребляют огромные объемы CUDA , эффективные YOLO , такие как YOLO26, позволяют использовать более крупные пакеты данных на потребительских графических процессорах, что делает доступ к высокопроизводительному обучению искусственного интеллекта более демократичным.

Заключение

И PP-YOLOE+, и YOLOv10 эффективными моделями. PP-YOLOE+ — отличный выбор для PaddlePaddle , а YOLOv10 границы эффективности благодаря своей конструкции NMS. Однако для максимально оптимизированного опыта разработки, широкой поддержки оборудования и передовых функций, таких как оптимизатор MuSGD и ProgLoss, Ultralytics выделяется как лучший выбор для современных инженеров в области компьютерного зрения.

Чтобы изучить другие варианты, обратите внимание на YOLOv8 или основанный на трансформере RT-DETR для сценариев с высокой точностью.


Комментарии