Перейти к содержанию

PP-YOLOE+ против YOLOv10: комплексное техническое сравнение

Выбор правильной модели обнаружения объектов - важнейшее решение, влияющее на эффективность, точность и масштабируемость систем компьютерного зрения. В этом подробном сравнении анализируются PP-YOLOE+, усовершенствованный безъякорный детектор из экосистемы PaddlePaddle компании Baidu, и YOLOv10революционный сквозной детектор реального времени от Университета Цинхуа, полностью интегрированный в экосистему Ultralytics .

Эти модели представляют собой два разных подхода к решению проблемы компромисса между скоростью и точностью. Рассмотрев их архитектурные новшества, показатели производительности и идеальные примеры использования, мы дадим вам представление о том, как выбрать лучший инструмент для конкретного приложения.

PP-YOLOE+: Точность в экосистеме PaddlePaddle

PP-YOLOE+ (Practical PaddlePaddle You Only Look One-level Efficient Plus) - это эволюция архитектуры PP-YOLOE, созданная для обеспечения высокоточных механизмов обнаружения. Разработанная компанией Baidu, она является флагманской моделью в рамках серии PaddlePaddle с упором на оптимизацию для промышленных приложений, где аппаратное окружение заранее определено.

Авторы: PaddlePaddle Authors
Organization:Baidu
Date: 2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHub:PaddleDetection Repository
Docs:PP-YOLOE+ Documentation

Основные архитектурные особенности

PP-YOLOE+ отличается несколькими структурными усовершенствованиями, направленными на улучшение представления и локализации признаков:

  • Механизм без якорей: Использует безъякорный подход для снижения сложности настройки гиперпараметров и улучшения обобщения по формам объектов.
  • CSPRepResNet Backbone: Интегрирует сети Cross Stage Partial (CSP) с RepResNet, предлагая надежные возможности извлечения признаков, которые уравновешивают вычислительную нагрузку и репрезентативную мощность.
  • Task Alignment Learning (TAL): использует специализированную функцию потерь, которая динамически согласовывает баллы классификации с точностью локализации, обеспечивая наиболее точное обнаружение с высокой степенью достоверности.
  • Эффективная головка (ET-Head): Усовершенствованная головка обнаружения, которая разделяет задачи классификации и регрессии для минимизации помех и повышения скорости сходимости.

Узнайте больше о PP-YOLOE+

YOLOv10: революция в реальном времени NMS

YOLOv10 представляет собой смену парадигмы в линейке YOLO . Разработанная исследователями из Университета Цинхуа, она устраняет историческое узкое место, связанное с немаксимальным подавлением (NMS), путем введения последовательных двойных назначений для обучения NMS. Это позволяет реализовать настоящее сквозное развертывание со значительным снижением задержки вывода.

Авторы: Ao Wang, Hui Chen, Lihao Liu, et al.
Organization:Tsinghua University
Date: 2024-05-23
ArXiv:https://arxiv.org/abs/2405.14458
GitHub:YOLOv10 Repository
Docs:Ultralytics YOLOv10 Docs

Инновации и интеграция экосистем

YOLOv10 - это не просто архитектурное обновление, это целостный дизайн, ориентированный на эффективность.

  • ОбучениеNMS: Благодаря двойной стратегии присвоения меток - один ко многим для богатого наблюдения и один к одному для эффективного вывода - YOLOv10 устраняет необходимость в постобработке NMS . Это снижает время задержки вывода и сложность развертывания.
  • Комплексный дизайн эффективности: Облегченные головки классификации и понижающая дискретизация с развязкой по пространственным каналам позволяют максимально сохранить информацию при минимизации количества операций FLOP.
  • Интеграция сUltralytics : Являясь частью экосистемы Ultralytics , YOLOv10 получает преимущества простоты использования благодаря унифицированному API Python , что позволяет разработчикам без труда обучать, проверять и развертывать модели.
  • Эффективность использования памяти: Архитектура оптимизирована для снижения потребления памяти во время обучения, что является значительным преимуществом по сравнению с детекторами на основе трансформаторов или старыми итерациями YOLO .

Узнайте больше о YOLOv10

Анализ технических характеристик

Следующие показатели подчеркивают разницу в производительности между двумя моделями. YOLOv10 неизменно демонстрирует превосходную эффективность, предлагая более высокую точность при меньшем количестве параметров и меньшей задержке.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Эффективность и скорость Интерпретация

Данные свидетельствуют о явном преимуществе YOLOv10 с точки зрения баланса производительности.

  • Эффективность использования параметров: YOLOv10l достигает более высокого mAP (53,3%), чем PP-YOLOE+l (52,9%), используя при этом почти вдвое меньше параметров (29,5M против 52,2M). Это делает YOLOv10 значительно легче для хранения и быстрее для загрузки.
  • Вычислительная нагрузка: количество операций FLOPs в моделях YOLOv10 неизменно ниже для сопоставимых уровней точности, что приводит к снижению энергопотребления - критически важному фактору для пограничных устройств искусственного интеллекта.
  • Скорость вывода: благодаря конструкции NMS, YOLOv10n достигает сверхнизкой задержки в 1,56 мс на GPU T4, опережая самый маленький вариант PP-YOLOE+.

Преимущество NMS

Традиционные детекторы объектов требуют Non-Maximum SuppressionNMS) для фильтрации перекрывающихся блоков, что часто является медленным и трудно оптимизируемым аппаратным процессом. В YOLOv10 этот шаг полностью исключен, что приводит к постоянному времени вычисления независимо от количества обнаруженных объектов.

Сильные и слабые стороны

YOLOv10: Современный выбор

  • Преимущества:
    • Простота использования: легко интегрируется в экосистему Ultralytics , предлагая стандартизированный API для обучения и развертывания.
    • Скорость развертывания: истинная сквозная архитектура устраняет узкие места, связанные с постобработкой.
    • Эффективность использования ресурсов: Низкое потребление памяти и меньшее количество параметров делают его идеальным для сред с ограниченными ресурсами, таких как робототехника и мобильные приложения.
    • Эффективность обучения: Поддерживает быстрое обучение с помощью легкодоступных предварительно обученных весов и оптимизированных загрузчиков данных.
  • Слабые стороны:
    • Поскольку это новая архитектура, экосистема сторонних учебников быстро растет, но может быть меньше, чем в старых версиях YOLO , таких как YOLOv5 или YOLOv8.

PP-YOLOE+: Специалист по PaddlePaddle

  • Преимущества:
    • Высокая точность: Обеспечивает превосходную точность, особенно в самых больших вариантах моделей (PP-YOLOE+x).
    • Оптимизация фреймворка: Высокотехнологичная настройка для пользователей, которые уже глубоко вложились в инфраструктуру PaddlePaddle .
  • Слабые стороны:
    • Замкнутость экосистемы: Первичная поддержка ограничена фреймворком PaddlePaddle , что может стать препятствием для команд, использующих PyTorch или TensorFlow.
    • Тяжеловес: Требует значительно больше вычислительных ресурсов (FLOPs и Params), чтобы соответствовать точности более новых моделей YOLO .

Рекомендации по применению

Приложения реального времени и граничные вычисления

Для приложений, требующих мгновенного реагирования, таких как автономные транспортные средства или высокоскоростные производственные линии, YOLOv10 является лучшим выбором. Низкая задержка и отсутствие шага NMS обеспечивают детерминированную скорость вывода, что очень важно для систем, критически важных для безопасности.

Компьютерное зрение общего назначения

Для разработчиков, ищущих универсальное решение, моделиYOLO от Ultralytics имеют явное преимущество благодаря хорошо поддерживаемой экосистеме. Возможность легко переключаться между задачамиdetect, segment, позирование) и экспортировать в такие форматы, как ONNX, TensorRT и CoreML , делает YOLOv10 и его собратьев очень адаптируемыми.

Конкретные промышленные развертывания

Если ваша существующая инфраструктура полностью построена на технологическом стеке Baidu, PP-YOLOE+ представляет собой оригинальное решение, которое хорошо интегрируется с другими инструментами PaddlePaddle . Однако для новых проектов эффективность обучения и более низкие аппаратные затраты YOLOv10 часто оказываются более выгодными.

Начало работы с YOLOv10

Оцените простоту использования, характерную для моделей Ultralytics . Вы можете загружать и запускать прогнозы с помощью YOLOv10 всего за несколько строк кода на Python :

from ultralytics import YOLO

# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("path/to/image.jpg")

# Display the results
results[0].show()

Этот простой API позволяет исследователям сосредоточиться на данных и результатах, а не на шаблонном коде.

Заключение

В то время как PP-YOLOE+ остается мощным соперником в своей специфической структуре, YOLOv10 предлагает более привлекательный пакет для более широкого сообщества компьютерного зрения. Архитектурный прорыв в устранении NMS в сочетании с надежностью экосистемы Ultralytics дает разработчикам инструмент, который не только быстрее и легче, но и проще в использовании и обслуживании.

Для тех, кто хочет быть на самом передовом рубеже, мы также рекомендуем посетить YOLO11новейшую флагманскую модель от Ultralytics , которая еще больше расширяет границы универсальности и производительности при выполнении различных задач зрения.

Изучите другие модели

С помощью этих сравнений вы расширите свое представление об особенностях обнаружения объектов:


Комментарии