Перейти к содержанию

YOLOv10 PP-YOLOE+: техническое сравнение архитектур обнаружения в реальном времени

В быстро развивающейся области компьютерного зрения поиск оптимального баланса между скоростью вывода и точностью обнаружения стимулирует постоянные инновации. Две заметные архитектуры, которые сформировали эту дискуссию, — это YOLOv10, академический прорыв в области сквозного обнаружения, и PP-YOLOE+, промышленный детектор, оптимизированный для PaddlePaddle . В данном анализе подробно рассматриваются их технические характеристики, архитектурные различия и показатели производительности, чтобы помочь исследователям и инженерам выбрать подходящий инструмент для конкретных задач обнаружения объектов.

Метрики производительности и тесты

В следующей таблице сравниваются характеристики YOLOv10 PP-YOLOE+ для различных масштабов моделей. Показатели сосредоточены на средней средней точности (mAP) на COCO и задержке вывода, подчеркивая компромисс между эффективностью параметров и сырой пропускной способностью.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

YOLOv10: Сквозная эволюция

YOLOv10 представляет собой сдвиг парадигмы в YOLO , внедряя обучение NMS. В отличие от традиционных детекторов, которые используют Non-Maximum Suppression (NMS) для фильтрации перекрывающихся ограничительных рамок, YOLOv10 стратегию последовательного двойного назначения. Это позволяет модели напрямую предсказывать одну лучшую рамку для каждого объекта, что значительно сокращает задержку вывода и сложность развертывания.

Узнайте больше о YOLOv10

Ключевые архитектурные особенности

  1. ОбучениеNMS: благодаря использованию двойных меток — «один ко многим» для тщательного контроля во время обучения и «один к одному» для вывода —YOLOv10 необходимость в NMS последующей обработки.
  2. Эффективность и точность конструкции: архитектура отличается легкой классификационной головкой, пространственно-канальным декуплированным понижающим преобразованием и блочной конструкцией с ранжированием для максимальной вычислительной эффективности.
  3. Комплексная оптимизация: модель включает в себя свертки с большим ядром и модули частичного самоуправления для улучшения рецептивных полей без значительных вычислительных затрат.

Простота развертывания

Удаление NMS важным преимуществом для периферийного развертывания. NMS часто создают узкие места на аппаратных ускорителях, таких как FPGA или NPU, которые оптимизированы для умножения матриц, но испытывают трудности с сортировкой и логической фильтрацией.

PP-YOLOE+: промышленный стандарт

PP-YOLOE+ — это усовершенствованная версия PP-YOLOE, разработанная Baidu в рамках PaddlePaddle . Она ориентирована на практическое применение в промышленности, усовершенствовала механизм без анкеров и представила мощную структуру backbone и neck. Она разработана для высокой совместимости с различными аппаратными бэкэндами, особенно при использовании с PaddleLite.

Ключевые архитектурные особенности

  1. CSPRepResNet Backbone: эта магистраль сочетает в себе преимущества остаточных соединений с эффективностью сетей CSP (Cross Stage Partial), предлагая мощные возможности извлечения признаков.
  2. ET-Head: Эффективная система, ориентированная на задачи, объединяет качество классификации и локализации, обеспечивая высокую точность обнаружения и точность граничных рамок.
  3. Динамическое присвоение меток: использует TAL (Task Alignment Learning) для динамического присвоения меток во время обучения, что повышает скорость сходимости и конечную точность.

Сравнительный анализ

При выборе между YOLOv10 PP-YOLOE+ решение часто зависит от среды развертывания и конкретных требований проекта.

Точность и скорость

YOLOv10 , предлагает превосходный компромисс между эффективностью и точностью, особенно при меньших масштабах модели. Например, YOLOv10n достигает сопоставимой точности с более крупными моделями, сохраняя при этом чрезвычайно низкую задержку благодаря удалению NMS. PP-YOLOE+ остается конкурентоспособным, особенно в более крупных x варианты, в которых его надежная основа проявляется в сложной экстракции признаков.

Экосистема и простота использования

Хотя PP-YOLOE+ является сильным конкурентом в PaddlePaddle , Ultralytics предлагают более универсальный и оптимизированный опыт. Ultralytics позволяет пользователям управлять наборами данных, обучать в облаке и развертывать в любом формате (ONNX, TensorRT, CoreML, TFLite) одним щелчком мыши. Такой уровень интеграции значительно снижает инженерные затраты по сравнению с навигацией по инструментам, специфичным для конкретной платформы.

Эффективность обучения и ресурсы

YOLOv10 современные методы оптимизации, которые снижают потребление памяти во время обучения. В отличие от этого, более старые архитектуры часто требуют значительного CUDA , что затрудняет их обучение на потребительских графических процессорах. Ultralytics известны своей эффективностью в процессе обучения, что позволяет создавать высокопроизводительные модели на скромном оборудовании.

Ultralytics : больше, чем просто обнаружение

Хотя сравнение конкретных архитектур является ценным, окружающая экосистема часто является решающим фактором для долгосрочного успеха проекта.

  • Универсальность: Ultralytics широкий спектр задач, выходящих за рамки простого обнаружения, включая сегментацию экземпляров, оценку позы и обнаружение OBB (Oriented Bounding Box). Это позволяет разработчикам решать многогранные проблемы с помощью одной библиотеки.
  • Документация: обширная и актуальная документация позволяет разработчикам устранять неполадки и внедрять расширенные функции без затруднений.
  • Активное развитие: Ultralytics очень активное, что обеспечивает частые обновления, исправление ошибок и интеграцию последних научных достижений.

Представляем YOLO26: Новый стандарт

Для разработчиков, стремящихся к абсолютному максимуму производительности, недавно выпущенная версия YOLO26 основана на инновациях YOLOv10 еще более усовершенствована.

Узнайте больше о YOLO26

YOLO26 включает в себя несколько передовых усовершенствований:

  • Сквозной дизайн NMS: как и YOLOv10, YOLO26 изначально является сквозным, что исключает NMS более быстрое и простое развертывание.
  • Удаление DFL: функция Distribution Focal Loss (фокусная потеря распределения) была удалена для упрощения экспорта и улучшения совместимости с периферийными устройствами и устройствами с низким энергопотреблением.
  • MuSGD Optimizer: гибрид SGD Muon (вдохновленный обучением LLM), этот оптимизатор обеспечивает более стабильное обучение и более быструю конвергенцию.
  • Улучшения для конкретных задач: включают такие усовершенствования, как семантическая сегментационная потеря для моделей Seg и специализированная угловая потеря для задач OBB.
  • Более быстрое выведение: специально оптимизирован для CPU , обеспечивая скорость до 43 % выше, чем у предыдущих поколений, что делает его идеальным для пограничных вычислений.

Приложения в реальном мире

Умная розничная торговля и управление запасами

Для интеллектуальных приложений в сфере розничной торговли критически важны скорость и обнаружение мелких объектов. Способность YOLOv10 работать без NMS делает его идеальным решением для отслеживания покупателей или идентификации товаров на полках в режиме реального времени.

Промышленная автоматизация

В производстве PP-YOLOE+ широко используется для обнаружения дефектов на сборочных линиях. Однако простота использования Ultralytics , таких как YOLO26, позволяет инженерам завода быстро переобучать и переразвертывать модели по мере изменения продуктов, сокращая время простоя и техническую задолженность.

Автономные системы и робототехника

Приложения робототехники требуют низкой задержки для реагирования на динамические условия окружающей среды. Удаленный NMS в YOLOv10 YOLO26 напрямую приводит к более быстрой реакции автономных мобильных роботов (AMR) или дронов, перемещающихся в сложных пространствах.

Заключение

YOLOv10 PP-YOLOE+ — это мощные инструменты в арсенале компьютерного зрения. PP-YOLOE+ — надежный вариант для тех, кто глубоко интегрирован в экосистему Baidu. YOLOv10с его архитектурой NMS дает представление о будущем эффективного обнаружения.

Однако для комплексного решения, сочетающего в себе современную точность, молниеносную скорость вывода и непревзойденный опыт разработчиков, Ultralytics выделяется как лучший выбор. Его интеграция с Ultralytics , поддержка разнообразных задач и оптимизация для периферийных устройств делают его наиболее перспективной инвестицией на 2026 год и далее.

Для дальнейшего изучения эффективных моделей рекомендуем ознакомиться со статьей YOLO11 или основанную на трансформаторе RT-DETR.

Пример кода: Начало работы с Ultralytics

Оцените простоту Ultralytics . Переключение между моделями так же просто, как изменение строки.

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model on a custom dataset
# This handles data loading, augmentation, and training loops automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
# NMS-free architecture in YOLO26 means faster post-processing
results = model("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Комментарии