Навигация в детектировании объектов: PP-YOLOE+ против YOLOv6-3.0

Область computer vision в реальном времени быстро расширяется, что приводит к созданию узкоспециализированных архитектур, оптимизированных для различных сценариев развертывания. Разработчики часто сравнивают PP-YOLOE+ и YOLOv6-3.0, когда создают приложения, требующие баланса между высокой пропускной способностью и надежной точностью. Обе модели привнесли существенные архитектурные улучшения при своем выпуске, сосредоточившись на увеличении скорости вывода для промышленных и периферийных приложений.

Прежде чем погружаться в детальный архитектурный разбор, изучи график ниже, чтобы визуализировать, как эти модели работают друг относительно друга с точки зрения скорости и точности.

PP-YOLOE+: архитектурные сильные и слабые стороны

Разработанная авторами PaddlePaddle, модель PP-YOLOE+ является известным детектором без привязки к якорям (anchor-free), который базируется на своих предшественниках для обеспечения надежной производительности в соответствии с различными требованиями к масштабу.

Основные архитектурные особенности

PP-YOLOE+ представила несколько критических улучшений по сравнению с оригинальным дизайном PP-YOLOE. Она использует мощный бэкбон CSPRepResNet, который эффективно балансирует вычислительные затраты с возможностями извлечения признаков. Кроме того, она включает в себя продвинутую пирамидальную сеть признаков (FPN) в сочетании с сетью агрегации путей (PAN) для обеспечения слияния признаков на нескольких масштабах. Одной из ее выдающихся особенностей является ET-head (эффективная головка с выравниванием задач), которая значительно улучшает координацию классификации и локализации во время детектирования объектов.

Хотя PP-YOLOE+ достигает впечатляющей средней точности (mAP), ее зависимость от экосистемы PaddlePaddle иногда может представлять крутую кривую обучения для исследователей, привыкших к рабочим процессам на базе PyTorch. Это может немного усложнить процесс развертывания модели при работе с гетерогенными периферийными устройствами, которым не хватает прямой поддержки вывода Paddle.

Контекст развертывания

PP-YOLOE+ высоко оптимизирована для развертывания в технологическом стеке Baidu, что делает ее отличным выбором, если твоя рабочая среда сильно опирается на инструменты вывода Paddle.

Узнай больше о PP-YOLOE+

YOLOv6-3.0: промышленная пропускная способность

Выпущенная департаментом Meituan Vision AI, YOLOv6-3.0 была явно спроектирована как детектор объектов нового поколения для промышленных приложений, отдавая приоритет массовой пропускной способности на GPU-оборудовании.

Основные архитектурные особенности

YOLOv6-3.0 features an EfficientRep backbone specifically tailored to maximize hardware utilization, particularly on NVIDIA GPUs using TensorRT. The v3.0 update brought a Bi-directional Concatenation (BiC) module to the neck, enhancing spatial feature retention without severely bloating the parameter count. Additionally, it introduced an Anchor-Aided Training (AAT) strategy that fuses the benefits of anchor-based stability during model training while maintaining a fast, anchor-free architecture during real-time inference.

Однако, поскольку YOLOv6-3.0 высоко оптимизирована для GPU серверного класса, ее прирост задержки иногда снижается при развертывании на сильно ограниченных периферийных устройствах только с CPU. Эта специализация означает, что она превосходна в средах типа офлайн-видеоаналитики, но может отставать от динамически оптимизированных моделей на меньшем, локализованном оборудовании.

Узнай больше о YOLOv6

Таблица сравнения производительности

В следующей таблице представлены ключевые показатели производительности, напрямую сравнивающие различные масштабные варианты обеих архитектур.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Варианты использования и рекомендации

Выбор между PP-YOLOE+ и YOLOv6 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать PP-YOLOE+

PP-YOLOE+ — отличный выбор для:

  • Интеграция с экосистемой PaddlePaddle: организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
  • Развертывание на Paddle Lite Edge: развертывание на оборудовании с высокооптимизированными ядрами вывода специально для двигателя Paddle Lite или вывода Paddle.
  • Высокоточное обнаружение на стороне сервера: сценарии, отдающие приоритет максимальной точности обнаружения на мощных серверных GPU, где зависимость от фреймворка не является проблемой.

Когда выбирать YOLOv6

YOLOv6 рекомендуется для:

  • Развертывания с учетом промышленного оборудования: Сценарии, где аппаратная оптимизация модели и эффективная репараметризация обеспечивают наилучшую производительность на конкретном целевом оборудовании.
  • Быстрой одностадийной детекции: Приложения, ставящие во главу угла скорость логического вывода на GPU для обработки видео в реальном времени в контролируемых средах.
  • Интеграции в экосистему Meituan: Команды, уже работающие внутри технологического стека и инфраструктуры развертывания Meituan.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Преимущество Ultralytics: продвижение вперед за рамки устаревших моделей

Хотя PP-YOLOE+ и YOLOv6-3.0 предлагают целевые решения, современная разработка ИИ требует гибких, эффективных по памяти рабочих процессов. Именно здесь платформа Ultralytics обеспечивает непревзойденный опыт разработчика. С единым Python API ты можешь бесшовно обучать, проверять и развертывать передовые модели без огромных накладных расходов на конфигурацию, которые обычно встречаются в старых исследовательских репозиториях.

Модели Ultralytics изначально поддерживают широкий спектр задач компьютерного зрения, помимо стандартного обнаружения, включая сегментацию экземпляров, оценку позы, классификацию изображений и извлечение ориентированных ограничивающих рамок (OBB). Кроме того, они высоко оптимизированы для снижения использования памяти во время обучения — это разительный контраст по сравнению с моделями на базе Transformer, такими как RT-DETR, которые обычно требуют огромных объемов GPU VRAM.

Открой для себя YOLO26: новый стандарт

Для организаций, стремящихся развернуть лучшие современные модели компьютерного зрения, Ultralytics YOLO26 (выпущенная в январе 2026 года) переопределяет границы производительности. Она значительно превосходит старые поколения благодаря нескольким критическим инновациям:

  • Сквозной дизайн без NMS: Развивая концепции YOLOv10, YOLO26 полностью устраняет постобработку немаксимального подавления (NMS). Этот естественный сквозной подход гарантирует предсказуемый инференс с ультранизкой задержкой, что критически важно для систем безопасности реального времени.
  • До 43% быстрее CPU-инференс: Благодаря удалению Distribution Focal Loss (DFL) из архитектуры, YOLO26 радикально оптимизирована для периферийных вычислений и сред, лишенных выделенного GPU-ускорения.
  • Оптимизатор MuSGD: Интегрируя стабильность обучения LLM в модели компьютерного зрения, этот гибридный оптимизатор (вдохновленный Moonshot AI) обеспечивает быструю сходимость и высокостабильные сессии пользовательского обучения.
  • ProgLoss + STAL: Эти передовые формулировки функций потерь обеспечивают замечательные улучшения в распознавании мелких объектов, что жизненно важно для таких приложений, как аэрофотосъемка с дронов и анализ сцен с высокой плотностью.
Подготовь свои пайплайны к будущему

Если ты строишь новый проект сегодня, мы настоятельно рекомендуем обходить устаревшие архитектуры и внедрять YOLO26. Ее эффективность памяти и скорость без NMS значительно облегчают вывод в продакшн.

Бесшовная реализация

Обучение и экспорт передовых моделей с использованием пакета Ultralytics Python удивительно просты. Следующий пример демонстрирует, как обучить последнюю модель YOLO26 и экспортировать ее в ONNX для быстрого развертывания на периферии:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

Для команд, глубоко интегрированных в старые рабочие процессы, но ищущих современную стабильность, изучение Ultralytics YOLO11 также является отличным переходным шагом, предлагающим комплексную универсальность задач при поддержке всей экосистемы Ultralytics.

Комментарии