Перейти к содержанию

Обзор обнаружения объектов: PP-YOLOE+ против YOLOv6-3.0

Область компьютерного зрения в реальном времени быстро расширилась, что привело к появлению узкоспециализированных архитектур, оптимизированных для различных сценариев развертывания. Разработчики часто сравнивают PP-YOLOE+ и YOLOv6-3.0 при создании приложений, требующих баланса высокой пропускной способности и надежной точности. Обе модели привнесли существенные архитектурные улучшения при своем выпуске, сосредоточившись на повышении скорости инференса для промышленных и граничных приложений.

Прежде чем углубляться в детальный архитектурный анализ, изучите приведенную ниже диаграмму, чтобы визуализировать, как эти модели соотносятся друг с другом по скорости и точности.

PP-YOLOE+: Архитектурные преимущества и недостатки

Разработанный PaddlePaddle Authors, PP-YOLOE+ является выдающимся безякорным детектором, который, опираясь на своих предшественников, обеспечивает надежную производительность при различных требованиях к масштабу.

Основные характеристики архитектуры

PP-YOLOE+ представил несколько критически важных улучшений по сравнению с исходной архитектурой PP-YOLOE. Он использует мощный бэкбон CSPRepResNet, который эффективно балансирует вычислительные затраты с возможностями извлечения признаков. Кроме того, он включает в себя усовершенствованную сеть пирамиды признаков (FPN) в сочетании с сетью агрегации путей (PAN) для обеспечения слияния многомасштабных признаков. Одной из его выдающихся особенностей является ET-head (Efficient Task-aligned head), который значительно улучшает координацию классификации и локализации во время обнаружения объектов.

Хотя PP-YOLOE+ достигает впечатляющей средней точности (mAP), ее зависимость от экосистемы PaddlePaddle иногда может представлять собой крутую кривую обучения для исследователей, привыкших к рабочим процессам, ориентированным на PyTorch. Это может немного усложнить процесс развертывания модели при нацеливании на гетерогенные периферийные устройства, которым не хватает прямой поддержки инференции Paddle.

Контекст развертывания

PP-YOLOE+ высоко оптимизирован для развертывания в технологическом стеке Baidu, что делает его отличным выбором, если ваша производственная среда сильно зависит от инструментов вывода Paddle.

Узнайте больше о PP-YOLOE+

YOLOv6-3.0: Промышленная Пропускная Способность

Выпущенный отделом Meituan Vision AI, YOLOv6-3.0 был специально разработан как детектор объектов нового поколения для промышленных приложений, с приоритетом на высокую пропускную способность на оборудовании с GPU.

  • Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг и др.
  • Организация:Meituan
  • Дата: 2023-01-13
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

Основные характеристики архитектуры

YOLOv6-3.0 оснащен бэкбоном EfficientRep, специально разработанным для максимального использования аппаратных ресурсов, особенно на GPU NVIDIA с использованием TensorRT. Обновление v3.0 добавило модуль двунаправленной конкатенации (BiC) в шейку, улучшая сохранение пространственных признаков без значительного увеличения количества параметров. Кроме того, была представлена стратегия обучения с помощью якорей (AAT), которая объединяет преимущества стабильности на основе якорей во время обучения модели, сохраняя при этом быструю архитектуру без якорей во время вывода в реальном времени.

Однако, поскольку YOLOv6-3.0 высоко оптимизирован для серверных GPU, его выигрыш в задержке иногда уменьшается при развертывании на сильно ограниченных периферийных устройствах, работающих только на CPU. Эта специализация означает, что он превосходно работает в таких средах, как автономная видеоаналитика, но может отставать от динамически оптимизированных моделей на более мелком, локализованном оборудовании.

Узнайте больше о YOLOv6

Таблица сравнения производительности

В следующей таблице представлены ключевые метрики производительности, напрямую сравнивающие различные масштабные варианты обеих архитектур.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Сценарии использования и рекомендации

Выбор между PP-YOLOE+ и YOLOv6 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать PP-YOLOE+

PP-YOLOE+ является отличным выбором для:

  • Интеграция с экосистемой PaddlePaddle: Для организаций с существующей инфраструктурой, построенной на фреймворке и инструментарии Baidu PaddlePaddle.
  • Развертывание Paddle Lite на периферийных устройствах: Развертывание на аппаратном обеспечении с высокооптимизированными ядрами вывода специально для механизма вывода Paddle Lite или Paddle.
  • Высокоточное серверное обнаружение: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, и зависимость от фреймворка не является проблемой.

Когда выбирать YOLOv6

YOLOv6 рекомендуется для:

  • Промышленное развертывание с учетом аппаратного обеспечения: Сценарии, где аппаратно-ориентированный дизайн модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
  • Быстрое одностадийное detect: Приложения, отдающие приоритет чистой скорости инференции на GPU для обработки видео в реальном времени в контролируемых средах.
  • Интеграция в экосистему Meituan: Команды, уже работающие в технологическом стеке и инфраструктуре развертывания Meituan.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Преимущество Ultralytics: Прогресс за пределами устаревших моделей

В то время как PP-YOLOE+ и YOLOv6-3.0 предлагают целевые решения, современная разработка ИИ требует универсальных, эффективных по памяти рабочих процессов. Именно здесь платформа Ultralytics обеспечивает беспрецедентный опыт для разработчиков. С унифицированным Python API вы можете бесшовно обучать, проверять и развертывать передовые модели без огромных накладных расходов на конфигурацию, обычно встречающихся в старых исследовательских репозиториях.

Модели Ultralytics нативно поддерживают широкий спектр задач компьютерного зрения, выходящих за рамки стандартного detect, включая сегментацию экземпляров, оценку позы, классификацию изображений и извлечение ориентированных ограничивающих рамок (obb). Кроме того, они высоко оптимизированы для снижения потребления памяти во время обучения, что резко контрастирует с моделями на основе трансформеров, такими как RT-DETR, которые обычно требуют значительных объемов видеопамяти GPU.

Откройте для себя YOLO26: Новый стандарт

Для организаций, стремящихся развернуть самые передовые модели компьютерного зрения, Ultralytics YOLO26 (выпущенный в январе 2026 года) переопределяет границы производительности. Он значительно превосходит предыдущие поколения благодаря нескольким критически важным инновациям:

  • Сквозная архитектура без NMS: Основываясь на концепциях из YOLOv10, YOLO26 полностью исключает постобработку Non-Maximum Suppression (NMS). Этот изначально сквозной подход гарантирует предсказуемый вывод с ультранизкой задержкой, что критически важно для систем безопасности реального времени.
  • До 43% более быстрый инференс на CPU: Благодаря удалению Distribution Focal Loss (DFL) из архитектуры YOLO26 радикально оптимизирован для периферийных вычислений и сред, не имеющих выделенного GPU-ускорения.
  • Оптимизатор MuSGD: Интегрируя стабильность обучения LLM в модели компьютерного зрения, этот гибридный оптимизатор (вдохновленный Moonshot AI) обеспечивает быструю сходимость и высокостабильные пользовательские сеансы обучения.
  • ProgLoss + STAL: Эти передовые формулировки функций потерь обеспечивают значительные улучшения в распознавании мелких объектов, что жизненно важно для таких приложений, как аэрофотосъемка с дронов и анализ переполненных сцен.

Подготовьте ваши конвейеры к будущему

Если вы начинаете новый проект сегодня, мы настоятельно рекомендуем обойти устаревшие архитектуры и принять YOLO26. Его эффективность использования памяти и NMS-free скорость значительно упрощают вывод в продакшн.

Бесшовная реализация

Обучение и экспорт передовых моделей с использованием пакета Ultralytics Python удивительно просты. Следующий пример демонстрирует, как обучить новейшую модель YOLO26 и экспортировать ее в ONNX для быстрого развертывания на периферии:

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for edge deployment
model.export(format="onnx")

Для команд, глубоко интегрированных в старые рабочие процессы, но ищущих современную стабильность, изучение Ultralytics YOLO11 также является отличным переходным шагом, предлагая всестороннюю универсальность задач, поддерживаемую полной экосистемой Ultralytics.


Комментарии