Обзор обнаружения объектов: PP-YOLOE+ против YOLOv6-3.0
Область компьютерного зрения в реальном времени быстро расширилась, что привело к появлению узкоспециализированных архитектур, оптимизированных для различных сценариев развертывания. Разработчики часто сравнивают PP-YOLOE+ и YOLOv6-3.0 при создании приложений, требующих баланса высокой пропускной способности и надежной точности. Обе модели привнесли существенные архитектурные улучшения при своем выпуске, сосредоточившись на повышении скорости инференса для промышленных и граничных приложений.
Прежде чем углубляться в детальный архитектурный анализ, изучите приведенную ниже диаграмму, чтобы визуализировать, как эти модели соотносятся друг с другом по скорости и точности.
PP-YOLOE+: Архитектурные преимущества и недостатки
Разработанный PaddlePaddle Authors, PP-YOLOE+ является выдающимся безякорным детектором, который, опираясь на своих предшественников, обеспечивает надежную производительность при различных требованиях к масштабу.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv:2203.16250
- GitHub:PaddlePaddle/PaddleDetection
Основные характеристики архитектуры
PP-YOLOE+ представил несколько критически важных улучшений по сравнению с исходной архитектурой PP-YOLOE. Он использует мощный бэкбон CSPRepResNet, который эффективно балансирует вычислительные затраты с возможностями извлечения признаков. Кроме того, он включает в себя усовершенствованную сеть пирамиды признаков (FPN) в сочетании с сетью агрегации путей (PAN) для обеспечения слияния многомасштабных признаков. Одной из его выдающихся особенностей является ET-head (Efficient Task-aligned head), который значительно улучшает координацию классификации и локализации во время обнаружения объектов.
Хотя PP-YOLOE+ достигает впечатляющей средней точности (mAP), ее зависимость от экосистемы PaddlePaddle иногда может представлять собой крутую кривую обучения для исследователей, привыкших к рабочим процессам, ориентированным на PyTorch. Это может немного усложнить процесс развертывания модели при нацеливании на гетерогенные периферийные устройства, которым не хватает прямой поддержки инференции Paddle.
Контекст развертывания
PP-YOLOE+ высоко оптимизирован для развертывания в технологическом стеке Baidu, что делает его отличным выбором, если ваша производственная среда сильно зависит от инструментов вывода Paddle.
YOLOv6-3.0: Промышленная Пропускная Способность
Выпущенный отделом Meituan Vision AI, YOLOv6-3.0 был специально разработан как детектор объектов нового поколения для промышленных приложений, с приоритетом на высокую пропускную способность на оборудовании с GPU.
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг и др.
- Организация:Meituan
- Дата: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
Основные характеристики архитектуры
YOLOv6-3.0 оснащен бэкбоном EfficientRep, специально разработанным для максимального использования аппаратных ресурсов, особенно на GPU NVIDIA с использованием TensorRT. Обновление v3.0 добавило модуль двунаправленной конкатенации (BiC) в шейку, улучшая сохранение пространственных признаков без значительного увеличения количества параметров. Кроме того, была представлена стратегия обучения с помощью якорей (AAT), которая объединяет преимущества стабильности на основе якорей во время обучения модели, сохраняя при этом быструю архитектуру без якорей во время вывода в реальном времени.
Однако, поскольку YOLOv6-3.0 высоко оптимизирован для серверных GPU, его выигрыш в задержке иногда уменьшается при развертывании на сильно ограниченных периферийных устройствах, работающих только на CPU. Эта специализация означает, что он превосходно работает в таких средах, как автономная видеоаналитика, но может отставать от динамически оптимизированных моделей на более мелком, локализованном оборудовании.
Таблица сравнения производительности
В следующей таблице представлены ключевые метрики производительности, напрямую сравнивающие различные масштабные варианты обеих архитектур.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Сценарии использования и рекомендации
Выбор между PP-YOLOE+ и YOLOv6 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.
Когда следует выбирать PP-YOLOE+
PP-YOLOE+ является отличным выбором для:
- Интеграция с экосистемой PaddlePaddle: Для организаций с существующей инфраструктурой, построенной на фреймворке и инструментарии Baidu PaddlePaddle.
- Развертывание Paddle Lite на периферийных устройствах: Развертывание на аппаратном обеспечении с высокооптимизированными ядрами вывода специально для механизма вывода Paddle Lite или Paddle.
- Высокоточное серверное обнаружение: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, и зависимость от фреймворка не является проблемой.
Когда выбирать YOLOv6
YOLOv6 рекомендуется для:
- Промышленное развертывание с учетом аппаратного обеспечения: Сценарии, где аппаратно-ориентированный дизайн модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
- Быстрое одностадийное detect: Приложения, отдающие приоритет чистой скорости инференции на GPU для обработки видео в реальном времени в контролируемых средах.
- Интеграция в экосистему Meituan: Команды, уже работающие в технологическом стеке и инфраструктуре развертывания Meituan.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Преимущество Ultralytics: Прогресс за пределами устаревших моделей
В то время как PP-YOLOE+ и YOLOv6-3.0 предлагают целевые решения, современная разработка ИИ требует универсальных, эффективных по памяти рабочих процессов. Именно здесь платформа Ultralytics обеспечивает беспрецедентный опыт для разработчиков. С унифицированным Python API вы можете бесшовно обучать, проверять и развертывать передовые модели без огромных накладных расходов на конфигурацию, обычно встречающихся в старых исследовательских репозиториях.
Модели Ultralytics нативно поддерживают широкий спектр задач компьютерного зрения, выходящих за рамки стандартного detect, включая сегментацию экземпляров, оценку позы, классификацию изображений и извлечение ориентированных ограничивающих рамок (obb). Кроме того, они высоко оптимизированы для снижения потребления памяти во время обучения, что резко контрастирует с моделями на основе трансформеров, такими как RT-DETR, которые обычно требуют значительных объемов видеопамяти GPU.
Откройте для себя YOLO26: Новый стандарт
Для организаций, стремящихся развернуть самые передовые модели компьютерного зрения, Ultralytics YOLO26 (выпущенный в январе 2026 года) переопределяет границы производительности. Он значительно превосходит предыдущие поколения благодаря нескольким критически важным инновациям:
- Сквозная архитектура без NMS: Основываясь на концепциях из YOLOv10, YOLO26 полностью исключает постобработку Non-Maximum Suppression (NMS). Этот изначально сквозной подход гарантирует предсказуемый вывод с ультранизкой задержкой, что критически важно для систем безопасности реального времени.
- До 43% более быстрый инференс на CPU: Благодаря удалению Distribution Focal Loss (DFL) из архитектуры YOLO26 радикально оптимизирован для периферийных вычислений и сред, не имеющих выделенного GPU-ускорения.
- Оптимизатор MuSGD: Интегрируя стабильность обучения LLM в модели компьютерного зрения, этот гибридный оптимизатор (вдохновленный Moonshot AI) обеспечивает быструю сходимость и высокостабильные пользовательские сеансы обучения.
- ProgLoss + STAL: Эти передовые формулировки функций потерь обеспечивают значительные улучшения в распознавании мелких объектов, что жизненно важно для таких приложений, как аэрофотосъемка с дронов и анализ переполненных сцен.
Подготовьте ваши конвейеры к будущему
Если вы начинаете новый проект сегодня, мы настоятельно рекомендуем обойти устаревшие архитектуры и принять YOLO26. Его эффективность использования памяти и NMS-free скорость значительно упрощают вывод в продакшн.
Бесшовная реализация
Обучение и экспорт передовых моделей с использованием пакета Ultralytics Python удивительно просты. Следующий пример демонстрирует, как обучить новейшую модель YOLO26 и экспортировать ее в ONNX для быстрого развертывания на периферии:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")
Для команд, глубоко интегрированных в старые рабочие процессы, но ищущих современную стабильность, изучение Ultralytics YOLO11 также является отличным переходным шагом, предлагая всестороннюю универсальность задач, поддерживаемую полной экосистемой Ultralytics.