Навигация в детектировании объектов: PP-YOLOE+ против YOLOv6-3.0
Область computer vision в реальном времени быстро расширяется, что приводит к созданию узкоспециализированных архитектур, оптимизированных для различных сценариев развертывания. Разработчики часто сравнивают PP-YOLOE+ и YOLOv6-3.0, когда создают приложения, требующие баланса между высокой пропускной способностью и надежной точностью. Обе модели привнесли существенные архитектурные улучшения при своем выпуске, сосредоточившись на увеличении скорости вывода для промышленных и периферийных приложений.
Прежде чем погружаться в детальный архитектурный разбор, изучи график ниже, чтобы визуализировать, как эти модели работают друг относительно друга с точки зрения скорости и точности.
PP-YOLOE+: архитектурные сильные и слабые стороны
Разработанная авторами PaddlePaddle, модель PP-YOLOE+ является известным детектором без привязки к якорям (anchor-free), который базируется на своих предшественниках для обеспечения надежной производительности в соответствии с различными требованиями к масштабу.
- Авторы: Авторы PaddlePaddle
- Организация: Baidu
- Дата: 2022-04-02
- Arxiv: 2203.16250
- GitHub: PaddlePaddle/PaddleDetection
Основные архитектурные особенности
PP-YOLOE+ представила несколько критических улучшений по сравнению с оригинальным дизайном PP-YOLOE. Она использует мощный бэкбон CSPRepResNet, который эффективно балансирует вычислительные затраты с возможностями извлечения признаков. Кроме того, она включает в себя продвинутую пирамидальную сеть признаков (FPN) в сочетании с сетью агрегации путей (PAN) для обеспечения слияния признаков на нескольких масштабах. Одной из ее выдающихся особенностей является ET-head (эффективная головка с выравниванием задач), которая значительно улучшает координацию классификации и локализации во время детектирования объектов.
Хотя PP-YOLOE+ достигает впечатляющей средней точности (mAP), ее зависимость от экосистемы PaddlePaddle иногда может представлять крутую кривую обучения для исследователей, привыкших к рабочим процессам на базе PyTorch. Это может немного усложнить процесс развертывания модели при работе с гетерогенными периферийными устройствами, которым не хватает прямой поддержки вывода Paddle.
PP-YOLOE+ высоко оптимизирована для развертывания в технологическом стеке Baidu, что делает ее отличным выбором, если твоя рабочая среда сильно опирается на инструменты вывода Paddle.
YOLOv6-3.0: промышленная пропускная способность
Выпущенная департаментом Meituan Vision AI, YOLOv6-3.0 была явно спроектирована как детектор объектов нового поколения для промышленных приложений, отдавая приоритет массовой пропускной способности на GPU-оборудовании.
- Авторы: Chuyi Li, Lulu Li, Yifei Geng и др.
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Основные архитектурные особенности
YOLOv6-3.0 features an EfficientRep backbone specifically tailored to maximize hardware utilization, particularly on NVIDIA GPUs using TensorRT. The v3.0 update brought a Bi-directional Concatenation (BiC) module to the neck, enhancing spatial feature retention without severely bloating the parameter count. Additionally, it introduced an Anchor-Aided Training (AAT) strategy that fuses the benefits of anchor-based stability during model training while maintaining a fast, anchor-free architecture during real-time inference.
Однако, поскольку YOLOv6-3.0 высоко оптимизирована для GPU серверного класса, ее прирост задержки иногда снижается при развертывании на сильно ограниченных периферийных устройствах только с CPU. Эта специализация означает, что она превосходна в средах типа офлайн-видеоаналитики, но может отставать от динамически оптимизированных моделей на меньшем, локализованном оборудовании.
Таблица сравнения производительности
В следующей таблице представлены ключевые показатели производительности, напрямую сравнивающие различные масштабные варианты обеих архитектур.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
| PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
| PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
| PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
| PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Варианты использования и рекомендации
Выбор между PP-YOLOE+ и YOLOv6 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.
Когда выбирать PP-YOLOE+
PP-YOLOE+ — отличный выбор для:
- Интеграция с экосистемой PaddlePaddle: организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
- Развертывание на Paddle Lite Edge: развертывание на оборудовании с высокооптимизированными ядрами вывода специально для двигателя Paddle Lite или вывода Paddle.
- Высокоточное обнаружение на стороне сервера: сценарии, отдающие приоритет максимальной точности обнаружения на мощных серверных GPU, где зависимость от фреймворка не является проблемой.
Когда выбирать YOLOv6
YOLOv6 рекомендуется для:
- Развертывания с учетом промышленного оборудования: Сценарии, где аппаратная оптимизация модели и эффективная репараметризация обеспечивают наилучшую производительность на конкретном целевом оборудовании.
- Быстрой одностадийной детекции: Приложения, ставящие во главу угла скорость логического вывода на GPU для обработки видео в реальном времени в контролируемых средах.
- Интеграции в экосистему Meituan: Команды, уже работающие внутри технологического стека и инфраструктуры развертывания Meituan.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:
- Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.
Преимущество Ultralytics: продвижение вперед за рамки устаревших моделей
Хотя PP-YOLOE+ и YOLOv6-3.0 предлагают целевые решения, современная разработка ИИ требует гибких, эффективных по памяти рабочих процессов. Именно здесь платформа Ultralytics обеспечивает непревзойденный опыт разработчика. С единым Python API ты можешь бесшовно обучать, проверять и развертывать передовые модели без огромных накладных расходов на конфигурацию, которые обычно встречаются в старых исследовательских репозиториях.
Модели Ultralytics изначально поддерживают широкий спектр задач компьютерного зрения, помимо стандартного обнаружения, включая сегментацию экземпляров, оценку позы, классификацию изображений и извлечение ориентированных ограничивающих рамок (OBB). Кроме того, они высоко оптимизированы для снижения использования памяти во время обучения — это разительный контраст по сравнению с моделями на базе Transformer, такими как RT-DETR, которые обычно требуют огромных объемов GPU VRAM.
Открой для себя YOLO26: новый стандарт
Для организаций, стремящихся развернуть лучшие современные модели компьютерного зрения, Ultralytics YOLO26 (выпущенная в январе 2026 года) переопределяет границы производительности. Она значительно превосходит старые поколения благодаря нескольким критическим инновациям:
- Сквозной дизайн без NMS: Развивая концепции YOLOv10, YOLO26 полностью устраняет постобработку немаксимального подавления (NMS). Этот естественный сквозной подход гарантирует предсказуемый инференс с ультранизкой задержкой, что критически важно для систем безопасности реального времени.
- До 43% быстрее CPU-инференс: Благодаря удалению Distribution Focal Loss (DFL) из архитектуры, YOLO26 радикально оптимизирована для периферийных вычислений и сред, лишенных выделенного GPU-ускорения.
- Оптимизатор MuSGD: Интегрируя стабильность обучения LLM в модели компьютерного зрения, этот гибридный оптимизатор (вдохновленный Moonshot AI) обеспечивает быструю сходимость и высокостабильные сессии пользовательского обучения.
- ProgLoss + STAL: Эти передовые формулировки функций потерь обеспечивают замечательные улучшения в распознавании мелких объектов, что жизненно важно для таких приложений, как аэрофотосъемка с дронов и анализ сцен с высокой плотностью.
Если ты строишь новый проект сегодня, мы настоятельно рекомендуем обходить устаревшие архитектуры и внедрять YOLO26. Ее эффективность памяти и скорость без NMS значительно облегчают вывод в продакшн.
Бесшовная реализация
Обучение и экспорт передовых моделей с использованием пакета Ultralytics Python удивительно просты. Следующий пример демонстрирует, как обучить последнюю модель YOLO26 и экспортировать ее в ONNX для быстрого развертывания на периферии:
from ultralytics import YOLO
# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model on the COCO8 example dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a test image (NMS-free speed)
predict_results = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX format for edge deployment
model.export(format="onnx")Для команд, глубоко интегрированных в старые рабочие процессы, но ищущих современную стабильность, изучение Ultralytics YOLO11 также является отличным переходным шагом, предлагающим комплексную универсальность задач при поддержке всей экосистемы Ultralytics.