Перейти к содержанию

YOLOv6-3.0 против PP-YOLOE+: Оценка промышленных детекторов объектов

При выборе фреймворка для обнаружения объектов в реальном времени инженеры по машинному обучению часто оценивают различные высокопроизводительные архитектуры. Две заметные модели в области промышленных приложений — это YOLOv6-3.0 и PP-YOLOE+. Обе модели расширили границы точности и скорости, но они адаптированы для несколько разных экосистем и аппаратного обеспечения развертывания.

Это техническое сравнение предлагает углубленный анализ их архитектур, метрик производительности и методологий обучения, а также представляет современные альтернативы, такие как Ultralytics YOLO26, которые обеспечивают превосходную универсальность и простоту использования.

YOLOv6-3.0: Высокопроизводительный промышленный движок

Разработанный отделом Vision AI в Meituan, YOLOv6-3.0 значительно оптимизирован для промышленных сред, особенно тех, которые используют мощные серверные GPU.

  • Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
  • Организация: Meituan
  • Дата: 13.01.2023
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Архитектурные инновации

YOLOv6-3.0 использует бэкбон EfficientRep, специально разработанный для максимального использования аппаратных ускорителей, таких как NVIDIA GPU. Архитектура представляет модуль двунаправленной конкатенации (BiC) в шейке, значительно улучшая слияние многомасштабных признаков. Кроме того, он включает стратегию обучения с помощью якорей (AAT). Этот гибридный подход обладает надежными характеристиками сходимости сетей на основе якорей во время фазы обучения, отбрасывая якоря во время инференса для поддержания высокой скорости, характерной для безякорных парадигм.

Узнайте больше о YOLOv6

PP-YOLOE+: Чемпион PaddlePaddle по detect

PP-YOLOE+ — это эволюция серии PP-YOLO, разработанная полностью в рамках PaddlePaddle исследователями Baidu. Он превосходно работает в средах, где экосистема Paddle уже создана.

Архитектурные инновации

PP-YOLOE+ — это безанкерный детектор, который представляет стратегию динамического присвоения меток, известную как TAL (Task Alignment Learning). Он использует backbone CSPRepResNet, который эффективно захватывает семантические признаки, сохраняя при этом вычислительную эффективность. Модель сильно оптимизирована для развертывания через TensorRT и OpenVINO, что делает ее сильным кандидатом для развертывания на периферийных устройствах и серверах, при условии, что пользователь знаком с API PaddlePaddle.

Узнайте больше о PP-YOLOE+

Соображения по выбору фреймворка

Хотя PP-YOLOE+ демонстрирует отличные результаты, ее зависимость от PaddlePaddle может представлять собой кривую обучения для инженеров, привыкших к PyTorch. Использование унифицированного фреймворка, такого как Ultralytics, может значительно сократить время настройки.

Сравнение производительности

Оценка этих моделей требует рассмотрения их баланса между средней точностью (mAP) и скоростью инференса. В таблице ниже приведена их производительность на валидационном наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Хотя обе модели демонстрируют высокую производительность, YOLOv6-3.0 обычно имеет небольшое преимущество в чистой скорости TensorRT при меньших размерах моделей, что делает ее очень эффективной для высокоскоростной автоматизированной кассы или обнаружения производственных дефектов. Напротив, PP-YOLOE+ хорошо масштабируется до большего числа параметров для достижения максимальной точности.

Преимущество Ultralytics: Представляем YOLO26

Хотя YOLOv6-3.0 и PP-YOLOE+ обладают высокой производительностью, быстрая эволюция компьютерного зрения требует архитектур, которые предлагают не только высокую скорость, но и исключительную простоту использования, более низкие требования к памяти и унифицированную экосистему. Именно здесь модели Ultralytics YOLO, в частности YOLO11 и передовая YOLO26, переосмысливают современное состояние технологий.

Выпущенный в январе 2026 года, YOLO26 устанавливает новый стандарт для периферийного и облачного ИИ-зрения, предлагая значительные преимущества перед устаревшими моделями:

  • Сквозная архитектура без NMS: Основываясь на принципах, заложенных YOLOv10, YOLO26 изначально исключает подавление немаксимумов (NMS) на этапе постобработки. Это значительно упрощает логику развертывания и снижает изменчивость задержки в сценах с большим количеством объектов.
  • До 43% более быстрая инференция на CPU: За счет стратегического удаления Distribution Focal Loss (DFL), YOLO26 значительно ускоряет производительность CPU, что делает его значительно превосходящим YOLOv6 или PP-YOLOE+ для IoT-устройств и мобильных приложений.
  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM (такими как Kimi K2 от Moonshot AI), гибридный оптимизатор MuSGD обеспечивает невероятно стабильное и эффективное обучение, сходясь быстрее, чем традиционные SGD или AdamW.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что является критическим фактором для изображений с дронов и воздушного наблюдения.
  • Универсальность для различных задач: В отличие от YOLOv6-3.0, который сильно сфокусирован на обнаружении, YOLO26 поддерживает сегментацию экземпляров, оценку позы, классификацию и обнаружение ориентированных ограничивающих рамок (OBB) из коробки.

Оптимизированная экосистема обучения

Развертывание PP-YOLOE+ требует управления средой PaddlePaddle, в то время как YOLOv6-3.0 требует работы с исследовательскими скриптами. В отличие от этого, платформа Ultralytics обеспечивает бесшовный опыт от новичка до эксперта.

Обучение передовой модели YOLO26 требует всего нескольких строк Python-кода:

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

Этот простой API, в сочетании с меньшим потреблением памяти во время обучения по сравнению с моделями, интенсивно использующими трансформеры, такими как RT-DETR, демократизирует высокопроизводительный ИИ.

Идеальные варианты использования и стратегии развертывания

Выбор правильной модели определяет успех вашего конвейера развертывания.

Когда использовать YOLOv6-3.0

  • Высокоскоростное производство: Среды, где промышленные камеры напрямую передают данные на выделенные GPU NVIDIA T4 или A100, требуя стабильного инференса менее 5 мс.
  • Серверная видеоаналитика: Обработка нескольких плотных видеопотоков, где чистая пропускная способность GPU является основным узким местом.

Когда использовать PP-YOLOE+

  • Экосистемы Baidu/Paddle: Корпоративные среды, активно использующие технологический стек PaddlePaddle или развертывающие решения на оборудовании, оптимизированном для инструментария Baidu.
  • Высокоточные статические изображения: Сценарии, где высокий mAP модели Extra-Large (PP-YOLOE+x) более критичен, чем скорость развертывания на периферийных устройствах.

Когда стоит выбрать Ultralytics YOLO26

  • Периферийные и IoT-устройства: Благодаря своей NMS-free архитектуре и удалению DFL, YOLO26 является бесспорным выбором для развертывания на Raspberry Pi, NXP или мобильных CPU.
  • Многозадачные приложения: Проекты, требующие одновременного отслеживания объектов, оценки позы или сегментации с использованием унифицированного API.
  • Быстрое прототипирование до производства: Команды, использующие Ultralytics Platform для оптимизированной аннотации наборов данных, настройки гиперпараметров и развертывания моделей в один клик.

Для разработчиков, желающих изучить более широкий спектр моделей обнаружения, фреймворки, такие как YOLOX и DAMO-YOLO, также предлагают уникальные архитектурные подходы, которые стоит рассмотреть в документации Ultralytics.


Комментарии