Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 против PP-YOLOE+#

Выбирая фреймворк для детектирования объектов в реальном времени, ML-инженеры часто оценивают множество высокопроизводительных архитектур. Две примечательные модели в области промышленных приложений — это YOLOv6-3.0 и PP-YOLOE+. Обе модели расширили границы точности и скорости, однако они оптимизированы для несколько разных экосистем и оборудования для развертывания.

Этот технический обзор содержит подробный анализ их архитектур, показателей производительности и методологий обучения, а также знакомит с современными альтернативами, такими как Ultralytics YOLO26, которые предлагают превосходную универсальность и простоту использования.

Link to this sectionYOLOv6-3.0: Высокопроизводительный промышленный движок#

Разработанная Vision AI Department в Meituan, модель YOLOv6-3.0 глубоко оптимизирована для промышленных сред, особенно для тех, где используются мощные серверные GPU.

  • Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
  • Организация: Meituan
  • Дата: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionАрхитектурные инновации#

YOLOv6-3.0 использует бэкбон EfficientRep, специально разработанный для максимального использования аппаратных ускорителей, таких как NVIDIA GPU. Архитектура внедряет модуль Bi-directional Concatenation (BiC) внутри шеи (neck), что значительно улучшает слияние многомасштабных признаков. Кроме того, она включает стратегию Anchor-Aided Training (AAT). Этот гибридный подход использует преимущества устойчивой сходимости anchor-based сетей на этапе обучения, при этом отказываясь от анкоров во время инференса для поддержания высокой скорости, характерной для anchor-free парадигм.

Узнай больше о YOLOv6

Link to this sectionPP-YOLOE+: Чемпион по детектированию от PaddlePaddle#

PP-YOLOE+ — это эволюция серии PP-YOLO, полностью разработанная в рамках фреймворка PaddlePaddle исследователями Baidu. Она отлично работает в средах, где экосистема Paddle уже установлена.

Link to this sectionАрхитектурные инновации#

PP-YOLOE+ — это anchor-free детектор, который внедряет стратегию динамического назначения меток, известную как TAL (Task Alignment Learning). Он использует бэкбон CSPRepResNet, который эффективно захватывает семантические признаки, сохраняя вычислительную эффективность. Модель высоко оптимизирована для развертывания через TensorRT и OpenVINO, что делает ее сильным претендентом для Edge и серверного развертывания, при условии, что ты комфортно работаешь с PaddlePaddle API.

Узнай больше о PP-YOLOE+

Особенности фреймворков

Хотя PP-YOLOE+ дает отличные результаты, зависимость от PaddlePaddle может создать определенный порог вхождения для инженеров, привыкших к PyTorch. Использование унифицированного фреймворка, такого как Ultralytics, может значительно сократить время настройки.

Link to this sectionСравнение производительности#

Оценка этих моделей требует анализа их баланса mean average precision (mAP) и скорости инференса. В таблице ниже показана их производительность на валидационном датасете COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Хотя обе модели показывают отличную производительность, YOLOv6-3.0, как правило, сохраняет небольшое преимущество в «чистой» скорости TensorRT на моделях меньшего размера, что делает ее крайне эффективной для высокоскоростной автоматизированной кассы или обнаружения дефектов на производстве. И наоборот, PP-YOLOE+ хорошо масштабируется до большего количества параметров для обеспечения максимальной точности.

Link to this sectionПреимущество Ultralytics: представляем YOLO26#

Несмотря на высокую эффективность YOLOv6-3.0 и PP-YOLOE+, стремительная эволюция computer vision требует архитектур, которые предлагают не только «чистую» скорость, но и исключительную простоту использования, сниженные требования к памяти и унифицированную экосистему. Именно здесь модели Ultralytics YOLO, особенно YOLO11 и передовая YOLO26, переопределяют состояние технологий.

Выпущенная в январе 2026 года, YOLO26 устанавливает новый стандарт для Edge- и облачных AI-решений, предлагая значительные преимущества перед устаревшими моделями:

  • Дизайн без NMS (End-to-End): Опираясь на фундамент, заложенный YOLOv10, YOLO26 нативно исключает Non-Maximum Suppression (NMS) при постобработке. Это значительно упрощает логику развертывания и снижает вариативность задержек в перегруженных сценах.
  • До 43% быстрее инференс на CPU: Стратегически удалив Distribution Focal Loss (DFL), YOLO26 кардинально ускоряет производительность CPU, делая модель значительно превосходящей YOLOv6 или PP-YOLOE+ для IoT-устройств и мобильных приложений.
  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM (такими как Kimi K2 от Moonshot AI), гибридный оптимизатор MuSGD обеспечивает невероятно стабильное и эффективное обучение, сходясь быстрее традиционных SGD или AdamW.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что является критически важным фактором для съемки с дронов и воздушного наблюдения.
  • Универсальность в задачах: В отличие от YOLOv6-3.0, которая ориентирована в основном на детекцию, YOLO26 из коробки поддерживает instance segmentation, pose estimation, classification и Oriented Bounding Box (OBB) детекцию.

Link to this sectionОптимизированная экосистема обучения#

Развертывание PP-YOLOE+ требует управления окружением PaddlePaddle, в то время как YOLOv6-3.0 требует работы с исследовательскими скриптами. Напротив, Ultralytics Platform обеспечивает бесшовный опыт «с нуля до результата».

Обучение state-of-the-art модели YOLO26 требует всего нескольких строк на Python:

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's accuracy
metrics = model.val()

# Export seamlessly to OpenVINO or TensorRT
path = model.export(format="engine")

Этот простой API в сочетании с меньшим потреблением памяти во время обучения по сравнению с моделями на базе Transformer, такими как RT-DETR, делает высокопроизводительный AI доступным для каждого.

Link to this sectionИдеальные варианты использования и стратегии развертывания#

Выбор подходящей модели определяет успех твоего пайплайна развертывания.

Link to this sectionКогда использовать YOLOv6-3.0#

  • Высокоскоростное производство: Среды, где промышленные камеры передают данные напрямую на выделенные GPU NVIDIA T4 или A100, требующие стабильного инференса быстрее 5 мс.
  • Серверная видеоаналитика: Обработка множества плотных видеопотоков, где чистая GPU пропускная способность является основным «бутылочным горлышком».

Link to this sectionКогда использовать PP-YOLOE+#

  • Экосистемы Baidu/Paddle: Корпоративные среды, глубоко интегрированные в технологический стек PaddlePaddle или развертывающиеся специально на оборудовании, оптимизированном под тулчейн Baidu.
  • Высокоточная работа со статичными изображениями: Сценарии, где высокий mAP модели Extra-Large (PP-YOLOE+x) важнее скорости развертывания на Edge-устройствах.

Link to this sectionКогда выбирать Ultralytics YOLO26#

  • Edge и IoT устройства: Благодаря дизайну без NMS и удалению DFL, YOLO26 является бесспорным выбором для развертывания на Raspberry Pi, NXP или мобильных CPU.
  • Многозадачные приложения: Проекты, требующие одновременного отслеживания объектов, оценки позы или сегментации с использованием унифицированного API.
  • От быстрого прототипирования до продакшена: Команды, использующие Ultralytics Platform для оптимизированной разметки датасетов, настройки гиперпараметров и развертывания моделей в один клик.

Для разработчиков, желающих изучить более широкий спектр моделей детекции, такие фреймворки, как YOLOX и DAMO-YOLO, также предлагают уникальные архитектурные подходы, которые стоит рассмотреть в документации Ultralytics.

Участники

Комментарии