Meet YOLO26: next-gen vision AI.

Link to this sectionPP-YOLOE+ против YOLOX#

Ландшафт computer vision претерпел значительные изменения благодаря стремительной эволюции моделей детектирования объектов. Среди примечательных вех на этом пути — PP-YOLOE+ и YOLOX, две архитектуры, раздвинувшие границы производительности в реальном времени и точности. Понимание их архитектурных нюансов, компромиссов в производительности и оптимальных сценариев развертывания критически важно для исследователей и разработчиков, создающих системы визуального распознавания нового поколения.

Link to this sectionПроисхождение и детали моделей#

Прежде чем погружаться в технические архитектуры, полезно контекстуализировать происхождение обеих моделей. Каждая из них была разработана для решения конкретных «узких мест» в object detection под значительным влиянием организаций, стоящих за ними.

Подробности PP-YOLOE+:

Узнай больше о PP-YOLOE+

Подробности YOLOX:

Узнай больше о YOLOX

Link to this sectionАрхитектурные инновации#

Основные различия между этими двумя детекторами заключаются в их подходе к извлечению признаков и прогнозированию BBox.

YOLOX произвел фурор в 2021 году, успешно адаптировав семейство YOLO к anchor-free дизайну. Убрав anchor boxes, YOLOX значительно сократил количество параметров проектирования и эвристической настройки, требуемых для пользовательских наборов данных. Кроме того, он представил разделенную голову (decoupled head), которая отделяет задачи классификации и локализации в разные нейронные пути. Это разделение разрешило внутренний конфликт между классификацией объекта и регрессией его пространственных координат, что привело к более быстрой сходимости во время обучения.

PP-YOLOE+, разработанный Baidu, сильно оптимизирован под экосистему PaddlePaddle. Он основывается на своем предшественнике, PP-YOLOv2, внедряя стратегию динамического назначения меток (TAL) и новую архитектуру backbone под названием CSPRepResNet. Этот backbone использует структурную репараметризацию, позволяя модели выигрывать от сложных многоветвевых архитектур во время обучения, плавно переходя в быструю однопутную сеть для вывода.

Структурная репараметризация

Структурная репараметризация позволяет модели обучаться с несколькими параллельными ветвями (улучшая градиентный поток), а затем математически свернуть эти ветви в один сверточный слой для развертывания, повышая скорость вывода без ущерба для точности.

Link to this sectionСравнение производительности и метрик#

При прямом сравнении этих моделей становится очевидно, что они служат немного разным целям в спектре производительности. PP-YOLOE+ обычно достигает более высокой абсолютной точности, в то время как YOLOX превосходит конкурента в предоставлении чрезвычайно легких вариантов, подходящих для сильно ограниченного оборудования.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Примечание: Значения с наилучшей производительностью в каждом соответствующем сегменте столбца выделены жирным шрифтом.

В то время как YOLOX предлагает версии nano и tiny, которые почти не занимают места на диске или памяти CUDA, PP-YOLOE+ отлично масштабируется до оборудования серверного уровня, что делает его надежным выбором для тяжелых промышленных приложений в экосистеме Baidu.

Link to this sectionПрименение в реальных условиях#

Выбор между этими фреймворками часто сводится к требованиям интеграции и целевому оборудованию.

Link to this sectionВ чем YOLOX превосходит#

Благодаря своей anchor-free природе и наличию вариантов для экстремально граничных вычислений, YOLOX популярен в robotics и развертывании на микроконтроллерах. Его простой конвейер постобработки позволяет легче переносить модель на специализированные форматы NPU, такие как TensorRT и NCNN.

Link to this sectionВ чем превосходит PP-YOLOE+#

Для организаций, глубоко интегрированных в азиатские производственные хабы и использующих технологический стек Baidu, PP-YOLOE+ предоставляет предварительно оптимизированный путь к развертыванию. Он блистает в сценариях высокоточного quality inspection, работающих на мощных серверных стойках, где строгие ограничения по времени позволяют использовать немного более тяжелые веса модели.

Link to this sectionСценарии использования и рекомендации#

Выбор между PP-YOLOE+ и YOLOX зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в отношении экосистемы.

Link to this sectionКогда выбирать PP-YOLOE+#

PP-YOLOE+ — это сильный выбор в следующих случаях:

  • Интеграция с экосистемой PaddlePaddle: Организации с существующей инфраструктурой, построенной на фреймворке и инструментах Baidu PaddlePaddle.
  • Развертывание на периферии с Paddle Lite: Развертывание на оборудовании с высокооптимизированными ядрами вывода, специально предназначенными для движка Paddle Lite или Paddle.
  • Серверное обнаружение с высокой точностью: Сценарии, где приоритетом является максимальная точность обнаружения на мощных GPU-серверах, где зависимость от фреймворка не является проблемой.

Link to this sectionКогда выбирать YOLOX#

YOLOX рекомендуется для:

  • Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
  • Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
  • Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionПреимущество Ultralytics: знакомься с YOLO26#

Хотя PP-YOLOE+ и YOLOX представляют собой отличные исследовательские достижения, современный ландшафт развертывания требует более целостного, дружелюбного к разработчику опыта с превосходной эффективностью. Именно здесь Ultralytics YOLO26 полностью переопределяет стандарты современного визуального ИИ.

Для команд, стремящихся перейти от изолированных исследовательских репозиториев к готовым к эксплуатации системам, Ultralytics предлагает надежную, хорошо поддерживаемую экосистему. Обучение модели больше не требует настройки сложных сред; это так же просто, как использование единого Python API.

Ключевые преимущества Ultralytics YOLO26 включают:

  • End-to-End NMS-Free дизайн: В отличие от PP-YOLOE+ и YOLOX, которым требуется Non-Maximum Suppression (NMS) для фильтрации избыточных BBox, YOLO26 является нативно end-to-end решением. Это устраняет узкие места по задержке и радикально упрощает логику развертывания.
  • До 43% быстрее вывод на CPU: Стратегически удалив Distribution Focal Loss (DFL), YOLO26 достигает непревзойденной скорости вывода на аппаратном обеспечении CPU, что делает его гораздо более эффективным для edge computing и маломощных устройств.
  • Оптимизатор MuSGD: Вдохновленный Kimi K2 от Moonshot AI, этот гибридный оптимизатор привносит стабильность обучения LLM в computer vision, обеспечивая гораздо более быструю сходимость и минимизируя требования к памяти на этапах обучения.
  • ProgLoss + STAL: Эти продвинутые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов — критически важная особенность для drone operations и детальной аэрофотосъемки.
  • Универсальность: В то время как PP-YOLOE+ и YOLOX фокусируются исключительно на детекции, YOLO26 легко справляется с instance segmentation, pose estimation и Oriented Bounding Boxes (OBB), используя тот же интуитивно понятный синтаксис.

Узнай больше о YOLO26

Link to this sectionОптимизированное обучение с Ultralytics#

Эффективность использования памяти и скорость обучения моделей Ultralytics не имеют аналогов, полностью превосходя альтернативы на базе Transformer, которые требуют огромных затрат памяти CUDA. Ты можешь использовать мощь YOLO26 всего в нескольких строках кода:

from ultralytics import YOLO

# Load the highly efficient, end-to-end YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with built-in auto-batching and MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
metrics = model.val()

# Export seamlessly to ONNX or TensorRT
model.export(format="engine")
Изучи платформу Ultralytics

Для команд, ищущих решение no-code, Ultralytics Platform предоставляет облачное обучение, интегрированную разметку наборов данных и развертывание в один клик для всех твоих моделей YOLO.

Link to this sectionЗаключение#

И PP-YOLOE+, и YOLOX заняли свое место в истории computer vision, предлагая высокую точность и легкие anchor-free дизайны соответственно. Однако для организаций, строящих будущее AI in agriculture, умных городов и ритейла, постоянная поддержка, простота использования и нативная NMS-free архитектура Ultralytics YOLO26 делают его бесспорным выбором.

Если ты изучаешь альтернативные архитектуры для конкретных бенчмарков, ты также можешь найти пользу в сравнении более старых вариантов, таких как YOLO11 или опций на базе Transformer, таких как RT-DETR, через исчерпывающую документацию Ultralytics. Переходя на единую экосистему Ultralytics, разработчики экономят бесценное время и ресурсы, достигая при этом результатов state-of-the-art на любом edge или облачном развертывании.

Участники

Комментарии