YOLOX против YOLO26: эволюция от безанкорного к end-to-end обнаружению объектов

Область компьютерного зрения претерпела невероятные трансформации за последнее десятилетие. Двумя важными вехами на этом пути стали выпуск YOLOX, который сделал популярными безанкорные архитектуры, и недавнее появление Ultralytics YOLO26, который полностью переопределяет производительность в реальном времени благодаря своей архитектуре end-to-end без использования NMS. В этом подробном сравнении мы изучим архитектуры, метрики производительности и идеальные сценарии развертывания, чтобы помочь тебе принять обоснованные решения для твоего следующего AI-проекта.

Обзор моделей

Понимание происхождения и основных целей разработки каждой модели дает важный контекст для их соответствующих технических достижений.

YOLOX

Авторы: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li и Jian Sun
Организация: Megvii
Дата: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
Документация: YOLOX ReadTheDocs

Представленный в середине 2021 года, YOLOX стал значительным шагом вперед, перейдя на безанкорный дизайн в сочетании с разделенной «головой» (decoupled head) и передовой стратегией назначения меток, известной как SimOTA. Отказавшись от традиционных механизмов anchor box, которые доминировали в предыдущих архитектурах, YOLOX успешно преодолел разрыв между академическими исследованиями и промышленным применением, предложив элегантный и очень эффективный фреймворк для обнаружения объектов.

Узнай больше о YOLOX

YOLO26

Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2026-01-14
GitHub: ultralytics/ultralytics
Платформа: Ultralytics Platform

Выпущенный в начале 2026 года, YOLO26 является кульминацией многолетних итеративных улучшений с упором на развертывание на периферийных устройствах (edge deployment) и упрощение пайплайнов обучения. В нем представлена end-to-end архитектура без NMS, полностью устраняющая традиционный шаг постобработки Non-Maximum Suppression. Этот прорыв радикально упрощает развертывание модели на различном оборудовании. Кроме того, благодаря удалению модуля Distribution Focal Loss (DFL), YOLO26 достигает значительно меньшей задержки, закрепляя свой статус лучшего выбора для современных приложений компьютерного зрения.

Узнай больше о YOLO26

Архитектурные инновации

Архитектуры этих двух моделей подчеркивают стремительный прогресс методологий глубокого обучения, особенно в том, что касается функций потерь и постобработки.

Подход YOLOX

YOLOX разделил задачи классификации и регрессии в своей «голове» предсказаний, что значительно ускорило сходимость во время обучения. Его безанкорная природа сократила количество параметров проектирования, уменьшив потребность в сложной настройке анкоров перед обучением. В сочетании с алгоритмом назначения меток SimOTA, YOLOX достиг передовых на то время результатов, особенно на стандартных бенчмарках, таких как набор данных COCO.

Преимущество YOLO26

YOLO26 выводит архитектурную эффективность на новый уровень. Удаление NMS не только сокращает задержку вывода, но и обеспечивает стабильное, детерминированное время выполнения — критический фактор для автономных транспортных средств и робототехники.

Ключевые инновации YOLO26 включают:

  • Оптимизатор MuSGD: вдохновленный техниками обучения больших языковых моделей (LLM), этот гибрид SGD и Muon обеспечивает исключительно стабильные прогоны обучения и более быструю сходимость.
  • До 43% более быстрый CPU-вывод: благодаря устранению DFL и оптимизации архитектуры сети, YOLO26 сильно оптимизирован для edge-устройств с ограниченными ресурсами, от простых IoT-датчиков до плат Raspberry Pi.
  • ProgLoss + STAL: эти продвинутые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что крайне важно для анализа аэроснимков и точного контроля качества в автоматизации производства.
Оптимизация с приоритетом на Edge

Если твой проект нацелен на встраиваемые системы или мобильные приложения без выделенных GPU, оптимизированная производительность YOLO26 на CPU дает огромное преимущество, требуя значительно меньше вычислительных затрат, чем модели предыдущих поколений.

Производительность и бенчмарки

При оценке моделей для производственных сред крайне важно анализировать баланс между точностью, скоростью и вычислительной сложностью. Ниже приведено детальное сравнение стандартных моделей, протестированных при размере изображения 640 пикселей (и 416 для версий nano/tiny).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Как показывает таблица, серия YOLO26 обеспечивает превосходный баланс производительности. Например, YOLO26x достигает впечатляющих 57.5 mAP, используя почти вдвое меньше параметров, чем модель YOLOXx, что напрямую означает более быстрое время вывода на GPU (11.8 мс против 16.1 мс) и гораздо более высокую гибкость развертывания.

Опыт обучения и экосистема

Одно из самых глубоких различий между этими архитектурами заключается в их удобстве использования и поддержке экосистемы.

Хотя YOLOX остается фундаментальным репозиторием для исследователей, изучающих градиентные потоки и безанкорные механизмы, его настройка может быть сложной и часто требует ручной конфигурации зависимостей и операторов. Напротив, экосистема Ultralytics устанавливает отраслевой стандарт простоты использования.

Используя унифицированный Python API, ты можешь инициализировать, обучать и развертывать модели YOLO26 с непревзойденной простотой. Система по умолчанию обрабатывает загрузку датасетов, настройку гиперпараметров и бесшовный экспорт в такие форматы, как ONNX, TensorRT и OpenVINO.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

Более того, модели Ultralytics YOLO требуют значительно меньше памяти во время обучения по сравнению с тяжелыми альтернативами на базе Transformer, что позволяет инженерам использовать большие размеры батчей даже на потребительском оборудовании.

Применение в реальных условиях

Выбор между YOLOX и YOLO26 в конечном итоге зависит от твоих ограничений при развертывании и требований к многозадачности.

В чем превосходство YOLOX

YOLOX остается жизнеспособным кандидатом для специфических академических бенчмарков и устаревших систем, глубоко интегрированных с фреймворком MegEngine. Его историческая значимость делает его популярным базовым решением для исследования безанкорных детекторов и пользовательских стратегий назначения меток.

В чем YOLO26 превосходит остальных

YOLO26 фундаментально разработан для современных промышленных приложений. Поскольку он нативно поддерживает сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (OBB), он гораздо универсальнее стандартных движков обнаружения.

  • Умный ритейл и инвентаризация: использование дизайна без NMS гарантирует, что автоматизированные системы оплаты обрабатывают видеопотоки с ультранизкой задержкой, распознавая продукты без узких мест в виде циклов постобработки.
  • Аналитика дронов и аэроснимков: специализированная функция потерь угла для OBB и интеграция ProgLoss + STAL делают YOLO26 непревзойденным в обнаружении повернутых объектов и крошечных артефактов на обширных спутниковых изображениях.
  • Системы безопасности на периферии: благодаря выводу на CPU, который на 43% быстрее, YOLO26 позволяет компаниям развертывать надежную аналитику безопасности прямо на недорогом локальном оборудовании без необходимости использования дорогостоящих облачных вычислений.

Варианты использования и рекомендации

Выбор между YOLOX и YOLO26 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать YOLOX

YOLOX — сильный выбор, если:

  • Исследований обнаружения без анкоров: Академических исследований, использующих чистую архитектуру YOLOX без анкоров в качестве базы для экспериментов с новыми головами обнаружения или функциями потерь.
  • Сверхлегких граничных устройств: Развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый размер варианта YOLOX-Nano (0.91 млн параметров).
  • Исследований назначения меток SimOTA: Исследовательских проектов, изучающих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Когда выбирать YOLO26

YOLO26 рекомендуется для:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Изучение других моделей Ultralytics

Если ты изучаешь эволюцию компьютерного зрения, есть и другие высокоэффективные модели в семействе Ultralytics, которые стоит исследовать:

  • YOLO11: непосредственный предшественник YOLO26, предлагающий надежную производительность и широкую поддержку сообщества для стабильных производственных сред.
  • YOLOv8: проверенная в бою архитектура, установившая стандарт простоты использования и гибкости в тысячах реальных развертываний.

В заключение, хотя YOLOX привнес важнейшие концепции в область обнаружения объектов, новый YOLO26 обеспечивает качественный скачок в скорости, точности и простоте развертывания, что делает его окончательным выбором для прогрессивных разработчиков и предприятий.

Комментарии