Перейти к содержанию

YOLOX против YOLO26: Эволюция от безанкерного к сквозному обнаружению объектов

Область компьютерного зрения претерпела невероятные изменения за последнее десятилетие. Двумя значительными вехами на этом пути являются выпуск YOLOX, популяризировавшего безанкерные архитектуры, и недавнее появление Ultralytics YOLO26, который полностью переопределяет производительность в реальном времени благодаря нативной сквозной конструкции без NMS. Это всестороннее сравнение исследует их архитектуры, метрики производительности и идеальные сценарии развертывания, чтобы помочь разработчикам принимать обоснованные решения для своих следующих проектов в области ИИ.

Обзоры моделей

Понимание истоков и основных проектных целей каждой модели обеспечивает важный контекст для понимания их соответствующих технических достижений.

YOLOX

Авторы: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li и Jian Sun
Организация: Megvii
Дата: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
Документация: YOLOX ReadTheDocs

Представленный в середине 2021 года, YOLOX ознаменовал собой значительный сдвиг за счет использования безанкерной архитектуры в сочетании с разделенной головой (decoupled head) и передовой стратегии присвоения меток, известной как SimOTA. Отказавшись от традиционных механизмов якорных боксов, которые доминировали в предыдущих архитектурах, YOLOX успешно преодолел разрыв между академическими исследованиями и промышленным применением, предложив элегантную, но при этом высокоэффективную основу для обнаружения объектов.

Узнайте больше о YOLOX

YOLO26

Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2026-01-14
GitHub: ultralytics/ultralytics
Платформа: Платформа Ultralytics

Выпущенный в начале 2026 года, YOLO26 является кульминацией многолетних итеративных улучшений, с сильным акцентом на периферийное развертывание и упрощенные конвейеры обучения. Он представляет сквозную без-NMS архитектуру, полностью исключающую традиционный этап постобработки Non-Maximum Suppression. Этот прорыв значительно упрощает развертывание моделей на различном оборудовании. Кроме того, удаление модуля Distribution Focal Loss (DFL) позволяет YOLO26 достичь значительно меньшей задержки, закрепляя за ним статус лучшего выбора для современных приложений компьютерного зрения.

Узнайте больше о YOLO26

Архитектурные инновации

Архитектуры этих двух моделей подчеркивают быстрый прогресс методологий глубокого обучения, особенно в отношении функций потерь и постобработки.

Подход YOLOX

YOLOX разделил задачи классификации и регрессии в своей предсказательной головке, что значительно ускорило сходимость во время обучения. Его безанкерная природа сократила количество проектных параметров, уменьшив необходимость в сложной настройке якорей перед обучением. В сочетании с алгоритмом назначения меток SimOTA YOLOX достиг передовых результатов для своего времени, особенно на стандартных бенчмарках, таких как набор данных COCO.

Преимущество YOLO26

YOLO26 выводит архитектурную эффективность на новый уровень. Устранение NMS не только сокращает задержку вывода, но и обеспечивает стабильное, детерминированное время выполнения — критически важный фактор для автономных транспортных средств и робототехники.

Ключевые нововведения YOLO26 включают:

  • Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (LLM), этот гибрид SGD и Muon обеспечивает исключительно стабильные циклы обучения и более быструю сходимость.
  • До 43% более быстрый инференс на CPU: Устраняя DFL и оптимизируя архитектуру сети, YOLO26 сильно оптимизирован для граничных устройств с ограниченными ресурсами, от простых IoT-датчиков до плат Raspberry Pi.
  • ProgLoss + STAL: Эти усовершенствованные функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для анализа аэрофотоснимков и выполнения точного контроля качества в автоматизации производства.

Оптимизация с приоритетом периферии

Если ваш проект ориентирован на встраиваемые системы или мобильные приложения без выделенных GPU, оптимизированная производительность YOLO26 на CPU обеспечивает огромное преимущество, требуя значительно меньше вычислительных затрат, чем модели предыдущих поколений.

Производительность и сравнительное тестирование

При оценке моделей для производственных сред анализ баланса между точностью, скоростью и вычислительной сложностью имеет первостепенное значение. Ниже представлено подробное сравнение стандартных моделей, оцененных при размере изображения 640 пикселей (и 416 для нано/миниатюрных вариантов).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Как иллюстрирует таблица, серия YOLO26 обеспечивает превосходный баланс производительности. Например, YOLO26x достигает впечатляющего 57,5 mAP, используя при этом почти вдвое меньше параметров, чем YOLOXx модели, что напрямую приводит к более быстрому времени инференса на GPU (11.8 мс против 16.1 мс) и значительно превосходящей гибкости развертывания.

Опыт обучения и экосистемы

Одно из наиболее глубоких различий между этими архитектурами заключается в их удобстве использования и поддержке экосистемы.

Хотя YOLOX остается фундаментальным репозиторием для исследователей, изучающих градиентный поток и безанкерные механизмы, его настройка может быть сложной, часто требующей ручной конфигурации зависимостей и операторов. Напротив, экосистема Ultralytics определяет отраслевой стандарт простоты использования.

Используя унифицированный API на Python, разработчики могут инициализировать, обучать и развертывать модели YOLO26 с беспрецедентной простотой. Система изначально обрабатывает загрузку наборов данных, настройку гиперпараметров и бесшовный экспорт в такие форматы, как ONNX, TensorRT и OpenVINO.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

Кроме того, модели Ultralytics YOLO отличаются значительно более низкими требованиями к памяти во время обучения по сравнению с тяжелыми альтернативами на основе трансформеров, позволяя инженерам обучать большие размеры пакетов даже на потребительском оборудовании.

Приложения в реальном мире

Выбор между YOLOX и YOLO26 в конечном итоге зависит от ваших ограничений развертывания и требований к многозадачности.

В чем YOLOX превосходит

YOLOX остается жизнеспособным кандидатом для определенных академических бенчмарков и устаревших систем, глубоко интегрированных с фреймворком MegEngine. Его историческое значение делает его популярной базовой моделью для исследования безакорных детекторов и пользовательских стратегий присвоения.

В чем превосходит YOLO26

YOLO26 принципиально разработан для современных промышленных приложений. Поскольку он нативно поддерживает сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (obb), он гораздо более универсален, чем стандартные движки обнаружения.

  • Умная розничная торговля и управление запасами: Использование безалгометрической NMS-архитектуры гарантирует, что автоматизированные кассовые системы обрабатывают видеопотоки со сверхнизкой задержкой, распознавая продукты без узкого места циклов постобработки.
  • Аналитика с дронов и аэроаналитика: Специализированная угловая функция потерь для obb и интеграция ProgLoss + STAL делают YOLO26 непревзойденным в detect повернутых объектов и крошечных артефактов на обширных спутниковых снимках.
  • Системы безопасности на периферии: Благодаря ускорению вывода на CPU на 43% YOLO26 позволяет компаниям развертывать надежную аналитику безопасности непосредственно на недорогом локальном оборудовании без необходимости в дорогостоящих облачных вычислениях.

Сценарии использования и рекомендации

Выбор между YOLOX и YOLO26 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать YOLOX

YOLOX является отличным выбором для:

  • Исследования безъякорного detect: Академические исследования, использующие чистую, безъякорную архитектуру YOLOX в качестве основы для экспериментов с новыми головами detect или функциями потерь.
  • Сверхлегкие граничные устройства: Развертывание на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый объем (0,91 млн параметров) варианта YOLOX-Nano.
  • Исследования по назначению меток SimOTA: Исследовательские проекты, изучающие стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Когда выбирать YOLO26

YOLO26 рекомендуется для:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Исследование других моделей Ultralytics

Если вы изучаете эволюцию компьютерного зрения, в семействе Ultralytics есть и другие высокопроизводительные модели, заслуживающие изучения:

  • YOLO11: Непосредственный предшественник YOLO26, обеспечивающий надежную производительность и широкую поддержку сообщества для стабильных производственных сред.
  • YOLOv8: Архитектура, прошедшая серьезные испытания, установившая стандарт простоты использования и гибкости в тысячах реальных развертываний.

В заключение, хотя YOLOX представил ключевые концепции в области обнаружения объектов, новый YOLO26 обеспечивает скачок на поколение вперед в скорости, точности и простоте развертывания, что делает его окончательным выбором для дальновидных разработчиков и предприятий.


Комментарии