Link to this sectionYOLOX против YOLO26: эволюция от безъякорного детектора к сквозному обнаружению объектов#
Область компьютерного зрения за последнее десятилетие претерпела невероятные изменения. Двумя важными вехами на этом пути стали выпуск YOLOX, популяризировавшего безъякорные архитектуры, и недавнее появление Ultralytics YOLO26, которое полностью переосмысливает производительность в реальном времени благодаря нативно сквозному дизайну без NMS. В этом подробном сравнении мы исследуем их архитектуры, показатели производительности и идеальные сценарии развертывания, чтобы помочь тебе принять обоснованные решения для твоего следующего AI-проекта.
Link to this sectionОбзор моделей#
Понимание истоков и основных целей проектирования каждой модели дает важный контекст для оценки их технических достижений.
Link to this sectionYOLOX#
Авторы: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li и Jian Sun
Организация: Megvii
Дата: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
Документация: YOLOX ReadTheDocs
Представленный в середине 2021 года, YOLOX стал значительным шагом вперед, внедрив безъякорный дизайн в сочетании с разделенной головой (decoupled head) и продвинутой стратегией назначения меток, известной как SimOTA. Отказавшись от традиционных механизмов anchor box, доминировавших в предыдущих архитектурах, YOLOX успешно сократил разрыв между академическими исследованиями и промышленным применением, предложив элегантный и высокоэффективный фреймворк для обнаружения объектов.
Link to this sectionYOLO26#
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2026-01-14
GitHub: ultralytics/ultralytics
Платформа: Ultralytics Platform
Выпущенная в начале 2026 года, YOLO26 стала кульминацией многолетних итеративных улучшений с акцентом на развертывание на edge-устройствах и упрощение процессов обучения. Она представляет сквозной дизайн без NMS, полностью исключающий традиционный этап постобработки Non-Maximum Suppression. Это прорывное решение радикально упрощает развертывание моделей на разнообразном оборудовании. Кроме того, благодаря удалению модуля Distribution Focal Loss (DFL), YOLO26 достигает значительно меньшей задержки, укрепляя свои позиции как лучшего выбора для современных приложений компьютерного зрения.
Link to this sectionАрхитектурные инновации#
Архитектуры этих двух моделей подчеркивают быстрое развитие методологий глубокого обучения, особенно в отношении функций потерь и постобработки.
Link to this sectionПодход YOLOX#
YOLOX разделил задачи классификации и регрессии в своей голове предсказаний, что значительно ускорило сходимость при обучении. Его безъякорная природа сократила количество проектных параметров, уменьшив необходимость в сложной настройке якорей перед обучением. В сочетании с алгоритмом назначения меток SimOTA, YOLOX добился результатов, бывших лучшими на тот момент, особенно на стандартных бенчмарках, таких как набор данных COCO.
Link to this sectionПреимущества YOLO26#
YOLO26 выводит архитектурную эффективность на новый уровень. Удаление NMS не только снижает задержку вывода, но и обеспечивает стабильное, детерминированное время выполнения — критический фактор для автономных транспортных средств и робототехники.
Ключевые инновации YOLO26 включают:
- Оптимизатор MuSGD: вдохновленный методами обучения больших языковых моделей (LLM), этот гибрид SGD и Muon обеспечивает исключительно стабильные прогоны обучения и более быструю сходимость.
- До 43% более быстрый вывод на CPU: за счет исключения DFL и оптимизации сетевой архитектуры YOLO26 максимально адаптирована для edge-устройств с ограниченными ресурсами, от простых IoT-датчиков до плат Raspberry Pi.
- ProgLoss + STAL: эти продвинутые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для анализа аэрофотоснимков и выполнения точного контроля качества в производственной автоматизации.
Если твой проект ориентирован на встроенные системы или мобильные приложения без выделенных GPU, оптимизированная производительность YOLO26 на CPU дает огромное преимущество, требуя значительно меньших вычислительных затрат по сравнению с моделями предыдущих поколений.
Link to this sectionПроизводительность и бенчмарки#
При оценке моделей для производственных сред первостепенное значение имеет анализ баланса между точностью, скоростью и вычислительной сложностью. Ниже приведено подробное сравнение стандартных моделей, оцененных при размере изображения 640 пикселей (и 416 для вариантов nano/tiny).
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Как показывает таблица, серия YOLO26 обеспечивает превосходный баланс производительности. Например, YOLO26x достигает впечатляющих 57.5 mAP, используя почти в два раза меньше параметров, чем модель YOLOXx, что напрямую переводится в более быстрое время вывода на GPU (11.8 мс против 16.1 мс) и значительно большую гибкость развертывания.
Link to this sectionОпыт обучения и экосистема#
Одно из самых глубоких различий между этими архитектурами заключается в удобстве использования и поддержке экосистемы.
В то время как YOLOX остается фундаментальным репозиторием для исследователей, изучающих градиентный поток и безъякорную механику, его настройка может быть сложной и часто требует ручной конфигурации зависимостей и операторов. Напротив, экосистема Ultralytics задает отраслевой стандарт простоты использования.
Используя унифицированный Python API, ты можешь инициализировать, обучать и развертывать модели YOLO26 с непревзойденной простотой. Система по умолчанию берет на себя загрузку данных, настройку гиперпараметров и бесшовный экспорт в такие форматы, как ONNX, TensorRT и OpenVINO.
from ultralytics import YOLO
# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")
# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate the model's performance on the validation set
metrics = model.val()
# Export the optimized model for edge deployment
model.export(format="onnx")Более того, модели Ultralytics YOLO требуют значительно меньше памяти во время обучения по сравнению с тяжелыми трансформерными альтернативами, что позволяет инженерам обучать модели с большими размерами батчей даже на оборудовании потребительского уровня.
Link to this sectionПрименение в реальных условиях#
Выбор между YOLOX и YOLO26 в конечном итоге зависит от твоих ограничений при развертывании и требований к многозадачности.
Link to this sectionВ чем YOLOX превосходит#
YOLOX остается жизнеспособным кандидатом для специфических академических бенчмарков и устаревших систем, глубоко интегрированных с фреймворком MegEngine. Его историческая значимость делает его популярным базовым решением для исследования безъякорных детекторов и стратегий пользовательского назначения.
Link to this sectionВ чем YOLO26 превосходит#
YOLO26 фундаментально спроектирована для современных промышленных приложений. Поскольку она нативно поддерживает сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (OBB), она гораздо более универсальна, чем стандартные движки обнаружения.
- Умный ритейл и инвентаризация: использование дизайна без NMS гарантирует, что автоматизированные системы оплаты обрабатывают видеопотоки с ультранизкой задержкой, распознавая продукты без узкого места в виде циклов постобработки.
- Дроны и воздушная аналитика: специализированная функция угловых потерь для OBB и интеграция ProgLoss + STAL делают YOLO26 непревзойденной в обнаружении повернутых объектов и крошечных артефактов на обширных спутниковых изображениях.
- Edge-системы безопасности: благодаря на 43% более быстрому выводу на CPU, YOLO26 позволяет компаниям развертывать надежную аналитику безопасности прямо на недорогом локальном оборудовании, не требуя дорогих облачных вычислений.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOX и YOLO26 зависит от твоих специфических требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать YOLOX#
YOLOX — сильный выбор для:
- Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
- Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
- Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.
Link to this sectionКогда стоит выбрать YOLO26#
YOLO26 рекомендуется для:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionИзучение других моделей Ultralytics#
Если ты изучаешь эволюцию компьютерного зрения, есть и другие высокоэффективные модели в семействе Ultralytics, заслуживающие внимания:
- YOLO11: непосредственный предшественник YOLO26, предлагающий надежную производительность и широкую поддержку сообщества для стабильных производственных сред.
- YOLOv8: проверенная в боях архитектура, установившая стандарт простоты использования и гибкости в тысячах реальных внедрений.
В заключение, хотя YOLOX привнес важные концепции в ландшафт обнаружения объектов, новая YOLO26 обеспечивает качественный скачок в скорости, точности и простоте развертывания, что делает ее окончательным выбором для дальновидных разработчиков и предприятий.