Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX против EfficientDet: оценка объектных детекторов без якорей и с возможностью масштабирования#

Эволюция обнаружения объектов была продиктована постоянным стремлением найти баланс между скоростью, точностью и вычислительной эффективностью. Две знаковые модели, которые значительно повлияли на этот путь, — это YOLOX и EfficientDet. В то время как YOLOX представила семейству YOLO высокооптимизированную архитектуру без якорей, EfficientDet сосредоточилась на масштабируемой структуре с использованием compound scaling и BiFPN. Это руководство содержит подробное техническое сравнение их архитектур, показателей производительности и методологий обучения, а также знакомит с современными альтернативами, такими как передовая модель Ultralytics YOLO26.

Link to this sectionПроисхождение моделей и технические подробности#

Прежде чем погружаться в структурные различия, важно понять происхождение и фундаментальные исследования, стоящие за обеими моделями.

Подробности YOLOX:

Узнай больше о YOLOX

Подробности EfficientDet:

Узнай больше об EfficientDet

Link to this sectionАрхитектурное сравнение#

Фундаментальное различие между YOLOX и EfficientDet заключается в способах извлечения признаков и прогнозирования ограничивающих рамок. Понимание этих архитектур для обнаружения объектов критически важно для выбора подходящей модели для твоей среды развертывания.

Link to this sectionYOLOX: инноватор без использования якорей#

YOLOX произвела революцию в серии YOLO, перейдя от якорного детектора к дизайну без якорей. Этот переход кардинально сократил количество параметров проектирования и упростил процесс обучения.

Ключевые архитектурные особенности включают разделенную голову (decoupled head), которая отделяет задачи классификации от регрессии. Это решает конфликт между определением того, что это за объект, и точным предсказанием того, где он находится. Кроме того, YOLOX использует передовые стратегии назначения меток, такие как SimOTA, которая динамически назначает положительные выборки объектам ground truth во время обучения, что ведет к более быстрой сходимости и превосходному балансу производительности.

Link to this sectionEfficientDet: compound scaling и BiFPN#

EfficientDet подходит к обнаружению объектов через призму эффективности и масштабируемости. Разработанная Google, она в значительной степени опирается на бэкенд EfficientNet для извлечения признаков.

Ее определяющей чертой является двунаправленная пирамидальная сеть признаков (BiFPN). В отличие от традиционных FPN, BiFPN обеспечивает легкое и быстрое слияние признаков разных масштабов за счет введения обучаемых весов для определения важности различных входных данных. В сочетании с методом compound scaling, который равномерно масштабирует разрешение, глубину и ширину для всех сетей — бэкенда, сети признаков и сетей прогнозирования рамок/классов, EfficientDet может масштабироваться от моделей мобильного размера (d0) до массивных серверных моделей (d7).

Архитектурная сложность

Хотя compound scaling в EfficientDet предоставляет предсказуемый путь к повышению точности, это часто приводит к созданию сложных вычислительных графов, которые могут быть трудными для оптимизации под периферийные вычисления в режиме реального времени по сравнению с оптимизированным дизайном YOLOX без якорей.

Link to this sectionАнализ производительности и метрик#

При оценке этих моделей для реальных приложений компьютерного зрения такие показатели, как средняя точность (mAP), скорость вывода и количество параметров, имеют первостепенное значение.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Link to this sectionАнализ компромиссов#

Данные подчеркивают четкое расхождение в философии проектирования. EfficientDet-d7 достигает наивысшей общей точности с впечатляющим mAP в 53.7%, но ценой огромных затрат на скорость вывода (128.07 мс на GPU T4). Напротив, YOLOXx достигает весьма конкурентоспособного показателя mAP в 51.1%, поддерживая при этом высокую скорость вывода в 16.1 мс, что делает ее значительно превосходящей для понимания видео и робототехники в реальном времени.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOX и EfficientDet зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLOX#

YOLOX — сильный выбор для:

  • Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
  • Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
  • Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Link to this sectionКогда стоит выбрать EfficientDet#

EfficientDet рекомендуется для:

  • Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
  • Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionСовременная альтернатива: Ultralytics YOLO26#

Хотя YOLOX и EfficientDet были важными этапами, ландшафт машинного обучения быстро продвинулся вперед. Для разработчиков, которые хотят внедрить современные системы зрения сегодня, крайне рекомендуемым выбором является YOLO26, новейшая флагманская модель от Ultralytics, выпущенная в январе 2026 года.

YOLO26 предлагает хорошо поддерживаемую экосистему и колоссальный скачок вперед как в скорости, так и в простоте использования, превосходя устаревшие архитектуры в нескольких ключевых областях:

Link to this sectionКлючевые инновации YOLO26#

  • Сквозной дизайн без NMS: YOLO26 исключает необходимость постобработки подавления немаксимумов (NMS). Этот естественный сквозной подход, впервые примененный в более ранних поколениях, упрощает процесс экспорта и сокращает задержки при развертывании.
  • До 43% более быстрый вывод на CPU: Благодаря глубокой архитектурной оптимизации и удалению функции Distribution Focal Loss (DFL), YOLO26 работает удивительно быстро на периферийных устройствах без дискретных GPU, значительно опережая тяжелые варианты EfficientDet.
  • Оптимизатор MuSGD: Привнося инновации больших языковых моделей (LLM) в компьютерное зрение, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon) для обеспечения высокой стабильности обучения и быстрой сходимости, что приводит к отличной эффективности обучения.
  • ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для таких сценариев использования, как операции с дронами и анализ аэрофотоснимков.
  • Непревзойденная универсальность: В отличие от YOLOX, которая является исключительно детектором объектов, YOLO26 нативно поддерживает широкий спектр задач, включая сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB).

Узнай больше о YOLO26

Link to this sectionПростота использования с Ultralytics API#

Одним из самых значительных преимуществ моделей Ultralytics является оптимизированный пользовательский опыт. Обучение и развертывание модели YOLO26 требует гораздо меньших требований к памяти, чем сложные архитектуры трансформеров, и включает лишь несколько строк кода на Python:

from ultralytics import YOLO

# Initialize the natively end-to-end YOLO26 model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the trained model to TensorRT for blazing-fast inference
model.export(format="engine", dynamic=True)

Для пользователей, предпочитающих визуальные интерфейсы, платформа Ultralytics предоставляет мощные инструменты для разметки наборов данных, настройки гиперпараметров и бесшовного развертывания.

Link to this sectionРеальные сценарии использования#

Выбор подходящей архитектуры сильно зависит от твоих специфических ограничений при развертывании.

Link to this sectionКогда стоит рассмотреть EfficientDet#

EfficientDet остается предметом академического интереса для сред, где скорость вывода абсолютно не важна, а максимальная теоретическая точность на изображениях с высоким разрешением является единственной целью. Ее реализация в экосистеме TensorFlow также может быть привлекательной для команд, поддерживающих старую инфраструктуру Google.

Link to this sectionКогда стоит рассмотреть YOLOX#

YOLOX подходит для приложений, требующих баланса скорости и точности без сложностей, связанных с якорными рамками. Она исторически хорошо показывала себя в сценариях промышленного производства, где требуется быстрое обнаружение дефектов на конвейерных лентах.

Link to this sectionПочему YOLO26 — это лучший выбор#

Почти для всех современных приложений YOLO26 предоставляет лучшее решение. Ее дизайн без NMS обеспечивает детерминированную задержку, что делает ее идеальным кандидатом для автономного вождения, быстрых систем охранной сигнализации и внедрений в «умных городах». Более того, надежная поддержка сообщества и частые обновления от Ultralytics гарантируют, что разработчики никогда не столкнутся с проблемами из-за устаревших зависимостей.

Разработчикам, изучающим передовое компьютерное зрение, также стоит обратить внимание на другие универсальные архитектуры в экосистеме Ultralytics, такие как YOLO11 для стабильных старых внедрений или специализированные модели, например FastSAM для задач сегментации на основе промптов. Использование полного набора инструментов Ultralytics гарантирует создание перспективного и высокооптимизированного конвейера для зрения на базе ИИ.

Авторы

Комментарии