Link to this sectionYOLOX против EfficientDet: оценка объектных детекторов без якорей и с возможностью масштабирования#
Эволюция обнаружения объектов была продиктована постоянным стремлением найти баланс между скоростью, точностью и вычислительной эффективностью. Две знаковые модели, которые значительно повлияли на этот путь, — это YOLOX и EfficientDet. В то время как YOLOX представила семейству YOLO высокооптимизированную архитектуру без якорей, EfficientDet сосредоточилась на масштабируемой структуре с использованием compound scaling и BiFPN. Это руководство содержит подробное техническое сравнение их архитектур, показателей производительности и методологий обучения, а также знакомит с современными альтернативами, такими как передовая модель Ultralytics YOLO26.
Link to this sectionПроисхождение моделей и технические подробности#
Прежде чем погружаться в структурные различия, важно понять происхождение и фундаментальные исследования, стоящие за обеими моделями.
Подробности YOLOX:
- Авторы: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li и Jian Sun
- Организация: Megvii
- Дата: 18 июля 2021 г.
- ArXiv: YOLOX: Exceeding YOLO Series in 2021
- GitHub: Megvii-BaseDetection/YOLOX
- Документация: Официальная документация YOLOX
Подробности EfficientDet:
- Авторы: Минсин Тан, Руомин Пан и Куок В. Ле
- Организация: Google Brain
- Дата: 20 ноября 2019 г.
- ArXiv: EfficientDet: Scalable and Efficient Object Detection
- GitHub и документация: Google AutoML EfficientDet
Link to this sectionАрхитектурное сравнение#
Фундаментальное различие между YOLOX и EfficientDet заключается в способах извлечения признаков и прогнозирования ограничивающих рамок. Понимание этих архитектур для обнаружения объектов критически важно для выбора подходящей модели для твоей среды развертывания.
Link to this sectionYOLOX: инноватор без использования якорей#
YOLOX произвела революцию в серии YOLO, перейдя от якорного детектора к дизайну без якорей. Этот переход кардинально сократил количество параметров проектирования и упростил процесс обучения.
Ключевые архитектурные особенности включают разделенную голову (decoupled head), которая отделяет задачи классификации от регрессии. Это решает конфликт между определением того, что это за объект, и точным предсказанием того, где он находится. Кроме того, YOLOX использует передовые стратегии назначения меток, такие как SimOTA, которая динамически назначает положительные выборки объектам ground truth во время обучения, что ведет к более быстрой сходимости и превосходному балансу производительности.
Link to this sectionEfficientDet: compound scaling и BiFPN#
EfficientDet подходит к обнаружению объектов через призму эффективности и масштабируемости. Разработанная Google, она в значительной степени опирается на бэкенд EfficientNet для извлечения признаков.
Ее определяющей чертой является двунаправленная пирамидальная сеть признаков (BiFPN). В отличие от традиционных FPN, BiFPN обеспечивает легкое и быстрое слияние признаков разных масштабов за счет введения обучаемых весов для определения важности различных входных данных. В сочетании с методом compound scaling, который равномерно масштабирует разрешение, глубину и ширину для всех сетей — бэкенда, сети признаков и сетей прогнозирования рамок/классов, EfficientDet может масштабироваться от моделей мобильного размера (d0) до массивных серверных моделей (d7).
Хотя compound scaling в EfficientDet предоставляет предсказуемый путь к повышению точности, это часто приводит к созданию сложных вычислительных графов, которые могут быть трудными для оптимизации под периферийные вычисления в режиме реального времени по сравнению с оптимизированным дизайном YOLOX без якорей.
Link to this sectionАнализ производительности и метрик#
При оценке этих моделей для реальных приложений компьютерного зрения такие показатели, как средняя точность (mAP), скорость вывода и количество параметров, имеют первостепенное значение.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
| YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
| YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
| YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
| YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
| YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Link to this sectionАнализ компромиссов#
Данные подчеркивают четкое расхождение в философии проектирования. EfficientDet-d7 достигает наивысшей общей точности с впечатляющим mAP в 53.7%, но ценой огромных затрат на скорость вывода (128.07 мс на GPU T4). Напротив, YOLOXx достигает весьма конкурентоспособного показателя mAP в 51.1%, поддерживая при этом высокую скорость вывода в 16.1 мс, что делает ее значительно превосходящей для понимания видео и робототехники в реальном времени.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOX и EfficientDet зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать YOLOX#
YOLOX — сильный выбор для:
- Исследований безъякорного обнаружения: академических исследований, использующих чистую безъякорную архитектуру YOLOX как базу для экспериментов с новыми головами детекции или функциями потерь.
- Сверхлегких Edge-устройств: развертывания на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый вес варианта YOLOX-Nano (0.91 млн параметров).
- Изучения назначения меток SimOTA: исследовательских проектов, анализирующих стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.
Link to this sectionКогда стоит выбрать EfficientDet#
EfficientDet рекомендуется для:
- Конвейеры Google Cloud и TPU: Системы с глубокой интеграцией в Google Cloud Vision API или инфраструктуру TPU, где EfficientDet имеет встроенную оптимизацию.
- Исследования составного масштабирования: Академическое тестирование, сфокусированное на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
- Мобильного развертывания через TFLite: Проектов, которые требуют экспорта в TensorFlow Lite специально для Android или встраиваемых устройств на базе Linux.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionСовременная альтернатива: Ultralytics YOLO26#
Хотя YOLOX и EfficientDet были важными этапами, ландшафт машинного обучения быстро продвинулся вперед. Для разработчиков, которые хотят внедрить современные системы зрения сегодня, крайне рекомендуемым выбором является YOLO26, новейшая флагманская модель от Ultralytics, выпущенная в январе 2026 года.
YOLO26 предлагает хорошо поддерживаемую экосистему и колоссальный скачок вперед как в скорости, так и в простоте использования, превосходя устаревшие архитектуры в нескольких ключевых областях:
Link to this sectionКлючевые инновации YOLO26#
- Сквозной дизайн без NMS: YOLO26 исключает необходимость постобработки подавления немаксимумов (NMS). Этот естественный сквозной подход, впервые примененный в более ранних поколениях, упрощает процесс экспорта и сокращает задержки при развертывании.
- До 43% более быстрый вывод на CPU: Благодаря глубокой архитектурной оптимизации и удалению функции Distribution Focal Loss (DFL), YOLO26 работает удивительно быстро на периферийных устройствах без дискретных GPU, значительно опережая тяжелые варианты EfficientDet.
- Оптимизатор MuSGD: Привнося инновации больших языковых моделей (LLM) в компьютерное зрение, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon) для обеспечения высокой стабильности обучения и быстрой сходимости, что приводит к отличной эффективности обучения.
- ProgLoss + STAL: Эти передовые функции потерь обеспечивают заметные улучшения в распознавании мелких объектов, что критически важно для таких сценариев использования, как операции с дронами и анализ аэрофотоснимков.
- Непревзойденная универсальность: В отличие от YOLOX, которая является исключительно детектором объектов, YOLO26 нативно поддерживает широкий спектр задач, включая сегментацию экземпляров, классификацию изображений, оценку позы и обнаружение ориентированных ограничивающих рамок (OBB).
Link to this sectionПростота использования с Ultralytics API#
Одним из самых значительных преимуществ моделей Ultralytics является оптимизированный пользовательский опыт. Обучение и развертывание модели YOLO26 требует гораздо меньших требований к памяти, чем сложные архитектуры трансформеров, и включает лишь несколько строк кода на Python:
from ultralytics import YOLO
# Initialize the natively end-to-end YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to TensorRT for blazing-fast inference
model.export(format="engine", dynamic=True)Для пользователей, предпочитающих визуальные интерфейсы, платформа Ultralytics предоставляет мощные инструменты для разметки наборов данных, настройки гиперпараметров и бесшовного развертывания.
Link to this sectionРеальные сценарии использования#
Выбор подходящей архитектуры сильно зависит от твоих специфических ограничений при развертывании.
Link to this sectionКогда стоит рассмотреть EfficientDet#
EfficientDet остается предметом академического интереса для сред, где скорость вывода абсолютно не важна, а максимальная теоретическая точность на изображениях с высоким разрешением является единственной целью. Ее реализация в экосистеме TensorFlow также может быть привлекательной для команд, поддерживающих старую инфраструктуру Google.
Link to this sectionКогда стоит рассмотреть YOLOX#
YOLOX подходит для приложений, требующих баланса скорости и точности без сложностей, связанных с якорными рамками. Она исторически хорошо показывала себя в сценариях промышленного производства, где требуется быстрое обнаружение дефектов на конвейерных лентах.
Link to this sectionПочему YOLO26 — это лучший выбор#
Почти для всех современных приложений YOLO26 предоставляет лучшее решение. Ее дизайн без NMS обеспечивает детерминированную задержку, что делает ее идеальным кандидатом для автономного вождения, быстрых систем охранной сигнализации и внедрений в «умных городах». Более того, надежная поддержка сообщества и частые обновления от Ultralytics гарантируют, что разработчики никогда не столкнутся с проблемами из-за устаревших зависимостей.
Разработчикам, изучающим передовое компьютерное зрение, также стоит обратить внимание на другие универсальные архитектуры в экосистеме Ultralytics, такие как YOLO11 для стабильных старых внедрений или специализированные модели, например FastSAM для задач сегментации на основе промптов. Использование полного набора инструментов Ultralytics гарантирует создание перспективного и высокооптимизированного конвейера для зрения на базе ИИ.