YOLO26 против EfficientDet: техническое сравнение современных архитектур детектирования объектов
Выбор правильной архитектуры нейронной сети критически важен для успеха любого приложения computer vision. В этом техническом руководстве рассматриваются компромиссы, метрики производительности и архитектурные инновации двух выдающихся моделей: передовой Ultralytics YOLO26 и хорошо зарекомендовавшей себя EfficientDet от Google.
Независимо от того, ориентирована ли твоя разработка на облачные серверы с высокой пропускной способностью или на устройства edge AI с ограниченной задержкой, понимание различий между этими архитектурами гарантирует оптимальный баланс скорости, точности и эффективности.
Архитектурный обзор: YOLO26
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2026-01-14
GitHub: Ultralytics GitHub
Документация: Официальная документация YOLO26
Выпущенная в начале 2026 года, YOLO26 представляет собой новейшую эволюцию семейства YOLO, специально разработанную для обеспечения непревзойденного пользовательского опыта и высочайшей точности mean Average Precision (mAP). Спроектированная с нуля для современного оборудования, она предлагает исключительную универсальность в задачах object detection, instance segmentation, image classification и pose estimation.
YOLO26 представляет несколько революционных функций, которые значительно улучшают как стабильность обучения, так и скорость инференса:
- Дизайн End-to-End без NMS: Основываясь на концепциях, заложенных в YOLOv10, модель YOLO26 изначально является end-to-end, что полностью исключает необходимость постпроцессинга Non-Maximum Suppression (NMS). Это упрощает логику развертывания и значительно снижает вариативность задержки.
- Ускорение инференса на CPU до 43%: Благодаря глубоким архитектурным оптимизациям модель достигает беспрецедентной скорости инференса на стандартных CPUs, что делает ее крайне востребованной для IoT и встраиваемых сред.
- Удаление DFL: Функция Distribution Focal Loss была удалена, что привело к более чистому процессу экспорта и улучшенной совместимости с маломощными периферийными устройствами с использованием таких инструментов, как ONNX.
- Оптимизатор MuSGD: Вдохновленный методами обучения LLM от Moonshot AI's Kimi K2, этот гибрид SGD и Muon переносит инновации обучения больших языковых моделей непосредственно в область computer vision, обеспечивая более быструю сходимость и более стабильные режимы обучения.
- ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что является критическим фактором для приложений, связанных с аэрофотосъемкой с дронов и робототехникой.
Благодаря удалению DFL и архитектуре без NMS, экспорт моделей YOLO26 в удобные для периферийных устройств форматы, такие как NVIDIA TensorRT или Intel OpenVINO, практически не требует разработки пользовательских плагинов.
Архитектурный обзор: EfficientDet
Авторы: Минсин Тан, Руоминг Панг и Куок В. Ле
Организация: Google Research
Дата: 2019-11-20
Arxiv: Статья о EfficientDet
GitHub: Репозиторий Google AutoML
Представленная Google, модель EfficientDet активно использует экосистему TensorFlow и была разработана вокруг концепции составного масштабирования (compound scaling). Ее архитектура одновременно масштабирует базовую сеть, сеть признаков и сети прогнозирования рамок/классов в зависимости от ограничений ресурсов.
Ключевые инновации EfficientDet включают:
- BiFPN (двунаправленная сеть пирамид признаков): Механизм, обеспечивающий простое и быстрое слияние признаков на разных масштабах, позволяя сети лучше понимать объекты разного размера.
- Составное масштабирование: Эвристический метод равномерного масштабирования разрешения, глубины и ширины, создающий семейство моделей от d0 (самая маленькая) до d7 (самая большая).
Хотя EfficientDet остается надежным выбором для строгого детектирования объектов с помощью ограничивающих рамок (BBox), ей в целом не хватает современной многозадачности (например, нативных задач OBB) и оптимизированной, унифицированной экосистемы Python, которую ожидают современные разработчики.
Сравнение производительности и метрик
Чтобы определить границу Парето скорости и точности, мы провели сравнительный анализ обеих архитектур в стандартных средах с использованием набора данных COCO. В следующей таблице выделены различия в размерах моделей, точности и задержке, измеренные на инстансе AWS EC2 P4d.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Как показано выше, YOLO26 устанавливает превосходный баланс производительности. Модель YOLO26x достигает высочайшей точности (57.5 mAP), значительно превосходя самую тяжелую модель EfficientDet-d7. Кроме того, модели YOLO26 демонстрируют существенно меньшие требования к памяти и гораздо более высокую скорость инференса на GPU (до 1.7 мс на TensorRT), что подчеркивает преимущества дизайна без NMS.
Эффективность обучения и преимущество экосистемы
Главное различие между этими двумя архитектурами заключается в их средах разработки. EfficientDet глубоко интегрирована в экосистему Google AutoML и TensorFlow, которая, будучи мощной, может создавать крутую кривую обучения и требовать жестких конфигураций для пользовательских наборов данных, таких как DOTAv1.
Напротив, Ultralytics предлагает невероятно хорошо поддерживаемую экосистему, построенную на PyTorch. Использование памяти во время обучения строго оптимизировано, что позволяет инженерам обучать надежные модели без избыточных выделений VRAM, обычных для сетей на основе трансформеров.
Благодаря Ultralytics Platform разработчики получают доступ к полноценному MLOps-процессу. Это включает в себя бесшовную разметку данных, автоматическую настройку гиперпараметров и обучение в облаке в один клик, что значительно ускоряет путь от прототипирования до внедрения в производство.
Пример реализации
Простота использования, предоставляемая API Ultralytics, означает, что ты можешь обучить и проверить передовую модель YOLO26 всего за несколько строк кода.
from ultralytics import YOLO
# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")
# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Train on GPU
)
# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")Идеальные сценарии использования
Когда использовать YOLO26:
- Edge-вычисления и мобильные устройства: Благодаря ускорению инференса на CPU до 43% и отсутствию накладных расходов NMS, YOLO26 отлично работает на устройствах с жестко ограниченными вычислительными ресурсами, таких как Raspberry Pi или мобильные телефоны.
- Многозадачность: Когда один пайплайн требует использования ограничивающих рамок, масок сегментации и трекинга, универсальность YOLO26 не имеет себе равных.
- Дроны и аэрофотосъемка: Комбинация ProgLoss и STAL значительно улучшает обнаружение экстремально мелких объектов с больших высот.
Когда использовать EfficientDet:
- Устаревшие пайплайны TensorFlow: Если твоя инфраструктура сильно привязана к поддержке только TensorFlow SavedModels или требует специфических пайплайнов TensorFlow Serving, EfficientDet обеспечивает нативную совместимость.
- TPU с ограниченными ресурсами: EfficientDet была сильно оптимизирована для специализированных тензорных процессоров Google (TPUs).
Изучение других альтернатив
Хотя это руководство в основном посвящено парадигме YOLO26 vs EfficientDet, более широкая экосистема Ultralytics включает в себя другие невероятные архитектуры. Если твое приложение сильно зависит от трансформеров, RT-DETR предлагает детектирование на основе трансформеров в реальном времени. Если ты поддерживаешь устаревшие системы, YOLO11 остается полностью поддерживаемой и высокоэффективной. Для получения более общего обзора посети Центр сравнения моделей Ultralytics.
В конечном итоге, для любого современного пайплайна computer vision, создаваемого сегодня, колоссальная скорость, простота использования и передовая точность YOLO26 делают ее бесспорной рекомендацией как для исследователей, так и для разработчиков.