EfficientDet против YOLO26: Глубокий анализ архитектур обнаружения объектов
При выборе модели обнаружения объектов разработчики часто взвешивают компромиссы между архитектурной сложностью, скоростью и точностью. Это подробное сравнение исследует технические различия между EfficientDet от Google и Ultralytics YOLO26, анализируя их философии проектирования, метрики производительности и пригодность для реального развертывания.
Обзор архитектур
Хотя обе модели нацелены на решение проблемы обнаружения объектов, они подходят к эффективности и масштабированию с принципиально разных точек зрения. EfficientDet опирается на метод составного масштабирования, тогда как YOLO26 делает акцент на упрощенной сквозной архитектуре, оптимизированной для производительности на периферии.
EfficientDet: Масштабируемое слияние признаков
Авторы: Минсин Тан, Руоминг Пан и Куок В. Ле
Организация:Google
Дата: 20 ноября 2019 г.
Ссылки:Arxiv | GitHub
EfficientDet представил концепцию BiFPN (Bidirectional Feature Pyramid Network), позволяющую легко и быстро выполнять слияние многомасштабных признаков. Он сочетает это с методом составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех базовых, признаковых и сетей предсказания ограничивающих рамок/классов. Хотя в свое время это было весьма эффективно, такая сильная зависимость от сложных слоев слияния признаков часто приводит к увеличению задержки на неспециализированном оборудовании.
YOLO26: Сквозная скорость и простота
Авторы: Гленн Джочер и Цзин Цю
Организация:Ultralytics
Дата: 14 января 2026 г.
Ссылки:Документация | GitHub
YOLO26 представляет собой смену парадигмы в сторону нативного сквозного (E2E) вывода, полностью устраняя необходимость в Non-Maximum Suppression (NMS). Такое проектное решение значительно упрощает конвейер развертывания. Устраняя модуль Distribution Focal Loss (DFL), YOLO26 достигает до 43% более быстрого вывода на CPU, что делает его превосходным выбором для граничных вычислений. Он также представляет оптимизатор MuSGD, гибрид SGD и Muon, обеспечивающий улучшение стабильности обучения, вдохновленное инновациями в LLM.
Ключевое отличие: Сквозной подход против постобработки
EfficientDet полагается на постобработку NMS для фильтрации перекрывающихся ограничивающих рамок, что может стать узким местом в сценах с высокой плотностью объектов. YOLO26 использует бесNMS-архитектуру, выдавая окончательные предсказания непосредственно из модели, что обеспечивает постоянную задержку независимо от плотности объектов.
Анализ производительности
Бенчмарки показывают значительные различия в эффективности, особенно при развертывании в средах с ограниченными ресурсами. Следующие диаграмма и таблица иллюстрируют разрыв в производительности между семейством EfficientDet (d0-d7) и серией YOLO26 (n-x).
Таблица сравнения метрик
В таблице ниже представлена производительность на наборе данных COCO. Обратите внимание на значительное преимущество YOLO26 в скорости, особенно в бенчмарках CPU.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Скорость и задержка
EfficientDet достигает достойной точности, но часто сталкивается с проблемами задержки из-за своих сложных слоев BiFPN и ресурсоемких операций масштабирования. В отличие от него, YOLO26 предлагает превосходный компромисс между скоростью и точностью. Например, YOLO26s превосходит EfficientDet-d3 по точности (48.6% против 47.5% mAP), при этом поддерживая значительно меньшее количество FLOPs (20.7B против 24.9B) и значительно более высокие скорости вывода на GPU (2.5мс против 19.59мс).
Требования к памяти и ресурсам
YOLO26 проявляет себя наилучшим образом в средах со строгими ограничениями памяти. Удаление DFL и оптимизированная архитектура приводят к снижению использования VRAM во время обучения и уменьшению размеров экспортируемых файлов. В то время как модели EfficientDet масштабируются до огромных размеров (d7 требует значительных вычислительных ресурсов), экосистема Ultralytics гарантирует, что даже самые крупные варианты YOLO26 остаются обучаемыми на стандартном потребительском оборудовании, в отличие от тяжелых моделей на основе Transformer или старых тяжелых архитектур.
Ключевые особенности и инновации
Стабильность обучения и сходимость
Уникальным преимуществом YOLO26 является интеграция оптимизатора MuSGD. Вдохновленный Kimi K2 от Moonshot AI, этот оптимизатор стабилизирует динамику обучения, позволяя использовать более высокие скорости обучения и более быструю сходимость по сравнению со стандартными методами оптимизации, часто требуемыми для сложного составного масштабирования EfficientDet.
Обнаружение мелких объектов
EfficientDet известен хорошей обработкой многомасштабных объектов, но YOLO26 представляет ProgLoss (Progressive Loss) + STAL (Small-Target-Aware Label Assignment). Эти специализированные функции потерь целенаправленно устраняют общую слабость в detect мелких объектов, делая YOLO26 исключительно эффективным для таких задач, как анализ аэрофотоснимков или удаленное наблюдение.
Универсальность в различных задачах
В то время как EfficientDet является в первую очередь детектором объектов, YOLO26 — это унифицированный фреймворк. Он нативно поддерживает:
- Сегментация экземпляров (с многомасштабными прото-модулями)
- Оценка позы (с использованием оценки остаточного логарифмического правдоподобия)
- Ориентированные ограничивающие рамки (OBB) (со специализированной угловой функцией потерь)
- Классификация изображений
Реальные примеры использования
Развертывание на периферии и IoT
Идеальная модель: YOLO26n Для приложений, работающих на Raspberry Pi или NVIDIA Jetson Nano, YOLO26n является очевидным победителем. Его оптимизация для CPU позволяет обрабатывать данные в реальном времени без выделенного GPU.
- Применение: Камеры видеонаблюдения для умного дома, detect людей и домашних животных.
- Почему: EfficientDet-d0 значительно медленнее на CPU, что потенциально может приводить к пропуску кадров в потоках реального времени.
Высокоточное промышленное инспектирование
Идеальная модель: YOLO26x / EfficientDet-d7 В сценариях, где точность имеет первостепенное значение, а аппаратное обеспечение не является ограничением (например, обработка на стороне сервера), обе модели жизнеспособны. Однако YOLO26x обеспечивает более высокий mAP (57.5%), чем EfficientDet-d7 (53.7%), при значительно меньшем времени вывода.
- Применение:Контроль качества производства, detect мельчайших дефектов на сборочных линиях.
- Почему: Функция STAL в YOLO26x улучшает detect крошечных дефектов, которые могут быть пропущены более старыми архитектурами.
Удобство использования и экосистема
Одно из наиболее существенных различий заключается в опыте разработчика. EfficientDet, хотя и мощный, часто требует сложной настройки в рамках TensorFlow Object Detection API или пакетов AutoML.
Ultralytics отдает приоритет простоте использования. С помощью простого Python API пользователи могут загружать, обучать и развертывать модели всего в нескольких строках кода:
from ultralytics import YOLO
# Load a pretrained YOLO26 model
model = YOLO("yolo26n.pt")
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Хорошо поддерживаемая экосистема вокруг Ultralytics включает бесшовные интеграции для аннотирования данных, отслеживания экспериментов и экспорта в форматы, такие как ONNX, TensorRT и CoreML. Эта обширная сеть поддержки гарантирует, что разработчики тратят меньше времени на отладку инфраструктуры и больше — на доработку своих приложений.
Похожие модели
Если вы заинтересованы в изучении других современных архитектур в рамках Ultralytics, обратите внимание на:
Заключение
В то время как EfficientDet внедрил важные концепции масштабирования признаков, YOLO26 представляет собой передовую технологию 2026 года. Его архитектурные инновации — в частности, сквозная архитектура без NMS, оптимизатор MuSGD и удаление DFL — обеспечивают ощутимое преимущество как в скорости, так и в точности.
Для разработчиков, ищущих универсальную, высокопроизводительную модель, которая легко обучается и эффективно развёртывается на периферийных устройствах, YOLO26 является рекомендуемым выбором. Её интеграция в экосистему Ultralytics дополнительно упрощает жизненный цикл проектов машинного обучения, от подготовки наборов данных до развёртывания в производстве.