Перейти к содержанию

EfficientDet против YOLO26: Подробное техническое сравнение

Выбор правильной архитектуры компьютерного зрения является критически важным шагом в создании масштабируемых и эффективных систем ИИ. Это всеобъемлющее руководство представляет собой углубленное техническое сравнение между устаревшей EfficientDet от Google и передовой Ultralytics YOLO26. Мы оцениваем их базовые архитектуры, метрики производительности и методологии обучения, чтобы помочь вам выбрать лучшую модель для ваших конкретных ограничений развертывания.

Происхождение и авторство модели

Понимание истоков этих архитектур дает ценный контекст относительно их философии проектирования и предполагаемых сценариев использования.

EfficientDet Авторы: Mingxing Tan, Ruoming Pang, and Quoc V. Le
Организация: Google Research
Дата: 2019-11-20
Arxiv: 1911.09070
GitHub: google/automl/efficientdet

Узнайте больше об EfficientDet

YOLO26
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2026-01-14
GitHub: ultralytics/ultralytics

Узнайте больше о YOLO26

Архитектурные инновации

Архитектурные различия между этими двумя моделями значительны, что отражает стремительное развитие глубокого обучения за последние несколько лет.

EfficientDet была построена на основе BiFPN (двунаправленной пирамидальной сети признаков) и использует метод составного масштабирования по разрешению, глубине и ширине. Хотя в 2019 году она достигла превосходной теоретической эффективности, она сильно зависит от устаревших фреймворков TensorFlow и сложных алгоритмов поиска AutoML, которые часто громоздки для адаптации под пользовательские наборы данных.

Напротив, Ultralytics YOLO26 представляет собой абсолютный передовой край компьютерного зрения в реальном времени. Он представляет несколько новаторских архитектурных улучшений, разработанных специально для современных конвейеров развертывания:

  • Сквозная архитектура без NMS: YOLO26 изначально является сквозной, полностью исключая необходимость постобработки методом Non-Maximum Suppression (NMS). Этот прорывной подход, впервые примененный в YOLOv10, обеспечивает более быструю и простую логику развертывания и значительно снижает вариативность задержки на периферийных чипах.
  • Удаление DFL: Удаление Distribution Focal Loss (DFL) в YOLO26 упрощает выходную головку, что приводит к превосходной совместимости с периферийными вычислениями и маломощными устройствами.
  • Оптимизатор MuSGD: Вдохновленный инновациями в больших языковых моделях, такими как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD — гибрид SGD и Muon. Это обеспечивает значительно более стабильное обучение и более быструю сходимость, чем стандартные оптимизаторы.
  • ProgLoss + STAL: Внедрение Progressive Loss в сочетании с Scale-aware Task-aligned Learning (STAL) обеспечивает заметные улучшения в распознавании мелких объектов, что крайне важно для аэрофотосъемки и робототехники.

Совет профессионала: Развертывание без NMS

Поскольку YOLO26 исключает NMS, вся модель может быть выполнена как единый, непрерывный вычислительный граф. Это делает экспорт в такие форматы, как ONNX или TensorRT, невероятно простым и максимизирует использование NPU/GPU.

Метрики производительности и тесты

Истинная проверка любой модели обнаружения объектов заключается в ее производительности в реальных условиях. В таблице ниже сравнивается точность, измеряемая в средней средней точности (mAP), со скоростью инференса и вычислительными требованиями.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Как показано выше, YOLO26 предлагает значительно превосходящий баланс производительности. В то время как старые архитектуры могут иногда демонстрировать низкие теоретические FLOPs, YOLO26 использует оптимизированные шаблоны доступа к памяти для достижения значительно более быстрой инференции на GPU. Например, YOLO26x достигает невероятного показателя 57.5 mAP, работая почти в 10 раз быстрее на оборудовании TensorRT, чем эквивалентный EfficientDet-d7. Кроме того, YOLO26 включает оптимизации, которые обеспечивают до 43% более быструю инференцию на CPU по сравнению с устаревшими вариантами YOLO, что делает его лучшим выбором для граничного ИИ.

Преимущество экосистемы Ultralytics

Выбор архитектуры редко сводится только к теоретическим FLOPs; он сильно зависит от инженерных рабочих процессов. Разработчики регулярно отдают предпочтение Ultralytics благодаря непревзойденной простоте использования.

Обучение EfficientDet часто требует сложного управления зависимостями, ручной настройки гиперпараметров и использования устаревших конфигураций TensorFlow. Напротив, модели Ultralytics обладают элегантно простым API. Этот бесшовный опыт напрямую распространяется на платформу Ultralytics, которая обеспечивает облачное обучение, аннотацию данных и отслеживание экспериментов в реальном времени «из коробки».

Кроме того, детекторы на основе трансформеров и сложные модели AutoML страдают от чрезмерного потребления памяти. Модели Ultralytics известны своими высокоэффективными требованиями к памяти, что означает возможность обучения надежных моделей на потребительском оборудовании без возникновения ошибок нехватки памяти (OOM).

Универсальность и поддержка задач

EfficientDet — это строго сеть для обнаружения объектов. YOLO26 — это унифицированная многозадачная модель. Она включает в себя специфические для задач инновации, изначально встроенные в архитектуру:

Устаревшая поддержка

Если вы поддерживаете устаревшие системы, Ultralytics по-прежнему полностью поддерживает YOLO11 и более ранние итерации в том же API. Однако для всех новых разработок YOLO26 обеспечивает наилучшее соотношение ресурсов и точности.

Сценарии использования и рекомендации

Выбор между EfficientDet и YOLO26 зависит от ваших конкретных требований проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать EfficientDet

EfficientDet является отличным выбором для:

  • Конвейеры Google Cloud и TPU: Системы, глубоко интегрированные с API Google Cloud Vision или инфраструктурой TPU, где EfficientDet имеет нативную оптимизацию.
  • Исследование составного масштабирования: Академическое бенчмаркинг, сфокусированное на изучении влияния сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильное развертывание через TFLite: Проекты, которые специально требуют экспорта TensorFlow Lite для Android или встраиваемых устройств на Linux.

Когда выбирать YOLO26

YOLO26 рекомендуется для:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Пример реализации: Обучение YOLO26

Благодаря SDK Ultralytics для Python, запуск высокооптимизированного процесса обучения требует всего нескольких строк кода. Фреймворк нативно поддерживает масштабирование со смешанной точностью, оркестрацию нескольких GPU через PyTorch и конвейеры аугментации.

from ultralytics import YOLO

# Load the lightweight, end-to-end YOLO26n model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset leveraging the robust MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Automatically engages GPU acceleration
)

# Export natively to ONNX without NMS plugins
exported_path = model.export(format="onnx")
print(f"Model seamlessly exported to: {exported_path}")

Заключение: какую модель вам следует выбрать?

При сравнении EfficientDet и YOLO26 траектория развития отрасли очевидна. EfficientDet остается важным историческим этапом в исследованиях составного масштабирования. Однако для современных приложений — будь то развертывание на облачных кластерах или ограниченных устройствах Raspberry Pi — выбор сильно смещен в сторону Ultralytics.

Устранение NMS, оптимизация для значительно меньшего потребления VRAM и интеграция технологии в экосистему разработчиков мирового класса делают YOLO26 однозначно рекомендуемой архитектурой для надёжного, готового к производству компьютерного зрения. Независимо от того, detect ли вы производственные дефекты или картируете урожайность сельскохозяйственных культур, Платформа Ultralytics гарантирует переход от набора данных к развёртыванию с непревзойдённой скоростью и точностью.


Комментарии