EfficientDet против YOLO26: комплексное техническое сравнение

Выбор правильной архитектуры компьютерного зрения — критически важный шаг при создании масштабируемых и эффективных систем ИИ. Это подробное руководство содержит глубокое техническое сравнение устаревшей модели EfficientDet от Google и передовой Ultralytics YOLO26. Мы оцениваем их базовые архитектуры, показатели производительности и методологии обучения, чтобы помочь тебе выбрать лучшую модель для твоих конкретных ограничений развертывания.

Происхождение моделей и авторы

Понимание истоков этих архитектур дает ценный контекст касательно философии их проектирования и предполагаемых сценариев использования.

EfficientDet Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google Research
Дата: 20.11.2019
Arxiv: 1911.09070
GitHub: google/automl/efficientdet

Узнай больше о EfficientDet

YOLO26 Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 14.01.2026
GitHub: ultralytics/ultralytics

Узнай больше о YOLO26

Архитектурные инновации

Различия в архитектуре между этими двумя моделями существенны, что отражает стремительный прогресс в области глубокого обучения за последние несколько лет.

EfficientDet была построена на основе BiFPN (двунаправленная пирамидальная сеть признаков) и использует метод составного масштабирования по разрешению, глубине и ширине. Хотя в 2019 году она достигла отличной теоретической эффективности, модель сильно зависит от устаревших фреймворков TensorFlow и сложных алгоритмов поиска AutoML, которые часто затруднительно адаптировать под пользовательские наборы данных.

В отличие от нее, Ultralytics YOLO26 представляет собой абсолютный передний край технологий компьютерного зрения в реальном времени. В ней представлено несколько революционных архитектурных улучшений, разработанных специально для современных конвейеров развертывания:

  • Сквозной дизайн без NMS: YOLO26 является нативно сквозной моделью, полностью исключающей необходимость постобработки методом подавления немаксимумов (NMS). Этот прорывной подход, впервые примененный в YOLOv10, обеспечивает более быструю и простую логику развертывания, а также значительно снижает вариативность задержек на периферийных чипах.
  • Удаление DFL: Удалив функцию потерь распределения (DFL), YOLO26 упростила выходной слой, что привело к превосходной совместимости с периферийными вычислениями и маломощными устройствами.
  • Оптимизатор MuSGD: Вдохновленная инновациями больших языковых моделей, такими как Kimi K2 от Moonshot AI, модель YOLO26 использует оптимизатор MuSGD — гибрид SGD и Muon. Это обеспечивает значительно более стабильное обучение и более быструю сходимость по сравнению со стандартными оптимизаторами.
  • ProgLoss + STAL: Внедрение прогрессивных функций потерь в сочетании с обучением, ориентированным на задачи с учетом масштаба (STAL), обеспечивает заметные улучшения в распознавании мелких объектов, что крайне важно для аэросъемки и робототехники.
Совет эксперта: развертывание без NMS

Поскольку YOLO26 исключает NMS, вся модель может выполняться как единый непрерывный вычислительный граф. Это делает экспорт в такие форматы, как ONNX или TensorRT, невероятно простым и максимально повышает загрузку NPU/GPU.

Метрики производительности и бенчмарки

Настоящая проверка любой модели детектирования объектов заключается в ее производительности в реальных условиях. В таблице ниже точность, измеряемая в средней точности (mAP), сравнивается со скоростью логического вывода и вычислительными требованиями.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Как показано выше, YOLO26 предлагает значительно лучший баланс производительности. Хотя старые архитектуры могут иногда демонстрировать низкие теоретические показатели FLOPs, YOLO26 использует оптимизированные шаблоны доступа к памяти для достижения значительно более быстрого логического вывода на GPU. Например, YOLO26x достигает невероятных 57.5 mAP, работая почти в 10 раз быстрее на оборудовании TensorRT, чем эквивалентная EfficientDet-d7. Кроме того, YOLO26 оснащена оптимизациями, которые обеспечивают до 43% более быстрый логический вывод на CPU по сравнению с устаревшими вариантами YOLO, что делает ее лучшим выбором для Edge AI.

Преимущество экосистемы Ultralytics

Выбор архитектуры редко сводится только к теоретическим FLOPs; он сильно зависит от инженерных рабочих процессов. Разработчики постоянно отдают предпочтение Ultralytics из-за непревзойденной простоты использования.

Обучение EfficientDet часто требует сложного управления зависимостями, ручной настройки гиперпараметров и устаревших настроек TensorFlow. И наоборот, модели Ultralytics имеют элегантно простой API. Этот бесшовный опыт напрямую переносится на платформу Ultralytics, которая берет на себя облачное обучение, разметку данных и отслеживание экспериментов в реальном времени прямо «из коробки».

Более того, детекторы на базе трансформеров и сложные модели AutoML страдают от непомерного потребления памяти. Модели Ultralytics славятся своими крайне эффективными требованиями к памяти, что означает, что ты можешь обучать надежные модели на потребительском оборудовании, не сталкиваясь с ошибками нехватки памяти (OOM).

Универсальность и поддержка задач

EfficientDet — это строго сеть для детектирования объектов. YOLO26 — это универсальный мультизадачный ученик. Она включает в себя специфические инновации, изначально встроенные в архитектуру:

Поддержка устаревших версий

Если ты поддерживаешь старые системы, Ultralytics по-прежнему полностью поддерживает YOLO11 и более старые итерации в рамках того же API. Однако для всех новых разработок YOLO26 обеспечивает лучшую отдачу от соотношения ресурсов к точности.

Варианты использования и рекомендации

Выбор между EfficientDet и YOLO26 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать EfficientDet

EfficientDet — это хороший выбор для:

  • Конвейеров Google Cloud и TPU: Систем, глубоко интегрированных с API Google Cloud Vision или инфраструктурой TPU, где EfficientDet имеет нативную оптимизацию.
  • Исследований в области составного масштабирования: Академических бенчмарков, сфокусированных на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Развертывания на мобильных устройствах через TFLite: Проектов, которые специально требуют экспорта в TensorFlow Lite для Android или встроенных Linux-устройств.

Когда выбирать YOLO26

YOLO26 рекомендуется для:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Пример реализации: Обучение YOLO26

Благодаря Python SDK от Ultralytics для запуска высокооптимизированного обучения требуется всего несколько строк кода. Фреймворк нативно поддерживает масштабирование со смешанной точностью, оркестрацию с использованием нескольких GPU через PyTorch и конвейеры аугментации.

from ultralytics import YOLO

# Load the lightweight, end-to-end YOLO26n model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset leveraging the robust MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Automatically engages GPU acceleration
)

# Export natively to ONNX without NMS plugins
exported_path = model.export(format="onnx")
print(f"Model seamlessly exported to: {exported_path}")

Заключение: какую модель выбрать?

При сравнении EfficientDet и YOLO26 траектория развития отрасли очевидна. EfficientDet остается важной исторической вехой в исследованиях составного масштабирования. Однако для современных приложений — будь то развертывание в облачных кластерах или на устройствах с ограничениями, таких как Raspberry Pi — выбор сильно склоняется в сторону Ultralytics.

Исключив NMS, оптимизировав модель для значительно меньшего потребления VRAM и обернув технологию в экосистему разработчиков мирового класса, YOLO26 определенно является рекомендованной архитектурой для надежного компьютерного зрения, готового к производству. Независимо от того, обнаруживаешь ли ты производственные дефекты или оцениваешь урожайность в сельском хозяйстве, платформа Ultralytics гарантирует, что ты перейдешь от набора данных к развертыванию с непревзойденной скоростью и точностью.

Комментарии