EfficientDet против YOLO11: подробное техническое сравнение

Выбор оптимальной архитектуры нейронной сети — основа любого успешного приложения компьютерного зрения. Это подробное руководство содержит глубокое техническое сравнение EfficientDet от Google и Ultralytics YOLO11, анализируя их архитектурные различия, показатели производительности и идеальные сценарии развертывания.

Независимо от того, стремишься ли ты к миллисекундной задержке на устройствах edge AI или нуждаешься в масштабируемой точности для облачного вывода, понимание нюансов этих моделей имеет решающее значение.

Профили моделей и технические детали

Понимание истории развития и базовой философии дизайна каждой архитектуры помогает связать их производительность с реальными задачами обнаружения объектов.

EfficientDet

Разработанный исследователями Google Brain, EfficientDet представил принципиальный подход к масштабированию сетей обнаружения объектов наряду с инновационной структурой BiFPN (Bidirectional Feature Pyramid Network).

Узнай больше об EfficientDet

YOLO11

YOLO11 представляет собой значительную эволюцию в экосистеме Ultralytics, расширяя границы производительности в реальном времени, эффективности параметров и многозадачного обучения.

Узнай больше о YOLO11

Архитектурное сравнение

Архитектурные различия между этими двумя моделями подчеркивают расхождение в стратегиях проектирования на протяжении многих лет.

EfficientDet использует бэкбон EfficientNet и внедряет BiFPN, что позволяет объединять многомасштабные признаки как сверху вниз, так и снизу вверх. Он использует метод составного масштабирования, который одновременно равномерно масштабирует разрешение, глубину и ширину для всех сетей бэкбона, сети признаков и сетей прогнозирования боксов/классов. Хотя это очень эффективно для максимизации средней точности (mAP), сложная маршрутизация в BiFPN иногда может создавать узкое место в пропускной способности памяти при инференсе.

YOLO11, напротив, использует оптимизированный модуль C2f и усовершенствованную anchor-free голову обнаружения. Этот упрощенный подход минимизирует накладные расходы при извлечении признаков. Ultralytics разработала YOLO11 для максимизации использования аппаратного обеспечения GPU, что привело к значительно меньшим требованиям к памяти при обучении и инференсе по сравнению со старыми архитектурами или тяжелыми трансформерными моделями.

Многозадачная универсальность

В то время как EfficientDet является исключительно детектором объектов, YOLO11 обладает исключительной универсальностью. Единая архитектура YOLO11 поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).

Показатели производительности

В таблице ниже сравнивается производительность обоих семейств моделей в разных масштабах на датасете COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Сбалансированный анализ: сильные и слабые стороны

Ускорение GPU: YOLO11 доминирует в средах с GPU. Например, YOLO11m выдает mAP 51,5% при скорости 4,7 мс на GPU T4 с использованием TensorRT. Для достижения сопоставимой точности EfficientDet-d5 требуется 67,86 мс — более чем в 14 раз медленнее. Это подчеркивает превосходный баланс производительности моделей Ultralytics для приложений в реальном времени.

Среды CPU: EfficientDet демонстрирует высокооптимизированную скорость инференса на CPU в своих меньших вариантах (таких как d0 и d1) с использованием ONNX. Однако его точность плохо масштабируется без значительных штрафов по задержке на GPU в более крупных вариантах, таких как d7.

Методология обучения и экосистема

Опыт разработчика часто так же важен, как и теоретические возможности модели. Именно здесь экосистема Ultralytics проявляет себя наилучшим образом.

EfficientDet сильно полагается на устаревшую экосистему TensorFlow и сложные библиотеки AutoML. Настройка пользовательского конвейера обучения предполагает крутую кривую обучения, сложное управление зависимостями и ручную конфигурацию анкоров и функций потерь.

Напротив, Ultralytics предлагает непревзойденную простоту использования. Благодаря хорошо поддерживаемой экосистеме PyTorch, обучение модели YOLO требует всего несколько строк кода. Фреймворк автоматически управляет настройкой гиперпараметров, расширенной аугментацией данных и оптимальным планированием скорости обучения прямо из коробки.

Пример кода: Начало работы с Ultralytics

Этот надежный, готовый к эксплуатации сниппет демонстрирует, насколько простыми являются обучение и инференс в Python API.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()

Идеальные сценарии использования

Когда использовать EfficientDet: EfficientDet остается жизнеспособным выбором для исследовательских сред, сильно завязанных на конвейеры TensorFlow, или специфических ограничений CPU, где ранние архитектуры вроде d0 работают адекватно.

Когда использовать YOLO11: YOLO11 — это окончательный выбор для современных корпоративных развертываний. Его исключительная скорость делает его идеальным для автономных транспортных средств, аналитики спортивных событий в реальном времени и высокопроизводительного обнаружения дефектов на производстве. Кроме того, меньшее использование памяти позволяет гибко развертывать его на оборудовании с ограниченными ресурсами, таком как NVIDIA Jetson.

Взгляд в будущее: обновление YOLO26

Хотя YOLO11 исключительно способна, разработчикам, начинающим новые проекты, стоит оценить другие архитектуры Ultralytics, такие как проверенная YOLOv8 или недавно выпущенная YOLO26. Выпущенная в начале 2026 года, YOLO26 берет за основу YOLO11 и внедряет несколько прорывных инноваций:

  • Сквозной дизайн без NMS: Основываясь на наследии YOLOv10, YOLO26 полностью устраняет не-максимальное подавление (NMS) при постобработке, сокращая задержку и упрощая конвейеры развертывания.
  • Оптимизатор MuSGD: Гибридный оптимизатор, сочетающий стандартный SGD с Muon (вдохновленный обучением больших языковых моделей), что значительно улучшает стабильность обучения.
  • До 43% быстрее инференс на CPU: Специальные оптимизации делают YOLO26 невероятно мощной на периферийных устройствах без дискретных GPU.
  • ProgLoss + STAL: Передовые функции потерь, которые заметно улучшают обнаружение мелких объектов, что критично для аэрофотосъемки и робототехники.

Исследуй более широкий спектр архитектур компьютерного зрения, включая детекторы на основе трансформеров, такие как RT-DETR, в нашей комплексной документации Ultralytics.

Комментарии