EfficientDet против YOLO11: Всестороннее техническое сравнение
Выбор оптимальной архитектуры нейронной сети является основой любого успешного приложения компьютерного зрения. Это всестороннее руководство содержит углубленное техническое сравнение EfficientDet от Google и Ultralytics YOLO11, анализируя их архитектурные различия, метрики производительности и идеальные сценарии развертывания.
Независимо от того, стремитесь ли вы к миллисекундной задержке на периферийных ИИ-устройствах или требуете масштабируемой точности для облачного инференса, понимание нюансов этих моделей имеет решающее значение.
Профили моделей и технические детали
Понимание происхождения и основополагающей философии проектирования каждой архитектуры помогает контекстуализировать их производительность в реальных задачах обнаружения объектов.
EfficientDet
Разработанный исследователями Google Brain, EfficientDet представил принципиальный подход к масштабированию сетей обнаружения объектов наряду с новой BiFPN (двунаправленной пирамидальной сетью признаков).
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация:Google
- Дата: 2019-11-20
- Arxiv:https://arxiv.org/abs/1911.09070
- GitHub:https://github.com/google/automl/tree/master/efficientdet
- Документация:https://github.com/google/automl/tree/master/efficientdet#readme
Узнайте больше об EfficientDet
YOLO11
YOLO11 представляет собой значительную эволюцию в экосистеме Ultralytics, расширяя границы производительности в реальном времени, эффективности параметров и многозадачного обучения.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Документация:https://docs.ultralytics.com/models/yolo11/
Архитектурное сравнение
Архитектурные различия между этими двумя моделями подчеркивают расхождение в стратегиях проектирования на протяжении многих лет.
EfficientDet использует основу EfficientNet и вводит BiFPN, что позволяет осуществлять многомасштабное слияние признаков сверху вниз и снизу вверх. Он использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех сетей основы, признаков и предсказания рамок/классов одновременно. Хотя это очень эффективно для максимизации средней точности (mAP), сложная маршрутизация в BiFPN иногда может создавать узкое место в пропускной способности памяти во время инференса.
YOLO11, с другой стороны, использует оптимизированный модуль C2f и продвинутую безъякорную детектирующую голову. Этот оптимизированный подход минимизирует накладные расходы при извлечении признаков. Ultralytics разработала YOLO11 для максимального использования аппаратного обеспечения GPU, что приводит к значительно более низким требованиям к памяти как во время обучения, так и во время инференса по сравнению со старыми архитектурами или тяжелыми трансформерными моделями.
Многозадачная универсальность
В то время как EfficientDet является строго детектором объектов, YOLO11 обладает исключительной универсальностью. Единая архитектура YOLO11 нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Ориентиры производительности
В таблице ниже сопоставляется производительность обоих семейств моделей в различных масштабах на наборе данных COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Сбалансированный анализ: сильные и слабые стороны
Ускорение GPU: YOLO11 доминирует в средах GPU. Например, YOLO11m обеспечивает mAP 51,5% при невероятных 4,7 мс на GPU T4 с использованием TensorRT. Для достижения сопоставимой точности EfficientDet-d5 требуется 67,86 мс — более чем в 14 раз медленнее. Это подчеркивает превосходный баланс производительности моделей Ultralytics для приложений реального времени.
Среды CPU: EfficientDet демонстрирует высокооптимизированную скорость инференса на CPU в своих меньших вариантах (таких как d0 и d1) с использованием ONNX. Однако его точность плохо масштабируется без значительных штрафов за задержку GPU в более крупных вариантах, таких как d7.
Методология обучения и экосистема
Опыт разработчика часто так же важен, как и теоретические возможности модели. Именно здесь экосистема Ultralytics проявляет себя наилучшим образом.
EfficientDet в значительной степени полагается на устаревшую экосистему TensorFlow и сложные библиотеки AutoML. Настройка пользовательского конвейера обучения включает в себя крутую кривую обучения, сложное управление зависимостями и ручную настройку якорей и функций потерь.
Напротив, Ultralytics предлагает беспрецедентную простоту использования. Благодаря хорошо поддерживаемой экосистеме PyTorch, обучение модели YOLO требует всего нескольких строк кода. Фреймворк автоматически управляет настройкой гиперпараметров, расширенными аугментациями данных и оптимальным планированием скорости обучения из коробки.
Пример кода: Начало работы с Ultralytics
Этот надежный, готовый к производству фрагмент кода демонстрирует простоту обучения и вывода в рамках Python API.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()
Идеальные варианты использования
Когда использовать EfficientDet: EfficientDet остается жизнеспособным выбором для исследовательских сред, глубоко укоренившихся в конвейерах TensorFlow или имеющих специфические ограничения, связанные с CPU, где ранние архитектуры, такие как d0, работают адекватно.
Когда использовать YOLO11: YOLO11 — это окончательный выбор для современных корпоративных развертываний. Его исключительная скорость делает его идеальным для автономных транспортных средств, спортивной аналитики в реальном времени и высокопроизводительного обнаружения дефектов на производстве. Кроме того, его меньшее потребление памяти обеспечивает гибкое развертывание на аппаратуре с ограниченными ресурсами, такой как NVIDIA Jetson.
Взгляд в будущее: Обновление YOLO26
Хотя YOLO11 исключительно эффективен, разработчикам, начинающим новые проекты, следует рассмотреть другие архитектуры Ultralytics, такие как проверенный YOLOv8 или недавно выпущенный YOLO26. Выпущенный в начале 2026 года, YOLO26 берет за основу YOLO11 и представляет несколько новаторских инноваций:
- Сквозная архитектура без NMS: Основываясь на наследии YOLOv10, YOLO26 полностью исключает подавление немаксимумов (NMS) на этапе постобработки, значительно сокращая задержку и упрощая конвейеры развертывания.
- Оптимизатор MuSGD: Гибридный оптимизатор, сочетающий стандартный SGD с Muon (вдохновленный обучением больших языковых моделей), что значительно повышает стабильность обучения.
- До 43% более быстрый инференс на CPU: Специфические оптимизации делают YOLO26 невероятно мощным на периферийных устройствах, не имеющих дискретных GPU.
- ProgLoss + STAL: Передовые функции потерь, которые значительно улучшают обнаружение мелких объектов, что критически важно для аэросъемки и робототехники.
Изучите более широкий спектр архитектур компьютерного зрения, включая детекторы на основе трансформеров, такие как RT-DETR, в нашей всеобъемлющей документации Ultralytics.