EfficientDet против YOLO11: подробное техническое сравнение
Выбор оптимальной архитектуры нейронной сети — основа любого успешного приложения компьютерного зрения. Это подробное руководство содержит глубокое техническое сравнение EfficientDet от Google и Ultralytics YOLO11, анализируя их архитектурные различия, показатели производительности и идеальные сценарии развертывания.
Независимо от того, стремишься ли ты к миллисекундной задержке на устройствах edge AI или нуждаешься в масштабируемой точности для облачного вывода, понимание нюансов этих моделей имеет решающее значение.
Профили моделей и технические детали
Понимание истории развития и базовой философии дизайна каждой архитектуры помогает связать их производительность с реальными задачами обнаружения объектов.
EfficientDet
Разработанный исследователями Google Brain, EfficientDet представил принципиальный подход к масштабированию сетей обнаружения объектов наряду с инновационной структурой BiFPN (Bidirectional Feature Pyramid Network).
- Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
- Организация: Google
- Дата: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
YOLO11
YOLO11 представляет собой значительную эволюцию в экосистеме Ultralytics, расширяя границы производительности в реальном времени, эффективности параметров и многозадачного обучения.
- Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Архитектурное сравнение
Архитектурные различия между этими двумя моделями подчеркивают расхождение в стратегиях проектирования на протяжении многих лет.
EfficientDet использует бэкбон EfficientNet и внедряет BiFPN, что позволяет объединять многомасштабные признаки как сверху вниз, так и снизу вверх. Он использует метод составного масштабирования, который одновременно равномерно масштабирует разрешение, глубину и ширину для всех сетей бэкбона, сети признаков и сетей прогнозирования боксов/классов. Хотя это очень эффективно для максимизации средней точности (mAP), сложная маршрутизация в BiFPN иногда может создавать узкое место в пропускной способности памяти при инференсе.
YOLO11, напротив, использует оптимизированный модуль C2f и усовершенствованную anchor-free голову обнаружения. Этот упрощенный подход минимизирует накладные расходы при извлечении признаков. Ultralytics разработала YOLO11 для максимизации использования аппаратного обеспечения GPU, что привело к значительно меньшим требованиям к памяти при обучении и инференсе по сравнению со старыми архитектурами или тяжелыми трансформерными моделями.
В то время как EfficientDet является исключительно детектором объектов, YOLO11 обладает исключительной универсальностью. Единая архитектура YOLO11 поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Показатели производительности
В таблице ниже сравнивается производительность обоих семейств моделей в разных масштабах на датасете COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Сбалансированный анализ: сильные и слабые стороны
Ускорение GPU: YOLO11 доминирует в средах с GPU. Например, YOLO11m выдает mAP 51,5% при скорости 4,7 мс на GPU T4 с использованием TensorRT. Для достижения сопоставимой точности EfficientDet-d5 требуется 67,86 мс — более чем в 14 раз медленнее. Это подчеркивает превосходный баланс производительности моделей Ultralytics для приложений в реальном времени.
Среды CPU: EfficientDet демонстрирует высокооптимизированную скорость инференса на CPU в своих меньших вариантах (таких как d0 и d1) с использованием ONNX. Однако его точность плохо масштабируется без значительных штрафов по задержке на GPU в более крупных вариантах, таких как d7.
Методология обучения и экосистема
Опыт разработчика часто так же важен, как и теоретические возможности модели. Именно здесь экосистема Ultralytics проявляет себя наилучшим образом.
EfficientDet сильно полагается на устаревшую экосистему TensorFlow и сложные библиотеки AutoML. Настройка пользовательского конвейера обучения предполагает крутую кривую обучения, сложное управление зависимостями и ручную конфигурацию анкоров и функций потерь.
Напротив, Ultralytics предлагает непревзойденную простоту использования. Благодаря хорошо поддерживаемой экосистеме PyTorch, обучение модели YOLO требует всего несколько строк кода. Фреймворк автоматически управляет настройкой гиперпараметров, расширенной аугментацией данных и оптимальным планированием скорости обучения прямо из коробки.
Пример кода: Начало работы с Ultralytics
Этот надежный, готовый к эксплуатации сниппет демонстрирует, насколько простыми являются обучение и инференс в Python API.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()Идеальные сценарии использования
Когда использовать EfficientDet: EfficientDet остается жизнеспособным выбором для исследовательских сред, сильно завязанных на конвейеры TensorFlow, или специфических ограничений CPU, где ранние архитектуры вроде d0 работают адекватно.
Когда использовать YOLO11: YOLO11 — это окончательный выбор для современных корпоративных развертываний. Его исключительная скорость делает его идеальным для автономных транспортных средств, аналитики спортивных событий в реальном времени и высокопроизводительного обнаружения дефектов на производстве. Кроме того, меньшее использование памяти позволяет гибко развертывать его на оборудовании с ограниченными ресурсами, таком как NVIDIA Jetson.
Взгляд в будущее: обновление YOLO26
Хотя YOLO11 исключительно способна, разработчикам, начинающим новые проекты, стоит оценить другие архитектуры Ultralytics, такие как проверенная YOLOv8 или недавно выпущенная YOLO26. Выпущенная в начале 2026 года, YOLO26 берет за основу YOLO11 и внедряет несколько прорывных инноваций:
- Сквозной дизайн без NMS: Основываясь на наследии YOLOv10, YOLO26 полностью устраняет не-максимальное подавление (NMS) при постобработке, сокращая задержку и упрощая конвейеры развертывания.
- Оптимизатор MuSGD: Гибридный оптимизатор, сочетающий стандартный SGD с Muon (вдохновленный обучением больших языковых моделей), что значительно улучшает стабильность обучения.
- До 43% быстрее инференс на CPU: Специальные оптимизации делают YOLO26 невероятно мощной на периферийных устройствах без дискретных GPU.
- ProgLoss + STAL: Передовые функции потерь, которые заметно улучшают обнаружение мелких объектов, что критично для аэрофотосъемки и робототехники.
Исследуй более широкий спектр архитектур компьютерного зрения, включая детекторы на основе трансформеров, такие как RT-DETR, в нашей комплексной документации Ultralytics.