Link to this sectionEfficientDet против YOLO11: подробное техническое сравнение#
Выбор оптимальной архитектуры нейронной сети — основа любого успешного приложения для компьютерного зрения. В этом подробном руководстве представлено углубленное техническое сравнение EfficientDet от Google и Ultralytics YOLO11, в котором анализируются их архитектурные различия, показатели производительности и сценарии для развертывания.
Независимо от того, стремишься ли ты к миллисекундной задержке на устройствах Edge AI или тебе требуется масштабируемая точность для облачного инференса, понимание нюансов этих моделей имеет решающее значение.
Link to this sectionПрофили моделей и технические детали#
Понимание истории и базовой философии проектирования каждой архитектуры помогает связать их производительность с реальными задачами обнаружения объектов.
Link to this sectionEfficientDet#
Разработанная исследователями из Google Brain, модель EfficientDet представила принципиальный подход к масштабированию сетей обнаружения объектов наряду с новой технологией BiFPN (двунаправленная пирамидальная сеть признаков).
- Авторы: Минсин Тан, Руомин Пан и Куок В. Ле
- Организация: Google
- Дата: 2019-11-20
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Документация: https://github.com/google/automl/tree/master/efficientdet#readme
Link to this sectionYOLO11#
YOLO11 представляет собой значительную эволюцию в экосистеме Ultralytics, расширяя границы производительности в реальном времени, эффективности параметров и многозадачного обучения.
- Авторы: Glenn Jocher и Jing Qiu
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Link to this sectionАрхитектурное сравнение#
Архитектурные различия между этими двумя моделями подчеркивают расхождение в стратегиях проектирования на протяжении многих лет.
EfficientDet использует бэкбон EfficientNet и внедряет BiFPN, что позволяет объединять признаки разных масштабов как сверху вниз, так и снизу вверх. Модель использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех сетей бэкбона, признаков и предсказания рамок/классов одновременно. Хотя это весьма эффективно для максимизации средней точности (mAP), сложная маршрутизация в BiFPN иногда может создавать узкое место в пропускной способности памяти во время инференса.
YOLO11, с другой стороны, использует оптимизированный модуль C3k2 и продвинутую «безъякорную» (anchor-free) голову детектирования. Такой оптимизированный подход минимизирует накладные расходы при извлечении признаков. Ultralytics спроектировали YOLO11 так, чтобы максимизировать использование оборудования GPU, что приводит к значительно меньшим требованиям к памяти как во время обучения, так и во время инференса по сравнению со старыми архитектурами или тяжелыми моделями трансформеров.
В то время как EfficientDet — это строго детектор объектов, YOLO11 отличается экстремальной универсальностью. Единая архитектура YOLO11 нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Link to this sectionТесты производительности#
В таблице ниже приведено сравнение производительности обеих семейств моделей в разных масштабах на наборе данных COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this sectionСбалансированный анализ: сильные и слабые стороны#
Ускорение на GPU: YOLO11 доминирует в средах с GPU. Например, YOLO11m выдает mAP 51.5% при молниеносных 4.7 мс на GPU T4 с использованием TensorRT. Чтобы достичь сопоставимой точности, EfficientDet-d5 требуется 67.86 мс — это более чем в 14 раз медленнее. Это подчеркивает превосходный баланс производительности моделей Ultralytics для приложений реального времени.
Среды CPU: EfficientDet демонстрирует высокооптимизированную скорость инференса на CPU в своих меньших вариантах (таких как d0 и d1) с использованием ONNX. Однако его точность плохо масштабируется без значительных потерь в задержке GPU в более крупных вариантах, таких как d7.
Link to this sectionМетодология обучения и экосистема#
Опыт разработчика зачастую так же важен, как и теоретические возможности модели. Именно здесь экосистема Ultralytics показывает себя с лучшей стороны.
EfficientDet сильно опирается на устаревшую экосистему TensorFlow и сложные библиотеки AutoML. Настройка конвейера пользовательского обучения включает крутую кривую обучения, сложное управление зависимостями и ручную конфигурацию якорей и функций потерь.
Напротив, Ultralytics предлагает непревзойденную простоту использования. Благодаря хорошо поддерживаемой экосистеме PyTorch, для обучения модели YOLO требуется всего несколько строк кода. Платформа автоматически управляет настройкой гиперпараметров, расширенной аугментацией данных и оптимальным планированием скорости обучения прямо «из коробки».
Link to this sectionПример кода: начало работы с Ultralytics#
Этот надежный, готовый к эксплуатации фрагмент кода демонстрирует, насколько простыми являются обучение и инференс в рамках Python API.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()Link to this sectionИдеальные варианты использования#
Когда использовать EfficientDet: EfficientDet остается жизнеспособным выбором для исследовательских сред, сильно зависимых от конвейеров TensorFlow или специфических ограничений CPU, где ранние архитектуры, такие как d0, работают достаточно хорошо.
Когда использовать YOLO11: YOLO11 — это окончательный выбор для современных корпоративных развертываний. Его исключительная скорость делает его идеальным для автономных транспортных средств, спортивной аналитики в реальном времени и высокопроизводительного обнаружения дефектов на производстве. Кроме того, низкое потребление памяти позволяет гибко развертывать его на оборудовании с ограниченными ресурсами, таком как NVIDIA Jetson.
Link to this sectionВзгляд в будущее: обновление YOLO26#
Хотя YOLO11 исключительно способна, разработчикам, начинающим новые проекты, следует оценить другие архитектуры Ultralytics, такие как проверенная YOLOv8 или недавно выпущенная YOLO26. Выпущенная в начале 2026 года, YOLO26 берет за основу YOLO11 и внедряет несколько революционных инноваций:
- Сквозной дизайн без NMS: Развивая наследие YOLOv10, YOLO26 полностью устраняет не-максимальное подавление (NMS) при постобработке, сокращая задержку и упрощая конвейеры развертывания.
- Оптимизатор MuSGD: Гибридный оптимизатор, сочетающий стандартный SGD с Muon (вдохновленный обучением больших языковых моделей), что значительно повышает стабильность обучения.
- До 43% быстрее инференс на CPU: Специфические оптимизации делают YOLO26 невероятно мощной на edge-устройствах, у которых нет дискретных GPU.
- ProgLoss + STAL: Продвинутые функции потерь, которые значительно улучшают обнаружение мелких объектов, что критически важно для аэрофотосъемки и робототехники.
Изучи более широкий ландшафт архитектур компьютерного зрения, включая детекторы на базе трансформеров, такие как RT-DETR, в нашей подробной документации Ultralytics.