YOLO11 EfficientDet: техническое сравнение архитектур систем технического зрения
В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. В этом сравнении рассматриваются технические различия между Ultralytics YOLO11, передовой детектор реального времени, выпущенный в конце 2024 года, и Google , очень влиятельной архитектурой 2019 года, которая внедрила в эту область составное масштабирование.
В то время как EfficientDet установил стандарты эффективности параметров после своего выпуска, YOLO11 результат многолетних инноваций, направленных на максимальное повышение скорости вывода, точности и удобства использования для современных периферийных ИИ-приложений и облачных приложений.
Доступна новая модель
Хотя YOLO11 мощной моделью, Ultralytics (выпущенная в январе 2026 года) в настоящее время является рекомендуемым современным выбором для новых проектов. YOLO26 предлагает комплексную конструкцию NMS, более быстрое выведение и повышенную точность.
Метрики производительности и анализ
В следующей таблице представлено прямое сравнение показателей производительности на COCO . Ключевые показатели включают среднюю среднюю точность (mAP) для точности, скорость вывода (задержка) на различном оборудовании, размер модели (параметры) и вычислительную сложность (FLOP).
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Основные выводы
- Задержка вывода: Ultralytics YOLO11 превосходит EfficientDet по задержке. Например, YOLO11x достигает более высокой точности (54,7 mAP) по сравнению с EfficientDet-d7 (53,7 mAP), при этом работая более чем в 10 раз быстрее на GPU T4 GPU 11,3 мс против 128,07 мс).
- Эффективность архитектуры: в то время как EfficientDet оптимизирует FLOP (операции с плавающей запятой), YOLO11 использование аппаратного обеспечения. Это подчеркивает важное различие в показателях производительности ИИ: более низкие FLOP не всегда означают более быстрое вычисление в реальных условиях из-за затрат на доступ к памяти и ограничений параллелизма.
- Масштабируемость модели: YOLO11 более практичную кривую масштабирования. Модель «nano» (YOLO11n) обеспечивает полезную производительность 39,5 mAP невероятной скорости, в то время как самая маленькая модель EfficientDet-d0 отстает с показателем 34,6 mAP.
Ultralytics YOLO11: архитектура и особенности
Ultralytics YOLO11 на наследии семейства YOLO You Only Look Once) и усовершенствует архитектуру для современной эры компьютерного зрения. Он вносит значительные изменения в основу и шею для улучшения извлечения характеристик и скорости обработки.
Среди значительных архитектурных усовершенствований можно отметить блок C3k2, усовершенствованную версию узкого места Cross Stage Partial (CSP), использовавшегося в предыдущих версиях, и модуль C2PSA (Cross Stage Partial Spatial Attention). Эти компоненты позволяют модели улавливать сложные паттерны и контекст в изображениях с меньшим количеством параметров.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- GitHub:ultralytics/ultralytics
- Документация:Документация YOLO11
Сильные стороны YOLO11
- Единая экосистема: YOLO11 не просто модель обнаружения; она поддерживает сегментацию экземпляров, оценку позы, OBB и классификацию из коробки.
- Готовность к развертыванию: благодаря встроенному режиму экспорта пользователи могут конвертировать модели в ONNX, TensorRT, CoreML и TFLite одной команды, что обеспечивает беспроблемное развертывание на мобильных и пограничных устройствах.
- Эффективность обучения: YOLO11 значительно быстрее, чем более старые архитектуры, такие как EfficientDet, благодаря использованию современных конвейеров аугментации и оптимизированных функций потерь.
Google : архитектура и наследие
EfficientDet, разработанный командой Google , ввел концепцию Compound Scaling в область обнаружения объектов. Вместо ручного проектирования более крупных моделей авторы предложили метод одновременного масштабирования разрешения, глубины и ширины сети.
Основой EfficientDet является BiFPN (Bi-directional Feature Pyramid Network), которая позволяет легко объединять многомасштабные характеристики. Она использует базовую структуру EfficientNet, которая также была разработана с помощью Neural Architecture Search (NAS).
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация: Google
- Дата: 2019-11-20
- Архив:1911.09070
- GitHub:google/automl
Сильные стороны и ограничения
- Эффективность параметров: EfficientDet исторически известен тем, что достигает высокой точности с очень небольшим количеством параметров.
- Теоретическая эффективность: несмотря на низкую производительность по FLOP, сложные связи в слое BiFPN могут быть памятьем-емкими и медленнее выполняться на GPU по сравнению с прямыми сверточными путями YOLO.
- Ограниченная универсальность: исходный репозиторий в основном ориентирован на обнаружение и не обладает встроенной многозадачной гибкостью (сегментация, поза, OBB), которая присутствует в Ultralytics .
Сравнительный анализ: почему стоит выбрать Ultralytics?
При сравнении этих двух моделей для производственных сред в 2025 и 2026 годах преимущества Ultralytics становятся очевидными.
Простота использования и опыт разработчика
Ultralytics оптимизации пользовательского опыта. Для реализации YOLO11 всего несколько строк Python , тогда как использование EfficientDet часто сопряжено с необходимостью навигации по сложным устаревшим кодовым базам или TensorFlow .
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Хорошо поддерживаемая экосистема
Ultralytics активно поддерживается и часто обновляется. Проблемы, поднимаемые на GitHub, решаются быстро, а поддержка со стороны сообщества обширна. В отличие от этого, старые исследовательские репозитории, такие как оригинальная EfficientDet, часто обновляются нерегулярно, что затрудняет их поддержку в долгосрочных коммерческих проектах.
Баланс производительности и память
YOLO11 превосходный баланс скорости и точности. Архитектурные решения в YOLO11 GPU , что приводит к более быстрым временам инференции, даже если теоретическое количество FLOP выше, чем в EfficientDet. Кроме того, Ultralytics оптимизированы для меньшего использования памяти во время обучения, что позволяет пользователям обучать эффективные модели на потребительских GPU, в отличие от многих альтернатив на основе Transformer, которые требуют огромного объема VRAM.
Универсальность в различных задачах
В то время как EfficientDet в первую очередь является детектором объектов, YOLO11 основой для решения различных задач. Такая универсальность снижает необходимость изучения различных фреймворков для решения разных задач.
Одна структура, несколько задач
- Обнаружение: определение объектов и их местоположения.
- Сегментация: понимание объектов на уровне пикселей.
- Оценка позы: обнаружение ключевых точек на теле человека.
- Ориентированные ограничительные рамки (OBB): обнаружение повернутых объектов, таких как корабли, на аэрофотоснимках.
- Классификация: Эффективная классификация целых изображений.
Заключение
Обе архитектуры представляют собой важные вехи в истории компьютерного зрения. EfficientDet продемонстрировал мощь нейронного архитектурного поиска и сложного масштабирования. Однако для практического применения на сегодняшний день Ultralytics YOLO11 является лучшим выбором. Он предлагает более высокую скорость вывода, более высокую точность и удобную для разработчиков экосистему, которая значительно сокращает время вывода продукта на рынок.
Разработчикам, стремящимся к максимальной производительности, мы рекомендуем ознакомиться с YOLO26, который основан на успехах YOLO11 еще большей эффективностью и дизайном NMS. Те, кто интересуется подходами на основе трансформаторов, могут также рассмотреть RT-DETR для глобального контекстного распознавания.
Откройте для себя весь потенциал искусственного интеллекта в области зрения, посетив Ultralytics , где вы сможете обучать, развертывать и управлять своими моделями в облаке.