Перейти к содержанию

YOLO11 EfficientDet: техническое сравнение архитектур систем технического зрения

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. В этом сравнении рассматриваются технические различия между Ultralytics YOLO11, передовой детектор реального времени, выпущенный в конце 2024 года, и Google , очень влиятельной архитектурой 2019 года, которая внедрила в эту область составное масштабирование.

В то время как EfficientDet установил стандарты эффективности параметров после своего выпуска, YOLO11 результат многолетних инноваций, направленных на максимальное повышение скорости вывода, точности и удобства использования для современных периферийных ИИ-приложений и облачных приложений.

Доступна новая модель

Хотя YOLO11 мощной моделью, Ultralytics (выпущенная в январе 2026 года) в настоящее время является рекомендуемым современным выбором для новых проектов. YOLO26 предлагает комплексную конструкцию NMS, более быстрое выведение и повышенную точность.

Узнайте больше о YOLO26

Метрики производительности и анализ

В следующей таблице представлено прямое сравнение показателей производительности на COCO . Ключевые показатели включают среднюю среднюю точность (mAP) для точности, скорость вывода (задержка) на различном оборудовании, размер модели (параметры) и вычислительную сложность (FLOP).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Основные выводы

  • Задержка вывода: Ultralytics YOLO11 превосходит EfficientDet по задержке. Например, YOLO11x достигает более высокой точности (54,7 mAP) по сравнению с EfficientDet-d7 (53,7 mAP), при этом работая более чем в 10 раз быстрее на GPU T4 GPU 11,3 мс против 128,07 мс).
  • Эффективность архитектуры: в то время как EfficientDet оптимизирует FLOP (операции с плавающей запятой), YOLO11 использование аппаратного обеспечения. Это подчеркивает важное различие в показателях производительности ИИ: более низкие FLOP не всегда означают более быстрое вычисление в реальных условиях из-за затрат на доступ к памяти и ограничений параллелизма.
  • Масштабируемость модели: YOLO11 более практичную кривую масштабирования. Модель «nano» (YOLO11n) обеспечивает полезную производительность 39,5 mAP невероятной скорости, в то время как самая маленькая модель EfficientDet-d0 отстает с показателем 34,6 mAP.

Ultralytics YOLO11: архитектура и особенности

Ultralytics YOLO11 на наследии семейства YOLO You Only Look Once) и усовершенствует архитектуру для современной эры компьютерного зрения. Он вносит значительные изменения в основу и шею для улучшения извлечения характеристик и скорости обработки.

Среди значительных архитектурных усовершенствований можно отметить блок C3k2, усовершенствованную версию узкого места Cross Stage Partial (CSP), использовавшегося в предыдущих версиях, и модуль C2PSA (Cross Stage Partial Spatial Attention). Эти компоненты позволяют модели улавливать сложные паттерны и контекст в изображениях с меньшим количеством параметров.

Узнайте больше о YOLO11

Сильные стороны YOLO11

  1. Единая экосистема: YOLO11 не просто модель обнаружения; она поддерживает сегментацию экземпляров, оценку позы, OBB и классификацию из коробки.
  2. Готовность к развертыванию: благодаря встроенному режиму экспорта пользователи могут конвертировать модели в ONNX, TensorRT, CoreML и TFLite одной команды, что обеспечивает беспроблемное развертывание на мобильных и пограничных устройствах.
  3. Эффективность обучения: YOLO11 значительно быстрее, чем более старые архитектуры, такие как EfficientDet, благодаря использованию современных конвейеров аугментации и оптимизированных функций потерь.

Google : архитектура и наследие

EfficientDet, разработанный командой Google , ввел концепцию Compound Scaling в область обнаружения объектов. Вместо ручного проектирования более крупных моделей авторы предложили метод одновременного масштабирования разрешения, глубины и ширины сети.

Основой EfficientDet является BiFPN (Bi-directional Feature Pyramid Network), которая позволяет легко объединять многомасштабные характеристики. Она использует базовую структуру EfficientNet, которая также была разработана с помощью Neural Architecture Search (NAS).

  • Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
  • Организация: Google
  • Дата: 2019-11-20
  • Архив:1911.09070
  • GitHub:google/automl

Сильные стороны и ограничения

  • Эффективность параметров: EfficientDet исторически известен тем, что достигает высокой точности с очень небольшим количеством параметров.
  • Теоретическая эффективность: несмотря на низкую производительность по FLOP, сложные связи в слое BiFPN могут быть памятьем-емкими и медленнее выполняться на GPU по сравнению с прямыми сверточными путями YOLO.
  • Ограниченная универсальность: исходный репозиторий в основном ориентирован на обнаружение и не обладает встроенной многозадачной гибкостью (сегментация, поза, OBB), которая присутствует в Ultralytics .

Сравнительный анализ: почему стоит выбрать Ultralytics?

При сравнении этих двух моделей для производственных сред в 2025 и 2026 годах преимущества Ultralytics становятся очевидными.

Простота использования и опыт разработчика

Ultralytics оптимизации пользовательского опыта. Для реализации YOLO11 всего несколько строк Python , тогда как использование EfficientDet часто сопряжено с необходимостью навигации по сложным устаревшим кодовым базам или TensorFlow .

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

Хорошо поддерживаемая экосистема

Ultralytics активно поддерживается и часто обновляется. Проблемы, поднимаемые на GitHub, решаются быстро, а поддержка со стороны сообщества обширна. В отличие от этого, старые исследовательские репозитории, такие как оригинальная EfficientDet, часто обновляются нерегулярно, что затрудняет их поддержку в долгосрочных коммерческих проектах.

Баланс производительности и память

YOLO11 превосходный баланс скорости и точности. Архитектурные решения в YOLO11 GPU , что приводит к более быстрым временам инференции, даже если теоретическое количество FLOP выше, чем в EfficientDet. Кроме того, Ultralytics оптимизированы для меньшего использования памяти во время обучения, что позволяет пользователям обучать эффективные модели на потребительских GPU, в отличие от многих альтернатив на основе Transformer, которые требуют огромного объема VRAM.

Универсальность в различных задачах

В то время как EfficientDet в первую очередь является детектором объектов, YOLO11 основой для решения различных задач. Такая универсальность снижает необходимость изучения различных фреймворков для решения разных задач.

Одна структура, несколько задач

  • Обнаружение: определение объектов и их местоположения.
  • Сегментация: понимание объектов на уровне пикселей.
  • Оценка позы: обнаружение ключевых точек на теле человека.
  • Ориентированные ограничительные рамки (OBB): обнаружение повернутых объектов, таких как корабли, на аэрофотоснимках.
  • Классификация: Эффективная классификация целых изображений.

Заключение

Обе архитектуры представляют собой важные вехи в истории компьютерного зрения. EfficientDet продемонстрировал мощь нейронного архитектурного поиска и сложного масштабирования. Однако для практического применения на сегодняшний день Ultralytics YOLO11 является лучшим выбором. Он предлагает более высокую скорость вывода, более высокую точность и удобную для разработчиков экосистему, которая значительно сокращает время вывода продукта на рынок.

Разработчикам, стремящимся к максимальной производительности, мы рекомендуем ознакомиться с YOLO26, который основан на успехах YOLO11 еще большей эффективностью и дизайном NMS. Те, кто интересуется подходами на основе трансформаторов, могут также рассмотреть RT-DETR для глобального контекстного распознавания.

Откройте для себя весь потенциал искусственного интеллекта в области зрения, посетив Ultralytics , где вы сможете обучать, развертывать и управлять своими моделями в облаке.


Комментарии