Перейти к содержанию

EfficientDet против YOLO11: оценка эволюции обнаружения объектов

Выбор оптимальной архитектуры для приложений компьютерного зрения часто предполагает поиск баланса между вычислительной эффективностью и точностью обнаружения. В этом всестороннем сравнении рассматриваются технические различия между EfficientDet, масштабируемой архитектурой обнаружения от Google 2019 года, и YOLO11, выпущенной в 2024 году компанией Ultralytics , которая переопределила производительность в реальном времени.

В то время как EfficientDet представил революционные концепции в области масштабирования моделей, YOLO11 значительный скачок вперед в области удобства использования, скорости вывода и многозадачности. Разработчикам, начинающим новые проекты в 2026 году, мы также рекомендуем ознакомиться с новейшей версией YOLO26, которая основана на описанных здесь инновациях и поддерживает нативную сквозную обработку.

Анализ эталонных показателей производительности

Область обнаружения объектов претерпела радикальные изменения: от оптимизации теоретической производительности FLOPs к оптимизации реальной задержки. В таблице ниже показан резкий контраст в скорости вывода. В то время как EfficientDet-d0 требует примерно 10 мс для CPU , современные архитектуры, такие как YOLO11n, выполняют аналогичные задачи значительно быстрее, часто менее чем за 2 мс на сопоставимом оборудовании, при этом сохраняя конкурентоспособную среднюю точность (mAP).

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLO11n64039.51.52.62.66.5
YOLO11s64047.02.59.49.421.5
YOLO11m64051.54.720.120.168.0
YOLO11l64053.46.225.325.386.9
YOLO11x64054.711.356.956.9194.9

EfficientDet: Пионер составного масштабирования

EfficientDet, разработанный командой Google , стал системным подходом к масштабированию моделей. Он был построен на основе базовой архитектуры EfficientNet и представил взвешенную двунаправленную пирамиду признаков (BiFPN), которая позволяет легко и быстро объединять многомасштабные признаки.

Основной инновацией стало сложное масштабирование — метод, который равномерно масштабирует разрешение, глубину и ширину магистральной сети, сети признаков и сетей прогнозирования ящиков/классов. Это позволило семейству EfficientDet (от D0 до D7) ориентироваться на широкий спектр ограничений по ресурсам, от мобильных устройств до мощных GPU .

Несмотря на академический успех и высокую эффективность с точки зрения FLOP, EfficientDet часто сталкивается с задержками на реальном оборудовании из-за затрат на доступ к памяти, связанных со сложными соединениями BiFPN и разделяемыми по глубине свертками, которые не всегда оптимизируются ускорителями, такими как TensorRT.

Метаданные EfficientDet:

Узнайте больше об EfficientDet

Ultralytics YOLO11: переосмысление современных технологий в режиме реального времени

Выпущен в сентябре 2024 года, YOLO11 предназначен для практического высокоскоростного обнаружения объектов и мгновенного развертывания. В отличие от EfficientDet, который уделяет большое внимание эффективности параметров, YOLO11 для использования аппаратного обеспечения, обеспечивая исключительно быструю работу модели как на пограничных процессорах, так и на корпоративных графических процессорах.

YOLO11 усовершенствования архитектуры, такие как блок C3k2 и улучшенный модуль SPPF (Spatial Pyramid Pooling - Fast). Эти изменения повышают способность модели извлекать особенности в различных масштабах без задержки, характерной для старых конструкций пирамиды особенностей. Кроме того, YOLO11 унифицированную структуру для нескольких задач машинного зрения, включая сегментацию экземпляров, оценку позы и обнаружение ориентированных ограничивающих прямоугольников (OBB), которые требуют сложных настраиваемых реализаций с помощью EfficientDet.

Преимущество экосистемы

Ultralytics полностью интегрированы с Ultralytics , что обеспечивает беспрепятственное управление наборами данных, автоматическую аннотацию и обучение моделей в облаке одним щелчком мыши.

YOLO11 :

Узнайте больше о YOLO11

Ключевые технические различия

Архитектура и объединение функций

EfficientDet основан на BiFPN, сложном слое взвешенного слияния признаков, который повторно соединяет карты признаков сверху вниз и снизу вверх. Хотя теоретически это эффективно, нерегулярные шаблоны доступа к памяти могут замедлять вывод на GPU.

В отличие от этого, YOLO11 оптимизированную архитектуру, вдохновленную PANet (Path Aggregation Network), с блоками C3k2. Такая конструкция благоприятствует плотным, регулярным моделям доступа к памяти, которые хорошо согласуются с CUDA и современными архитектурами NPU, что приводит к значительному увеличению скорости, наблюдаемому в таблице тестов (например, YOLO11x значительно быстрее, чем EfficientDet-d7, при этом сохраняя более высокую точность).

Эффективность обучения и простота использования

Обучение модели EfficientDet обычно предполагает использование API TensorFlow Detection или библиотеки AutoML, которые могут иметь сложную кривую обучения и сложные конфигурационные файлы.

Ultralytics опыту разработчиков. Обучение YOLO11 через простой Python или интерфейс командной строки (CLI). Библиотека автоматически обрабатывает настройку гиперпараметров, увеличение объема данных и форматирование наборов данных.

from ultralytics import YOLO

# Load a COCO-pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Универсальность и развертывание

EfficientDet — это в первую очередь архитектура для обнаружения объектов. Для адаптации к таким задачам, как сегментация или оценка позы, требуются значительные изменения архитектуры.

YOLO11 изначально YOLO11 мультимодальным. Один и тот же базовый алгоритм и конвейер обучения поддерживают:

  • Обнаружение: Стандартные ограничивающие рамки.
  • Сегментация: маски на уровне пикселей для точного определения границ объектов.
  • Классификация: Категоризация целых изображений.
  • Поза: определение ключевых точек для отслеживания скелета.
  • OBB: Повернутые коробки для аэрофотосъемки и обнаружения текста.

Эта универсальность делает YOLO11 швейцарским YOLO11 для инженеров в области искусственного интеллекта, позволяя использовать один репозиторий для различных приложений, от медицинской визуализации до автономной робототехники.

Почему стоит выбрать модели Ultralytics?

При сравнении этих двух архитектур для современных производственных систем Ultralytics предлагают явные преимущества:

  1. Меньший объем памяти: YOLO оптимизированы для обучения на потребительском оборудовании. В отличие от моделей на основе трансформаторов или старых тяжелых архитектур, требующих огромного CUDA , эффективные YOLO демократизируют доступ к высокопроизводительному обучению ИИ.
  2. Оптимизированное развертывание: экспорт в ONNX, TensorRT, CoreML или TFLite однострочная команда в Ultralytics .
  3. Активная поддержка: Ultralytics является активным и динамичным. Благодаря частым обновлениям, фреймворк обеспечивает совместимость с последними версиями PyTorch CUDA.

Заключение: современный выбор

Хотя EfficientDet остается важной вехой в истории исследований в области компьютерного зрения, демонстрируя мощь сложного масштабирования, YOLO11 и более новая YOLO26 являются лучшим выбором для практического применения на сегодняшний день. Они предлагают лучший баланс скорости и точности, значительно более удобный интерфейс и гибкость для выполнения нескольких задач компьютерного зрения в рамках одной платформы.

Разработчикам, стремящимся оставаться на передовом крае технологий, мы рекомендуем ознакомиться с YOLO26, в котором представлена комплексная конструкция NMS, обеспечивающая еще более низкую задержку и упрощенные конвейеры развертывания.

Чтобы изучить другие высокопроизводительные варианты, рекомендуем ознакомиться с нашими сравнениями YOLOv10 или RT-DETR.


Комментарии