Перейти к содержанию

YOLO11 против EfficientDet: Всестороннее техническое сравнение

Выбор оптимальной нейронной сети для проектов компьютерного зрения требует глубокого понимания доступных архитектур. Это руководство содержит углубленное техническое сравнение Ultralytics YOLO11 и EfficientDet от Google. Мы рассмотрим их архитектурные различия, метрики производительности, эффективность обучения и идеальные сценарии развертывания, чтобы помочь вам принять обоснованное решение для ваших рабочих нагрузок машинного обучения.

Предыстория и спецификации моделей

Обе модели оказали значительное влияние на ландшафт глубокого обучения, хотя они и возникли из разных философий проектирования и эпох развития ИИ.

Детали YOLO11

Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

Узнайте больше о YOLO11

Подробности EfficientDet

Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le
Организация: Google
Дата: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Документация: https://github.com/google/automl/tree/master/efficientdet#readme

Узнайте больше об EfficientDet

Преимущество экосистемы

При работе с моделями компьютерного зрения окружающая экосистема так же важна, как и сама модель. Экосистема Ultralytics обеспечивает беспрецедентный опыт разработчика, предлагая обширную документацию, активную поддержку сообщества и бесшовные возможности экспорта в такие форматы, как ONNX и TensorRT.

Архитектурные инновации

EfficientDet: BiFPN и составное масштабирование

Представленный в конце 2019 года, EfficientDet стремился максимизировать точность при минимизации вычислительных затрат. Это достигается в основном за счет двух механизмов. Во-первых, он использует базовую сеть (backbone) EfficientNet, которая согласованно масштабирует глубину, ширину и разрешение. Во-вторых, он представил двунаправленную пирамидальную сеть признаков (BiFPN), которая обеспечивает легкое и быстрое многомасштабное слияние признаков.

Будучи высокоэффективным для своего времени, EfficientDet, из-за зависимости от библиотеки AutoML в TensorFlow, может быть негибким. Исследователи часто сталкиваются с трудностями при обрезке моделей (model pruning) и внесении пользовательских модификаций по сравнению с современными модульными фреймворками на базе PyTorch.

YOLO11: Улучшенное извлечение признаков и универсальность

YOLO11 представляет собой значительный шаг вперед в архитектурах обнаружения объектов. Он основывается на успехах своих предшественников, вводя усовершенствованные блоки C3k2 и улучшенный модуль Spatial Pyramid Pooling. Эти улучшения приводят к превосходному извлечению признаков, позволяя YOLO11 захватывать сложные визуальные паттерны с исключительной четкостью.

Основным преимуществом YOLO11 является его универсальность. В то время как EfficientDet является строго моделью обнаружения объектов, YOLO11 нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB). Кроме того, YOLO11 обладает невероятно низкими требованиями к памяти как во время обучения, так и во время инференса, что делает его значительно превосходящим старые модели и громоздкие визуальные трансформеры при развертывании в условиях ограниченных ресурсов периферийного ИИ.

Производительность и сравнительное тестирование

Баланс между точностью, измеряемой в средней средней точности (mAP), и скоростью инференции является критическим решающим фактором для реальных развертываний. Таблица ниже иллюстрирует чистую производительность обоих семейств моделей на стандартном наборе данных COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Как показано, YOLO11 достигает весьма благоприятного баланса производительности. YOLO11x достигает наивысшей общей точности (54.7 mAP), в то время как меньшие варианты YOLO11 абсолютно доминируют по скорости вывода на GPU (всего 1.5 мс на T4 с использованием TensorRT).

Эффективность обучения и экосистема

Одной из определяющих характеристик моделей Ultralytics является их простота использования. Обучение модели EfficientDet часто требует навигации по сложным конфигурациям графов TensorFlow и управления запутанными цепочками зависимостей. В отличие от этого, YOLO11 построена на чистой, полностью современной PyTorch основе.

Эта хорошо поддерживаемая экосистема означает, что разработчики могут установить пакет, загрузить предварительно обученную модель и начать обучение на пользовательском наборе данных всего за несколько строк кода.

Пример кода на Python

Вот полностью рабочий пример, демонстрирующий простоту API Ultralytics. Этот скрипт загружает предобученную модель YOLO11, обучает ее и выполняет быстрое предсказание.

from ultralytics import YOLO

# Initialize a pretrained YOLO11 nano model
model = YOLO("yolo11n.pt")

# Train the model efficiently using the integrated PyTorch engine
# Training efficiency is high, requiring less VRAM than legacy models
results = model.train(data="coco8.yaml", epochs=10, imgsz=640, device="cpu")

# Run real-time inference on a sample image
prediction = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the output bounding boxes
prediction[0].show()

Взгляд в будущее: Преимущество YOLO26

Хотя YOLO11 исключительно мощный, командам, начинающим новые проекты с нуля, следует серьезно рассмотреть Ultralytics YOLO26, выпущенный в январе 2026 года. YOLO26 представляет собой смену парадигмы в простоте развертывания и производительности на периферии.

Ключевые нововведения YOLO26 включают:

  • Сквозная архитектура без NMS: За счет исключения подавления немаксимумов (NMS) на этапе постобработки YOLO26 обеспечивает стабильно сверхнизкую задержку, что критически важно для высокоскоростной робототехники и автономного вождения.
  • До 43% более быстрая инференция на CPU: Для развертываний без выделенных GPU, YOLO26 специально оптимизирован для максимизации пропускной способности на стандартных процессорах.
  • Оптимизатор MuSGD: Вдохновленный Kimi K2 от Moonshot AI, этот гибридный оптимизатор привносит стабильность обучения LLM в компьютерное зрение, обеспечивая более быструю сходимость.
  • ProgLoss + STAL: Эти улучшенные функции потерь значительно улучшают распознавание мелких объектов, что часто является проблемой в анализе спутниковых изображений и видеозаписях с дронов.
  • Удаление DFL: Удаление Distribution Focal Loss оптимизирует процесс экспорта модели на периферийные устройства.

Альтернативные модели для изучения

Если ваш проект имеет очень специфические требования, вы также можете захотеть протестировать модель RT-DETR для обнаружения на основе трансформеров или широко используемую YOLOv8, которая остается основным элементом во многих устаревших корпоративных развертываниях.

Сценарии использования и рекомендации

Выбор между YOLO11 и EfficientDet зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать YOLO11

YOLO11 — отличный выбор для:

  • Промышленное периферийное развертывание: Коммерческие приложения на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активное обслуживание имеют первостепенное значение.
  • Многозадачные приложения компьютерного зрения: Проекты, требующие detect, сегментации, оценки позы и obb в рамках единой унифицированной среды.
  • Быстрое прототипирование и развертывание: Команды, которым необходимо быстро перейти от сбора данных к производству, используя оптимизированный Ultralytics Python API.

Когда следует выбирать EfficientDet

EfficientDet рекомендуется для:

  • Конвейеры Google Cloud и TPU: Системы, глубоко интегрированные с API Google Cloud Vision или инфраструктурой TPU, где EfficientDet имеет нативную оптимизацию.
  • Исследование составного масштабирования: Академическое бенчмаркинг, сфокусированное на изучении влияния сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильное развертывание через TFLite: Проекты, которые специально требуют экспорта TensorFlow Lite для Android или встраиваемых устройств на Linux.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Заключение

EfficientDet была новаторской архитектурой, доказавшей жизнеспособность составного масштабирования в обнаружении объектов. Однако быстрый темп исследований в области ИИ привел к появлению моделей, которые просто более функциональны, легче интегрируются и быстрее работают.

Благодаря своим надежным многозадачным возможностям, невероятной скорости инференции на GPU и, возможно, самому удобному для разработчиков API в отрасли, YOLO11 является очевидным победителем для современных конвейеров компьютерного зрения. Для тех, кто стремится к абсолютному переднему краю технологий — особенно для развертываний с приоритетом на периферийные устройства — обновление до YOLO26 обеспечивает идеальное сочетание скорости без NMS и беспрецедентной точности.


Комментарии