Перейти к содержанию

Ultralytics YOLOv8 против EfficientDet: Всестороннее техническое сравнение

В быстро развивающейся области обнаружения объектов выбор оптимальной архитектуры нейронной сети критически важен для балансирования точности, скорости инференса и возможности развертывания. Этот подробный технический анализ сравнивает две весьма влиятельные архитектуры: Ultralytics YOLOv8, универсальный стандарт в современной экосистеме компьютерного зрения, и EfficientDet, фундаментальную модель от Google, известную своей стратегией составного масштабирования.

Независимо от того, нацелено ли ваше развертывание на высокопроизводительные облачные серверы или периферийные устройства с ограниченными ресурсами, понимание архитектурных нюансов этих моделей приведет ваш проект к успеху.

Архитектурный обзор

Обе модели подходят к задаче идентификации и локализации объектов на изображении, используя сверточные нейронные сети, но применяют различные методологии для извлечения признаков и регрессии ограничивающих рамок.

Ultralytics YOLOv8

Выпущенный Ultralytics в январе 2023 года, YOLOv8 ознаменовал значительный прорыв в линейке семейства YOLO. Разработанный Гленном Джочером, Аюшем Чаурасией и Цзин Цю, он был спроектирован с нуля для бесшовной поддержки множества задач компьютерного зрения, включая обнаружение объектов, сегментацию экземпляров, оценку позы и классификацию изображений.

Архитектура представляет собой безъякорную голову обнаружения, что значительно сокращает количество предсказаний ограничивающих рамок и ускоряет Non-Maximum Suppression (NMS). Ее магистральная сеть использует новый модуль C2f (Cross-Stage Partial bottleneck с двумя свертками) для улучшения потока градиентов во время обучения, сохраняя при этом легковесную структуру. Это делает YOLOv8 исключительно эффективным при компиляции в такие форматы, как NVIDIA TensorRT или ONNX.

Узнайте больше о YOLOv8

EfficientDet

Разработанный Минсин Таном, Руомин Паном и Куок В. Ле в Google и выпущенный в конце 2019 года, EfficientDet фокусируется на масштабируемой эффективности. Описанная в их официальной статье на Arxiv, модель активно использует экосистему AutoML.

Отличительной особенностью EfficientDet является ее двунаправленная пирамидальная сеть признаков (BiFPN), которая обеспечивает простое и быстрое слияние многомасштабных признаков. В сочетании с базовой сетью EfficientNet архитектура использует метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех базовых сетей, сетей признаков и сетей предсказания рамок/классов одновременно. Хотя это приводит к превосходной эффективности параметров, сложная топология сети часто испытывает трудности с достижением оптимальных скоростей в реальном времени на стандартных GPU.

Узнайте больше об EfficientDet

Сравнение производительности и метрик

При сравнении детекторов объектов средняя точность (mAP) и задержка инференса являются основными бенчмарками. В таблице ниже показано, как варианты YOLOv8 и семейство EfficientDet (d0-d7) сравниваются по стандартным метрикам на наборах данных, таких как COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Анализ баланса производительности

Хотя EfficientDet достигает похвальной точности при меньшем теоретическом количестве FLOPs, Ultralytics YOLOv8 доминирует по скорости инференса на GPU в реальных условиях. Например, YOLOv8x достигает немного более высокого mAP (53.9), чем EfficientDet-d7 (53.7), но обрабатывает изображения значительно быстрее на T4 GPU (14.37 мс против 128.07 мс), что делает YOLOv8 очевидным выбором для анализа видео в реальном времени.

Методологии обучения и экосистема

Опыт разработчика является решающим фактором при выборе архитектуры машинного обучения. Именно здесь поддержка сообщества с открытым исходным кодом и инструментарий экосистемы по-настоящему отличают эти модели.

EfficientDet в значительной степени полагается на TensorFlow и специализированные конвейеры AutoML. Хотя это эффективно для крупномасштабного распределенного облачного обучения, настройка среды, корректировка якорей и разбор плотных файлов конфигурации, найденных в репозитории EfficientDet на GitHub, может быть сложной задачей для быстро развивающихся инженерных команд.

В отличие от этого, Ultralytics YOLOv8 изначально построен на PyTorch, предлагая беспрецедентную простоту использования. Разработчики могут запускать сложные циклы обучения с помощью одной строки кода на python или команды CLI. Кроме того, требования к памяти модели во время обучения значительно оптимизированы; YOLOv8 позволяет разработчикам с обычными потребительскими GPU обучать надёжные модели без возникновения ошибок нехватки памяти (OOM), которые часто преследуют архитектуры, интенсивно использующие трансформеры.

Бесшовная интеграция с Ultralytics Platform делает еще один шаг вперед, предоставляя беcкодовый интерфейс для аннотации наборов данных, обучения моделей и развертывания в облаке одним щелчком. Такие функции, как автоматическая настройка гиперпараметров, гарантируют, что вы всегда получите максимально возможную точность для ваших пользовательских наборов данных.

Пример кода на python: Инференс YOLOv8

Запуск современного детектора с использованием репозитория Ultralytics на GitHub чрезвычайно прост:

from ultralytics import YOLO

# Initialize the YOLOv8 model natively in PyTorch
model = YOLO("yolov8n.pt")

# Train the model on the COCO8 example dataset
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on an image URL
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes
inference_results[0].show()

Следующее поколение: Обновление до Ultralytics YOLO26

Хотя YOLOv8 остается высокопроизводительной производственной моделью, исследователям и разработчикам, ищущим передовые достижения в производительности ИИ, следует оценить Ultralytics YOLO26, выпущенную в январе 2026 года.

YOLO26 переосмысливает парадигму обнаружения объектов, представляя нативный сквозной NMS-free дизайн. Устраняя необходимость в подавлении немаксимумов во время постобработки — узкого места, существовавшего с ранних версий YOLO — дисперсия задержки практически исключается. Это меняет правила игры для развертывания на маломощных устройствах.

Кроме того, YOLO26 включает несколько новаторских инноваций в обучении:

  • Оптимизатор MuSGD: Вдохновленный передовыми методами обучения LLM, этот гибрид SGD и Muon обеспечивает высокостабильное обучение и значительно ускоренные темпы сходимости.
  • До 43% более быстрый инференс на CPU: Благодаря удалению NMS и сильно оптимизированному бэкбону YOLO26 достигает беспрецедентных скоростей на периферийных устройствах, работающих только на CPU, не полагаясь на выделенные NPU.
  • ProgLoss + STAL: Эти усовершенствованные функции потерь обеспечивают заметный скачок в точности распознавания мелких объектов, что делает YOLO26 незаменимым для аэрофотосъемки и прецизионных датчиков IoT.
  • Удаление DFL: Функция потерь Distribution Focal Loss была полностью удалена для значительного упрощения процесса экспорта в такие форматы, как OpenVINO и CoreML.

Сценарии использования и рекомендации

Выбор между этими архитектурами в конечном итоге зависит от ваших ограничений развертывания и требований к устаревшему ПО.

  • Выберите Ultralytics YOLOv8, если: вы разрабатываете современные, универсальные приложения компьютерного зрения, требующие высокой точности, инференса в реальном времени на GPU и беспроблемного опыта разработки. Его высокая производительность в задачах классификации, сегментации и detect делает его мощным многофункциональным инструментом для розничной аналитики, робототехники и систем безопасности.
  • Выберите EfficientDet, если: Вы привязаны к устаревшим рабочим процессам TensorFlow, и вашей основной задачей является минимизация количества параметров и теоретических FLOPs, возможно, для исследовательских целей, а не для строгого промышленного развертывания в реальном времени.
  • Выберите Ultralytics YOLO26, если: Вы начинаете новый проект и вам требуется абсолютно лучшее решение. Его нативная сквозная архитектура без NMS делает его идеальным выбором как для сверхбыстрых граничных развертываний, так и для интенсивной облачной обработки.

Если вы изучаете другие высокопроизводительные фреймворки в экосистеме Ultralytics, вы также можете рассмотреть Ultralytics YOLO11 для сбалансированной производительности с устаревшими системами или RT-DETR для подхода к обнаружению в реальном времени на основе трансформеров.


Комментарии