Перейти к содержанию

EfficientDet против YOLOv6.0: подробное изучение архитектур обнаружения объектов

Выбор подходящей модели обнаружения объектов часто представляет собой баланс между точностью, задержкой и ограничениями развертывания. В этом сравнении рассматриваются два важных этапа в истории компьютерного зрения: EfficientDet, масштабируемая архитектура Google, которая в 2019 году переопределила эффективность параметров, и YOLOv6.YOLOv6, промышленный детектор Meituan, оптимизированный для высокопроизводительных GPU в 2023 году.

Сравнение метрик производительности

В следующей таблице показаны различия в производительности двух архитектур. В то время как EfficientDet фокусируется на эффективности параметров (меньший размер модели при заданной точности), YOLOv6. YOLOv6 уделяет приоритетное внимание скорости вывода на аппаратных ускорителях, таких как графические процессоры.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

EfficientDet: масштабируемость и эффективность параметров

EfficientDet был представлен командой Google для решения проблемы эффективного масштабирования моделей обнаружения объектов. В отличие от предыдущих моделей, которые просто делали сети более глубокими или широкими, EfficientDet представил метод Compound Scaling, который равномерно масштабирует разрешение, глубину и ширину.

Ключевые архитектурные особенности

  • BiFPN (взвешенная двунаправленная пирамидальная сеть): EfficientDet создает сложный путь слияния признаков. В отличие от стандартной FPN, BiFPN позволяет легко осуществлять многомасштабное слияние признаков за счет введения обучаемых весов для различных входных признаков, что гарантирует приоритет более важной информации в сети.
  • EfficientNet Backbone: использует EfficientNet в качестве основы, которая высоко оптимизирована для операций с плавающей запятой (FLOP) и количества параметров.
  • Комбинированное масштабирование: простой коэффициент $\phi$ одновременно контролирует масштабирование основной сети, BiFPN и сетей классов/боксов.

Предупреждение о сложности

Хотя BiFPN является математически элегантным и эффективным с точки зрения параметров, его нерегулярные схемы доступа к памяти могут затруднять оптимизацию на определенных аппаратных ускорителях по сравнению с простыми сверточными блоками, используемыми в YOLO .

Метаданные:

  • Авторы: Мингксинг Тан, Руоминг Панг, Куок В. Ле
  • Организация:Google Research
  • Дата: 20 ноября 2019 г.
  • Ссылки:Arxiv | GitHub

Узнайте больше об EfficientDet

YOLOv6.0: промышленный скоростной демон

Выпущенная Meituan в 2023 году, YOLOv6. YOLOv6(часто называемая «Full-Scale Reloading») была разработана специально для промышленного применения. Авторы уделили приоритетное внимание реальной скорости вывода на GPU, а не теоретическим FLOP, в результате чего получилась модель, которая доминирует в сценариях с высокой пропускной способностью, таких как видеоаналитика.

Ключевые архитектурные особенности

  • RepBi-PAN: эта обновленная структура шеи использует блоки типа RepVGG. Во время обучения эти блоки имеют многоветвленную топологию для лучшего потока градиента. Во время вывода они структурно перепараметризируются в одну свертку 3x3, что значительно сокращает задержку.
  • Обучение с помощью якорей (AAT): хотя YOLOv6 по сути YOLOv6 детектором без якорей, в версии 3.0 была введена вспомогательная ветвь на основе якорей во время обучения, чтобы стабилизировать сходимость и повысить точность без ущерба для скорости вывода.
  • Разделенная головка: задачи классификации и регрессии разделены на разные ветви, что стало стандартным решением в современных детекторах для устранения конфликта между этими двумя целями.

Метаданные:

  • Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг и др.
  • Организация:Meituan
  • Дата: 13 января 2023 г.
  • Ссылки:Arxiv | GitHub

Узнайте больше о YOLOv6

Сравнительный анализ

Задержка и пропускная способность

YOLOv6.YOLOv6 значительно быстрее работает на GPU . Как видно из таблицы, YOLOv6.YOLOv6 достигает mAP ,8% с TensorRT всего 8,95 мс. В отличие от этого, EfficientDet-d6 достигает аналогичного показателя mAP 52,6 %, mAP требует 89,29 мс, что практически на порядок медленнее. Это делает YOLOv6 явным YOLOv6 для приложений, требующих обработки в реальном времени на устройствах NVIDIA или Jetson.

Эффективность параметров

EfficientDet превосходит другие системы в средах, где основным препятствием является объем памяти. EfficientDet-d0 обеспечивает приличный показатель mAP 34,6% mAP всего 3,9 млн параметрах. Это меньше, чем у самой компактной YOLOv6 . Для академических исследований или сред с крайне ограниченным объемом памяти (например, при встраивании модели непосредственно в небольшой пакет мобильного приложения) компактность EfficientDet остается актуальной.

Обучение и удобство использования

EfficientDet основан на старой экосистеме TensorFlow , которую может быть сложно интегрировать в современные рабочие процессы, PyTorch. Обучение часто включает сложную настройку гиперпараметров для сложного масштабирования. YOLOv6. YOLOv6 предлагает более современный рецепт обучения, но в основном ориентирован на обнаружение объектов и не имеет встроенной поддержки других задач, таких как сегментация или оценка позы, в своей основной версии.

Преимущество Ultralytics

Изучение этих архитектур дает ценную информацию, но современные разработки требуют комплексной платформы. Ultralytics комплексную экосистему, которая заменяет отдельные архитектуры моделей, фокусируясь на всем жизненном цикле машинного обучения.

Почему стоит перейти на Ultralytics?

  • Непревзойденная универсальность: в отличие от EfficientDet и YOLOv6 в основном являются детекторами объектов, Ultralytics изначально поддерживают сегментацию экземпляров, оценку позы, ориентированные ограничивающие рамки (OBB) и классификацию.
  • Простота использования: единый Python позволяет переключаться между поколениями моделей (например, с YOLO11 YOLO26) путем изменения одной строки.
  • Эффективность использования памяти: Ultralytics оптимизированы для более низкого использования VRAM во время обучения, что позволяет использовать более крупные пакеты данных на потребительских графических процессорах по сравнению с архитектурами EfficientDet, требующими большого объема памяти.

Представляем YOLO26: новый стандарт

Для разработчиков, стремящихся к абсолютному передовому уровню, YOLO26 представляет собой вершину эффективности и производительности. Выпущенная в январе 2026 года, она устраняет ограничения как EfficientDet (скорость), так и YOLOv6 CPU ).

Прорывы YOLO26:

  • Полная NMS: благодаря устранению не максимального подавления (NMS) YOLO26 упрощает логику развертывания и снижает разброс задержки вывода.
  • MuSGD Optimizer: вдохновленный обучением LLM, этот гибридный оптимизатор стабилизирует обучение и ускоряет сходимость.
  • Оптимизация по краям: благодаря устранению Distribution Focal Loss (DFL) и специальным архитектурным доработкам YOLO26 работает на 43 % быстрее при выводах CPU по сравнению с предыдущими поколениями, что делает его превосходным решением для Raspberry Pi и мобильных устройств, где EfficientDet часто испытывает трудности.
  • Усовершенствованные функции потери: интеграция ProgLoss и STAL значительно улучшает обнаружение мелких объектов, что является важным требованием для изображений с дронов и датчиков IoT.
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on COCO8 dataset with MuSGD optimizer
model.train(data="coco8.yaml", epochs=100, optimizer="MuSGD")

# Export to ONNX for NMS-free deployment
model.export(format="onnx")

Узнайте больше о YOLO26

Рекомендации по вариантам использования

  • Выберите EfficientDet, если: вы проводите академические исследования по масштабированию слияния функций или работаете с устаревшими TensorFlow , где размер веса модели (МБ) является строгим ограничением.
  • Выберите YOLOv6. YOLOv6, если: вы развертываете систему исключительно на NVIDIA (таких как T4 или A10) и вашим единственным показателем является сырая пропускная способность (FPS) для стандартного обнаружения объектов.
  • Выберите Ultralytics , если: вам нужно готовое к производству решение, которое обеспечивает баланс междуGPU , не требует сложной постобработки (NMS), необходимо для выполнения задач, выходящих за рамки простого обнаружения (таких как сегментация или OBB), или требует упрощенного рабочего процесса обучения.

Для более подробного изучения современных детекторов объектов рекомендуем ознакомиться с нашими сравнениями YOLOv8 EfficientDet или возможностями Real-Time Detection Transformers (RT-DETR).


Комментарии