Перейти к содержанию

YOLOv5 EfficientDet: техническое сравнение ведущих моделей машинного зрения

В мире компьютерного зрения выбор оптимальной архитектуры для обнаружения объектов является ключевым решением, которое влияет на все: от точности модели до затрат на внедрение. В этом руководстве представлено всестороннее техническое сравнение между Ultralytics YOLOv5 и EfficientDet — двух влиятельных моделей, которые сформировали ландшафт современного искусственного интеллекта.

В то время как EfficientDet ввел концепцию масштабируемой эффективности посредством составного масштабирования, YOLOv5 этой области, сочетая в себе передовую производительность и беспрецедентный пользовательский опыт. В данном анализе подробно рассматриваются архитектурные различия, показатели производительности и практическая применимость этих технологий, чтобы помочь разработчикам и исследователям принимать решения на основе данных.

Обзор модели

Ultralytics YOLOv5

YOLOv5 (You Only Look Once версия 5) — это новаторская модель в истории обнаружения объектов. Выпущенная в середине 2020 года компанией Ultralytics, она быстро стала отраслевым стандартом благодаря своему балансу скорости, точности и простоты использования. В отличие от своих предшественников, YOLOv5 первой YOLO , реализованной нативно в PyTorch, что сделало ее исключительно доступной как для исследовательского сообщества, так и для корпоративных разработчиков.

Узнайте больше о YOLOv5

EfficientDet

EfficientDet — это семейство моделей обнаружения объектов, разработанное Google . Оно основано на базовой модели EfficientNet и использует взвешенную двунаправленную пирамиду признаков (BiFPN) и метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех базовых сетей, сетей признаков и сетей прогнозирования ячеек/классов.

Интерактивные сравнительные тесты производительности

Чтобы понять компромиссы между этими архитектурами, необходимо визуализировать их производительность на стандартных тестах. На приведенном ниже графике сравниваются ключевые показатели на COCO , с акцентом на соотношение скорости и точности.

Подробные метрики производительности

В следующей таблице представлены подробные данные о производительности различных масштабов моделей. Ultralytics демонстрируют стабильно высокую скорость вывода, особенно при оптимизации для приложений реального времени.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Архитектура и Дизайн

Фундаментальное различие между этими двумя моделями заключается в их философии проектирования: YOLOv5 выводу в реальном времени и простоте инжиниринга, в то время как EfficientDet фокусируется на эффективности параметров за счет сложного слияния характеристик.

YOLOv5: разработан для скорости и удобства использования

YOLOv5 магистраль CSPDarknet (Cross Stage Partial Network), которая улучшает градиентный поток и уменьшает вычислительные узкие места. Его шея использует PANet (Path Aggregation Network) для агрегирования характеристик в разных масштабах, обеспечивая высокую точность обнаружения как больших, так и маленьких объектов.

Преимущество Ultralytics

Одной из главных сильных сторон YOLOv5 является его модульная конструкция. Акцент на «Bag of Freebies» и «Bag of Specials» — методах оптимизации, которые повышают точность без увеличения затрат на вывод — делает его невероятно надежным для различных сценариев развертывания.

EfficientDet: Комбинированное масштабирование и BiFPN

EfficientDet построен на основе магистрали EfficientNet и представляет BiFPN (двунаправленную пирамидальную сеть признаков). В то время как стандартные FPN суммируют особенности с разных уровней, BiFPN применяет к этим особенностям обучаемые веса, позволяя сети определять, какие входные особенности являются более важными. Несмотря на теоретическую эффективность с точки зрения FLOP, сложные нерегулярные шаблоны доступа к памяти BiFPN часто могут приводить к более медленному выводу на GPU по сравнению с оптимизированной архитектурой CSPNet YOLOv5.

Обучение и простота использования

Для разработчиков «мягкие» показатели модели — насколько легко ее обучать, развертывать и отлаживать — часто так же важны, как и ее точность.

Оптимизированный пользовательский опыт

Ultralytics славятся своим простым освоением. YOLOv5 удобный интерфейс командной строки (CLI) и Python , которые позволяют пользователям за считанные минуты приступить к обучению на пользовательских данных. В отличие от этого, для эффективной работы реализации EfficientDet часто требуются более сложные конфигурационные файлы и глубокие знания TensorFlow конкретных PyTorch .

Эффективность обучения и ресурсы

YOLOv5 высоко YOLOv5 для эффективности обучения. Он включает в себя такие функции, как автоматический расчет анкоров, увеличение объема данных с помощью мозаики и эволюция гиперпараметров. Кроме того, Ultralytics обычно демонстрируют значительно более низкие требования к памяти во время обучения по сравнению с EfficientDet и архитектурами на основе трансформаторов. Это позволяет исследователям обучать более крупные партии на потребительских графических процессорах, демократизируя доступ к обучению высокопроизводительных моделей.

from ultralytics import YOLO

# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

Универсальность и применение в реальных условиях

Хотя EfficientDet в первую очередь является детектором объектов, Ultralytics расширила возможности YOLO за пределы простых ограничительных рамок.

Идеальные варианты использования

Выберите Ultralytics YOLOv5 или более новую версию), если:

  • Производительность в реальном времени имеет решающее значение: такие приложения, как автономное вождение, видеоаналитика и робототехника, требуют низкой задержки, которую обеспечивают YOLO .
  • Развертывание на периферии: вы развертываете на мобильных устройствах, Raspberry Pi или NVIDIA , где память и вычислительные ресурсы ограничены.
  • Быстрое развитие: вам необходимо быстро выполнять итерации с помощью стабильного, хорошо документированного API и активной поддержки сообщества.

Выберите EfficientDet, если:

  • Ограничения FLOPs имеют первостепенное значение: в очень специфических теоретических сценариях, где FLOPs являются единственным ограничением (а не задержка), масштабирование EfficientDet может дать преимущества.
  • Исходные данные исследования: Вы проводите сравнение конкретно с экстракторами признаков на основе EfficientNet в академической среде.

Будущее: YOLO26

Хотя YOLOv5 мощным инструментом, в этой области произошли значительные изменения. Ultralytics выпустила YOLO26, модель нового поколения, которая переопределяет стандарты, установленные ее предшественниками.

YOLO26 представляет собой комплексную конструкцию NMS, устраняющую необходимость в постобработке с помощью Non-Maximum Suppression. Это приводит к упрощению процессов развертывания и ускорению вывода. Кроме того, YOLO26 устраняет Distribution Focal Loss (DFL) для лучшей совместимости с краями и использует новый оптимизатор MuSGD, вдохновленный инновациями в области обучения LLM, для обеспечения стабильной конвергенции.

Разработчикам, стремящимся к максимальной производительности, настоятельно рекомендуется перейти на YOLO26. Он обеспечивает на 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его оптимальным выбором для современных приложений искусственного интеллекта на периферии.

Узнайте больше о YOLO26

Заключение

И YOLOv5 EfficientDet заслужили свое место в зале славы компьютерного зрения. EfficientDet продемонстрировал мощь составного масштабирования, а YOLOv5 , что высокая производительность может быть доступной и удобной для пользователя.

Однако для практического применения в 2026 году Ultralytics предлагает явное преимущество. Сочетание активного обслуживания, унифицированной платформы для аннотирования данных и обучения, а также постоянных архитектурных инноваций делает такие модели, как YOLOv5и передовую YOLO26, предпочтительным выбором для профессионалов.

Те, кто заинтересован в изучении других современных архитектур, могут ознакомиться со сравнением с YOLO11 или RT-DETR , чтобы полностью понять спектр доступных инструментов.


Комментарии