YOLOv5 EfficientDet: техническое сравнение ведущих моделей машинного зрения
В мире компьютерного зрения выбор оптимальной архитектуры для обнаружения объектов является ключевым решением, которое влияет на все: от точности модели до затрат на внедрение. В этом руководстве представлено всестороннее техническое сравнение между Ultralytics YOLOv5 и EfficientDet — двух влиятельных моделей, которые сформировали ландшафт современного искусственного интеллекта.
В то время как EfficientDet ввел концепцию масштабируемой эффективности посредством составного масштабирования, YOLOv5 этой области, сочетая в себе передовую производительность и беспрецедентный пользовательский опыт. В данном анализе подробно рассматриваются архитектурные различия, показатели производительности и практическая применимость этих технологий, чтобы помочь разработчикам и исследователям принимать решения на основе данных.
Обзор модели
Ultralytics YOLOv5
YOLOv5 (You Only Look Once версия 5) — это новаторская модель в истории обнаружения объектов. Выпущенная в середине 2020 года компанией Ultralytics, она быстро стала отраслевым стандартом благодаря своему балансу скорости, точности и простоты использования. В отличие от своих предшественников, YOLOv5 первой YOLO , реализованной нативно в PyTorch, что сделало ее исключительно доступной как для исследовательского сообщества, так и для корпоративных разработчиков.
- Автор: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- GitHub:Репозиторий Ultralytics YOLOv5
EfficientDet
EfficientDet — это семейство моделей обнаружения объектов, разработанное Google . Оно основано на базовой модели EfficientNet и использует взвешенную двунаправленную пирамиду признаков (BiFPN) и метод составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину для всех базовых сетей, сетей признаков и сетей прогнозирования ячеек/классов.
- Авторы: Мингксинг Тан, Руоминг Панг и Куок В. Ле
- Организация:Google Research
- Дата: 2019-11-20
- Arxiv:EfficientDet: Масштабируемое и эффективное обнаружение объектов
- GitHub:РепозиторийGoogle
Интерактивные сравнительные тесты производительности
Чтобы понять компромиссы между этими архитектурами, необходимо визуализировать их производительность на стандартных тестах. На приведенном ниже графике сравниваются ключевые показатели на COCO , с акцентом на соотношение скорости и точности.
Подробные метрики производительности
В следующей таблице представлены подробные данные о производительности различных масштабов моделей. Ultralytics демонстрируют стабильно высокую скорость вывода, особенно при оптимизации для приложений реального времени.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
Архитектура и Дизайн
Фундаментальное различие между этими двумя моделями заключается в их философии проектирования: YOLOv5 выводу в реальном времени и простоте инжиниринга, в то время как EfficientDet фокусируется на эффективности параметров за счет сложного слияния характеристик.
YOLOv5: разработан для скорости и удобства использования
YOLOv5 магистраль CSPDarknet (Cross Stage Partial Network), которая улучшает градиентный поток и уменьшает вычислительные узкие места. Его шея использует PANet (Path Aggregation Network) для агрегирования характеристик в разных масштабах, обеспечивая высокую точность обнаружения как больших, так и маленьких объектов.
Преимущество Ultralytics
Одной из главных сильных сторон YOLOv5 является его модульная конструкция. Акцент на «Bag of Freebies» и «Bag of Specials» — методах оптимизации, которые повышают точность без увеличения затрат на вывод — делает его невероятно надежным для различных сценариев развертывания.
EfficientDet: Комбинированное масштабирование и BiFPN
EfficientDet построен на основе магистрали EfficientNet и представляет BiFPN (двунаправленную пирамидальную сеть признаков). В то время как стандартные FPN суммируют особенности с разных уровней, BiFPN применяет к этим особенностям обучаемые веса, позволяя сети определять, какие входные особенности являются более важными. Несмотря на теоретическую эффективность с точки зрения FLOP, сложные нерегулярные шаблоны доступа к памяти BiFPN часто могут приводить к более медленному выводу на GPU по сравнению с оптимизированной архитектурой CSPNet YOLOv5.
Обучение и простота использования
Для разработчиков «мягкие» показатели модели — насколько легко ее обучать, развертывать и отлаживать — часто так же важны, как и ее точность.
Оптимизированный пользовательский опыт
Ultralytics славятся своим простым освоением. YOLOv5 удобный интерфейс командной строки (CLI) и Python , которые позволяют пользователям за считанные минуты приступить к обучению на пользовательских данных. В отличие от этого, для эффективной работы реализации EfficientDet часто требуются более сложные конфигурационные файлы и глубокие знания TensorFlow конкретных PyTorch .
Эффективность обучения и ресурсы
YOLOv5 высоко YOLOv5 для эффективности обучения. Он включает в себя такие функции, как автоматический расчет анкоров, увеличение объема данных с помощью мозаики и эволюция гиперпараметров. Кроме того, Ultralytics обычно демонстрируют значительно более низкие требования к памяти во время обучения по сравнению с EfficientDet и архитектурами на основе трансформаторов. Это позволяет исследователям обучать более крупные партии на потребительских графических процессорах, демократизируя доступ к обучению высокопроизводительных моделей.
from ultralytics import YOLO
# Load a pre-trained YOLO model (recommended over YOLOv5 for new projects)
model = YOLO("yolo26n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
Универсальность и применение в реальных условиях
Хотя EfficientDet в первую очередь является детектором объектов, Ultralytics расширила возможности YOLO за пределы простых ограничительных рамок.
- YOLOv5 : поддерживает обнаружение объектов, сегментацию экземпляров и классификацию изображений.
- Возможности EfficientDet: в первую очередь ориентированы на обнаружение объектов, с некоторыми адаптациями для сегментации, которые менее интегрированы в единый рабочий процесс.
Идеальные варианты использования
Выберите Ultralytics YOLOv5 или более новую версию), если:
- Производительность в реальном времени имеет решающее значение: такие приложения, как автономное вождение, видеоаналитика и робототехника, требуют низкой задержки, которую обеспечивают YOLO .
- Развертывание на периферии: вы развертываете на мобильных устройствах, Raspberry Pi или NVIDIA , где память и вычислительные ресурсы ограничены.
- Быстрое развитие: вам необходимо быстро выполнять итерации с помощью стабильного, хорошо документированного API и активной поддержки сообщества.
Выберите EfficientDet, если:
- Ограничения FLOPs имеют первостепенное значение: в очень специфических теоретических сценариях, где FLOPs являются единственным ограничением (а не задержка), масштабирование EfficientDet может дать преимущества.
- Исходные данные исследования: Вы проводите сравнение конкретно с экстракторами признаков на основе EfficientNet в академической среде.
Будущее: YOLO26
Хотя YOLOv5 мощным инструментом, в этой области произошли значительные изменения. Ultralytics выпустила YOLO26, модель нового поколения, которая переопределяет стандарты, установленные ее предшественниками.
YOLO26 представляет собой комплексную конструкцию NMS, устраняющую необходимость в постобработке с помощью Non-Maximum Suppression. Это приводит к упрощению процессов развертывания и ускорению вывода. Кроме того, YOLO26 устраняет Distribution Focal Loss (DFL) для лучшей совместимости с краями и использует новый оптимизатор MuSGD, вдохновленный инновациями в области обучения LLM, для обеспечения стабильной конвергенции.
Разработчикам, стремящимся к максимальной производительности, настоятельно рекомендуется перейти на YOLO26. Он обеспечивает на 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его оптимальным выбором для современных приложений искусственного интеллекта на периферии.
Заключение
И YOLOv5 EfficientDet заслужили свое место в зале славы компьютерного зрения. EfficientDet продемонстрировал мощь составного масштабирования, а YOLOv5 , что высокая производительность может быть доступной и удобной для пользователя.
Однако для практического применения в 2026 году Ultralytics предлагает явное преимущество. Сочетание активного обслуживания, унифицированной платформы для аннотирования данных и обучения, а также постоянных архитектурных инноваций делает такие модели, как YOLOv5и передовую YOLO26, предпочтительным выбором для профессионалов.
Те, кто заинтересован в изучении других современных архитектур, могут ознакомиться со сравнением с YOLO11 или RT-DETR , чтобы полностью понять спектр доступных инструментов.