Перейти к содержанию

EfficientDet против YOLOv7: Обзор архитектур обнаружения объектов в реальном времени

Выбор наиболее эффективной архитектуры нейронной сети имеет решающее значение для успеха любой инициативы в области компьютерного зрения. По мере роста спроса на высокопроизводительные решения ИИ сравнение таких зарекомендовавших себя моделей, как EfficientDet и YOLOv7, становится необходимым для разработчиков, стремящихся оптимизировать как точность, так и вычислительную эффективность.

Этот всеобъемлющий технический анализ исследует архитектурные нюансы, метрики производительности и идеальные сценарии развертывания для обеих моделей. Кроме того, мы проиллюстрируем, почему интегрированная экосистема, предоставляемая Ultralytics, кульминацией которой является передовой Ultralytics YOLO26, предлагает превосходную альтернативу для современных задач компьютерного зрения.

Понимание EfficientDet

EfficientDet была разработана для максимизации точности при систематическом управлении вычислительными затратами в различных ресурсных ограничениях. Это было достигнуто благодаря новому подходу к масштабированию и слиянию признаков.

Подробности EfficientDet:
Авторы: Mingxing Tan, Ruoming Pang, and Quoc V. Le
Организация: Google
Дата: 2019-11-20
Arxiv: EfficientDet: Масштабируемое и эффективное обнаружение объектов
GitHub: Репозиторий Google AutoML

Архитектура и инновации

По своей сути, EfficientDet использует двунаправленную пирамидальную сеть признаков (BiFPN). В отличие от традиционных FPN, BiFPN обеспечивает простое и быстрое слияние многомасштабных признаков путем введения обучаемых весов для определения важности различных входных признаков. Это сочетается с методом составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину базовой сети, сети признаков и сетей предсказания ограничивающих рамок/классов одновременно.

Сильные и слабые стороны

EfficientDet обладает высокой масштабируемостью. Его меньшие варианты (d0-d2) чрезвычайно эффективны по параметрам, что делает их подходящими для сред со строгими ограничениями на хранение данных. Более крупные варианты (например, d7) расширяют границы средней точности (mAP) для высокопроизводительной офлайн-обработки.

Однако EfficientDet сильно зависит от старых реализаций TensorFlow и сложных конвейеров AutoML. Эта устаревшая инфраструктура делает его крайне сложным для интеграции в современные рабочие процессы, ориентированные на PyTorch. Кроме того, он страдает от значительной задержки инференса на периферийных устройствах при масштабировании до вариантов с более высокой точностью.

Узнайте больше об EfficientDet

Понимание YOLOv7

YOLOv7, представленная в 2022 году, обеспечила значительный скачок в скорости и точности для приложений реального времени, установив новый эталон для широко популярного семейства YOLO на тот момент.

Подробности о YOLOv7:
Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: YOLOv7: Обучаемый набор «бесплатных» методов устанавливает новый уровень качества для детекторов объектов реального времени
GitHub: Официальный репозиторий YOLOv7

Архитектура и инновации

YOLOv7 представила расширенную эффективную сеть агрегации слоев (E-ELAN). Это архитектурное усовершенствование улучшает способность сети к обучению без разрушения исходного градиентного пути, позволяя модели эффективно изучать более разнообразные признаки. Кроме того, она реализует «обучаемый набор бесплатных приемов», используя такие методы, как плановая репараметризация и динамическое присвоение меток, для повышения точности без увеличения затрат на инференс.

Сильные и слабые стороны

YOLOv7 отлично подходит для сценариев реального времени, таких как видеоаналитика и высокоскоростная робототехническая навигация. Она исключительно хорошо масштабируется на серверных GPU и предлагает нативную реализацию на PyTorch, что делает её доступной для академических исследователей.

Несмотря на впечатляющую скорость, YOLOv7 по-прежнему полагается на подавление немаксимумов (NMS) для постобработки, что может вносить переменную задержку в сценах с большим скоплением объектов. Кроме того, его объем памяти во время обучения заметно больше, чем у новых поколений, требуя более мощного оборудования для обработки больших размеров пакетов.

Узнайте больше о YOLOv7

Сравнение производительности и метрик

При сравнении этих моделей крайне важно изучить компромиссы между точностью, скоростью инференса и размером параметров. Ниже представлена подробная оценка различных конфигураций EfficientDet и YOLOv7.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Выводы по производительности

Хотя EfficientDet-d7 достигает наивысшего mAP, ему требуется почти 128 мс на T4 GPU. В резком контрасте, YOLOv7x достигает сопоставимого mAP 53.1 с невероятно быстрой скоростью 11.57 мс, демонстрируя огромный скачок поколений в вычислительной эффективности для развертываний в реальном времени.

Сценарии использования и рекомендации

Выбор между EfficientDet и YOLOv7 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать EfficientDet

EfficientDet является отличным выбором для:

  • Конвейеры Google Cloud и TPU: Системы, глубоко интегрированные с API Google Cloud Vision или инфраструктурой TPU, где EfficientDet имеет нативную оптимизацию.
  • Исследование составного масштабирования: Академическое бенчмаркинг, сфокусированное на изучении влияния сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Мобильное развертывание через TFLite: Проекты, которые специально требуют экспорта TensorFlow Lite для Android или встраиваемых устройств на Linux.

Когда выбирать YOLOv7

YOLOv7 рекомендуется для:

  • Академическое сравнительное тестирование: Для воспроизведения передовых результатов 2022 года или изучения эффектов E-ELAN и обучаемых методов «набора бесплатных улучшений».
  • Исследования репараметризации: Исследование запланированных репараметризованных сверток и стратегий составного масштабирования моделей.
  • Существующие пользовательские конвейеры: Проекты с сильно кастомизированными конвейерами, построенными вокруг специфической архитектуры YOLOv7, которые не могут быть легко рефакторизированы.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Преимущество Ultralytics

Выбор правильной архитектуры выходит за рамки простых метрик; он включает в себя оценку всего жизненного цикла машинного обучения. Экосистема Ultralytics обеспечивает беспрецедентный опыт для разработчиков, значительно снижая порог входа для надежных развертываний ИИ.

  • Простота использования: Ultralytics предоставляет высокоунифицированный Python API. Разработчики могут обучать, проверять и экспортировать модели всего несколькими строками кода, устраняя необходимость управлять сложными, фрагментированными кодовыми базами, типичными для EfficientDet.
  • Хорошо поддерживаемая экосистема: Благодаря быстрым обновлениям, обширной документации и активному сообществу, Ultralytics обеспечивает совместимость с новейшими фреймворками развертывания, такими как TensorRT и OpenVINO.
  • Требования к памяти: Благодаря использованию высокооптимизированных загрузчиков данных PyTorch и упрощенных сетевых структур, модели Ultralytics YOLO требуют значительно меньше памяти CUDA во время обучения по сравнению с многоветочными сетями и моделями, сильно зависящими от трансформеров.
  • Универсальность: В отличие от старых архитектур, строго привязанных к обнаружению ограничивающих рамок, модели Ultralytics являются многозадачными мощными инструментами, поддерживающими сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (OBB).

Эффективность обучения с Ultralytics

Следующий код демонстрирует простоту обучения современной модели с использованием пакета Ultralytics Python, что является резким контрастом по сравнению с настройкой устаревших конвейеров TensorFlow.

from ultralytics import YOLO

# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the model to TensorRT for deployment
model.export(format="engine")

Новый стандарт: YOLO26

Хотя YOLOv7 и EfficientDet заложили основу для современного компьютерного зрения, ландшафт значительно изменился с появлением Ultralytics YOLO26 в январе 2026 года. Разработанная для исключительной точности и беспрецедентной производительности на периферии, YOLO26 является окончательной рекомендацией для всех новых проектов в области зрения.

Ключевые инновации YOLO26

  • Сквозная архитектура без NMS: Основываясь на принципах, заложенных в YOLOv10, YOLO26 изначально является сквозной (end-to-end) системой. Полностью исключая постобработку с подавлением немаксимумов (NMS), она обеспечивает более низкую и стабильную задержку, что критически важно для систем, отвечающих за безопасность, таких как автономное вождение.
  • До 43% более быстрый инференс на CPU: Благодаря удалению Distribution Focal Loss (DFL) YOLO26 обеспечивает значительно упрощенный процесс экспорта и беспрецедентную скорость на периферийных устройствах, таких как Raspberry Pi, что делает его бесспорным чемпионом в области периферийных вычислений.
  • Оптимизатор MuSGD: YOLO26 включает революционный оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM от Moonshot AI. Это приводит к удивительно стабильной динамике обучения и значительно более быстрым темпам сходимости.
  • ProgLoss + STAL: Интеграция Progressive Loss и Scale-Targeted Alignment Loss значительно улучшает способность модели detect мельчайшие объекты, решая серьезную проблему для изображений с дронов и систем охранной сигнализации.
  • Специализированные улучшения: YOLO26 — это не просто детектор. Он включает функцию потерь семантической сегментации и многомасштабный прототип для безупречной сегментации, оценку остаточного логарифмического правдоподобия (RLE) для сверхточной отслеживания позы и специализированную угловую функцию потерь для разрешения неоднозначностей границ OBB.

Узнайте больше о YOLO26

Исследование альтернативных моделей

Хотя YOLO26 представляет собой вершину современных технологий, экосистема Ultralytics поддерживает множество моделей, адаптированных для различных сценариев использования.

Для разработчиков, управляющих устаревшими системами, которые все еще требуют традиционного масштабирования без якорей, YOLO11 остается надежным и хорошо поддерживаемым вариантом в рамках платформы Ultralytics. Кроме того, для сценариев, явно требующих архитектур на основе трансформеров, RT-DETR предлагает обнаружение в реальном времени с использованием визуальных трансформеров, устраняя разрыв между высокоуровневыми механизмами внимания и скоростью выполнения в реальном времени.

В заключение, хотя EfficientDet предлагает академические идеи в области составного масштабирования, а YOLOv7 обеспечивает высокую базовую производительность в реальном времени, современным предприятиям лучше всего подходит внедрение платформы Ultralytics. Используя YOLO26, команды могут обеспечить максимальную производительность, минимальные сложности при обучении и готовность своих развертываний ИИ к будущему.


Комментарии