EfficientDet против YOLOv7: Навигация по архитектурам детектирования объектов в реальном времени

Выбор наиболее эффективной архитектуры нейронной сети имеет решающее значение для успеха любой инициативы в области компьютерного зрения. Поскольку спрос на высокопроизводительные решения в области ИИ растет, сравнение признанных моделей, таких как EfficientDet и YOLOv7, становится необходимым для разработчиков, стремящихся оптимизировать как точность, так и вычислительную эффективность.

Этот всесторонний технический анализ исследует архитектурные нюансы, метрики производительности и идеальные сценарии развертывания для обеих моделей. Кроме того, мы покажем, почему интегрированная экосистема, предоставляемая Ultralytics, — кульминацией которой является передовая Ultralytics YOLO26, — предлагает превосходную альтернативу для современных задач компьютерного зрения.

Понимание EfficientDet

EfficientDet был разработан для максимизации точности при систематическом управлении вычислительными затратами в условиях различных ресурсных ограничений. Он достиг этого благодаря новому подходу к масштабированию и слиянию признаков.

Детали EfficientDet: Авторы: Mingxing Tan, Ruoming Pang и Quoc V. Le Организация: Google Дата: 2019-11-20 Arxiv: EfficientDet: Scalable and Efficient Object Detection GitHub: Google AutoML Repository

Архитектура и инновации

По своей сути EfficientDet использует двунаправленную пирамидальную сеть признаков (BiFPN). В отличие от традиционных FPN, BiFPN позволяет легко и быстро объединять признаки разных масштабов за счет введения обучаемых весов для определения важности различных входных признаков. Это сочетается с методом составного масштабирования, который равномерно масштабирует разрешение, глубину и ширину базовой сети, сети признаков и сетей предсказания рамок/классов одновременно.

Сильные и слабые стороны

EfficientDet обладает высокой масштабируемостью. Его меньшие варианты (d0-d2) чрезвычайно эффективны с точки зрения параметров, что делает их подходящими для сред со строгими ограничениями на хранилище. Более крупные варианты (например, d7) расширяют границы средней точности (mAP) для высокопроизводительной автономной обработки.

Однако EfficientDet сильно зависит от устаревших реализаций TensorFlow и сложных конвейеров AutoML. Эта унаследованная инфраструктура делает его крайне трудным для интеграции в современные рабочие процессы, ориентированные на PyTorch. Кроме того, он страдает от значительной задержки вывода на периферийных устройствах при переходе к вариантам с более высокой точностью.

Узнай больше об EfficientDet

Понимание YOLOv7

YOLOv7, представленный в 2022 году, совершил огромный скачок в скорости и точности для приложений реального времени, установив новую планку для широко популярного семейства YOLO на тот момент.

Детали YOLOv7: Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao Организация: Institute of Information Science, Academia Sinica, Taiwan Дата: 2022-07-06 Arxiv: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors GitHub: Official YOLOv7 Repository

Архитектура и инновации

YOLOv7 представил расширенную сеть агрегации эффективных слоев (E-ELAN). Это архитектурное улучшение повышает способность сети к обучению, не разрушая исходный градиентный путь, что позволяет модели эффективно изучать более разнообразные признаки. Кроме того, он реализует «обучаемый набор бесплатных решений» (trainable bag-of-freebies), используя такие методы, как планируемая перепараметризация и динамическое назначение меток для повышения точности без увеличения стоимости вывода.

Сильные и слабые стороны

YOLOv7 превосходен в сценариях реального времени, таких как видеоаналитика и высокоскоростная роботизированная навигация. Он отлично масштабируется на серверных GPU и предлагает нативную реализацию на PyTorch, что делает его доступным для академических исследователей.

Несмотря на впечатляющую скорость, YOLOv7 по-прежнему полагается на немаксимальное подавление (NMS) для постобработки, что может вызвать переменную задержку в многолюдных сценах. Кроме того, его потребление памяти во время обучения заметно больше, чем у новых поколений, что требует более мощного оборудования для работы с большими размерами пакетов (batch sizes).

Узнай больше о YOLOv7

Сравнение производительности и метрик

При сравнении этих моделей важно изучить компромиссы между точностью, скоростью вывода и размером параметров. Ниже приведена подробная оценка различных конфигураций EfficientDet и YOLOv7.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
Выводы по производительности

Хотя EfficientDet-d7 достигает наивысшего mAP, ему требуется почти 128 мс на GPU T4. В разительном контрасте YOLOv7x достигает сопоставимого mAP 53.1 при невероятно быстрой скорости 11.57 мс, демонстрируя огромный поколенческий скачок в вычислительной эффективности для развертываний в реальном времени.

Варианты использования и рекомендации

Выбор между EfficientDet и YOLOv7 зависит от твоих конкретных требований проекта, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать EfficientDet

EfficientDet — это хороший выбор для:

  • Конвейеров Google Cloud и TPU: Систем, глубоко интегрированных с API Google Cloud Vision или инфраструктурой TPU, где EfficientDet имеет нативную оптимизацию.
  • Исследований в области составного масштабирования: Академических бенчмарков, сфокусированных на изучении эффектов сбалансированного масштабирования глубины, ширины и разрешения сети.
  • Развертывания на мобильных устройствах через TFLite: Проектов, которые специально требуют экспорта в TensorFlow Lite для Android или встроенных Linux-устройств.

Когда стоит выбрать YOLOv7

YOLOv7 рекомендуется для:

  • Академического бенчмаркинга: воспроизведение результатов SOTA 2022 года или изучение эффектов E-ELAN и методов trainable bag-of-freebies.
  • Исследований репараметризации: изучение запланированных репараметризованных сверток и стратегий масштабирования составных моделей.
  • Существующих пользовательских пайплайнов: проекты с сильно кастомизированными пайплайнами, построенными вокруг специфической архитектуры YOLOv7, которые нелегко рефакторить.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Преимущество Ultralytics

Выбор правильной архитектуры выходит за рамки просто необработанных метрик; он включает в себя оценку всего жизненного цикла машинного обучения. Экосистема Ultralytics предоставляет непревзойденный опыт разработчика, значительно снижая барьер входа для надежных развертываний ИИ.

  • Простота использования: Ultralytics предоставляет высокоунифицированный Python API. Ты можешь обучать, валидировать и экспортировать модели всего за несколько строк кода, устраняя необходимость управлять сложными, фрагментированными кодовыми базами, типичными для EfficientDet.
  • Хорошо поддерживаемая экосистема: Благодаря быстрым обновлениям, обширной документации и активному сообществу, Ultralytics обеспечивает совместимость с новейшими фреймворками развертывания, такими как TensorRT и OpenVINO.
  • Требования к памяти: Используя высокооптимизированные загрузчики данных PyTorch и оптимизированные структуры сетей, модели Ultralytics YOLO требуют значительно меньше памяти CUDA во время обучения по сравнению с многоветвевыми сетями и моделями, перегруженными трансформерами.
  • Универсальность: В отличие от старых архитектур, строго привязанных к обнаружению ограничивающих рамок, модели Ultralytics — это многозадачные системы, поддерживающие сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (OBB).

Эффективность обучения с Ultralytics

Следующий код демонстрирует простоту обучения современной модели с использованием пакета Ultralytics Python, что резко контрастирует с настройкой устаревших конвейеров TensorFlow.

from ultralytics import YOLO

# Load the highly recommended YOLO26 model
model = YOLO("yolo26s.pt")

# Train the model automatically handling hyperparameter tuning and augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export the model to TensorRT for deployment
model.export(format="engine")

Новый стандарт: YOLO26

Хотя YOLOv7 и EfficientDet заложили основу для современного компьютерного зрения, ситуация кардинально изменилась с появлением Ultralytics YOLO26 в январе 2026 года. Созданная как для экстремальной точности, так и для непревзойденной производительности на периферии, YOLO26 является главной рекомендацией для всех новых проектов в области зрения.

Ключевые инновации YOLO26

  • Сквозной дизайн без NMS: Опираясь на фундамент, заложенный YOLOv10, YOLO26 является нативно сквозной моделью. Полностью исключая постобработку немаксимального подавления (NMS), она обеспечивает меньшую и более стабильную задержку, что критически важно для систем, где важна безопасность, таких как беспилотные автомобили.
  • До 43% более быстрый вывод на CPU: Благодаря удалению функции потерь DFL (Distribution Focal Loss), YOLO26 отличается значительно упрощенным процессом экспорта и непревзойденной скоростью на периферийных устройствах, таких как Raspberry Pi, что делает ее бесспорным чемпионом периферийных вычислений.
  • Оптимизатор MuSGD: YOLO26 включает революционный оптимизатор MuSGD — гибрид SGD и Muon, вдохновленный инновациями в обучении LLM от Moonshot AI. Это приводит к удивительно стабильной динамике обучения и гораздо более высокой скорости сходимости.
  • ProgLoss + STAL: Интеграция Progressive Loss и Scale-Targeted Alignment Loss существенно улучшает способность модели обнаруживать крошечные объекты, решая серьезную проблему для изображений с дронов и систем охранной сигнализации.
  • Улучшения для конкретных задач: YOLO26 — это не просто детектор. Он включает функцию потерь семантической сегментации и мультимасштабные прототипы для безупречной сегментации, оценку остаточного логарифмического правдоподобия (RLE) для сверхточного отслеживания позы и специализированную функцию потерь углов для устранения неоднозначностей границ OBB.

Узнай больше о YOLO26

Изучение альтернативных моделей

Хотя YOLO26 представляет собой вершину современных технологий, экосистема Ultralytics поддерживает множество моделей, адаптированных для различных вариантов использования.

Для разработчиков, управляющих унаследованными системами, которым все еще требуется традиционное масштабирование без анкеров, YOLO11 остается надежным и хорошо поддерживаемым вариантом в рамках платформы Ultralytics. Кроме того, для сценариев, явно требующих архитектур на основе трансформеров, RT-DETR предлагает детектирование в реальном времени с использованием визуальных трансформеров, преодолевая разрыв между высокоуровневыми механизмами внимания и скоростью выполнения в реальном времени.

В заключение, хотя EfficientDet дает академическое понимание составного масштабирования, а YOLOv7 предлагает надежную базовую производительность в реальном времени, современным предприятиям лучше всего использовать платформу Ultralytics. Используя YOLO26, команды могут обеспечить максимальную производительность, минимальные трудности при обучении и подготовить свои ИИ-развертывания к будущему.

Комментарии