Перейти к содержанию

EfficientDet против YOLOv6.0: Всестороннее техническое сравнение

В развивающемся ландшафте компьютерного зрения выбор правильной архитектуры обнаружения объектов имеет решающее значение для успешного внедрения. В этом сравнении рассматриваются технические различия между EfficientDet, моделью Google, ориентированной на исследования, и YOLOv6.0, детектором промышленного класса от Meituan. В то время как EfficientDet представил революционные концепции эффективности, такие как масштабирование соединений, YOLOv6.0 был разработан специально для промышленных приложений с низкой задержкой, что свидетельствует о переходе от академических бенчмарков к реальной пропускной способности.

Сравнение показателей производительности

Следующие бенчмарки на наборе данныхCOCO иллюстрируют компромисс между архитектурной эффективностью и задержкой вывода. YOLOv6.0 демонстрирует превосходную скорость работы на аппаратном обеспечении GPU , используя методы репараметризации, в то время как EfficientDet сохраняет конкурентоспособную точность при более высоких вычислительных затратах.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

EfficientDet: Масштабируемая эффективность

EfficientDet представляет собой смену парадигмы в разработке моделей, систематически оптимизируя глубину, ширину и разрешение сети. Построенная на основе EfficientNet, она представила двунаправленную сеть пирамид признаков (BiFPN), позволяющую легко объединять многомасштабные признаки.

Архитектурные инновации

В основе EfficientDet лежит сеть BiFPN, которая позволяет передавать информацию как сверху вниз, так и снизу вверх, многократно объединяя признаки в разных масштабах. Это контрастирует с более простыми сетями пирамид признаков (FPN), часто используемыми в старых детекторах. Кроме того, в EfficientDet используется Compound Scaling- метод, который равномерно масштабирует опорную сеть, BiFPN и сети классов/боксов с помощью одного составного коэффициента $\phi$. Такой структурированный подход гарантирует, что ресурсы будут сбалансированы по всем измерениям модели, что позволяет избежать узких мест, часто встречающихся в архитектурах, разработанных вручную.

Сильные и слабые стороны

EfficientDet превосходит по эффективности параметров, достигая высоких mAP с относительно меньшим количеством параметров, чем у его современников, таких как YOLOv3. Он особенно эффективен для задач классификации и обнаружения изображений, где размер модели (объем памяти) является ограничением, но задержка поддается регулированию. Однако сложные нерегулярные соединения в слое BiFPN и широкое использование разделимых по глубине сверток могут быть неэффективны на стандартных GPU, что приводит к увеличению задержки вывода, несмотря на меньшее количество FLOP.

Латентность в сравнении с FLOPs

Хотя EfficientDet имеет низкое количество FLOP (операций с плавающей запятой), это не всегда означает более высокую скорость работы на GPU. Затраты на доступ к памяти, связанные с разделимыми по глубине свертками, могут снижать производительность по сравнению со стандартными свертками, используемыми в моделях YOLO .

Узнайте больше об EfficientDet

YOLOv6.0: Промышленная скорость

YOLOv6.0 отходит от чисто академических показателей и фокусируется на реальной пропускной способности, в частности, оптимизируя аппаратные ограничения, встречающиеся в промышленных средах.

Архитектура и Дизайн

В YOLOv6.0 используется EfficientRep Backbone, который использует репараметризацию (стиль RepVGG) для разделения архитектур времени обучения и времени вывода. Во время обучения модель использует сложные многоразветвленные блоки для лучшего градиентного потока; во время вывода они сворачиваются в одиночные свертки стоимостью $3 \times 3$, максимизируя GPU плотность вычислений. В версию 3.0 также интегрированы такие передовые стратегии, как обучение с учетом квантования (QAT) и саморасщепление, что позволяет модели сохранять точность даже при квантовании с точностью INT8 для развертывания на пограничных устройствах.

Идеальные варианты использования

Благодаря удобной конструкции YOLOv6.0 идеально подходит для аппаратного обеспечения:

  • Высокоскоростное производство: Обнаружение дефектов на быстро движущихся конвейерных лентах, где скорость вывода информации не является обязательным условием.
  • Автоматизация розничной торговли: Системы безкассового обслуживания, требующие распознавания объектов с низкой задержкой.
  • Аналитика "умного города": Обработка нескольких видеопотоков для анализа трафика или систем безопасности.

Узнайте больше о YOLOv6.0

Сравнительный анализ

Различия в философии проектирования этих двух моделей создают явные преимущества в зависимости от оборудования для развертывания.

Точность в сравнении со скоростью

Как видно из таблицы, YOLOv6.0l достигает mAP (52,8), сравнимого с EfficientDet-d6 (52,6), но работает почти в 10 раз быстрее на GPU T4 (8,95 мс против 89,29 мс). Такой большой разрыв подчеркивает неэффективность глубинных сверток на высокопроизводительном оборудовании по сравнению с плотными свертками YOLOv6. EfficientDet сохраняет небольшое преимущество в абсолютной точности благодаря своему самому большому варианту D7, но за счет задержки, которая не позволяет делать выводы в реальном времени.

Обучение и универсальность

EfficientDet в значительной степени опирается на экосистему TensorFlow и ускорение TPU для эффективного обучения. YOLOv6 , напротив, вписывается в экосистему PyTorch , что делает ее более доступной для обычных исследователей. Однако обе модели в первую очередь предназначены для обнаружения объектов. Для проектов, требующих сегментации объектов или оценки позы, пользователям часто приходится искать внешние форки или альтернативные архитектуры.

Преимущество Ultralytics

В то время как YOLOv6.0 и EfficientDet являются способными моделями, Ultralytics YOLO11 представляет собой следующую эволюцию в компьютерном зрении, устраняя ограничения обоих предшественников с помощью единой, ориентированной на пользователя структуры.

Почему стоит выбрать Ultralytics YOLO11?

  1. Простота использования и экосистема: В отличие от разрозненных хранилищ исследовательских моделей, Ultralytics обеспечивает бесшовный опыт. Согласованный API наPython позволяет обучать, проверять и развертывать модели всего в нескольких строках кода.
  2. Непревзойденная универсальность: YOLO11 не ограничивается ограничивающими рамками. Он поддерживает Классификация изображений, сегментацию объектов, оценка позыи Ориентированные граничные коробки (OBB)что делает его универсальным решением для сложных конвейеров ИИ.
  3. Эффективность обучения: Модели Ultralytics оптимизированы с учетом требований к памяти, часто сходятся быстрее и используют меньше VRAM, чем утяжеленные трансформаторами или старые архитектуры. Такая доступность демократизирует разработку ИИ высокого уровня для тех, у кого нет массивных вычислительных кластеров.
  4. Хорошо поддерживаемая экосистема: Поддерживаемая активным сообществом и частыми обновлениями, экосистема Ultralytics гарантирует, что ваши проекты будут перспективными, с легкой интеграцией в инструменты для аннотирования, регистрации и развертывания данных.

Упорядоченное развитие

В Ultralytics переключиться с обнаружения объектов на сегментацию экземпляров можно просто изменив имя модели (например, yolo11n.pt в yolo11n-seg.pt). Такая гибкость значительно сокращает время разработки по сравнению с адаптацией различных архитектур, таких как EfficientDet, к новым задачам.

Пример кода

Оцените простоту API Ultralytics по сравнению со сложными кодовыми базами исследований:

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

Узнайте больше о YOLO11

Заключение

EfficientDet остается вехой в теории масштабирования моделей, идеально подходящей для академических исследований или автономной обработки, где точность является единственной метрикой. YOLOv6.0 расширяет возможности промышленного ИИ, обеспечивая превосходную скорость работы на поддерживаемом оборудовании.

Однако для целостного решения, сочетающего в себе современную производительность и продуктивность разработчика, Ultralytics YOLO11 является рекомендуемым выбором. Его интеграция различных задач технического зрения, меньший объем памяти и надежная система поддержки позволяют разработчикам уверенно переходить от прототипа к производству.

Изучите другие модели

Если вы хотите узнать больше, рассмотрите эти связанные сравнения в нашей документации:


Комментарии