Перейти к содержанию

YOLOv6.0 против EfficientDet: Баланс между скоростью и точностью обнаружения объектов

В быстро развивающемся ландшафте компьютерного зрения выбор правильной архитектуры обнаружения объектов имеет решающее значение для успеха вашего проекта. В этом сравнении рассматриваются YOLOv6.0 и EfficientDet- две известные модели, которые подходят к решению задачи визуального распознавания с разных сторон. В то время как EfficientDet фокусируется на эффективности параметров и масштабируемости, YOLOv6.0 разработан специально для промышленных приложений, где задержка вывода и скорость работы в реальном времени не являются обязательными условиями.

Показатели производительности и технический анализ

Фундаментальное различие между этими двумя архитектурами заключается в их философии проектирования. EfficientDet опирается на сложный механизм слияния признаков, известный как BiFPN, который повышает точность, но часто за счет скорости вычислений на GPU. В YOLOv6.0, напротив, используется аппаратно-ориентированный дизайн, использующий репараметризацию для оптимизации операций во время вывода, что приводит к значительному повышению FPS (кадров в секунду).

Приведенная ниже таблица иллюстрирует этот компромисс. Хотя EfficientDet-d7 достигает высокого mAP, его задержка существенна. Напротив, YOLOv6.0l обеспечивает сопоставимую точность при значительно меньшем времени вывода, что делает его гораздо более подходящим для сценариев вывода в реальном времени.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Оптимизация производительности

Для промышленного развертывания сочетание YOLOv6.0 с TensorRT может дать значительный прирост скорости. Архитектурная простота YOLOv6 позволяет ему очень эффективно отображаться на аппаратные инструкции GPU по сравнению со сложными сетями пирамид функций, которые встречаются в старых моделях.

YOLOv6.0: Создано для промышленности

YOLOv6.0 - это одноступенчатый детектор объектов, разработанный для преодоления разрыва между академическими исследованиями и промышленными требованиями. В нем приоритетом является скорость без ущерба для точности, необходимой для таких задач, как проверка качества.

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization:Meituan
Date: 2023-01-13
Arxiv:YOLOv6 v3.0: Полномасштабная перезагрузка
GitHub:YOLOv6
Docs:YOLOv6 Documentation

Архитектура и сильные стороны

Основой YOLOv6.0 является ее эффективная основа и дизайн "RepOpt". Благодаря использованию репараметризации модель отделяет многоразветвленные структуры времени обучения от одноразветвленных структур времени вывода. В результате получается модель, которую легко обучить с богатыми градиентами, но при этом она очень быстро выполняется.

  • Самодистилляция: В стратегии обучения используется самораспространение, когда предсказание самой модели действует как мягкая метка, направляющая обучение, повышая точность без дополнительных данных.
  • Поддержка квантования: Он разработан с учетом квантования модели, что позволяет минимизировать падение точности при преобразовании в INT8 для развертывания на границе.
  • Промышленная направленность: Идеально подходит для ИИ в производстве и робототехнике, где важна миллисекундная задержка.

Узнайте больше о YOLOv6.0

EfficientDet: Масштабируемая точность

EfficientDet произвел революцию в этой области, представив концепцию составного масштабирования для обнаружения объектов. Она оптимизирует глубину, ширину и разрешение сети одновременно для достижения превосходной производительности по каждому параметру.

Авторы: Mingxing Tan, Ruoming Pang, and Quoc V. Le
Organization:Google
Дата: 2019-11-20
Arxiv:EfficientDet: Масштабируемое и эффективное обнаружение объектов
GitHub:google

Архитектура и сильные стороны

EfficientDet опирается на основу EfficientNet и представляет двунаправленную сеть пирамид признаков (BiFPN). Эта сложная шейная структура позволяет легко и быстро объединять разномасштабные признаки.

  • BiFPN: В отличие от традиционных FPN, BiFPN позволяет информации течь как сверху вниз, так и снизу вверх, применяя весовые коэффициенты к различным входным признакам, чтобы подчеркнуть их важность.
  • Сложное масштабирование: Простой коэффициент $\phi$ позволяет пользователям увеличивать масштаб модели (от d0 до d7) в зависимости от имеющихся ресурсов, обеспечивая предсказуемую кривую "точность-вычисления".
  • Эффективность параметров: Меньшие варианты (d0-d2) чрезвычайно легки с точки зрения размера диска и количества FLOP, что делает их полезными в средах с ограниченным объемом памяти.

Архитектурная сложность

Хотя BiFPN очень эффективен с точки зрения точности, его нерегулярные шаблоны доступа к памяти могут сделать его более медленным на GPU по сравнению с плотными, регулярными блоками свертки, используемыми в архитектурах YOLO . Именно поэтому EfficientDet часто демонстрирует более высокую задержку вывода, несмотря на меньшее количество параметров.

Узнайте больше об EfficientDet

Реальные примеры использования

Выбор между этими моделями часто зависит от конкретных ограничений среды развертывания.

Идеальные сценарии для YOLOv6.0

  • Высокоскоростное производство: Обнаружение дефектов на быстро движущихся конвейерных лентах, где требуется высокая частота кадров для track каждого элемента.
  • Автономная навигация: Позволяет роботам ориентироваться в динамических средах, обрабатывая видеопоток в режиме реального времени.
  • Пограничные вычисления: Развертывание на таких устройствах, как NVIDIA Jetson, где ресурсы GPU должны быть максимально эффективными для обеспечения пропускной способности.

Идеальные сценарии для EfficientDet

  • Медицинский анализ: анализ статичных изображений высокого разрешения, например, обнаружение опухолей на рентгеновских снимках, где время обработки не так важно, как точность.
  • Дистанционное зондирование: Обработка спутниковых снимков в автономном режиме для выявления изменений окружающей среды или развития городов.
  • IoT с низким объемом памяти: Устройства с крайне ограниченным объемом памяти, которым требуется небольшой размер файла модели (например, EfficientDet-d0).

Преимущество Ultralytics: Почему стоит выбрать YOLO11?

Хотя YOLOv6.0 и EfficientDet являются способными моделями, но Ultralytics YOLO11 представляют собой передовой край технологии компьютерного зрения. YOLO11 усовершенствует лучшие атрибуты предыдущих поколений YOLO и объединяет их в бесшовную, удобную для пользователя экосистему.

Ключевые преимущества YOLO11

  1. Простота использования: Ultralytics уделяет первостепенное внимание работе с разработчиками. Благодаря Pythonic API вы можете обучать, проверять и развертывать модели всего в нескольких строках кода, в отличие от сложных конфигурационных файлов, которые часто требуются для EfficientDet.
  2. Универсальность: В отличие от YOLOv6 и EfficientDet, которые являются преимущественно моделями обнаружения объектов, YOLO11 поддерживает множество задач, включая сегментацию объектов, оценку позы, ориентированные ограничительные рамки (ООБ) и классификацию.
  3. Баланс производительности: В YOLO11 достигнут современный компромисс между скоростью и точностью. Он постоянно превосходит старые архитектуры на наборе данныхCOCO , сохраняя при этом низкую задержку.
  4. Хорошо поддерживаемая экосистема: Модели Ultralytics поддерживаются активным сообществом и часто обновляются. Вы получаете доступ к обширной документации, учебным пособиям и бесшовным интеграциям с такими инструментами, как Ultralytics HUB, для облачного обучения и управления наборами данных.
  5. Эффективность обучения: YOLO11 разработан для экономии ресурсов во время обучения, часто сходится быстрее и требует меньше памятиGPU , чем сложные модели на основе трансформаторов или старые архитектуры.
from ultralytics import YOLO

# Load the YOLO11 model (recommended over older versions)
model = YOLO("yolo11n.pt")

# Perform inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Узнайте больше о YOLO11

Изучите другие модели

Если вы оцениваете возможности своего конвейера компьютерного зрения, обратите внимание на другие модели в каталоге Ultralytics . Сайт YOLOv8 предлагает надежную производительность для широкого круга задач, а основанная на трансформаторах RT-DETR является альтернативой для сценариев, требующих глобального понимания контекста. Для мобильных приложений, YOLOv10 также заслуживает внимания. Их сравнение с EfficientDet поможет скорректировать выбор с учетом специфики оборудования и требований к точности.


Комментарии