Перейти к содержанию

YOLOv8 и DAMO-YOLO: всестороннее техническое сравнение

В быстро развивающейся области компьютерного зрения выбор правильной архитектуры обнаружения объектов имеет решающее значение для обеспечения баланса между точностью, скоростью и эффективностью развертывания. В этом руководстве представлен подробный технический анализ двух известных моделей: Ultralytics YOLOv8, известной своей надежной экосистемой и простотой использования, и YOLO, архитектурой, ориентированной на исследования, использующей поиск нейронных архитектур (NAS).

Краткое изложение

В то время какYOLO в 2022 годуYOLO такие инновационные концепции, как NAS-магистрали и перепараметризация, YOLOv8 (выпущенная в 2023 году) и более новая YOLO26 (выпущенная в 2026 году) предлагают более зрелую, готовую к производству экосистему. Ultralytics обеспечивают беспроблемный опыт «от нуля до героя» с интегрированной поддержкой обучения, валидации и развертывания на различном оборудовании, в то время какYOLO ориентирована на академические исследования с более сложным процессом обучения.

Метрики производительности

В таблице ниже сравниваются результаты YOLOv8 YOLO COCO наборе данных COCO . YOLOv8 превосходную универсальность и скорость, особенно в реальных сценариях инференции.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics YOLOv8 Обзор

YOLOv8 представляет собой значительный шаг вперед в YOLO , разработанный Ultralytics наиболее удобная и точная современная модель для широкого спектра задач.

Ключевые особенности YOLOv8

YOLOv8 на предыдущих успехах и использует унифицированную структуру, которая поддерживает обнаружение объектов, сегментацию экземпляров, оценку положения, классификацию и обнаружение ориентированных ограничивающих прямоугольников (OBB). Его анкерная головка обнаружения и новые функции потери оптимизируют процесс обучения, что приводит к более высокой точности и более быстрой конвергенции.

Интегрированная экосистема

В отличие от репозиториев, предназначенных исключительно для исследований, YOLOv8 комплексной Ultralytics . Она включает в себя Ultralytics для обучения без кода и управления наборами данных, а также бесшовную интеграцию с такими инструментами, как Weights & Biases и Ultralytics .

Узнайте больше о YOLOv8

Обзор DAMO-YOLO

YOLO — это платформа для обнаружения объектов, разработанная академией Alibaba DAMO Academy. Она отличается низкой задержкой и высокой точностью благодаря использованию нейронного архитектурного поиска (NAS) и других передовых технологий.

Архитектура и методология

YOLO многомасштабный поиск архитектуры (MAE-NAS) для нахождения оптимальных базовых структур для различных ограничений по задержке. Он использует RepGFPN (перепараметризованную обобщенную пирамидальную сеть признаков) для эффективного слияния признаков и применяет интенсивный процесс дистилляции во время обучения для повышения производительности обучаемой модели.

Подробное сравнение архитектурных решений

Архитектурные философии этих двух моделей значительно различаются, что влияет на их удобство использования и гибкость.

Backbone и Feature Fusion

YOLOv8 использует модифицированную магистраль CSPDarknet с модулями C2f, которые оптимизированы для богатого градиентного потока и аппаратной эффективности. Этот подход «bag-of-freebies» обеспечивает высокую производительность без необходимости сложных этапов поиска.

В отличие от этого, YOLO полагается на NAS для обнаружения базовых структур, таких как MobileOne или варианты на основе CSP, адаптированные к конкретному оборудованию. Хотя это может привести к теоретическому повышению эффективности, часто это усложняет процесс обучения и затрудняет настройку архитектуры для новых задач для среднестатистического разработчика.

Методология обучения

ОбучениеYOLO сложный многоэтапный процесс. Он включает в себя стратегию «ZeroHead» и сложный процесс дистилляции, в котором большая модель-учитель направляет ученика. Это требует значительных вычислительных ресурсов и сложной настройки.

Ultralytics уделяют приоритетное внимание эффективности обучения. YOLOv8 и более новая версия YOLO26) могут быть обучены с нуля или настроены на пользовательские данные с помощью одной команды. Использование предварительно обученных весов значительно сокращает время и CUDA , необходимые для сходимости.

# Simplicity of Ultralytics Training
yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640

Универсальность и поддержка задач

Важным преимуществом Ultralytics является ее универсальность. В то время какYOLO в первую очередьYOLO детектором объектов, YOLOv8 множество задач компьютерного зрения. Разработчики могут переключаться с обнаружения автомобилей на сегментацию опухолей или оценку позы человека без изменения своего программного стека.

Ultralytics : почему стоит выбрать YOLOv8 YOLO26?

Для разработчиков и предприятий выбор модели часто выходит за рамки простого mAP весь жизненный цикл продукта искусственного интеллекта.

1. Простота использования и документация

Ultralytics своей лучшей в отрасли документацией и простым Python . Интеграция YOLOv8 приложение занимает всего несколько строк кода, тогда какYOLO требует навигации по сложным исследовательским кодовым базам с ограниченной внешней поддержкой.

2. Развертывание и экспорт

Реальное внедрение требует гибкости. Ultralytics поддерживают экспорт в один клик в такие форматы, как ONNX, TensorRT, CoreMLи TFLite. Это гарантирует, что ваша модель может работать на всех устройствах, от облачных серверов до периферийных устройств, таких как Raspberry Pi или NVIDIA .

3. Баланс производительности

YOLOv8 исключительного баланса между скоростью и точностью. Для пользователей, которым требуется еще большая эффективность, недавно выпущенная версия YOLO26 основывается на этом наследии с помощью сквозной конструкции NMS. Это устраняет необходимость в постобработке с помощью Non-Maximum Suppression (NMS), что приводит к более быстрому выводу и более простой логике развертывания.

Будущее без NMS

YOLO26 является пионером в области нативной архитектуры «из конца в конец». Благодаря устранению необходимости в NMS использованию нового оптимизатора MuSGD (вдохновленного обучением LLM), YOLO26 предлагает на 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его лучшим выбором для пограничных вычислений.

Узнайте больше о YOLO26

Идеальные варианты использования

  • ВыберитеYOLO : вы являетесь исследователем, специально изучающим методы поиска нейронных архитектур (NAS), или у вас есть высокоспециализированные аппаратные ограничения, при которых общей базовой архитектуры недостаточно, и у вас есть ресурсы для управления сложными конвейерами дистилляции.
  • Выберите Ultralytics YOLOv8, если: вам нужно готовое к производству решение для аналитики в розничной торговле, автономных транспортных средств, медицинской визуализации или приложений для умных городов. Его надежные опции экспорта, низкие требования к памяти и активная поддержка сообщества делают его стандартом для надежного коммерческого внедрения.

Заключение

В то время какYOLO интересные академические инновации в области архитектурного поиска, Ultralytics YOLOv8 и передовой YOLO26 остаются предпочтительным выбором для практического применения. Их сочетание простоты использования, хорошо поддерживаемой экосистемы и сбалансированной производительности гарантирует, что разработчики могут сосредоточиться на решении реальных проблем, а не на борьбе с деталями реализации модели.

Те, кто готов начать свое путешествие в мир компьютерного зрения, могут ознакомиться с кратким руководством по началу работы или сразу же погрузиться в возможности Ultralytics .

Дополнительная литература


Комментарии