YOLOv8 и DAMO-YOLO: всестороннее техническое сравнение
В быстро развивающейся области компьютерного зрения выбор правильной архитектуры обнаружения объектов имеет решающее значение для обеспечения баланса между точностью, скоростью и эффективностью развертывания. В этом руководстве представлен подробный технический анализ двух известных моделей: Ultralytics YOLOv8, известной своей надежной экосистемой и простотой использования, и YOLO, архитектурой, ориентированной на исследования, использующей поиск нейронных архитектур (NAS).
Краткое изложение
В то время какYOLO в 2022 годуYOLO такие инновационные концепции, как NAS-магистрали и перепараметризация, YOLOv8 (выпущенная в 2023 году) и более новая YOLO26 (выпущенная в 2026 году) предлагают более зрелую, готовую к производству экосистему. Ultralytics обеспечивают беспроблемный опыт «от нуля до героя» с интегрированной поддержкой обучения, валидации и развертывания на различном оборудовании, в то время какYOLO ориентирована на академические исследования с более сложным процессом обучения.
Метрики производительности
В таблице ниже сравниваются результаты YOLOv8 YOLO COCO наборе данных COCO . YOLOv8 превосходную универсальность и скорость, особенно в реальных сценариях инференции.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Ultralytics YOLOv8 Обзор
YOLOv8 представляет собой значительный шаг вперед в YOLO , разработанный Ultralytics наиболее удобная и точная современная модель для широкого спектра задач.
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 10 января 2023 г.
- Документация:Документация YOLOv8
- GitHub:ultralytics/ultralytics
Ключевые особенности YOLOv8
YOLOv8 на предыдущих успехах и использует унифицированную структуру, которая поддерживает обнаружение объектов, сегментацию экземпляров, оценку положения, классификацию и обнаружение ориентированных ограничивающих прямоугольников (OBB). Его анкерная головка обнаружения и новые функции потери оптимизируют процесс обучения, что приводит к более высокой точности и более быстрой конвергенции.
Интегрированная экосистема
В отличие от репозиториев, предназначенных исключительно для исследований, YOLOv8 комплексной Ultralytics . Она включает в себя Ultralytics для обучения без кода и управления наборами данных, а также бесшовную интеграцию с такими инструментами, как Weights & Biases и Ultralytics .
Обзор DAMO-YOLO
YOLO — это платформа для обнаружения объектов, разработанная академией Alibaba DAMO Academy. Она отличается низкой задержкой и высокой точностью благодаря использованию нейронного архитектурного поиска (NAS) и других передовых технологий.
- Авторы: Сяньчжэ Сюй, Ици Цзян, Вэйхуа Чэнь, Илунь Хуан, Юань Чжан и Сююй Сунь
- Организация: Alibaba Group
- Дата: 23 ноября 2022 г.
- Arxiv:DAMO-YOLO: Отчет о проектировании системы обнаружения объектов в реальном времени
- GitHub:tinyvision/DAMO-YOLO
Архитектура и методология
YOLO многомасштабный поиск архитектуры (MAE-NAS) для нахождения оптимальных базовых структур для различных ограничений по задержке. Он использует RepGFPN (перепараметризованную обобщенную пирамидальную сеть признаков) для эффективного слияния признаков и применяет интенсивный процесс дистилляции во время обучения для повышения производительности обучаемой модели.
Подробное сравнение архитектурных решений
Архитектурные философии этих двух моделей значительно различаются, что влияет на их удобство использования и гибкость.
Backbone и Feature Fusion
YOLOv8 использует модифицированную магистраль CSPDarknet с модулями C2f, которые оптимизированы для богатого градиентного потока и аппаратной эффективности. Этот подход «bag-of-freebies» обеспечивает высокую производительность без необходимости сложных этапов поиска.
В отличие от этого, YOLO полагается на NAS для обнаружения базовых структур, таких как MobileOne или варианты на основе CSP, адаптированные к конкретному оборудованию. Хотя это может привести к теоретическому повышению эффективности, часто это усложняет процесс обучения и затрудняет настройку архитектуры для новых задач для среднестатистического разработчика.
Методология обучения
ОбучениеYOLO сложный многоэтапный процесс. Он включает в себя стратегию «ZeroHead» и сложный процесс дистилляции, в котором большая модель-учитель направляет ученика. Это требует значительных вычислительных ресурсов и сложной настройки.
Ultralytics уделяют приоритетное внимание эффективности обучения. YOLOv8 и более новая версия YOLO26) могут быть обучены с нуля или настроены на пользовательские данные с помощью одной команды. Использование предварительно обученных весов значительно сокращает время и CUDA , необходимые для сходимости.
# Simplicity of Ultralytics Training
yolo train model=yolov8n.pt data=coco8.yaml epochs=100 imgsz=640
Универсальность и поддержка задач
Важным преимуществом Ultralytics является ее универсальность. В то время какYOLO в первую очередьYOLO детектором объектов, YOLOv8 множество задач компьютерного зрения. Разработчики могут переключаться с обнаружения автомобилей на сегментацию опухолей или оценку позы человека без изменения своего программного стека.
Ultralytics : почему стоит выбрать YOLOv8 YOLO26?
Для разработчиков и предприятий выбор модели часто выходит за рамки простого mAP весь жизненный цикл продукта искусственного интеллекта.
1. Простота использования и документация
Ultralytics своей лучшей в отрасли документацией и простым Python . Интеграция YOLOv8 приложение занимает всего несколько строк кода, тогда какYOLO требует навигации по сложным исследовательским кодовым базам с ограниченной внешней поддержкой.
2. Развертывание и экспорт
Реальное внедрение требует гибкости. Ultralytics поддерживают экспорт в один клик в такие форматы, как ONNX, TensorRT, CoreMLи TFLite. Это гарантирует, что ваша модель может работать на всех устройствах, от облачных серверов до периферийных устройств, таких как Raspberry Pi или NVIDIA .
3. Баланс производительности
YOLOv8 исключительного баланса между скоростью и точностью. Для пользователей, которым требуется еще большая эффективность, недавно выпущенная версия YOLO26 основывается на этом наследии с помощью сквозной конструкции NMS. Это устраняет необходимость в постобработке с помощью Non-Maximum Suppression (NMS), что приводит к более быстрому выводу и более простой логике развертывания.
Будущее без NMS
YOLO26 является пионером в области нативной архитектуры «из конца в конец». Благодаря устранению необходимости в NMS использованию нового оптимизатора MuSGD (вдохновленного обучением LLM), YOLO26 предлагает на 43 % более быстрое CPU по сравнению с предыдущими поколениями, что делает его лучшим выбором для пограничных вычислений.
Идеальные варианты использования
- ВыберитеYOLO : вы являетесь исследователем, специально изучающим методы поиска нейронных архитектур (NAS), или у вас есть высокоспециализированные аппаратные ограничения, при которых общей базовой архитектуры недостаточно, и у вас есть ресурсы для управления сложными конвейерами дистилляции.
- Выберите Ultralytics YOLOv8, если: вам нужно готовое к производству решение для аналитики в розничной торговле, автономных транспортных средств, медицинской визуализации или приложений для умных городов. Его надежные опции экспорта, низкие требования к памяти и активная поддержка сообщества делают его стандартом для надежного коммерческого внедрения.
Заключение
В то время какYOLO интересные академические инновации в области архитектурного поиска, Ultralytics YOLOv8 и передовой YOLO26 остаются предпочтительным выбором для практического применения. Их сочетание простоты использования, хорошо поддерживаемой экосистемы и сбалансированной производительности гарантирует, что разработчики могут сосредоточиться на решении реальных проблем, а не на борьбе с деталями реализации модели.
Те, кто готов начать свое путешествие в мир компьютерного зрения, могут ознакомиться с кратким руководством по началу работы или сразу же погрузиться в возможности Ultralytics .
Дополнительная литература
- Сравнение YOLOv8 EfficientDet
- Изучите YOLO26 и RT-DETR
- Узнайте о YOLO11