Перейти к содержанию

YOLOv10 против YOLO: подробное техническое сравнение для обнаружения объектов

Выбор оптимальной модели обнаружения объектов имеет решающее значение для приложений компьютерного зрения, поскольку модели существенно различаются по точности, скорости и эффективности. На этой странице представлено подробное техническое сравнение YOLOv10 и YOLO, двух передовых моделей в области обнаружения объектов. Мы рассмотрим их архитектуру, эталоны производительности и подходящие приложения, чтобы помочь вам в выборе модели.

YOLOv10

YOLOv10 - это новейшая разработка в серии YOLO , известной своими возможностями обнаружения объектов в режиме реального времени. Разработанный исследователями из Университета Цинхуа и представленный 2024-05-23(препринт arXiv:2405.14458), YOLOv10 отличается сквозной эффективностью и повышенной производительностью. Официальная реализация PyTorch доступна на GitHub.

Архитектура и ключевые особенности

В YOLOv10 реализован ряд инноваций, направленных на оптимизацию архитектуры и улучшение баланса между скоростью и точностью, переход к обучению без NMS и эффективному проектированию моделей. Основные архитектурные новшества включают:

  • Обучение без NMS: Использует последовательное двойное назначение для обучения без немаксимального подавления (NMS), что снижает накладные расходы на постобработку и задержку вывода.
  • Целостный дизайн, ориентированный на эффективность и точность: Комплексная оптимизация различных компонентов модели для минимизации избыточности вычислений и повышения возможностей обнаружения.
  • Магистраль и структура сети: Усовершенствованные слои извлечения признаков и оптимизированная структура сети для повышения эффективности параметров и ускорения обработки.

Показатели производительности

YOLOv10 обеспечивает современную производительность в различных масштабах моделирования, предоставляя ряд возможностей для удовлетворения различных вычислительных потребностей. Показатели производительности на наборе данных COCO включают:

  • mAP: Достижение конкурентной средней точности (mAP) на наборе данных для проверки COCO. Например, YOLOv10-S достигает 46,7 % mAPval50-95.
  • Скорость вычислений: YOLOv10-N обеспечивает впечатляющую скорость вычислений: время вычисления на T4 TensorRT10 достигает 1,56 мс.
  • Размер модели: Выпускается в нескольких размерах (N, S, M, B, L, X) с параметрами модели от 2,3M для YOLOv10-N до 56,9M для YOLOv10-X.

Сильные и слабые стороны

Сильные стороны:

  • Производительность в реальном времени: Оптимизирован для повышения скорости и эффективности, что делает его идеальным для приложений, работающих в режиме реального времени.
  • Высокая точность: Достигается самая современная точность, особенно в больших моделях, таких как YOLOv10-X.
  • Конечная эффективность: Конструкция без NMS сокращает время ожидания и упрощает развертывание.
  • Универсальность: Подходит для решения различных задач по обнаружению объектов и адаптируется к различным аппаратным платформам, включая такие устройства, как Raspberry Pi и NVIDIA Jetson.
  • Простота использования: интеграция спакетом Ultralytics Python упрощает процессы обучения, проверки и развертывания.

Слабые стороны:

  • Развивающаяся модель: В качестве новой модели поддержка сообщества и предварительно обученные веса в более широких экосистемах могут все еще развиваться по сравнению с более устоявшимися моделями.
  • Компромисс: в небольших моделях приоритет отдается скорости, что может быть достигнуто за счет некоторой точности по сравнению с большими вариантами или более сложными моделями.

Примеры использования

YOLOv10 хорошо подходит для приложений, требующих высокоскоростного и точного обнаружения объектов, таких как:

Узнайте больше о YOLOv10

DAMO-YOLO

YOLO, разработанная компанией Alibaba Group, - это высокопроизводительная модель обнаружения объектов, представленная в 2022 году(препринт arXiv:2211.15444v2). Она разработана для быстрого и точного обнаружения объектов и включает в себя несколько передовых методов для эффективного обнаружения объектов. Официальная реализация и документация доступны на GitHub.

Архитектура и ключевые особенности

YOLO объединяет несколько инновационных компонентов для достижения баланса скорости и точности:

  • NAS Backbone: Использует нейронную архитектуру поиска (NAS) для проектирования эффективных магистральных сетей, оптимизированных для задач обнаружения объектов.
  • Эффективная сеть RepGFPN: Использует репараметризованную градиентную сеть пирамид признаков (RepGFPN) для эффективного слияния признаков и многомасштабного представления признаков.
  • ZeroHead: облегченная головка обнаружения, разработанная для минимизации вычислительных затрат при сохранении точности обнаружения.
  • AlignedOTA: использует Aligned Optimal Transport Assignment (AlignedOTA) для улучшения присвоения меток во время обучения, что повышает эффективность обнаружения.
  • Улучшение дистилляции: Включает в себя методы дистилляции знаний для дальнейшего повышения производительности модели.

Показатели производительности

Модели YOLO выпускаются в различных размерах (Tiny, Small, Medium, Large), чтобы удовлетворить различные потребности в производительности. Ключевые показатели производительности включают:

  • mAP: Достигается высокий показатель mAP на эталонных наборах данных, таких как COCO. Например, YOLO достигает 50,8% mAPval50-95.
  • Скорость вычислений: Обеспечивает высокую скорость вычислений, что делает его подходящим для приложений реального времени: время вычисления YOLO на T4 TensorRT10 составило 2,32 мс.
  • Размер модели: Размеры моделей варьируются, обеспечивая гибкость для различных сценариев развертывания: от 8,5 М параметров для YOLO до 42,1 М для YOLO.

Сильные и слабые стороны

Сильные стороны:

  • Высокая точность: Достигает превосходной точности обнаружения благодаря архитектурным инновациям и передовым методам обучения.
  • Быстрый вывод: Создан для скорости, обеспечивая эффективную работу с выводами, подходящую для систем реального времени.
  • Эффективная конструкция: Использование магистралей NAS и легких головок позволяет оптимизировать эффективность вычислений.
  • Широкий набор функций: Интегрирует множество передовых технологий, таких как RepGFPN и AlignedOTA, обеспечивая высокую производительность.

Слабые стороны:

  • Сложность: Интеграция сетевого хранилища и множества современных компонентов может усложнить настройку и модификацию.
  • Требования к ресурсам: Большие модели YOLO могут потребовать значительных вычислительных ресурсов по сравнению с очень легкими альтернативами.

Примеры использования

YOLO хорошо подходит для приложений, требующих высокой точности и скорости обнаружения объектов, таких как:

Узнайте больше о YOLO

Модель размер
(пикселей)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4TensorRT10
(мс)
params
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

Пользователям также может быть интересно сравнение YOLOv10 и YOLO с другими моделями семейства Ultralytics YOLO и не только:

📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии