YOLOv10 против YOLO: подробное техническое сравнение для обнаружения объектов
Выбор оптимальной модели обнаружения объектов имеет решающее значение для приложений компьютерного зрения, поскольку модели существенно различаются по точности, скорости и эффективности. На этой странице представлено подробное техническое сравнение YOLOv10 и YOLO, двух передовых моделей в области обнаружения объектов. Мы рассмотрим их архитектуру, эталоны производительности и подходящие приложения, чтобы помочь вам в выборе модели.
YOLOv10
YOLOv10 - это новейшая разработка в серии YOLO , известной своими возможностями обнаружения объектов в режиме реального времени. Разработанный исследователями из Университета Цинхуа и представленный 2024-05-23(препринт arXiv:2405.14458), YOLOv10 отличается сквозной эффективностью и повышенной производительностью. Официальная реализация PyTorch доступна на GitHub.
Архитектура и ключевые особенности
В YOLOv10 реализован ряд инноваций, направленных на оптимизацию архитектуры и улучшение баланса между скоростью и точностью, переход к обучению без NMS и эффективному проектированию моделей. Основные архитектурные новшества включают:
- Обучение без NMS: Использует последовательное двойное назначение для обучения без немаксимального подавления (NMS), что снижает накладные расходы на постобработку и задержку вывода.
- Целостный дизайн, ориентированный на эффективность и точность: Комплексная оптимизация различных компонентов модели для минимизации избыточности вычислений и повышения возможностей обнаружения.
- Магистраль и структура сети: Усовершенствованные слои извлечения признаков и оптимизированная структура сети для повышения эффективности параметров и ускорения обработки.
Показатели производительности
YOLOv10 обеспечивает современную производительность в различных масштабах моделирования, предоставляя ряд возможностей для удовлетворения различных вычислительных потребностей. Показатели производительности на наборе данных COCO включают:
- mAP: Достижение конкурентной средней точности (mAP) на наборе данных для проверки COCO. Например, YOLOv10-S достигает 46,7 % mAPval50-95.
- Скорость вычислений: YOLOv10-N обеспечивает впечатляющую скорость вычислений: время вычисления на T4 TensorRT10 достигает 1,56 мс.
- Размер модели: Выпускается в нескольких размерах (N, S, M, B, L, X) с параметрами модели от 2,3M для YOLOv10-N до 56,9M для YOLOv10-X.
Сильные и слабые стороны
Сильные стороны:
- Производительность в реальном времени: Оптимизирован для повышения скорости и эффективности, что делает его идеальным для приложений, работающих в режиме реального времени.
- Высокая точность: Достигается самая современная точность, особенно в больших моделях, таких как YOLOv10-X.
- Конечная эффективность: Конструкция без NMS сокращает время ожидания и упрощает развертывание.
- Универсальность: Подходит для решения различных задач по обнаружению объектов и адаптируется к различным аппаратным платформам, включая такие устройства, как Raspberry Pi и NVIDIA Jetson.
- Простота использования: интеграция спакетом Ultralytics Python упрощает процессы обучения, проверки и развертывания.
Слабые стороны:
- Развивающаяся модель: В качестве новой модели поддержка сообщества и предварительно обученные веса в более широких экосистемах могут все еще развиваться по сравнению с более устоявшимися моделями.
- Компромисс: в небольших моделях приоритет отдается скорости, что может быть достигнуто за счет некоторой точности по сравнению с большими вариантами или более сложными моделями.
Примеры использования
YOLOv10 хорошо подходит для приложений, требующих высокоскоростного и точного обнаружения объектов, таких как:
- Автономные системы: Самоуправляемые автомобили и робототехника.
- Охрана и наблюдение: Системы охранной сигнализации и мониторинг в режиме реального времени.
- Промышленная автоматизация: Контроль качества производства и автоматизация процессов.
- Аналитика розничной торговли: Управление запасами и анализ поведения покупателей.
DAMO-YOLO
YOLO, разработанная компанией Alibaba Group, - это высокопроизводительная модель обнаружения объектов, представленная в 2022 году(препринт arXiv:2211.15444v2). Она разработана для быстрого и точного обнаружения объектов и включает в себя несколько передовых методов для эффективного обнаружения объектов. Официальная реализация и документация доступны на GitHub.
Архитектура и ключевые особенности
YOLO объединяет несколько инновационных компонентов для достижения баланса скорости и точности:
- NAS Backbone: Использует нейронную архитектуру поиска (NAS) для проектирования эффективных магистральных сетей, оптимизированных для задач обнаружения объектов.
- Эффективная сеть RepGFPN: Использует репараметризованную градиентную сеть пирамид признаков (RepGFPN) для эффективного слияния признаков и многомасштабного представления признаков.
- ZeroHead: облегченная головка обнаружения, разработанная для минимизации вычислительных затрат при сохранении точности обнаружения.
- AlignedOTA: использует Aligned Optimal Transport Assignment (AlignedOTA) для улучшения присвоения меток во время обучения, что повышает эффективность обнаружения.
- Улучшение дистилляции: Включает в себя методы дистилляции знаний для дальнейшего повышения производительности модели.
Показатели производительности
Модели YOLO выпускаются в различных размерах (Tiny, Small, Medium, Large), чтобы удовлетворить различные потребности в производительности. Ключевые показатели производительности включают:
- mAP: Достигается высокий показатель mAP на эталонных наборах данных, таких как COCO. Например, YOLO достигает 50,8% mAPval50-95.
- Скорость вычислений: Обеспечивает высокую скорость вычислений, что делает его подходящим для приложений реального времени: время вычисления YOLO на T4 TensorRT10 составило 2,32 мс.
- Размер модели: Размеры моделей варьируются, обеспечивая гибкость для различных сценариев развертывания: от 8,5 М параметров для YOLO до 42,1 М для YOLO.
Сильные и слабые стороны
Сильные стороны:
- Высокая точность: Достигает превосходной точности обнаружения благодаря архитектурным инновациям и передовым методам обучения.
- Быстрый вывод: Создан для скорости, обеспечивая эффективную работу с выводами, подходящую для систем реального времени.
- Эффективная конструкция: Использование магистралей NAS и легких головок позволяет оптимизировать эффективность вычислений.
- Широкий набор функций: Интегрирует множество передовых технологий, таких как RepGFPN и AlignedOTA, обеспечивая высокую производительность.
Слабые стороны:
- Сложность: Интеграция сетевого хранилища и множества современных компонентов может усложнить настройку и модификацию.
- Требования к ресурсам: Большие модели YOLO могут потребовать значительных вычислительных ресурсов по сравнению с очень легкими альтернативами.
Примеры использования
YOLO хорошо подходит для приложений, требующих высокой точности и скорости обнаружения объектов, таких как:
- Передовые системы помощи водителю (ADAS): Обнаружение объектов в сценариях автономного вождения.
- Анализ изображений высокого разрешения: Приложения, требующие детального анализа изображений высокого разрешения, например, анализ спутниковых снимков.
- Робототехника и автоматизация: Точное обнаружение объектов для роботизированной навигации и манипулирования в промышленной автоматизации.
- Системы видеонаблюдения: Высокоточное обнаружение, разрушающее статус-кво в области видеонаблюдения с помощью искусственного интеллекта.
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Пользователям также может быть интересно сравнение YOLOv10 и YOLO с другими моделями семейства Ultralytics YOLO и не только:
- YOLOv8: Изучите универсальность и простоту использования YOLOv8 по сравнению с YOLO.
- YOLOv9: Понимание архитектурных инноваций в YOLOv9 по сравнению с YOLO.
- RT-DETR: Сравните сквозные детекторы в RT-DETR и YOLO.
- EfficientDet: Посмотрите, как соотносятся модели, ориентированные на эффективность, в сравнении EfficientDet и YOLO.
- PP-YOLOE: рассмотрите альтернативные эффективные модели, такие как PP-YOLOE против YOLO.