YOLOv8 против YOLO: подробное техническое сравнение
Выбор правильной модели обнаружения объектов очень важен для проектов в области компьютерного зрения. На этой странице представлено техническое сравнение Ultralytics YOLOv8 и YOLO, двух современных моделей, с анализом их архитектуры, производительности и областей применения.
Ultralytics YOLOv8
Ultralytics YOLOv8 Это последняя итерация серии YOLO , известной своим балансом скорости и точности в обнаружении объектов и других задачах зрения, таких как сегментация объектов и оценка позы. Разработанный Гленом Джошером, Аюшем Чаурасией и Цзином Цю из Ultralytics и выпущенный 2023-01-10, YOLOv8 опирается на предыдущие версии YOLO с архитектурными улучшениями и акцентом на удобство использования. В документации к ней подчеркивается простота использования и универсальность, что делает ее подходящей для широкого круга приложений и пользователей, от новичков до экспертов.
Сильные стороны:
- Производительность: YOLOv8 достигает современных показателей mAP, сохраняя при этом впечатляющую скорость вычислений. Он предлагает различные размеры моделей (n, s, m, l, x) для удовлетворения различных вычислительных потребностей.
- Универсальность: Помимо обнаружения объектов, YOLOv8 поддерживает множество задач технического зрения, включая сегментацию, классификацию и оценку положения, обеспечивая единое решение для различных задач компьютерного зрения.
- Простота использования: Ultralytics предоставляет исчерпывающую документацию и инструменты, упрощающие обучение, развертывание и интеграцию с такими платформами, как Ultralytics HUB.
- Поддержка сообщества: Большое и активное сообщество разработчиков с открытым исходным кодом обеспечивает постоянное совершенствование и широкую поддержку.
Слабые стороны:
- Ресурсоемкость: Большие модели YOLOv8 требуют значительных вычислительных ресурсов для обучения и выводов.
- Потребности в оптимизации: Для устройств с ограниченными ресурсами может потребоваться дополнительная оптимизация, например, обрезка модели.
Примеры использования:
Универсальность YOLOv8 делает его идеальным для широкого спектра приложений, от видеоаналитики в реальном времени в системах безопасности и "умных" городах до сложных задач в здравоохранении и производстве. Простота использования также делает его отличным средством для быстрого создания прототипов и разработки.
DAMO-YOLO
YOLO - это модель обнаружения объектов, разработанная компанией Alibaba Group и представленная в статье, опубликованной на сайте ArXiv 2022-11-23. Авторы работы - Сяньчжэ Сюй, Ици Цзян, Вэйхуа Чэнь, Илун Хуан, Юань Чжан и Сюйюй Сунь - YOLO нацелена на создание быстрого и точного детектора за счет использования инновационных технологий. К ним относятся основы на NAS, эффективный RepGFPN и ZeroHead, а также передовые стратегии обучения, такие как AlignedOTA и улучшение дистилляции. Официальная документация и репозиторий GitHub предоставляют подробную информацию о его архитектуре и реализации.
Сильные стороны:
- Высокая точность: YOLO рассчитан на высокую точность, обеспечивая конкурентоспособные показатели mAP, особенно в сценариях, требующих точного обнаружения объектов.
- Эффективный дизайн: Архитектурные инновации, такие как ZeroHead, способствуют созданию оптимизированной модели, сочетающей точность и эффективность вычислений.
- Передовые технологии: Включает в себя такие передовые технологии, как поиск нейронной архитектуры (NAS) для проектирования основы и AlignedOTA для оптимизации обучения.
Слабые стороны:
- Ограниченная универсальность задач: В первую очередь ориентирован на обнаружение объектов, не обладая многозадачными возможностями YOLOv8.
- Документация и сообщество: По сравнению с YOLOv8, YOLO может иметь меньшее сообщество и менее обширную документацию, что может создать проблемы для новых пользователей или тех, кто ищет широкую поддержку.
- Скорость вывода: Несмотря на эффективность, прямые сравнения скорости с YOLOv8 на стандартных бенчмарках не так доступны, и скорость может варьироваться в зависимости от конкретной реализации и аппаратного обеспечения.
Примеры использования:
YOLO хорошо подходит для приложений, где высокая точность обнаружения имеет первостепенное значение, например, в автономном вождении, высокоточном промышленном контроле и современных системах видеонаблюдения. Упор на точность и эффективность делает его сильным соперником в сценариях, где важно детальное и надежное обнаружение объектов.
Сравнительная таблица производительности
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Заключение
И YOLOv8 , и YOLO - мощные модели обнаружения объектов. YOLOv8 отличается универсальностью, простотой использования и сильным сообществом, что делает ее подходящей для широкого спектра задач и сценариев разработки. YOLO отличается точностью и эффективным дизайном, что делает ее отличным выбором для приложений, требующих точного обнаружения объектов. Пользователи, заинтересованные в других моделях, могут также рассмотреть YOLOv7, YOLOv9 или YOLOX в зависимости от их конкретных потребностей и приоритетов.