Сравнение моделей: YOLOv8 против YOLOv10 для обнаружения объектов
Выбор подходящей модели обнаружения объектов имеет решающее значение для успеха любого проекта компьютерного зрения. На этой странице представлено подробное техническое сравнение Ultralytics YOLOv8 и YOLOv10, двух современных моделей в этой области. Мы проанализируем их архитектурные нюансы, показатели производительности, методологии обучения и идеальные приложения, чтобы помочь вам принять обоснованное решение для ваших конкретных потребностей.
Ultralytics YOLOv8: Универсальность и зрелость
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8, запущенная в январе 2023 года компанией Ultralytics, представляет собой зрелую и очень универсальную модель, основанную на сильных сторонах своих предшественников YOLO. Она разработана для обеспечения скорости, точности и простоты использования в широком спектре задач визуального ИИ, включая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Архитектура и ключевые особенности
YOLOv8 представляет собой значительную эволюцию в серии YOLO, отличаясь подходом обнаружения без привязки к anchor, что упрощает архитектуру модели и улучшает обобщение для различных наборов данных. Ее гибкая базовая сеть и оптимизированные функции потерь способствуют повышению точности и более стабильному обучению. Ключевым преимуществом YOLOv8 является ее масштабируемость, предлагающая ряд размеров моделей от Nano (n) до Extra-large (x) для удовлетворения различных вычислительных требований и требований к точности. Эта универсальность делает ее отличным выбором для проектов, которые могут требовать больше, чем просто обнаружение объектов, поскольку она поддерживает несколько задач в рамках единой унифицированной структуры.
Производительность и сильные стороны
YOLOv8 обеспечивает надежный баланс производительности, достигая высоких показателей mAP, сохраняя при этом высокую скорость inference, подходящую для приложений реального времени. Например, YOLOv8x достигает 53,9% mAPval 50-95 на наборе данных COCO. Ее эффективная конструкция обеспечивает более низкие требования к памяти во время обучения и inference по сравнению со многими другими архитектурами, особенно моделями на основе transformer, такими как RT-DETR.
- Развитая и хорошо документированная: YOLOv8 выигрывает от обширной документации, большого сообщества и легкодоступных ресурсов, что делает ее исключительно удобной в использовании и простой в реализации с помощью простых интерфейсов Python и CLI.
- Универсальность и многозадачность: Поддержка широкого спектра задач компьютерного зрения является ключевым преимуществом перед более специализированными моделями, предлагая беспрецедентную гибкость для сложных проектных требований.
- Хорошо поддерживаемая экосистема: Модель легко интегрируется с Ultralytics HUB, платформой, которая оптимизирует рабочие процессы от обучения до развертывания. Она поддерживается активной разработкой и частыми обновлениями от Ultralytics.
- Баланс производительности: Обеспечивает превосходный компромисс между скоростью, точностью и размером модели, что делает его подходящим для широкого спектра реальных сценариев развертывания.
- Эффективность обучения: YOLOv8 предлагает эффективные процессы обучения и легкодоступные предварительно обученные веса, что значительно ускоряет циклы разработки.
Слабые стороны
Несмотря на высокую эффективность, YOLOv8 может незначительно уступать в конкретных, сильно ограниченных бенчмарках более новым моделям, таким как YOLOv10, которые ставят во главу угла скорость или количество параметров. Однако YOLOv8 часто предлагает лучший общий пакет удобства использования, универсальности и поддержки.
Идеальные варианты использования
Универсальность и простота использования YOLOv8 делают его идеальным для широкого спектра приложений:
- Системы безопасности: Отлично подходит для обнаружения объектов в реальном времени в системах охранной сигнализации.
- Аналитика розничной торговли: Полезна в интеллектуальной розничной торговле для понимания поведения клиентов и управления запасами.
- Промышленный контроль качества: Применим в производстве для автоматизированного визуального контроля.
- Многозадачные проекты: Идеально подходит для проектов, требующих одновременного обнаружения, сегментации и оценки позы с помощью одной модели.
YOLOv10: Расширяя границы эффективности
Авторы: Ао Ванг, Хуэй Чен, Лихао Лю и др.
Организация: Университет Цинхуа
Дата: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Документация: https://docs.ultralytics.com/models/yolov10/
YOLOv10, представленный в мае 2024 года, направлен на максимальное повышение эффективности и скорости при сохранении конкурентоспособной точности. Он особенно ориентирован на приложения реального времени и периферийные приложения. Ключевой инновацией является его подход к обучению, который устраняет необходимость в Non-Maximum Suppression (NMS), что помогает снизить задержку постобработки и обеспечивает истинное сквозное обнаружение объектов.
Архитектура и ключевые особенности
YOLOv10 отличается целостным подходом к проектированию модели, ориентированным на эффективность и точность. Он оптимизирует различные компоненты для уменьшения вычислительной избыточности и повышения возможностей обнаружения. Благодаря использованию согласованных двойных назначений для обучения, он устраняет шаг NMS, упрощая конвейер развертывания. Хотя это значительный шаг вперед, важно отметить, что YOLOv10 в первую очередь ориентирован на обнаружение объектов и не обладает встроенной универсальностью многозадачности YOLOv8.
Анализ производительности
YOLOv10 демонстрирует передовую эффективность, предлагая более высокую скорость инференса и меньший размер модели по сравнению со многими предыдущими версиями YOLO. Например, YOLOv10-S достигает 46,7% mAPval 50-95, имея всего 7,2 млн параметров. Из таблицы ниже видно, что для заданного уровня точности модели YOLOv10 часто имеют меньше параметров и более низкие FLOPs, чем их аналоги YOLOv8. Однако YOLOv8 сохраняет очень конкурентоспособную скорость, особенно на CPU, где она была значительно оптимизирована.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Сильные и слабые стороны
- Повышенная эффективность: Предлагает более высокую скорость вывода и меньшие размеры моделей во многих сравнениях, что выгодно для сред с ограниченными ресурсами.
- Обучение без NMS: Упрощает конвейер развертывания за счет удаления этапа постобработки NMS, снижая задержку.
- Передовая производительность: Достигает отличной производительности, особенно в тестах, ориентированных на задержку.
Однако, у YOLOv10 также есть некоторые ограничения:
- Более новая модель: Будучи более новой моделью, она имеет меньшее сообщество и меньше доступных ресурсов или интеграций со сторонними разработчиками по сравнению с хорошо зарекомендовавшей себя YOLOv8.
- Интеграция в экосистему: Будучи интегрированной в библиотеку Ultralytics, она может потребовать больше усилий для интеграции в устоявшиеся рабочие процессы MLOps по сравнению с такими моделями, как YOLOv8, которые являются нативными для комплексной экосистемы Ultralytics.
- Специализация по задачам: В основном он ориентирован на обнаружение объектов, ему не хватает встроенной универсальности для сегментации, классификации и оценки позы, предлагаемой YOLOv8.
Идеальные варианты использования
YOLOv10 особенно хорошо подходит для приложений, где производительность в реальном времени и эффективность использования ресурсов являются абсолютными приоритетами:
- Периферийные устройства: Идеально подходит для развертывания на устройствах с ограниченной вычислительной мощностью, таких как мобильные телефоны и встроенные системы.
- Высокоскоростная обработка: Подходит для приложений, требующих очень низкой задержки, таких как автономные дроны и робототехника.
- Аналитика в реальном времени: Идеально подходит для динамичных сред, требующих немедленного обнаружения объектов, таких как управление дорожным движением.
Заключение
Ultralytics YOLOv8 и YOLOv10 — это мощные и эффективные модели обнаружения объектов. Выбор между ними во многом зависит от приоритетов конкретного проекта.
Ultralytics YOLOv8 — рекомендуемый выбор для большинства разработчиков и исследователей. Она выделяется своей исключительной универсальностью, простотой использования, надежной экосистемой и отличным балансом скорости и точности. Ее многозадачные возможности делают ее перспективным решением для проектов, которые могут развиваться и включать сегментацию, оценку позы или другие задачи компьютерного зрения.
YOLOv10 предлагает убедительные преимущества в эффективности для специализированных приложений, критичных к задержкам. Если основным ограничением вашего проекта является развертывание на маломощных периферийных устройствах или достижение минимально возможного времени инференса для одной задачи, YOLOv10 является сильным претендентом.
Пользователям, заинтересованным в изучении других современных моделей, Ultralytics предлагает ряд вариантов, включая широко известную YOLOv5, инновационную YOLOv9 и новейшую YOLO11. Дополнительные сравнения, такие как YOLOv9 vs YOLOv8 и YOLOv5 vs YOLOv8, доступны, чтобы помочь вам выбрать лучшую модель для ваших нужд.