Перейти к содержанию

Сравнение моделей: YOLOv8 против YOLOv10 для обнаружения объектов

Выбор подходящей модели обнаружения объектов имеет решающее значение для успеха любого проекта компьютерного зрения. На этой странице представлено подробное техническое сравнение Ultralytics YOLOv8 и YOLOv10, двух современных моделей в этой области. Мы проанализируем их архитектурные нюансы, показатели производительности, методологии обучения и идеальные приложения, чтобы помочь вам принять обоснованное решение для ваших конкретных потребностей.

Ultralytics YOLOv8: Универсальность и зрелость

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8, запущенная в январе 2023 года компанией Ultralytics, представляет собой зрелую и очень универсальную модель, основанную на сильных сторонах своих предшественников YOLO. Она разработана для обеспечения скорости, точности и простоты использования в широком спектре задач визуального ИИ, включая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).

Архитектура и ключевые особенности

YOLOv8 представляет собой значительную эволюцию в серии YOLO, отличаясь подходом обнаружения без привязки к anchor, что упрощает архитектуру модели и улучшает обобщение для различных наборов данных. Ее гибкая базовая сеть и оптимизированные функции потерь способствуют повышению точности и более стабильному обучению. Ключевым преимуществом YOLOv8 является ее масштабируемость, предлагающая ряд размеров моделей от Nano (n) до Extra-large (x) для удовлетворения различных вычислительных требований и требований к точности. Эта универсальность делает ее отличным выбором для проектов, которые могут требовать больше, чем просто обнаружение объектов, поскольку она поддерживает несколько задач в рамках единой унифицированной структуры.

Производительность и сильные стороны

YOLOv8 обеспечивает надежный баланс производительности, достигая высоких показателей mAP, сохраняя при этом высокую скорость inference, подходящую для приложений реального времени. Например, YOLOv8x достигает 53,9% mAPval 50-95 на наборе данных COCO. Ее эффективная конструкция обеспечивает более низкие требования к памяти во время обучения и inference по сравнению со многими другими архитектурами, особенно моделями на основе transformer, такими как RT-DETR.

  • Развитая и хорошо документированная: YOLOv8 выигрывает от обширной документации, большого сообщества и легкодоступных ресурсов, что делает ее исключительно удобной в использовании и простой в реализации с помощью простых интерфейсов Python и CLI.
  • Универсальность и многозадачность: Поддержка широкого спектра задач компьютерного зрения является ключевым преимуществом перед более специализированными моделями, предлагая беспрецедентную гибкость для сложных проектных требований.
  • Хорошо поддерживаемая экосистема: Модель легко интегрируется с Ultralytics HUB, платформой, которая оптимизирует рабочие процессы от обучения до развертывания. Она поддерживается активной разработкой и частыми обновлениями от Ultralytics.
  • Баланс производительности: Обеспечивает превосходный компромисс между скоростью, точностью и размером модели, что делает его подходящим для широкого спектра реальных сценариев развертывания.
  • Эффективность обучения: YOLOv8 предлагает эффективные процессы обучения и легкодоступные предварительно обученные веса, что значительно ускоряет циклы разработки.

Слабые стороны

Несмотря на высокую эффективность, YOLOv8 может незначительно уступать в конкретных, сильно ограниченных бенчмарках более новым моделям, таким как YOLOv10, которые ставят во главу угла скорость или количество параметров. Однако YOLOv8 часто предлагает лучший общий пакет удобства использования, универсальности и поддержки.

Идеальные варианты использования

Универсальность и простота использования YOLOv8 делают его идеальным для широкого спектра приложений:

  • Системы безопасности: Отлично подходит для обнаружения объектов в реальном времени в системах охранной сигнализации.
  • Аналитика розничной торговли: Полезна в интеллектуальной розничной торговле для понимания поведения клиентов и управления запасами.
  • Промышленный контроль качества: Применим в производстве для автоматизированного визуального контроля.
  • Многозадачные проекты: Идеально подходит для проектов, требующих одновременного обнаружения, сегментации и оценки позы с помощью одной модели.

Узнайте больше о YOLOv8

YOLOv10: Расширяя границы эффективности

Авторы: Ао Ванг, Хуэй Чен, Лихао Лю и др.
Организация: Университет Цинхуа
Дата: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Документация: https://docs.ultralytics.com/models/yolov10/

YOLOv10, представленный в мае 2024 года, направлен на максимальное повышение эффективности и скорости при сохранении конкурентоспособной точности. Он особенно ориентирован на приложения реального времени и периферийные приложения. Ключевой инновацией является его подход к обучению, который устраняет необходимость в Non-Maximum Suppression (NMS), что помогает снизить задержку постобработки и обеспечивает истинное сквозное обнаружение объектов.

Архитектура и ключевые особенности

YOLOv10 отличается целостным подходом к проектированию модели, ориентированным на эффективность и точность. Он оптимизирует различные компоненты для уменьшения вычислительной избыточности и повышения возможностей обнаружения. Благодаря использованию согласованных двойных назначений для обучения, он устраняет шаг NMS, упрощая конвейер развертывания. Хотя это значительный шаг вперед, важно отметить, что YOLOv10 в первую очередь ориентирован на обнаружение объектов и не обладает встроенной универсальностью многозадачности YOLOv8.

Анализ производительности

YOLOv10 демонстрирует передовую эффективность, предлагая более высокую скорость инференса и меньший размер модели по сравнению со многими предыдущими версиями YOLO. Например, YOLOv10-S достигает 46,7% mAPval 50-95, имея всего 7,2 млн параметров. Из таблицы ниже видно, что для заданного уровня точности модели YOLOv10 часто имеют меньше параметров и более низкие FLOPs, чем их аналоги YOLOv8. Однако YOLOv8 сохраняет очень конкурентоспособную скорость, особенно на CPU, где она была значительно оптимизирована.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

Сильные и слабые стороны

  • Повышенная эффективность: Предлагает более высокую скорость вывода и меньшие размеры моделей во многих сравнениях, что выгодно для сред с ограниченными ресурсами.
  • Обучение без NMS: Упрощает конвейер развертывания за счет удаления этапа постобработки NMS, снижая задержку.
  • Передовая производительность: Достигает отличной производительности, особенно в тестах, ориентированных на задержку.

Однако, у YOLOv10 также есть некоторые ограничения:

  • Более новая модель: Будучи более новой моделью, она имеет меньшее сообщество и меньше доступных ресурсов или интеграций со сторонними разработчиками по сравнению с хорошо зарекомендовавшей себя YOLOv8.
  • Интеграция в экосистему: Будучи интегрированной в библиотеку Ultralytics, она может потребовать больше усилий для интеграции в устоявшиеся рабочие процессы MLOps по сравнению с такими моделями, как YOLOv8, которые являются нативными для комплексной экосистемы Ultralytics.
  • Специализация по задачам: В основном он ориентирован на обнаружение объектов, ему не хватает встроенной универсальности для сегментации, классификации и оценки позы, предлагаемой YOLOv8.

Идеальные варианты использования

YOLOv10 особенно хорошо подходит для приложений, где производительность в реальном времени и эффективность использования ресурсов являются абсолютными приоритетами:

  • Периферийные устройства: Идеально подходит для развертывания на устройствах с ограниченной вычислительной мощностью, таких как мобильные телефоны и встроенные системы.
  • Высокоскоростная обработка: Подходит для приложений, требующих очень низкой задержки, таких как автономные дроны и робототехника.
  • Аналитика в реальном времени: Идеально подходит для динамичных сред, требующих немедленного обнаружения объектов, таких как управление дорожным движением.

Узнайте больше о YOLOv10

Заключение

Ultralytics YOLOv8 и YOLOv10 — это мощные и эффективные модели обнаружения объектов. Выбор между ними во многом зависит от приоритетов конкретного проекта.

Ultralytics YOLOv8 — рекомендуемый выбор для большинства разработчиков и исследователей. Она выделяется своей исключительной универсальностью, простотой использования, надежной экосистемой и отличным балансом скорости и точности. Ее многозадачные возможности делают ее перспективным решением для проектов, которые могут развиваться и включать сегментацию, оценку позы или другие задачи компьютерного зрения.

YOLOv10 предлагает убедительные преимущества в эффективности для специализированных приложений, критичных к задержкам. Если основным ограничением вашего проекта является развертывание на маломощных периферийных устройствах или достижение минимально возможного времени инференса для одной задачи, YOLOv10 является сильным претендентом.

Пользователям, заинтересованным в изучении других современных моделей, Ultralytics предлагает ряд вариантов, включая широко известную YOLOv5, инновационную YOLOv9 и новейшую YOLO11. Дополнительные сравнения, такие как YOLOv9 vs YOLOv8 и YOLOv5 vs YOLOv8, доступны, чтобы помочь вам выбрать лучшую модель для ваших нужд.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии