YOLOv6-3.0 vs YOLOv10: подробное техническое сравнение
Выбор идеальной модели обнаружения объектов необходим для максимального успеха ваших проектов компьютерного зрения. Эта область постоянно развивается, и новые архитектуры предлагают улучшенные компромиссы между скоростью, точностью и эффективностью. На этой странице представлено всестороннее техническое сравнение между YOLOv6-3.0 и YOLOv10, двумя мощными моделями обнаружения объектов. Мы углубимся в их архитектурные различия, эталонные показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для ваших конкретных потребностей.
YOLOv6-3.0: оптимизирован для промышленной скорости
YOLOv6-3.0, разработанный Meituan, представляет собой фреймворк для обнаружения объектов, разработанный специально для промышленных приложений. Выпущенный в начале 2023 года, он фокусируется на достижении баланса между высокой скоростью инференса и конкурентоспособной точностью, что делает его надежным выбором для реальных сценариев развертывания, где задержка является критическим фактором.
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
- Организация: Meituan
- Дата: 13.01.2023
- Arxiv: https://arxiv.org/abs/2301.05586
- GitHub: https://github.com/meituan/YOLOv6
- Документация: https://docs.ultralytics.com/models/yolov6/
Архитектура и ключевые особенности
YOLOv6-3.0 построена на философии проектирования нейронных сетей с учетом аппаратного обеспечения. Его архитектура включает в себя несколько ключевых функций для оптимизации производительности:
- Эффективный Reparameterization Backbone: Эта конструкция позволяет оптимизировать структуру сети после обучения, что значительно ускоряет скорость инференса.
- Гибридные блоки: В neck модели используется комбинация различных конструкций блоков для достижения эффективного баланса между возможностями извлечения признаков и вычислительной эффективностью.
- Оптимизированная стратегия обучения: Он использует такие методы, как самодистилляция во время обучения, чтобы улучшить сходимость и повысить общую производительность модели. Фреймворк также обеспечивает хорошую поддержку квантования моделей, что полезно для развертывания на оборудовании с ограниченными ресурсами.
Сильные стороны
- Высокая скорость инференса: YOLOv6-3.0 высоко оптимизирована для высокой производительности, что делает ее особенно подходящей для приложений реального времени.
- Хорошая точность: Он обеспечивает конкурентоспособную точность, особенно с его более крупными вариантами модели, обеспечивая надежный компромисс между скоростью и точностью для многих задач.
- Поддержка мобильных устройств и квантования: Включение вариантов YOLOv6Lite и специализированных инструментов квантования делает его жизнеспособным вариантом для развертывания на мобильных устройствах или устройствах на базе CPU.
Слабые стороны
- Ограниченная универсальность задач: YOLOv6-3.0 в основном ориентирован на обнаружение объектов. Ему не хватает встроенной многозадачной поддержки сегментации, классификации и оценки позы, которая есть в более универсальных фреймворках, таких как Ultralytics YOLOv8.
- Экосистема и обслуживание: Будучи проектом с открытым исходным кодом, его экосистема не так всеобъемлюща и активно поддерживается, как платформа Ultralytics. Это может привести к замедлению обновлений, уменьшению поддержки сообщества и большему трению при интеграции в полноценный конвейер MLOps.
- Превосходство новых моделей: Как показано в таблице производительности ниже, новые модели, такие как YOLOv10, предлагают лучший баланс точности и эффективности, часто достигая более высокого mAP с меньшим количеством параметров.
Идеальные варианты использования
Сочетание скорости и точности YOLOv6-3.0 делает его хорошо подходящим для конкретных промышленных и высокопроизводительных приложений:
- Промышленная автоматизация: Отлично подходит для автоматизированных систем контроля в производстве, где для контроля качества требуется быстрая обработка.
- Системы реального времени: Эффективны в приложениях со строгими требованиями к задержке, таких как робототехника и видеонаблюдение.
- Edge Computing: Его эффективная конструкция и мобильно-оптимизированные варианты позволяют развертывать его на устройствах с ограниченными ресурсами, таких как NVIDIA Jetson.
YOLOv10: Переосмысление сквозной эффективности
YOLOv10, представленная исследователями из Университета Цинхуа в мае 2024 года, представляет собой значительный скачок вперед в области обнаружения объектов в реальном времени. Она ориентирована на достижение истинной сквозной эффективности за счет устранения узких мест как в постобработке, так и в архитектуре модели, устанавливая новый современный уровень для границы производительности и эффективности.
- Авторы: Ao Wang, Hui Chen, Lihao Liu, и др.
- Организация: Tsinghua University
- Дата: 2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- Документация: https://docs.ultralytics.com/models/yolov10/
Архитектура и ключевые особенности
YOLOv10 представляет несколько новаторских инноваций для оптимизации всего конвейера обнаружения:
- Обучение без NMS: Наиболее важной особенностью является устранение Non-Maximum Suppression (NMS) во время вывода. Благодаря использованию согласованных двойных назначений для присвоения меток, YOLOv10 избегает этого этапа постобработки, что снижает задержку при выводе и упрощает развертывание.
- Комплексный подход к эффективности и точности: Архитектура модели была всесторонне оптимизирована. Это включает в себя облегченную классификационную голову для снижения вычислительных затрат и пространственно-канальную разделенную дискретизацию для сохранения более богатой информации с меньшими затратами.
- Превосходная эффективность параметров: Модели YOLOv10 разработаны компактными, обеспечивая высокую точность со значительно меньшим количеством параметров и FLOPs по сравнению с предыдущими моделями.
Сильные стороны
- Передовая эффективность: YOLOv10 обеспечивает исключительный компромисс между скоростью и точностью, превосходя многих конкурентов, обеспечивая более высокую точность с меньшими и более быстрыми моделями.
- Настоящее сквозное развертывание: Конструкция без NMS упрощает и ускоряет развертывание, что является большим преимуществом для приложений, критичных к задержкам.
- Бесшовная интеграция в экосистему Ultralytics: YOLOv10 полностью интегрирован в экосистему Ultralytics. Это обеспечивает пользователям удобство работы, включая простой Python API, мощные команды CLI, обширную документацию и доступ к Ultralytics HUB для легкого обучения и развертывания.
- Эффективное обучение: Преимущества готовых предварительно обученных весов и оптимизированного процесса обучения, что делает его более быстрым и эффективным с точки зрения ресурсов для тонкой настройки на пользовательских наборах данных.
Слабые стороны
- Более новая модель: Будучи совсем новой моделью, сообщество и инструменты сторонних разработчиков все еще растут по сравнению с давно зарекомендовавшими себя моделями, такими как YOLOv8.
- Специализация по задачам: Как и YOLOv6-3.0, YOLOv10 в основном ориентирован на обнаружение объектов. Для проектов, требующих многозадачности, такой как сегментация или оценка позы, из коробки, больше подойдет такая модель, как Ultralytics YOLO11.
Идеальные варианты использования
YOLOv10 исключительно хорошо подходит для приложений, где производительность в реальном времени и эффективность использования ресурсов являются главными приоритетами:
- Приложения Edge AI: Его малый размер и низкая задержка делают его идеальным для развертывания на устройствах с ограниченной вычислительной мощностью, таких как мобильные телефоны и встроенные системы.
- Высокоскоростная обработка: Идеально подходит для приложений, требующих очень низкой задержки, таких как автономные дроны и искусственный интеллект в автомобильной промышленности.
- Аналитика в реальном времени: Отлично подходит для динамичных сред, требующих немедленного обнаружения объектов, таких как управление дорожным движением и аналитика розничной торговли.
Анализ производительности: YOLOv6-3.0 против YOLOv10
Сравнение производительности YOLOv6-3.0 и YOLOv10 подчеркивает достижения YOLOv10 в эффективности и точности.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Из данных вытекает несколько ключевых выводов:
- Эффективность: Модели YOLOv10 последовательно демонстрируют превосходную эффективность параметров и вычислений. Например, YOLOv10-S достигает более высокого mAP, чем YOLOv6-3.0s (46.7% против 45.0%), с менее чем половиной параметров (7.2M против 18.5M) и FLOPs (21.6B против 45.3B).
- Точность: Для всех сопоставимых размеров моделей YOLOv10 достигает более высоких показателей mAP. Самая большая модель, YOLOv10-X, достигает впечатляющего показателя 54,4% mAP, превосходя YOLOv6-3.0l.
- Скорость: Хотя YOLOv6-3.0n имеет небольшое преимущество в необработанной задержке TensorRT, модели YOLOv10 остаются весьма конкурентоспособными и предлагают лучший общий компромисс, учитывая их превосходную точность и меньший размер. Отсутствие NMS в YOLOv10 дополнительно снижает сквозную задержку в реальных конвейерах.
Заключение: какую модель вам следует выбрать?
YOLOv6-3.0 и YOLOv10 — это эффективные модели обнаружения объектов, но они ориентированы на разные приоритеты.
YOLOv6-3.0 остается жизнеспособным выбором для устаревших промышленных проектов, где ее конкретные оптимизации скорости уже были интегрированы и проверены. Ее ориентация на скорость инференса сделала ее сильным претендентом на момент ее выпуска.
Однако, почти для всех новых проектов YOLOv10 является явным лидером и рекомендуемым выбором. Он предлагает превосходное сочетание точности, скорости и эффективности. Его инновационная архитектура без NMS упрощает развертывание и снижает задержку, что делает его идеальным для современных приложений реального времени. Самое главное, его полная интеграция в хорошо поддерживаемую и простую в использовании экосистему Ultralytics предоставляет значительное преимущество для разработчиков и исследователей, оптимизируя все, от обучения до производства.
Пользователям, заинтересованным в изучении других современных моделей, Ultralytics предлагает ряд вариантов, включая универсальную YOLOv8 и новейшую YOLO11, которые поддерживают различные задачи компьютерного зрения. Вам также могут быть полезны сравнения с другими моделями, такими как YOLOv7 и RT-DETR.