YOLOv10 против YOLO11: техническое сравнение для обнаружения объектов
Выбор оптимальной модели обнаружения объектов — это критически важное решение, которое балансирует точность, скорость и ограничения развертывания. На этой странице представлено подробное техническое сравнение между YOLOv10, моделью, ориентированной на сквозную эффективность, и Ultralytics YOLO11, новейшей современной моделью от Ultralytics, известной своей универсальностью, производительностью и простотой использования. Мы углубимся в их архитектурные различия, эталонные показатели производительности и идеальные приложения, чтобы помочь вам сделать осознанный выбор.
YOLOv10: Расширяя границы эффективности
Авторы: Ао Ванг, Хуэй Чен, Лихао Лю и др.
Организация: Университет Цинхуа
Дата: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Документация: https://docs.ultralytics.com/models/yolov10/
YOLOv10, представленная в мае 2024 года, — это модель обнаружения объектов, которая отдает приоритет производительности в реальном времени и сквозной производительности. Ее основное новшество — устранение Non-Maximum Suppression (NMS) во время постобработки, что традиционно увеличивает задержку инференса. Это достигается за счет новой стратегии обучения, называемой согласованными двойными назначениями.
Архитектура и ключевые особенности
В основе разработки YOLOv10 лежит целостный подход к эффективности и точности. В ней представлено несколько архитектурных оптимизаций для уменьшения вычислительной избыточности и улучшения возможностей модели. Ключевые особенности включают в себя облегченную классификационную голову и стратегию пространственно-канального разделения для более эффективного сохранения информации. Благодаря удалению этапа NMS, YOLOv10 стремится упростить конвейер развертывания и снизить задержку, что делает ее настоящим детектором end-to-end.
Сильные стороны
- Повышенная эффективность: Демонстрирует впечатляющую производительность в компромиссах между задержкой и точностью, а также размером и точностью, особенно в средах с ограниченными ресурсами.
- Дизайн без NMS: Устранение этапа постобработки NMS упрощает развертывание и сокращает сквозное время вывода.
- Передовые исследования: Представляет собой значительный академический вклад в обнаружение объектов в реальном времени за счет устранения узких мест постобработки.
Слабые стороны
- Более новая модель: Будучи недавним релизом от исследовательской группы университета, она имеет меньшее сообщество и меньше интеграций со сторонними разработчиками по сравнению с хорошо зарекомендовавшей себя экосистемой Ultralytics.
- Специализация по задачам: YOLOv10 в основном ориентирован на обнаружение объектов. Ему не хватает встроенной универсальности для других задач компьютерного зрения, таких как сегментация, классификация и оценка позы, которые являются родными для YOLO11.
- Интеграция в экосистему: Будучи построенной на базе фреймворка Ultralytics, она может потребовать дополнительных усилий для интеграции в комплексные рабочие процессы MLOps по сравнению с моделями, разработанными и поддерживаемыми непосредственно Ultralytics.
Идеальные варианты использования
YOLOv10 особенно хорошо подходит для приложений, где низкая задержка и вычислительная эффективность являются наивысшими приоритетами:
- Edge AI: Идеально подходит для развертывания на устройствах с ограниченной вычислительной мощностью, таких как мобильные телефоны и встроенные системы на NVIDIA Jetson или Raspberry Pi.
- Высокоскоростная обработка: Подходит для приложений, требующих очень быстрого вывода, таких как автономные дроны и робототехника.
- Аналитика в реальном времени: Идеально подходит для динамичных сред, требующих немедленного обнаружения объектов, таких как управление дорожным движением.
Ultralytics YOLO11: Передовой уровень универсальности и производительности
Авторы: Гленн Джокер, Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11 — это последняя эволюция в серии YOLO от Ultralytics, основанная на успехе очень популярных моделей, таких как YOLOv8. Он разработан для обеспечения современной точности и превосходного баланса производительности, и при этом невероятно прост в использовании и интеграции. YOLO11 — это не просто детектор объектов; это комплексная платформа AI для машинного зрения.
Архитектура и ключевые особенности
YOLO11 имеет высокооптимизированную архитектуру с расширенным извлечением признаков и оптимизированной структурой сети. Это приводит к более высокой точности, часто с уменьшенным количеством параметров по сравнению с его предшественниками. Ключевым преимуществом YOLO11 является его универсальность. Он изначально поддерживает широкий спектр задач, включая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Эта универсальность подкреплена хорошо поддерживаемой экосистемой. Ultralytics предоставляет оптимизированный пользовательский интерфейс с простым Python API и CLI, обширной документацией и полной интеграцией с такими инструментами, как Ultralytics HUB, для обучения и развертывания без кода. Модель выигрывает от эффективных процессов обучения, легкодоступных предварительно обученных весов, активной разработки и сильной поддержки сообщества. Кроме того, модели YOLO11 разработаны для эффективности, требуя меньше памяти во время обучения и логического вывода по сравнению со многими другими архитектурами, особенно моделями на основе трансформеров.
Сильные стороны
- Передовая производительность: Достигает первоклассных показателей mAP с превосходным балансом скорости и точности.
- Универсальность и многозадачность: Единый модельный фреймворк может обрабатывать обнаружение, сегментацию, классификацию, позу и OBB, обеспечивая непревзойденную гибкость для сложных проектов.
- Простота использования: Простой, интуитивно понятный API и исчерпывающая документация делают его доступным как для новичков, так и для экспертов.
- Надежная экосистема: Активная разработка, частые обновления, сильная поддержка сообщества и полная интеграция с инструментами MLOps, такими как Ultralytics HUB.
- Эффективность обучения и развертывания: Предлагает эффективные процессы обучения, сниженные требования к памяти и оптимизирован для широкого спектра оборудования, от периферийных устройств до облачных серверов.
Слабые стороны
- Как одностадийный детектор, он может столкнуться с проблемами при работе с очень маленькими объектами по сравнению с некоторыми специализированными двухстадийными детекторами.
- Более крупные модели, хотя и обладают высокой точностью, требуют значительных вычислительных ресурсов для обучения и развертывания.
Идеальные варианты использования
Сочетание высокой производительности, универсальности и простоты использования YOLO11 делает ее идеальным выбором для широкого спектра реальных приложений:
- Промышленная автоматизация: Для высокоточного контроля качества и мониторинга процессов в производстве.
- Здравоохранение: В анализе медицинских изображений для таких задач, как обнаружение опухолей или сегментация клеток.
- Безопасность и видеонаблюдение: Поддержка передовых систем безопасности с обнаружением и отслеживанием угроз в реальном времени.
- Аналитика розничной торговли: Улучшение управления запасами и анализ поведения клиентов.
- Многозадачные проекты: Идеально подходит для приложений, требующих одновременного обнаружения объектов, сегментации и оценки позы, таких как передовые системы помощи водителю.
Прямое сравнение производительности: YOLOv10 против YOLO11
При непосредственном сравнении моделей мы наблюдаем отчетливые компромиссы. Модели YOLOv10, особенно меньшие варианты, разработаны для экстремальной эффективности, часто имея меньше параметров и FLOPs. Это делает их сильными конкурентами для задач, критичных к задержке.
Однако, YOLO11 демонстрирует более надежный и сбалансированный профиль производительности. Он достигает несколько более высокого mAP для большинства размеров моделей и показывает значительно более высокую скорость инференса как на CPU, так и на GPU (T4 TensorRT). Этот превосходный баланс скорости и точности, в сочетании с его многозадачными возможностями и развитой экосистемой, делает YOLO11 более практичным и мощным выбором для большинства сценариев разработки и развертывания.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Заключение: какую модель вам следует выбрать?
И YOLO11, и YOLO10 — это мощные модели, расширяющие границы обнаружения объектов.
YOLOv10 — отличный выбор для исследователей и разработчиков, ориентированных на специализированные приложения, критичные к задержкам, где архитектура без NMS обеспечивает явное преимущество. Ее лаконичный дизайн делает ее идеальной для развертывания на устройствах edge с высокой степенью ограничений.
Однако, для подавляющего большинства разработчиков, исследователей и коммерческих приложений Ultralytics YOLO11 является рекомендуемым выбором. Его небольшое преимущество в точности и превосходная скорость логического вывода обеспечивают лучший общий баланс производительности. Что еще более важно, беспрецедентная универсальность YOLO11 в различных задачах компьютерного зрения в сочетании с простотой использования и надежной, хорошо поддерживаемой экосистемой Ultralytics значительно ускоряет разработку и упрощает развертывание. Активное сообщество, обширная документация и полная интеграция с такими инструментами, как Ultralytics HUB, делают YOLO11 не просто моделью, а комплексным решением для создания передовых приложений искусственного интеллекта для зрения.
Если вы изучаете другие модели, рассмотрите возможность сравнения YOLOv9 vs YOLO11 или YOLOv8 vs YOLO11, чтобы понять эволюцию и найти идеальный вариант для вашего проекта.