Перейти к содержанию

YOLOv10 против YOLO11: техническое сравнение для обнаружения объектов

Выбор оптимальной модели обнаружения объектов — это критически важное решение, которое балансирует точность, скорость и ограничения развертывания. На этой странице представлено подробное техническое сравнение между YOLOv10, моделью, ориентированной на сквозную эффективность, и Ultralytics YOLO11, новейшей современной моделью от Ultralytics, известной своей универсальностью, производительностью и простотой использования. Мы углубимся в их архитектурные различия, эталонные показатели производительности и идеальные приложения, чтобы помочь вам сделать осознанный выбор.

YOLOv10: Расширяя границы эффективности

Авторы: Ао Ванг, Хуэй Чен, Лихао Лю и др.
Организация: Университет Цинхуа
Дата: 2024-05-23
Arxiv: https://arxiv.org/abs/2405.14458
GitHub: https://github.com/THU-MIG/yolov10
Документация: https://docs.ultralytics.com/models/yolov10/

YOLOv10, представленная в мае 2024 года, — это модель обнаружения объектов, которая отдает приоритет производительности в реальном времени и сквозной производительности. Ее основное новшество — устранение Non-Maximum Suppression (NMS) во время постобработки, что традиционно увеличивает задержку инференса. Это достигается за счет новой стратегии обучения, называемой согласованными двойными назначениями.

Архитектура и ключевые особенности

В основе разработки YOLOv10 лежит целостный подход к эффективности и точности. В ней представлено несколько архитектурных оптимизаций для уменьшения вычислительной избыточности и улучшения возможностей модели. Ключевые особенности включают в себя облегченную классификационную голову и стратегию пространственно-канального разделения для более эффективного сохранения информации. Благодаря удалению этапа NMS, YOLOv10 стремится упростить конвейер развертывания и снизить задержку, что делает ее настоящим детектором end-to-end.

Сильные стороны

  • Повышенная эффективность: Демонстрирует впечатляющую производительность в компромиссах между задержкой и точностью, а также размером и точностью, особенно в средах с ограниченными ресурсами.
  • Дизайн без NMS: Устранение этапа постобработки NMS упрощает развертывание и сокращает сквозное время вывода.
  • Передовые исследования: Представляет собой значительный академический вклад в обнаружение объектов в реальном времени за счет устранения узких мест постобработки.

Слабые стороны

  • Более новая модель: Будучи недавним релизом от исследовательской группы университета, она имеет меньшее сообщество и меньше интеграций со сторонними разработчиками по сравнению с хорошо зарекомендовавшей себя экосистемой Ultralytics.
  • Специализация по задачам: YOLOv10 в основном ориентирован на обнаружение объектов. Ему не хватает встроенной универсальности для других задач компьютерного зрения, таких как сегментация, классификация и оценка позы, которые являются родными для YOLO11.
  • Интеграция в экосистему: Будучи построенной на базе фреймворка Ultralytics, она может потребовать дополнительных усилий для интеграции в комплексные рабочие процессы MLOps по сравнению с моделями, разработанными и поддерживаемыми непосредственно Ultralytics.

Идеальные варианты использования

YOLOv10 особенно хорошо подходит для приложений, где низкая задержка и вычислительная эффективность являются наивысшими приоритетами:

  • Edge AI: Идеально подходит для развертывания на устройствах с ограниченной вычислительной мощностью, таких как мобильные телефоны и встроенные системы на NVIDIA Jetson или Raspberry Pi.
  • Высокоскоростная обработка: Подходит для приложений, требующих очень быстрого вывода, таких как автономные дроны и робототехника.
  • Аналитика в реальном времени: Идеально подходит для динамичных сред, требующих немедленного обнаружения объектов, таких как управление дорожным движением.

Узнайте больше о YOLOv10

Ultralytics YOLO11: Передовой уровень универсальности и производительности

Авторы: Гленн Джокер, Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 — это последняя эволюция в серии YOLO от Ultralytics, основанная на успехе очень популярных моделей, таких как YOLOv8. Он разработан для обеспечения современной точности и превосходного баланса производительности, и при этом невероятно прост в использовании и интеграции. YOLO11 — это не просто детектор объектов; это комплексная платформа AI для машинного зрения.

Архитектура и ключевые особенности

YOLO11 имеет высокооптимизированную архитектуру с расширенным извлечением признаков и оптимизированной структурой сети. Это приводит к более высокой точности, часто с уменьшенным количеством параметров по сравнению с его предшественниками. Ключевым преимуществом YOLO11 является его универсальность. Он изначально поддерживает широкий спектр задач, включая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).

Эта универсальность подкреплена хорошо поддерживаемой экосистемой. Ultralytics предоставляет оптимизированный пользовательский интерфейс с простым Python API и CLI, обширной документацией и полной интеграцией с такими инструментами, как Ultralytics HUB, для обучения и развертывания без кода. Модель выигрывает от эффективных процессов обучения, легкодоступных предварительно обученных весов, активной разработки и сильной поддержки сообщества. Кроме того, модели YOLO11 разработаны для эффективности, требуя меньше памяти во время обучения и логического вывода по сравнению со многими другими архитектурами, особенно моделями на основе трансформеров.

Сильные стороны

  • Передовая производительность: Достигает первоклассных показателей mAP с превосходным балансом скорости и точности.
  • Универсальность и многозадачность: Единый модельный фреймворк может обрабатывать обнаружение, сегментацию, классификацию, позу и OBB, обеспечивая непревзойденную гибкость для сложных проектов.
  • Простота использования: Простой, интуитивно понятный API и исчерпывающая документация делают его доступным как для новичков, так и для экспертов.
  • Надежная экосистема: Активная разработка, частые обновления, сильная поддержка сообщества и полная интеграция с инструментами MLOps, такими как Ultralytics HUB.
  • Эффективность обучения и развертывания: Предлагает эффективные процессы обучения, сниженные требования к памяти и оптимизирован для широкого спектра оборудования, от периферийных устройств до облачных серверов.

Слабые стороны

  • Как одностадийный детектор, он может столкнуться с проблемами при работе с очень маленькими объектами по сравнению с некоторыми специализированными двухстадийными детекторами.
  • Более крупные модели, хотя и обладают высокой точностью, требуют значительных вычислительных ресурсов для обучения и развертывания.

Идеальные варианты использования

Сочетание высокой производительности, универсальности и простоты использования YOLO11 делает ее идеальным выбором для широкого спектра реальных приложений:

  • Промышленная автоматизация: Для высокоточного контроля качества и мониторинга процессов в производстве.
  • Здравоохранение: В анализе медицинских изображений для таких задач, как обнаружение опухолей или сегментация клеток.
  • Безопасность и видеонаблюдение: Поддержка передовых систем безопасности с обнаружением и отслеживанием угроз в реальном времени.
  • Аналитика розничной торговли: Улучшение управления запасами и анализ поведения клиентов.
  • Многозадачные проекты: Идеально подходит для приложений, требующих одновременного обнаружения объектов, сегментации и оценки позы, таких как передовые системы помощи водителю.

Узнайте больше о YOLO11

Прямое сравнение производительности: YOLOv10 против YOLO11

При непосредственном сравнении моделей мы наблюдаем отчетливые компромиссы. Модели YOLOv10, особенно меньшие варианты, разработаны для экстремальной эффективности, часто имея меньше параметров и FLOPs. Это делает их сильными конкурентами для задач, критичных к задержке.

Однако, YOLO11 демонстрирует более надежный и сбалансированный профиль производительности. Он достигает несколько более высокого mAP для большинства размеров моделей и показывает значительно более высокую скорость инференса как на CPU, так и на GPU (T4 TensorRT). Этот превосходный баланс скорости и точности, в сочетании с его многозадачными возможностями и развитой экосистемой, делает YOLO11 более практичным и мощным выбором для большинства сценариев разработки и развертывания.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Заключение: какую модель вам следует выбрать?

И YOLO11, и YOLO10 — это мощные модели, расширяющие границы обнаружения объектов.

YOLOv10 — отличный выбор для исследователей и разработчиков, ориентированных на специализированные приложения, критичные к задержкам, где архитектура без NMS обеспечивает явное преимущество. Ее лаконичный дизайн делает ее идеальной для развертывания на устройствах edge с высокой степенью ограничений.

Однако, для подавляющего большинства разработчиков, исследователей и коммерческих приложений Ultralytics YOLO11 является рекомендуемым выбором. Его небольшое преимущество в точности и превосходная скорость логического вывода обеспечивают лучший общий баланс производительности. Что еще более важно, беспрецедентная универсальность YOLO11 в различных задачах компьютерного зрения в сочетании с простотой использования и надежной, хорошо поддерживаемой экосистемой Ultralytics значительно ускоряет разработку и упрощает развертывание. Активное сообщество, обширная документация и полная интеграция с такими инструментами, как Ultralytics HUB, делают YOLO11 не просто моделью, а комплексным решением для создания передовых приложений искусственного интеллекта для зрения.

Если вы изучаете другие модели, рассмотрите возможность сравнения YOLOv9 vs YOLO11 или YOLOv8 vs YOLO11, чтобы понять эволюцию и найти идеальный вариант для вашего проекта.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии