Перейти к содержанию

YOLO11 vs YOLOv10: Подробное техническое сравнение

Выбор идеальной модели обнаружения объектов — это критически важное решение, которое балансирует требования к точности, скорости и ограничениям развертывания. На этой странице представлено подробное техническое сравнение между Ultralytics YOLO11 и YOLOv10, двумя мощными моделями, находящимися в авангарде компьютерного зрения. В то время как YOLOv10 представила заметные улучшения в эффективности, Ultralytics YOLO11 представляет собой вершину архитектуры YOLO, предлагая превосходную производительность, непревзойденную универсальность и значительное преимущество зрелой, хорошо поддерживаемой экосистемы.

Ultralytics YOLO11: Новейший уровень техники

Ultralytics YOLO11 — это новейшая и самая продвинутая модель в серии Ultralytics YOLO, устанавливающая новый стандарт для обнаружения объектов в реальном времени и не только. Разработанный создателями очень успешных моделей YOLOv5 и YOLOv8, YOLO11 разработан для обеспечения максимальной точности, скорости и универсальности.

Архитектура и ключевые особенности

YOLO11 опирается на проверенную архитектурную основу, включая усовершенствованные сети извлечения признаков и оптимизированную головку обнаружения для обеспечения современной точности. Ключевым преимуществом YOLO11 является его невероятная универсальность. В отличие от специализированных моделей, это многозадачная электростанция, изначально поддерживающая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой унифицированной структуры.

Эта универсальность подкреплена надежной экосистемой Ultralytics, в которой приоритет отдается простоте использования и продуктивности разработчиков. Благодаря простому Python API и CLI, обширной документации и полной интеграции с такими инструментами, как Ultralytics HUB, разработчики могут перейти от концепции к развертыванию быстрее, чем когда-либо. Модели выигрывают от эффективных процессов обучения, легкодоступных предварительно обученных весов и меньших требований к памяти по сравнению с более сложными архитектурами, такими как Transformers.

Сильные стороны

  • Превосходный баланс производительности: Достигает исключительного компромисса между скоростью и точностью, превосходя другие модели на различных аппаратных платформах.
  • Беспрецедентная универсальность: Одно семейство моделей обрабатывает пять ключевых задач AI в области зрения, упрощая разработку сложных приложений.
  • Развитая экосистема: Поддерживается активной разработкой, огромным сообществом, частыми обновлениями и всесторонними ресурсами, что обеспечивает надежность и поддержку.
  • Простота использования: Разработан для оптимизированного пользовательского опыта, позволяющего как новичкам, так и экспертам обучать и развертывать модели с минимальными трудностями.
  • Эффективность обучения и развертывания: Оптимизирован для более быстрого обучения и снижения использования памяти, что делает его подходящим для широкого спектра оборудования, от периферийных устройств до облачных серверов.

Слабые стороны

  • Будучи современной моделью, самые крупные варианты YOLO11 требуют значительных вычислительных ресурсов для достижения максимальной точности, хотя они остаются весьма эффективными для своего класса производительности.

Идеальные варианты использования

Сочетание высокой производительности и универсальности YOLO11 делает ее идеальным выбором для широкого спектра требовательных приложений:

Узнайте больше о YOLO11

YOLOv10: Расширение границ эффективности

YOLOv10, представленная исследователями из Университета Цинхуа, — это модель обнаружения объектов, которая фокусируется на оптимизации сквозной задержки за счет устранения необходимости в Non-Maximum Suppression (NMS) во время постобработки.

Архитектура и ключевые особенности

Основным нововведением YOLOv10 является стратегия обучения без NMS, которая использует согласованные двойные назначения для обработки избыточных прогнозов во время обучения. Это позволяет развертывать модель без этапа NMS, что снижает накладные расходы на постобработку и улучшает задержку вывода. Архитектура также отличается целостным подходом к эффективности и точности, с такими оптимизациями, как облегченная головная часть классификации для снижения вычислительной нагрузки.

Сильные стороны

  • Развертывание без NMS: Устраняет ключевое узкое место постобработки, что полезно для приложений, критичных к задержке.
  • Высокая эффективность: Демонстрирует отличную производительность с точки зрения FLOPs и количества параметров, что делает его подходящим для сред с ограниченными ресурсами.
  • Оптимальное соотношение задержки и точности: Достигает конкурентоспособной точности с очень низким временем инференса на GPU.

Слабые стороны

  • Ограниченная универсальность: YOLOv10 в основном предназначен для обнаружения объектов и не имеет встроенных возможностей многозадачности для сегментации, оценки позы и классификации, которые являются стандартными в YOLO11.
  • Экосистема и поддержка: Как модель, ориентированная на исследования из академического учреждения, она не имеет такого же уровня непрерывного обслуживания, поддержки сообщества или интегрированных инструментов, как модели в экосистеме Ultralytics.
  • Удобство использования: Интеграция YOLOv10 в производственный конвейер может потребовать больше ручных усилий по сравнению с упрощенным опытом, предлагаемым Ultralytics.

Идеальные варианты использования

YOLOv10 лучше всего подходит для специализированных приложений, где сквозная задержка обнаружения объектов является единственным наиболее важным фактором:

  • Edge AI: Развертывание на устройствах с ограниченной вычислительной мощностью, где важна каждая миллисекунда.
  • Высокопроизводительные системы: Приложения, такие как видеоаналитика в реальном времени, которые требуют обработки большого количества кадров в секунду.
  • Автономные дроны: Обеспечение быстрого обнаружения объектов для навигации и предотвращения столкновений.

Узнайте больше о YOLOv10

Противостояние производительности: YOLO11 против YOLOv10

При сравнении производительности становится ясно, что обе модели обладают большими возможностями, но YOLO11 демонстрирует превосходный общий баланс. Как показано в таблице ниже, модели YOLO11 стабильно достигают более высокой скорости инференса как на CPU, так и на GPU для заданного уровня точности. Например, YOLO11l достигает более высокого mAP, чем YOLOv10l, при этом значительно быстрее на T4 GPU. Кроме того, YOLO11x достигает более высокого mAP, чем YOLOv10x, с более высокой скоростью инференса.

Несмотря на то, что YOLOv10 демонстрирует впечатляющую эффективность параметров, архитектурные оптимизации YOLO11 обеспечивают лучшую производительность в реальных условиях, особенно если учитывать его многозадачность и простоту развертывания.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4

Заключение: какую модель вам следует выбрать?

Для подавляющего большинства разработчиков, исследователей и предприятий Ultralytics YOLO11 является рекомендуемым выбором. Он обеспечивает современную точность и скорость в сочетании с беспрецедентной универсальностью для решения множества задач компьютерного зрения. Ключевое преимущество заключается в его надежной, хорошо поддерживаемой экосистеме, которая обеспечивает простоту использования, эффективное обучение и плавный переход к производству. Такой целостный подход делает YOLO11 не просто мощной моделью, а комплексным решением для создания передовых систем искусственного интеллекта.

YOLOv10 — это похвальная модель с инновационной конструкцией без NMS, что делает ее отличным вариантом для узкоспециализированных задач обнаружения объектов, чувствительных к задержкам. Однако его узкая направленность и отсутствие всесторонней экосистемы поддержки делают его менее подходящим для общего использования или для проектов, которые могут развиваться и требовать дополнительных возможностей компьютерного зрения.

Если вам интересно изучить другие современные модели, вы можете найти больше сравнений в нашей документации, например, YOLO11 vs. YOLOv9 и YOLOv8 vs. YOLOv10.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии