Перейти к содержанию

YOLOv9 против YOLO11: техническое сравнение

Область обнаружения объектов в реальном времени постоянно развивается, и новые модели расширяют границы возможного. На этой странице представлено подробное техническое сравнение двух мощных претендентов: YOLOv9, модели, известной своими архитектурными инновациями, и Ultralytics YOLO11, новейшей современной модели от Ultralytics. Мы проанализируем их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать оптимальную модель для ваших проектов компьютерного зрения.

YOLOv9: Повышение точности с помощью новой архитектуры

YOLOv9 был представлен как значительный шаг вперед в обнаружении объектов, в первую очередь направленный на решение проблемы потери информации в глубоких нейронных сетях. Его новые архитектурные компоненты направлены на достижение более высокой точности за счет сохранения большего количества данных во всей модели.

Технические детали:

Архитектура и ключевые особенности

Основными инновациями YOLOv9 являются Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN). PGI предназначен для предоставления полной входной информации функции потерь, смягчая проблему информационного узкого места, которая может ухудшить производительность в очень глубоких сетях. GELAN — это легкая, эффективная сетевая архитектура, которая оптимизирует использование параметров и вычислительную эффективность. Вместе эти функции позволяют YOLOv9 устанавливать высокие стандарты точности на наборах данных, таких как COCO.

Сильные стороны

  • Высокая точность: Достигает самых современных результатов на наборе данных COCO, при этом его самый большой вариант, YOLOv9-E, достигает высокой mAP.
  • Сохранение информации: PGI эффективно решает проблему информационного узкого места, что имеет решающее значение для обучения глубоких и сложных моделей.
  • Эффективный дизайн: Архитектура GELAN обеспечивает высокое соотношение точности к параметрам.

Слабые стороны

  • Универсальность задач: Оригинальное исследование YOLOv9 в основном ориентировано на обнаружение объектов. Ему не хватает встроенной унифицированной поддержки для других задач, таких как сегментация экземпляров, оценка позы и классификация, которые являются стандартными в моделях Ultralytics.
  • Экосистема и удобство использования: Как модель от отдельной исследовательской группы, ее экосистема менее развита. Интеграция в производственные процессы может быть более сложной, и ей не хватает упрощенного пользовательского опыта, обширной документации и активной поддержки сообщества, предоставляемой Ultralytics.
  • Ресурсы для обучения: Как отмечено в документации, обучение YOLOv9 может потребовать больше ресурсов и времени по сравнению с высокооптимизированными моделями, такими как модели от Ultralytics.

Узнайте больше о YOLOv9

Ultralytics YOLO11: Вершина производительности и удобства использования

Ultralytics YOLO11 — это последняя флагманская модель от Ultralytics, разработанная для обеспечения исключительного баланса скорости, точности и универсальности. Основываясь на успехе предшественников, таких как YOLOv8, YOLO11 предназначен для широкого спектра реальных приложений и оптимизирован для простоты использования и развертывания на различных аппаратных платформах.

Технические детали:

Архитектура и ключевые особенности

YOLO11 уточняет проверенную архитектуру предыдущих моделей Ultralytics, включая расширенное извлечение признаков и оптимизированную структуру сети. Это приводит к более высокой точности с меньшим количеством параметров и вычислительных требований. Ключевое преимущество YOLO11 заключается не только в его производительности, но и в его интеграции в комплексную экосистему Ultralytics. Это обеспечивает несколько ключевых преимуществ:

  • Простота использования: Простой и интуитивно понятный Python API и CLI упрощают обучение, проверку и развертывание моделей как для новичков, так и для экспертов.
  • Хорошо поддерживаемая экосистема: YOLO11 поддерживается активной разработкой, частыми обновлениями и мощной поддержкой сообщества. Он легко интегрируется с такими инструментами, как Ultralytics HUB, для обучения и MLOps без кода.
  • Универсальность: YOLO11 — это многозадачная модель, поддерживающая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой унифицированной структуры.
  • Эффективность обучения и памяти: YOLO11 высоко оптимизирован для эффективного обучения, с легкодоступными предварительно обученными весами. Обычно он требует меньше памяти для обучения и инференса по сравнению с другими типами моделей, особенно большими моделями на основе трансформеров.

Сильные стороны

  • Превосходный баланс производительности: Предлагает превосходный компромисс между скоростью и точностью, что делает его идеальным для инференса в реальном времени.
  • Поддержка нескольких задач: Одна модель может обрабатывать широкий спектр задач компьютерного зрения, повышая ее полезность и снижая сложность разработки.
  • Оптимизация оборудования: Оптимизирован для развертывания на различном оборудовании, от периферийных устройств до облачных серверов, с отличной производительностью как на CPU, так и на GPU.
  • Надежность и зрелость: Результат многолетних исследований и разработок, обеспечивающий стабильность и надежность для производственных сред.

Слабые стороны

  • Как одностадийный детектор, он может столкнуться с проблемами при работе с очень маленькими или переполненными объектами по сравнению с некоторыми специализированными двухстадийными детекторами.
  • Самые крупные модели YOLO11, несмотря на свою эффективность, все же требуют значительной вычислительной мощности для достижения максимальной производительности.

Узнайте больше о YOLO11

Прямое сравнение производительности: YOLOv9 против YOLO11

При сравнении производительности становится ясно, что обе модели обладают большими возможностями. YOLOv9-E достигает самого высокого mAP на наборе данных COCO, но это достигается за счет более высокой задержки. В отличие от этого, семейство Ultralytics YOLO11 предоставляет более сбалансированный и практичный набор опций. Например, YOLO11l достигает сопоставимого mAP с YOLOv9c, но с более высокой скоростью инференса на GPU. Кроме того, небольшие модели, такие как YOLO11n и YOLO11s, обеспечивают исключительную производительность в реальном времени, что делает их гораздо более подходящими для приложений с ограниченными ресурсами.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv9t 640 38.3 - 2.3 2.0 7.7
YOLOv9s 640 46.8 - 3.54 7.1 26.4
YOLOv9m 640 51.4 - 6.43 20.0 76.3
YOLOv9c 640 53.0 - 7.16 25.3 102.1
YOLOv9e 640 55.6 - 16.77 57.3 189.0
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Идеальные варианты использования

YOLOv9

YOLOv9 лучше всего подходит для исследовательских проектов или приложений, где достижение абсолютно максимальной точности обнаружения является основной целью, а такие факторы, как простота использования, многозадачность и время обучения, являются второстепенными.

Ultralytics YOLO11

YOLO11 — идеальный выбор для подавляющего большинства реальных приложений, от быстрого прототипирования до крупномасштабного развертывания в производство. Сочетание производительности, универсальности и простоты использования делает его превосходным универсальным решением.

Несмотря на то, что YOLOv9 является похвальной моделью, которая вводит важные академические концепции, Ultralytics YOLO11 выделяется как более практичный, мощный и универсальный выбор для разработчиков и исследователей.

Сосредоточенность YOLOv9 на чистой точности впечатляет, но YOLO11 обеспечивает высокую конкурентоспособность, предлагая при этом значительно превосходящий пользовательский опыт, многозадачные возможности и надежную, хорошо поддерживаемую экосистему. Для проектов, которым необходимо эффективно перейти от концепции к производству, оптимизированный рабочий процесс, обширная документация и активное сообщество YOLO11 обеспечивают беспрецедентное преимущество. Его сбалансированный подход к скорости и точности гарантирует, что вы сможете найти идеальную модель для любого приложения, от легких периферийных устройств до мощных облачных серверов.

По этим причинам Ultralytics YOLO11 является определяющим выбором для создания следующего поколения решений в области компьютерного зрения на основе искусственного интеллекта.

Изучите другие модели

Если вам интересно, как YOLO11 и YOLOv9 соотносятся с другими моделями в экосистеме, обязательно ознакомьтесь с другими страницами сравнения. Такие модели, как YOLOv10 и RT-DETR, предлагают различные компромиссы в производительности и архитектуре, которые могут быть важны для ваших конкретных потребностей. Ознакомьтесь с нашей главной страницей сравнения моделей для получения полного обзора.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии