Перейти к содержанию

YOLO11 vs YOLOv7: Подробное техническое сравнение

Выбор оптимальной модели обнаружения объектов требует понимания конкретных возможностей и компромиссов различных архитектур. На этой странице представлено техническое сравнение между Ultralytics YOLO11 и YOLOv7, двумя мощными моделями в линейке YOLO. Мы углубимся в их архитектурные различия, эталонные показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать наиболее подходящий вариант для ваших проектов в области компьютерного зрения. В то время как YOLOv7 была значительным шагом вперед в обнаружении в реальном времени, Ultralytics YOLO11 представляет собой современное состояние техники, предлагая превосходную производительность, большую универсальность и более оптимизированный опыт для разработчиков.

YOLOv7: Эффективное и точное обнаружение объектов

YOLOv7 был представлен как крупный шаг вперед в обнаружении объектов в реальном времени, с акцентом на оптимизацию эффективности и точности обучения без увеличения затрат на вывод.

Архитектура и ключевые особенности

YOLOv7 развивает предыдущие архитектуры YOLO, внедряя несколько ключевых инноваций. В нем используются такие методы, как Extended Efficient Layer Aggregation Networks (E-ELAN) и методы масштабирования моделей, оптимизированные для моделей на основе конкатенации. Важным вкладом является концепция "trainable bag-of-freebies", которая включает в себя стратегии оптимизации, применяемые во время обучения (например, вспомогательные заголовки и руководство от грубого к точному), для повышения точности конечной модели без добавления вычислительных затрат во время вывода. YOLOv7 в основном фокусируется на обнаружении объектов, но имеет расширения сообщества для таких задач, как оценка позы.

Показатели производительности и варианты использования

После выпуска YOLOv7 продемонстрировала современную производительность, предлагая убедительный баланс между скоростью и точностью. Например, модель YOLOv7x достигает 53,1% mAPtest на наборе данных MS COCO при размере изображения 640. Ее эффективность делает ее подходящей для приложений реального времени, таких как передовые системы безопасности и автономные системы, требующие быстрого и точного обнаружения.

Сильные стороны

  • Баланс высокой точности и скорости: Предлагает сильное сочетание mAP и скорости инференса для задач реального времени.
  • Эффективное обучение: Использует передовые методы обучения ("bag-of-freebies") для повышения точности без увеличения стоимости инференса.
  • Подтвержденная производительность: Проверенные результаты на стандартных бенчмарках, таких как MS COCO.

Слабые стороны

  • Сложность: Архитектура и методы обучения могут быть сложными для полного понимания и оптимизации.
  • Требовательность к ресурсам: Более крупные модели YOLOv7 требуют значительных GPU-ресурсов для обучения.
  • Ограниченная универсальность задач: В основном ориентирован на обнаружение объектов, требуя отдельных реализаций для других задач, таких как сегментация или классификация, по сравнению с интегрированными моделями, такими как YOLO11.
  • Фрагментированная экосистема: Отсутствует единый фреймворк, обширная документация и активная поддержка, которые есть в экосистеме Ultralytics.

Узнайте больше о YOLOv7

Ultralytics YOLO11: Современная эффективность и универсальность

Ultralytics YOLO11, разработанная Гленном Джохером и Цзин Цю из Ultralytics, представляет собой последнюю эволюцию в серии YOLO. Выпущенная 27 сентября 2024 года, она разработана для обеспечения превосходной точности, повышенной эффективности и большей универсальности задач в удобной для пользователя среде.

Архитектура и ключевые особенности

В архитектуре YOLO11 используются передовые методы извлечения признаков и оптимизированная структура сети, что приводит к более высокой точности, часто при меньшем количестве параметров по сравнению с предшественниками, такими как YOLOv8 и YOLOv7. Эта оптимизация приводит к более высокой скорости инференса и снижению вычислительных требований, что имеет решающее значение для развертывания на различных платформах, от периферийных устройств до облачной инфраструктуры.

Ключевым преимуществом YOLO11 является его универсальность. Это многозадачная модель, которая изначально поддерживает обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие прямоугольники (OBB). Она легко интегрируется в экосистему Ultralytics, предлагая оптимизированный пользовательский опыт через простые интерфейсы Python и CLI, обширную документацию и легкодоступные предварительно обученные веса для эффективного обучения.

Сильные стороны

  • Передовая производительность: Достигает более высоких показателей mAP с более эффективной архитектурой.
  • Превосходная эффективность: Отличная скорость как на CPU, так и на GPU, со значительно меньшим количеством параметров и FLOPs, чем у YOLOv7, при сопоставимой точности.
  • Беспрецедентная универсальность: Нативно поддерживает обнаружение, сегментацию, классификацию, определение позы и OBB в едином унифицированном фреймворке.
  • Простота использования: Имеет простой API, исчерпывающую документацию и простую интеграцию с такими инструментами, как Ultralytics HUB, для обучения и развертывания без кода.
  • Хорошо поддерживаемая экосистема: Преимущества активной разработки, сильного сообщества, частых обновлений и большого количества ресурсов.
  • Эффективность памяти: Разработан для снижения использования памяти во время обучения и инференса, что делает его более доступным, чем другие архитектуры.

Слабые стороны

  • Как более новая модель, некоторые нишевые интеграции со сторонними инструментами все еще могут находиться в разработке по сравнению со старыми, более устоявшимися моделями.
  • Самые крупные модели, несмотря на высокую точность, все же могут требовать значительных вычислительных ресурсов для обучения и развертывания.

Узнайте больше о YOLO11

Прямое сравнение производительности: YOLO11 против YOLOv7

При непосредственном сравнении показателей производительности становятся очевидными преимущества Ultralytics YOLO11. Модели обеспечивают лучший компромисс между точностью и эффективностью по всем параметрам.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Из таблицы вытекает несколько ключевых выводов:

  • Точность и эффективность: YOLO11l достигает более высокого mAP (53,4), чем YOLOv7x (53,1), при этом используя значительно меньше параметров (25,3M против 71,3M) и FLOPs (86,9B против 189,9B).
  • Скорость инференса: Модели YOLO11 значительно быстрее, особенно на GPU с TensorRT. YOLO11l почти в два раза быстрее, чем YOLOv7x на T4 GPU. Кроме того, YOLO11 обеспечивает надежные тесты производительности CPU через ONNX, что является критически важным показателем для многих реальных развертываний, где данные YOLOv7 недоступны.
  • Масштабируемость: Семейство YOLO11 предлагает более широкий и эффективный диапазон моделей, от легкой YOLO11n (задержка 1,5 мс) до высокоточной YOLO11x (54,7 mAP), что позволяет разработчикам найти идеальный баланс для своих конкретных потребностей.

Почему стоит выбрать Ultralytics YOLO11?

Несмотря на то, что YOLOv7 была мощной моделью для своего времени, Ultralytics YOLO11 является очевидным выбором для современных проектов компьютерного зрения. Она не только превосходит YOLOv7 по основным показателям, таким как точность и скорость, но и предлагает значительно улучшенный пользовательский интерфейс и более полный набор функций.

Ключевые преимущества выбора YOLO11 включают:

  • Унифицированный фреймворк: Единый, простой в использовании пакет для различных задач компьютерного зрения, избавляющий от необходимости использовать разные репозитории и среды.
  • Активная разработка и поддержка: Как часть активно поддерживаемой экосистемы Ultralytics, YOLO11 получает непрерывные обновления, исправления ошибок и поддержку от большого сообщества и основной команды разработчиков.
  • Готов к производству: Благодаря своей ориентации на эффективность, простоту развертывания и надежные инструменты, YOLO11 создан для реальных приложений, от создания прототипов до крупномасштабного производства.
  • Ориентация на будущее: Принимая YOLO11, разработчики ориентируются на передовые исследования в области обнаружения объектов и получают выгоду от постоянных инноваций от Ultralytics.

Для разработчиков, ищущих современную, универсальную и высокопроизводительную модель, поддерживаемую надежной экосистемой, Ultralytics YOLO11 является окончательным выбором.

Сравнения с другими моделями

Для дальнейшего изучения рассмотрите эти сравнения с участием YOLOv7, YOLO11 и других соответствующих моделей:



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии