Перейти к содержанию

YOLO11 против YOLOv7: подробное техническое сравнение для обнаружения объектов

Выбор правильной модели обнаружения объектов имеет решающее значение для достижения оптимальной производительности в задачах компьютерного зрения. На этой странице представлено подробное техническое сравнение Ultralytics YOLO11 и YOLOv7, двух передовых моделей, предназначенных для эффективного и точного обнаружения объектов. Мы рассмотрим их архитектурные нюансы, эталоны производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение.

Ultralytics YOLO11

Ultralytics YOLO11, авторами которого являются Гленн Джочер и Цзин Цю из Ultralytics и который был выпущен 2024-09-27, является последней разработкой в серии YOLO . Она направлена на повышение точности и эффективности обнаружения объектов, что делает ее универсальной для широкого спектра реальных приложений. Ultralytics YOLO11 основан на предыдущих моделях YOLO , в нем усовершенствована структура сети, что позволяет достичь самой высокой точности обнаружения при сохранении производительности в режиме реального времени.

Архитектура и ключевые особенности:

Архитектура YOLO11 включает в себя передовые методы извлечения признаков, что позволяет добиться более высокой точности при меньшем количестве параметров по сравнению с моделями типа YOLOv8. Такая оптимизация позволяет повысить скорость работы механизма вывода и снизить требования к вычислительным ресурсам, что делает его пригодным для развертывания на различных платформах, от периферийных устройств до облачной инфраструктуры. YOLO11 поддерживает множество задач компьютерного зрения, включая обнаружение объектов, сегментацию объектов, классификацию изображений и оценку позы. Модель доступна на GitHub.

Метрики и контрольные показатели эффективности:

YOLO11 демонстрирует впечатляющие показатели средней точности (mAP) при различных размерах модели. Например, модель YOLO11m достигает показателя mAPval50-95 51,5 при размере изображения 640, обеспечивая эффективный баланс между скоростью и точностью. Меньшие варианты, такие как YOLO11n и YOLO11s, обеспечивают более быстрый вывод в реальном времени для приложений, которым важна скорость, в то время как большие модели, такие как YOLO11x, обеспечивают максимальную точность. Подробные показатели производительностиYOLO приведены в документации Ultralytics .

Примеры использования:

Повышенная точность и эффективность YOLO11 делают его идеальным для приложений, требующих точного обнаружения объектов в реальном времени, таких как:

  • Робототехника: Для точной навигации и взаимодействия с объектами в динамических средах.
  • Системы безопасности: Передовые системы охранной сигнализации для точного обнаружения вторжения и комплексного мониторинга.
  • Аналитика розничной торговли: ИИ в розничной торговле для улучшения управления запасами и углубленного анализа поведения покупателей.
  • Промышленная автоматизация: Для строгого контроля качества и эффективного обнаружения дефектов в производственных процессах.

Сильные стороны:

  • Высокая точность: Достижение передовых показателей МПД с помощью усовершенствованной архитектуры.
  • Эффективный вывод: Быстрая обработка, подходящая для приложений реального времени.
  • Универсальные задачи: Поддерживает обнаружение объектов, сегментацию, классификацию и оценку положения.
  • Масштабируемость: Эффективно работает на различных аппаратных средствах, от граничных устройств до облачных систем.

Слабые стороны:

  • Большие модели могут требовать больше вычислительных ресурсов по сравнению с оптимизированными по скорости моделями меньшего размера.
  • Оптимизация для конкретных граничных устройств может потребовать дополнительных конфигураций развертывания модели.

Узнайте больше о YOLO11

YOLOv7

YOLOv7, представленная в июле 2022 года Чиен-Яо Вангом, Алексеем Бочковским и Хонг-Юаном Марком Лиао из Института информационных наук Academia Sinica (Тайвань), известна своим обучаемым мешком бесплатных вещей, который устанавливает новый уровень для детекторов объектов в реальном времени. Подробно описанный в статье arXiv и репозитории GitHub, YOLOv7 делает упор на скорость и эффективность, сохраняя при этом высокую точность в задачах обнаружения объектов.

Архитектура и ключевые особенности:

YOLOv7 основывается на эффективной сети агрегирования уровней (ELAN) и представляет расширенную сеть ELAN (E-ELAN) для повышения способности сети к обучению. В ней используются такие методы, как перепараметризация модели и динамическое присвоение меток, для повышения эффективности обучения и скорости вывода. YOLOv7 предназначен для высокопроизводительного обнаружения объектов в различных приложениях.

Метрики и контрольные показатели эффективности:

YOLOv7 демонстрирует отличные показатели производительности, достигая mAP 51,4% на наборе данных COCO при размере изображения 640. Также следует отметить скорость работы: базовая модель YOLOv7 достигла 161 FPS при выводе данных в первой партии. Подробные бенчмарки производительности можно найти в официальном репозитории YOLOv7 на GitHub.

Примеры использования:

Баланс скорости и точности YOLOv7 позволяет использовать его в широком спектре приложений, включая:

  • Обнаружение объектов в реальном времени: Идеально подходит для приложений, требующих быстрого обнаружения, таких как автономное вождение и быстрый анализ видео.
  • Высокопроизводительные вычисления: Подходит для сред с доступными вычислительными ресурсами, где высокая точность приоритетна наряду со скоростью.
  • Исследования и разработки: Сильная базовая модель для дальнейших исследований в области архитектур обнаружения объектов и методик обучения.

Сильные стороны:

  • Высокая скорость: Достигает впечатляющей скорости вычислений, подходящей для систем реального времени.
  • Хорошая точность: Обеспечивает конкурентоспособные показатели mAP на эталонных наборах данных.
  • Эффективная архитектура: Используется E-ELAN и повторная параметризация модели для повышения производительности.

Слабые стороны:

  • Может потребовать больше вычислительных ресурсов по сравнению с небольшими, более современными моделями, такими как YOLO11n, для сценариев развертывания на границе.
  • Эта архитектура, несмотря на свою эффективность, менее универсальна в поддержке различных задач зрения, помимо обнаружения объектов, по сравнению с YOLO11.

Узнайте больше о YOLOv7

Сравнительная таблица моделей

Модель размер
(пикселей)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4TensorRT10
(мс)
params
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Заключение

YOLO11 и YOLOv7 - это мощные модели обнаружения объектов, каждая из которых обладает уникальными преимуществами. YOLO11 отличается универсальностью и эффективностью, поддерживая множество задач технического зрения с современной точностью и скоростью, что делает ее отличным выбором для различных приложений и сред развертывания. YOLOv7, несмотря на свою эффективность, особенно оптимизирован для высокоскоростного обнаружения объектов и подходит для приложений реального времени и исследовательских целей. Выбор между ними зависит от конкретных требований вашего проекта, при этом необходимо сбалансировать такие факторы, как универсальность задач, точность и ограничения на развертывание.

Для пользователей, заинтересованных в изучении других моделей, Ultralytics также предлагает YOLOv8, известную своей оптимизированной эффективностью и универсальностью, и YOLOv5, получившую широкое распространение благодаря своей скорости и простоте использования. Вы также можете сравнить YOLO11 с YOLOv9 или изучить такие модели, как RT-DETR , для различных архитектурных подходов к обнаружению объектов.

📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии