YOLO11 против YOLOv7: подробное техническое сравнение для обнаружения объектов
Выбор правильной модели обнаружения объектов имеет решающее значение для достижения оптимальной производительности в задачах компьютерного зрения. На этой странице представлено подробное техническое сравнение Ultralytics YOLO11 и YOLOv7, двух передовых моделей, предназначенных для эффективного и точного обнаружения объектов. Мы рассмотрим их архитектурные нюансы, эталоны производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение.
Ultralytics YOLO11
Ultralytics YOLO11, авторами которого являются Гленн Джочер и Цзин Цю из Ultralytics и который был выпущен 2024-09-27, является последней разработкой в серии YOLO . Она направлена на повышение точности и эффективности обнаружения объектов, что делает ее универсальной для широкого спектра реальных приложений. Ultralytics YOLO11 основан на предыдущих моделях YOLO , в нем усовершенствована структура сети, что позволяет достичь самой высокой точности обнаружения при сохранении производительности в режиме реального времени.
Архитектура и ключевые особенности:
Архитектура YOLO11 включает в себя передовые методы извлечения признаков, что позволяет добиться более высокой точности при меньшем количестве параметров по сравнению с моделями типа YOLOv8. Такая оптимизация позволяет повысить скорость работы механизма вывода и снизить требования к вычислительным ресурсам, что делает его пригодным для развертывания на различных платформах, от периферийных устройств до облачной инфраструктуры. YOLO11 поддерживает множество задач компьютерного зрения, включая обнаружение объектов, сегментацию объектов, классификацию изображений и оценку позы. Модель доступна на GitHub.
Метрики и контрольные показатели эффективности:
YOLO11 демонстрирует впечатляющие показатели средней точности (mAP) при различных размерах модели. Например, модель YOLO11m достигает показателя mAPval50-95 51,5 при размере изображения 640, обеспечивая эффективный баланс между скоростью и точностью. Меньшие варианты, такие как YOLO11n и YOLO11s, обеспечивают более быстрый вывод в реальном времени для приложений, которым важна скорость, в то время как большие модели, такие как YOLO11x, обеспечивают максимальную точность. Подробные показатели производительностиYOLO приведены в документации Ultralytics .
Примеры использования:
Повышенная точность и эффективность YOLO11 делают его идеальным для приложений, требующих точного обнаружения объектов в реальном времени, таких как:
- Робототехника: Для точной навигации и взаимодействия с объектами в динамических средах.
- Системы безопасности: Передовые системы охранной сигнализации для точного обнаружения вторжения и комплексного мониторинга.
- Аналитика розничной торговли: ИИ в розничной торговле для улучшения управления запасами и углубленного анализа поведения покупателей.
- Промышленная автоматизация: Для строгого контроля качества и эффективного обнаружения дефектов в производственных процессах.
Сильные стороны:
- Высокая точность: Достижение передовых показателей МПД с помощью усовершенствованной архитектуры.
- Эффективный вывод: Быстрая обработка, подходящая для приложений реального времени.
- Универсальные задачи: Поддерживает обнаружение объектов, сегментацию, классификацию и оценку положения.
- Масштабируемость: Эффективно работает на различных аппаратных средствах, от граничных устройств до облачных систем.
Слабые стороны:
- Большие модели могут требовать больше вычислительных ресурсов по сравнению с оптимизированными по скорости моделями меньшего размера.
- Оптимизация для конкретных граничных устройств может потребовать дополнительных конфигураций развертывания модели.
YOLOv7
YOLOv7, представленная в июле 2022 года Чиен-Яо Вангом, Алексеем Бочковским и Хонг-Юаном Марком Лиао из Института информационных наук Academia Sinica (Тайвань), известна своим обучаемым мешком бесплатных вещей, который устанавливает новый уровень для детекторов объектов в реальном времени. Подробно описанный в статье arXiv и репозитории GitHub, YOLOv7 делает упор на скорость и эффективность, сохраняя при этом высокую точность в задачах обнаружения объектов.
Архитектура и ключевые особенности:
YOLOv7 основывается на эффективной сети агрегирования уровней (ELAN) и представляет расширенную сеть ELAN (E-ELAN) для повышения способности сети к обучению. В ней используются такие методы, как перепараметризация модели и динамическое присвоение меток, для повышения эффективности обучения и скорости вывода. YOLOv7 предназначен для высокопроизводительного обнаружения объектов в различных приложениях.
Метрики и контрольные показатели эффективности:
YOLOv7 демонстрирует отличные показатели производительности, достигая mAP 51,4% на наборе данных COCO при размере изображения 640. Также следует отметить скорость работы: базовая модель YOLOv7 достигла 161 FPS при выводе данных в первой партии. Подробные бенчмарки производительности можно найти в официальном репозитории YOLOv7 на GitHub.
Примеры использования:
Баланс скорости и точности YOLOv7 позволяет использовать его в широком спектре приложений, включая:
- Обнаружение объектов в реальном времени: Идеально подходит для приложений, требующих быстрого обнаружения, таких как автономное вождение и быстрый анализ видео.
- Высокопроизводительные вычисления: Подходит для сред с доступными вычислительными ресурсами, где высокая точность приоритетна наряду со скоростью.
- Исследования и разработки: Сильная базовая модель для дальнейших исследований в области архитектур обнаружения объектов и методик обучения.
Сильные стороны:
- Высокая скорость: Достигает впечатляющей скорости вычислений, подходящей для систем реального времени.
- Хорошая точность: Обеспечивает конкурентоспособные показатели mAP на эталонных наборах данных.
- Эффективная архитектура: Используется E-ELAN и повторная параметризация модели для повышения производительности.
Слабые стороны:
- Может потребовать больше вычислительных ресурсов по сравнению с небольшими, более современными моделями, такими как YOLO11n, для сценариев развертывания на границе.
- Эта архитектура, несмотря на свою эффективность, менее универсальна в поддержке различных задач зрения, помимо обнаружения объектов, по сравнению с YOLO11.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
Заключение
YOLO11 и YOLOv7 - это мощные модели обнаружения объектов, каждая из которых обладает уникальными преимуществами. YOLO11 отличается универсальностью и эффективностью, поддерживая множество задач технического зрения с современной точностью и скоростью, что делает ее отличным выбором для различных приложений и сред развертывания. YOLOv7, несмотря на свою эффективность, особенно оптимизирован для высокоскоростного обнаружения объектов и подходит для приложений реального времени и исследовательских целей. Выбор между ними зависит от конкретных требований вашего проекта, при этом необходимо сбалансировать такие факторы, как универсальность задач, точность и ограничения на развертывание.
Для пользователей, заинтересованных в изучении других моделей, Ultralytics также предлагает YOLOv8, известную своей оптимизированной эффективностью и универсальностью, и YOLOv5, получившую широкое распространение благодаря своей скорости и простоте использования. Вы также можете сравнить YOLO11 с YOLOv9 или изучить такие модели, как RT-DETR , для различных архитектурных подходов к обнаружению объектов.