YOLOv7 против YOLO11: подробное техническое сравнение
Выбор оптимальной модели обнаружения объектов требует глубокого понимания конкретных возможностей и компромиссов различных архитектур. На этой странице представлено подробное техническое сравнение между YOLOv7 и Ultralytics YOLO11, двумя мощными моделями в линейке YOLO. Мы углубимся в их архитектурные различия, эталонные показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать наиболее подходящий вариант для ваших проектов в области компьютерного зрения.
YOLOv7: Эффективное и точное обнаружение объектов
YOLOv7 был представлен как значительный шаг вперед в обнаружении объектов в реальном времени, с акцентом на оптимизацию эффективности и точности обучения без увеличения затрат на вывод. Он установил новый современный уровень для детекторов в реальном времени после выпуска.
Авторы: Чен-Яо Ванг, Алексей Бочковский и Хонг-Юань Марк Ляо
Организация: Институт информатики, Academia Sinica, Тайвань
Дата: 2022-07-06
Arxiv: https://arxiv.org/abs/2207.02696
GitHub: https://github.com/WongKinYiu/yolov7
Документация: https://docs.ultralytics.com/models/yolov7/
Архитектура и ключевые особенности
YOLOv7 развивает предыдущие архитектуры YOLO, внедряя несколько ключевых инноваций. В основе он использует такие методы, как Extended Efficient Layer Aggregation Networks (E-ELAN), для повышения эффективности извлечения и обучения признаков. Важным вкладом является концепция "trainable bag-of-freebies", которая включает в себя стратегии оптимизации, применяемые во время обучения, такие как использование вспомогательной головки обнаружения и руководство от грубого к точному, для повышения точности конечной модели без добавления вычислительных затрат во время вывода. Хотя в основном он ориентирован на обнаружение объектов, официальный репозиторий показывает расширения сообщества для таких задач, как оценка позы и сегментация экземпляров.
Производительность и варианты использования
YOLOv7 продемонстрировал передовую производительность после выпуска, предложив убедительный баланс между скоростью и точностью. Например, модель YOLOv7x достигает 53,1% mAPtest на наборе данных MS COCO при размере изображения 640. Его эффективность делает его подходящим для приложений реального времени, таких как передовые системы безопасности и автономные системы, требующие быстрого и точного обнаружения.
Сильные стороны
- Баланс высокой точности и скорости: Предлагает сильное сочетание mAP и скорости инференса для задач реального времени на GPU.
- Эффективное обучение: Использует передовые методы обучения ("bag-of-freebies") для повышения точности без увеличения стоимости инференса.
- Подтвержденная производительность: Проверенные результаты на стандартных бенчмарках, таких как MS COCO.
Слабые стороны
- Сложность: Архитектура и методы обучения могут быть сложными для полного понимания и оптимизации.
- Требовательность к ресурсам: Более крупные модели YOLOv7 требуют значительных GPU-ресурсов для обучения.
- Ограниченная универсальность задач: В основном ориентирован на обнаружение объектов, требуя отдельных реализаций для других задач, таких как сегментация или классификация, в отличие от интегрированных моделей, таких как YOLO11.
- Менее поддерживаемый: Фреймворк не так активно разрабатывается или поддерживается, как экосистема Ultralytics, что приводит к меньшему количеству обновлений и меньшей поддержке сообщества.
Ultralytics YOLO11: Современная эффективность и универсальность
Ultralytics YOLO11 представляет собой последнюю эволюцию в серии YOLO от Ultralytics, разработанную для обеспечения превосходной точности, повышенной эффективности и большей универсальности задач в удобной для пользователя среде. Она основана на успехах своих предшественников, таких как YOLOv8, и обеспечивает современный опыт.
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/
Архитектура и ключевые особенности
В архитектуре YOLO11 используются передовые методы извлечения признаков и оптимизированная структура сети, что приводит к более высокой точности, часто при меньшем количестве параметров по сравнению с предшественниками. Эта оптимизация приводит к более высокой скорости инференса и снижению вычислительных требований, что имеет решающее значение для развертывания на различных платформах, от периферийных устройств до облачной инфраструктуры.
Ключевым преимуществом YOLO11 является его универсальность. Он изначально поддерживает несколько задач компьютерного зрения, включая обнаружение объектов, сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие прямоугольники (OBB). Он легко интегрируется в экосистему Ultralytics, предлагая оптимизированный пользовательский опыт через простые интерфейсы Python и CLI, обширную документацию и легкодоступные предварительно обученные веса для эффективного обучения.
Производительность и варианты использования
YOLO11 демонстрирует впечатляющие показатели средней точности (mAP) для различных размеров моделей, достигая благоприятного компромисса между скоростью и точностью. Например, YOLO11m достигает mAPval, равного 51,5, при размере изображения 640 со значительно меньшим количеством параметров, чем YOLOv7l. Меньшие варианты, такие как YOLO11n, предлагают исключительно быстрый логический вывод, в то время как более крупные модели, такие как YOLO11x, максимизируют точность. Примечательно, что модели YOLO11 часто демонстрируют меньшее использование памяти во время обучения и логического вывода по сравнению с другими архитектурами.
Повышенная точность и эффективность YOLO11 делают его идеальным для приложений, требующих точной обработки в реальном времени:
- Робототехника: Обеспечение точной навигации и взаимодействия с объектами, как рассмотрено в разделе Роль ИИ в робототехнике.
- Системы безопасности: Поддержка передовых систем охранной сигнализации для обнаружения вторжений.
- Аналитика розничной торговли: Улучшение управления запасами и анализа поведения клиентов.
- Промышленная автоматизация: Поддержка контроля качества в производстве.
Сильные стороны
- Передовая производительность: Высокие показатели mAP с оптимизированной архитектурой без привязки к anchor.
- Эффективный вывод: Отличная скорость, особенно на CPU, подходит для задач, требующих работы в реальном времени.
- Универсальная поддержка задач: Нативно обрабатывает обнаружение, сегментацию, классификацию, позу и OBB в едином фреймворке.
- Простота использования: Простой API, обширная документация и встроенная поддержка Ultralytics HUB для обучения и развертывания без кода.
- Экосистема с хорошей поддержкой: Активная разработка, сильное сообщество, частые обновления и эффективные процессы обучения.
- Масштабируемость: Эффективно работает на различном оборудовании, от периферии до облака, с более низкими требованиями к памяти.
Слабые стороны
- Как более новая модель, некоторые специфические интеграции со сторонними инструментами все еще могут развиваться по сравнению со старыми, более устоявшимися моделями.
- Более крупные модели могут потребовать значительных вычислительных ресурсов для обучения, хотя они остаются весьма эффективными для своего класса производительности.
Сравнение производительности: YOLOv7 против YOLO11
В следующей таблице представлено подробное сравнение производительности моделей YOLOv7 и YOLO11 на наборе данных COCO. Модели YOLO11 демонстрируют превосходный баланс точности, скорости и эффективности. Например, YOLO11l достигает более высокого mAP, чем YOLOv7x, с менее чем половиной параметров и FLOPs, и он значительно быстрее на GPU. Аналогично, YOLO11m соответствует точности YOLOv7l примерно с половиной параметров и вычислительных затрат. Самая маленькая модель, YOLO11n, обеспечивает замечательную скорость как на CPU, так и на GPU с минимальным использованием ресурсов, что делает ее идеальной для периферийных приложений.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Заключение: какую модель вам следует выбрать?
Несмотря на то, что YOLOv7 была мощной моделью для своего времени и по-прежнему демонстрирует высокую производительность для обнаружения объектов в реальном времени, Ultralytics YOLO11 представляет собой значительный шаг вперед. YOLO11 не только превосходит YOLOv7 по ключевым показателям производительности, но и предлагает гораздо более универсальную, удобную и хорошо поддерживаемую структуру.
Для разработчиков и исследователей, ищущих современное универсальное решение, YOLO11 — очевидный выбор. Ее преимущества включают в себя:
- Превосходный баланс производительности: YOLO11 обеспечивает лучший компромисс между точностью, скоростью и вычислительными затратами.
- Универсальность в многозадачности: Встроенная поддержка обнаружения, сегментации, классификации, определения позы и OBB устраняет необходимость в нескольких моделях и упрощает процессы разработки.
- Простота использования: Оптимизированный API, исчерпывающая документация и простые процедуры обучения делают его доступным как для начинающих, так и для экспертов.
- Активная разработка: Являясь частью экосистемы Ultralytics, YOLO11 получает выгоду от непрерывных обновлений, сильного сообщества open-source и интеграции с такими инструментами, как Ultralytics HUB для бесшовного MLOps.
В заключение, если ваш приоритет — использование новейших достижений в области искусственного интеллекта для широкого спектра приложений с акцентом на простоту развертывания и перспективность, Ultralytics YOLO11 — рекомендуемая модель.
Изучите другие модели
Для дальнейшего изучения рассмотрите эти сравнения с участием YOLOv7, YOLO11 и других соответствующих моделей в документации Ultralytics:
- YOLO11 против YOLOv8
- YOLO11 против YOLOv10
- YOLOv7 против YOLOv8
- YOLOv7 против YOLOv5
- Ознакомьтесь с последними моделями, такими как YOLOv9 и YOLOv10.