YOLOv8 vs YOLO11: подробное техническое сравнение
При выборе модели компьютерного зрения, особенно для обнаружения объектов, важно понимать сильные и слабые стороны различных архитектур. На этой странице представлено подробное техническое сравнение Ultralytics YOLOv8 и Ultralytics YOLO11, двух современных моделей от Ultralytics, предназначенных для обнаружения объектов и других задач компьютерного зрения. Мы проанализируем их архитектурные нюансы, эталонные показатели производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение для вашего проекта.
Ultralytics YOLOv8
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Выпущенная в начале 2023 года, YOLOv8 быстро стала эталоном для обнаружения объектов в реальном времени, предложив значительный скачок в производительности по сравнению с предыдущими версиями. Она представила механизм обнаружения без привязки к якорям и новую магистральную сеть на основе CSPDarknet53, что улучшило как точность, так и скорость. YOLOv8 — это очень универсальная модель, поддерживающая полный спектр задач компьютерного зрения, включая обнаружение, сегментацию экземпляров, оценку позы и классификацию изображений.
Архитектура и ключевые особенности
Архитектура YOLOv8 создана для эффективности и гибкости. Отсутствие anchor-ов в head-части уменьшает количество предсказаний bounding box-ов, упрощая конвейер постобработки и ускоряя вывод. Модель была разработана как комплексная платформа, а не просто как отдельная модель, предоставляя унифицированную платформу для обучения моделей для различных задач. Эта интеграция в экосистему Ultralytics означает, что пользователи получают выгоду от оптимизированного рабочего процесса, от обучения до развертывания, подкрепленного обширной документацией и надежным набором инструментов.
Сильные стороны
- Проверенная производительность: Высоконадежная и широко используемая модель, установившая отраслевые стандарты производительности и скорости.
- Универсальность задач: Единый унифицированный фреймворк, способный обрабатывать обнаружение, сегментацию, классификацию и оценку позы.
- Развитая экосистема: Преимуществами являются огромное количество учебных пособий от сообщества, интеграции со сторонними разработчиками и широкое развертывание в производственных средах.
- Простота использования: Имеет простой Python API и CLI, что делает его доступным как для начинающих, так и для экспертов.
Слабые стороны
- Хотя она по-прежнему является одним из лидеров, ее точность и скорость были превзойдены ее преемником, YOLO11, особенно в сценариях с ограничением CPU.
- Более крупные модели (YOLOv8l, YOLOv8x) могут быть требовательными к вычислительным ресурсам, требуя значительных ресурсов GPU для производительности в реальном времени.
Случаи использования
YOLOv8 остается отличным выбором для широкого спектра приложений, особенно там, где ценятся стабильность и развитая экосистема. Она превосходна в:
- Промышленная автоматизация: Для контроля качества и обнаружения дефектов в производстве.
- Системы безопасности: Поддержка передовых систем безопасности для мониторинга в реальном времени и обнаружения вторжений.
- Аналитика розничной торговли: Улучшение управления запасами и анализ поведения клиентов.
Ultralytics YOLO11
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/
YOLO11 — это новейшая разработка в серии Ultralytics YOLO, созданная для обеспечения превосходной точности и эффективности. Основываясь на прочном фундаменте YOLOv8, YOLO11 представляет архитектурные усовершенствования, которые оптимизируют извлечение и обработку признаков. Это приводит к более высокой точности обнаружения с меньшим количеством параметров и более высокой скоростью инференса, особенно на CPU. Как и его предшественник, YOLO11 — это многозадачная модель, поддерживающая обнаружение, сегментацию, классификацию, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой оптимизированной структуры.
Архитектура и ключевые особенности
YOLO11 уточняет структуру сети для достижения лучшего баланса между вычислительными затратами и производительностью. Он достигает более высокой точности с меньшим количеством параметров и меньшим количеством FLOPs по сравнению с YOLOv8, как показано в таблице производительности ниже. Эта эффективность делает его очень подходящим для развертывания на широком спектре оборудования, от периферийных устройств с ограниченными ресурсами до мощных облачных серверов. Ключевым преимуществом YOLO11 является его полная интеграция в хорошо поддерживаемую экосистему Ultralytics, которая обеспечивает превосходный пользовательский опыт, эффективные процессы обучения с легкодоступными предварительно обученными весами и меньшее использование памяти во время обучения и инференса.
Сильные стороны
- Современная точность: Обеспечивает более высокие показатели mAP, чем YOLOv8, для всех размеров моделей, устанавливая новый стандарт для обнаружения объектов.
- Повышенная эффективность: Предлагает значительно более высокую скорость вывода, особенно на CPU, при этом требуя меньше параметров и FLOP.
- Баланс производительности: Обеспечивает исключительный компромисс между скоростью и точностью, что делает его идеальным для различных реальных приложений.
- Масштабируемость и универсальность: Хорошо работает на различном оборудовании и поддерживает несколько задач компьютерного зрения в рамках единого, простого в использовании фреймворка.
- Хорошо поддерживаемая экосистема: Преимущества активной разработки, сильной поддержки сообщества через GitHub и Discord, и частых обновлений.
Слабые стороны
- Будучи более новой моделью, она может изначально иметь меньше сторонних интеграций по сравнению с более устоявшейся YOLOv8.
- Самые большие модели (например, YOLO11x) по-прежнему требуют значительной вычислительной мощности для обучения и развертывания, что является общей чертой детекторов высокой точности.
Случаи использования
YOLO11 — это рекомендуемый выбор для новых проектов, требующих высочайшего уровня точности и производительности в реальном времени. Его эффективность делает его идеальным для:
- Робототехника: Обеспечение точной навигации и взаимодействия с объектами в автономных системах.
- Здравоохранение: Помощь в анализе медицинских изображений для таких приложений, как обнаружение опухолей.
- Умные города: Поддержка интеллектуальных систем управления дорожным движением и общественной безопасности.
Прямое сравнение производительности: YOLOv8 против YOLO11
Основное различие между YOLOv8 и YOLO11 заключается в производительности. YOLO11 стабильно превосходит YOLOv8, обеспечивая более высокую точность (mAP) с большей эффективностью (меньшее количество параметров и более высокая скорость). Например, YOLO11l достигает более высокого mAP (53.4), чем YOLOv8l (52.9), почти на 42% меньшим количеством параметров и значительно быстрее на CPU. Эта тенденция сохраняется для всех вариантов моделей, что делает YOLO11 более мощным и эффективным преемником.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Заключение и рекомендации
YOLOv8 и YOLO11 — исключительные модели, но они отвечают несколько разным потребностям.
-
YOLOv8 — это надежная и зрелая модель, что делает ее безопасной ставкой для проектов, которые уже построены на ее основе или которые в значительной степени полагаются на ее обширную экосистему существующих сторонних инструментов и учебных пособий. Она остается грозным выбором для широкого спектра задач компьютерного зрения.
-
YOLO11 — явный победитель с точки зрения производительности и эффективности. Он представляет собой передовую технологию обнаружения объектов в реальном времени. Для любого нового проекта YOLO11 — рекомендуемая отправная точка. Его превосходная точность, более высокая скорость логического вывода (особенно на CPU) и более эффективная архитектура обеспечивают значительное преимущество и закладывают основу для будущего вашего приложения. Постоянная поддержка и разработка в рамках экосистемы Ultralytics еще больше укрепляют его положение в качестве лучшего выбора для разработчиков и исследователей.
Для тех, кто заинтересован в изучении других моделей, Ultralytics также поддерживает ряд архитектур, включая базовую YOLOv5, недавнюю YOLOv9 и модели на основе трансформеров, такие как RT-DETR. Дополнительные сравнения можно найти на нашей странице сравнения моделей.