Перейти к содержанию

YOLOv8 vs YOLO11: подробное техническое сравнение

При выборе модели компьютерного зрения, особенно для обнаружения объектов, важно понимать сильные и слабые стороны различных архитектур. На этой странице представлено подробное техническое сравнение Ultralytics YOLOv8 и Ultralytics YOLO11, двух современных моделей от Ultralytics, предназначенных для обнаружения объектов и других задач компьютерного зрения. Мы проанализируем их архитектурные нюансы, эталонные показатели производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение для вашего проекта.

Ultralytics YOLOv8

Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Выпущенная в начале 2023 года, YOLOv8 быстро стала эталоном для обнаружения объектов в реальном времени, предложив значительный скачок в производительности по сравнению с предыдущими версиями. Она представила механизм обнаружения без привязки к якорям и новую магистральную сеть на основе CSPDarknet53, что улучшило как точность, так и скорость. YOLOv8 — это очень универсальная модель, поддерживающая полный спектр задач компьютерного зрения, включая обнаружение, сегментацию экземпляров, оценку позы и классификацию изображений.

Архитектура и ключевые особенности

Архитектура YOLOv8 создана для эффективности и гибкости. Отсутствие anchor-ов в head-части уменьшает количество предсказаний bounding box-ов, упрощая конвейер постобработки и ускоряя вывод. Модель была разработана как комплексная платформа, а не просто как отдельная модель, предоставляя унифицированную платформу для обучения моделей для различных задач. Эта интеграция в экосистему Ultralytics означает, что пользователи получают выгоду от оптимизированного рабочего процесса, от обучения до развертывания, подкрепленного обширной документацией и надежным набором инструментов.

Сильные стороны

  • Проверенная производительность: Высоконадежная и широко используемая модель, установившая отраслевые стандарты производительности и скорости.
  • Универсальность задач: Единый унифицированный фреймворк, способный обрабатывать обнаружение, сегментацию, классификацию и оценку позы.
  • Развитая экосистема: Преимуществами являются огромное количество учебных пособий от сообщества, интеграции со сторонними разработчиками и широкое развертывание в производственных средах.
  • Простота использования: Имеет простой Python API и CLI, что делает его доступным как для начинающих, так и для экспертов.

Слабые стороны

  • Хотя она по-прежнему является одним из лидеров, ее точность и скорость были превзойдены ее преемником, YOLO11, особенно в сценариях с ограничением CPU.
  • Более крупные модели (YOLOv8l, YOLOv8x) могут быть требовательными к вычислительным ресурсам, требуя значительных ресурсов GPU для производительности в реальном времени.

Случаи использования

YOLOv8 остается отличным выбором для широкого спектра приложений, особенно там, где ценятся стабильность и развитая экосистема. Она превосходна в:

  • Промышленная автоматизация: Для контроля качества и обнаружения дефектов в производстве.
  • Системы безопасности: Поддержка передовых систем безопасности для мониторинга в реальном времени и обнаружения вторжений.
  • Аналитика розничной торговли: Улучшение управления запасами и анализ поведения клиентов.

Узнайте больше о YOLOv8

Ultralytics YOLO11

Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/

YOLO11 — это новейшая разработка в серии Ultralytics YOLO, созданная для обеспечения превосходной точности и эффективности. Основываясь на прочном фундаменте YOLOv8, YOLO11 представляет архитектурные усовершенствования, которые оптимизируют извлечение и обработку признаков. Это приводит к более высокой точности обнаружения с меньшим количеством параметров и более высокой скоростью инференса, особенно на CPU. Как и его предшественник, YOLO11 — это многозадачная модель, поддерживающая обнаружение, сегментацию, классификацию, оценку позы и ориентированные ограничивающие рамки (OBB) в рамках единой оптимизированной структуры.

Архитектура и ключевые особенности

YOLO11 уточняет структуру сети для достижения лучшего баланса между вычислительными затратами и производительностью. Он достигает более высокой точности с меньшим количеством параметров и меньшим количеством FLOPs по сравнению с YOLOv8, как показано в таблице производительности ниже. Эта эффективность делает его очень подходящим для развертывания на широком спектре оборудования, от периферийных устройств с ограниченными ресурсами до мощных облачных серверов. Ключевым преимуществом YOLO11 является его полная интеграция в хорошо поддерживаемую экосистему Ultralytics, которая обеспечивает превосходный пользовательский опыт, эффективные процессы обучения с легкодоступными предварительно обученными весами и меньшее использование памяти во время обучения и инференса.

Сильные стороны

  • Современная точность: Обеспечивает более высокие показатели mAP, чем YOLOv8, для всех размеров моделей, устанавливая новый стандарт для обнаружения объектов.
  • Повышенная эффективность: Предлагает значительно более высокую скорость вывода, особенно на CPU, при этом требуя меньше параметров и FLOP.
  • Баланс производительности: Обеспечивает исключительный компромисс между скоростью и точностью, что делает его идеальным для различных реальных приложений.
  • Масштабируемость и универсальность: Хорошо работает на различном оборудовании и поддерживает несколько задач компьютерного зрения в рамках единого, простого в использовании фреймворка.
  • Хорошо поддерживаемая экосистема: Преимущества активной разработки, сильной поддержки сообщества через GitHub и Discord, и частых обновлений.

Слабые стороны

  • Будучи более новой моделью, она может изначально иметь меньше сторонних интеграций по сравнению с более устоявшейся YOLOv8.
  • Самые большие модели (например, YOLO11x) по-прежнему требуют значительной вычислительной мощности для обучения и развертывания, что является общей чертой детекторов высокой точности.

Случаи использования

YOLO11 — это рекомендуемый выбор для новых проектов, требующих высочайшего уровня точности и производительности в реальном времени. Его эффективность делает его идеальным для:

Узнайте больше о YOLO11

Прямое сравнение производительности: YOLOv8 против YOLO11

Основное различие между YOLOv8 и YOLO11 заключается в производительности. YOLO11 стабильно превосходит YOLOv8, обеспечивая более высокую точность (mAP) с большей эффективностью (меньшее количество параметров и более высокая скорость). Например, YOLO11l достигает более высокого mAP (53.4), чем YOLOv8l (52.9), почти на 42% меньшим количеством параметров и значительно быстрее на CPU. Эта тенденция сохраняется для всех вариантов моделей, что делает YOLO11 более мощным и эффективным преемником.

Модель размер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Заключение и рекомендации

YOLOv8 и YOLO11 — исключительные модели, но они отвечают несколько разным потребностям.

  • YOLOv8 — это надежная и зрелая модель, что делает ее безопасной ставкой для проектов, которые уже построены на ее основе или которые в значительной степени полагаются на ее обширную экосистему существующих сторонних инструментов и учебных пособий. Она остается грозным выбором для широкого спектра задач компьютерного зрения.

  • YOLO11 — явный победитель с точки зрения производительности и эффективности. Он представляет собой передовую технологию обнаружения объектов в реальном времени. Для любого нового проекта YOLO11 — рекомендуемая отправная точка. Его превосходная точность, более высокая скорость логического вывода (особенно на CPU) и более эффективная архитектура обеспечивают значительное преимущество и закладывают основу для будущего вашего приложения. Постоянная поддержка и разработка в рамках экосистемы Ultralytics еще больше укрепляют его положение в качестве лучшего выбора для разработчиков и исследователей.

Для тех, кто заинтересован в изучении других моделей, Ultralytics также поддерживает ряд архитектур, включая базовую YOLOv5, недавнюю YOLOv9 и модели на основе трансформеров, такие как RT-DETR. Дополнительные сравнения можно найти на нашей странице сравнения моделей.



📅 Создано 1 год назад ✏️ Обновлено 1 месяц назад

Комментарии