Перейти к содержанию

YOLO11 vs YOLOv8: Архитектурная эволюция и анализ производительности

Выбор оптимальной модели компьютерного зрения является критически важным решением для разработчиков и исследователей, стремящихся сбалансировать точность, скорость и эффективность использования ресурсов. На этой странице представлено всестороннее техническое сравнение между Ultralytics YOLO11 и Ultralytics YOLOv8, двумя ведущими в отрасли архитектурами, предназначенными для object detection и расширенных задач vision. Мы анализируем их архитектурные инновации, эталонные показатели и идеальные сценарии развертывания, чтобы помочь вам определить, что лучше всего подходит для ваших приложений искусственного интеллекта.

Ultralytics YOLO11

Авторы: Гленн Джокер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Документация:https://docs.ultralytics.com/models/yolo11/

YOLO11 представляет собой последнюю эволюцию в известной серии YOLO, обеспечивая значительные улучшения в извлечении признаков и эффективности обработки. Благодаря усовершенствованию архитектур backbone и neck, YOLO11 достигает более высокого среднего значения Average Precision (mAP), используя при этом меньше параметров, чем его предшественники. Он изначально поддерживает широкий спектр задач, включая segmentation экземпляров, classify изображений, оценку позы и ориентированные ограничивающие рамки (obb).

Архитектура и ключевые особенности

В архитектуре YOLO11 представлен блок C3k2, оптимизированная версия узкого места CSP (Cross Stage Partial), и модуль C2PSA (Cross Stage Partial with Spatial Attention). Эти компоненты улучшают способность модели захватывать сложные визуальные образы и пространственные взаимосвязи, минимизируя при этом вычислительные издержки. Эта философия проектирования гарантирует, что YOLO11 превосходно справляется со сценариями вывода в реальном времени, особенно на периферийных устройствах, где вычислительные ресурсы ограничены.

Сильные стороны

  • Современная точность: Обеспечивает превосходную производительность обнаружения во всех масштабах модели, постоянно превосходя предыдущие итерации на наборе данныхCOCO .
  • Эффективность CPU: Оптимизированные архитектурные решения приводят к значительно более высокой скорости инференса на CPU, что делает его лучшим выбором для бессерверных или периферийных развертываний.
  • Эффективность параметров: Достигает высокой точности с меньшим количеством параметров и операций с плавающей запятой (FLOPs), снижая требования к хранению модели.
  • Унифицированный фреймворк: Беспрепятственно обрабатывает несколько задач компьютерного зрения в рамках единого, простого в использовании API.

Слабые стороны

  • Развитость экосистемы: Как более новый релиз, объем сторонних руководств и контента, создаваемого сообществом, быстро растет, но может быть менее обширным, чем у устоявшейся YOLOv8.
  • Интенсивное использование ресурсов для больших моделей: Несмотря на эффективность, самые большие варианты (например, YOLO11x) по-прежнему требуют значительных ресурсов GPU для обучения и высокопроизводительного вывода.

Случаи использования

YOLO11 — это лучший выбор для приложений, требующих максимально возможного соотношения точности и скорости:

  • Edge AI: Развертывание высокопроизводительного detect на устройствах NVIDIA Jetson или Raspberry Pi.
  • Робототехника в реальном времени: Обеспечение автономной навигации и взаимодействия с объектами с минимальной задержкой.
  • Медицинская визуализация: Помощь в точном анализе медицинских изображений для диагностики, где точность имеет первостепенное значение.

Узнайте больше о YOLO11

Ultralytics YOLOv8

Авторы: Гленн Джокер, Аюш Чаурасия, Цзин Цю
Организация:Ultralytics
Дата: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
Документация:https://docs.ultralytics.com/models/yolov8/

Выпущенная в начале 2023 года YOLOv8 изменила стандарты обнаружения объектов в реальном времени. В ней появилась головка обнаружения без якорей и магистральный модуль C2f, что ознаменовало значительный отход от подходов, основанных на якорях. YOLOv8 славится своей стабильностью, универсальностью и обширной экосистемой, которая развилась вокруг нее, что делает ее одной из самых широко распространенных моделей технического зрения во всем мире.

Архитектура и ключевые особенности

YOLOv8 использует модификацию backbone CSPDarknet53, включающую модули C2f, которые обеспечивают более насыщенное распространение градиента. Его конструкция без anchor boxes упрощает процесс non-maximum suppression (NMS) и снижает сложность настройки гиперпараметров, связанных с anchor boxes. Модель хорошо масштабируется, предлагая варианты от Nano (n) до Extra Large (x) в соответствии с различными вычислительными бюджетами.

Сильные стороны

  • Доказанная надежность: тщательно протестирована в производственных средах по всему миру, что обеспечивает высокую стабильность.
  • Развитая экосистема: поддерживается тысячами учебных пособий, интеграций и проектов сообщества.
  • Универсальность: Как и YOLO11, он поддерживает detect, segmentation, classification и pose estimation.
  • Надёжный базис: продолжает предлагать конкурентоспособную производительность, превосходящую многие архитектуры, отличные от YOLO.

Слабые стороны

  • Разрыв в производительности: Как правило, YOLO11 превосходит по точности (mAP) и скорости инференса, особенно на CPU.
  • Более высокие вычислительные затраты: Требуется немного больше параметров и FLOPs для достижения сопоставимой точности с YOLO11.

Случаи использования

YOLOv8 остается отличным вариантом для:

  • Устаревшие системы: Проекты, уже интегрированные с рабочими процессами YOLOv8, которым требуется стабильность, а не передовая производительность.
  • Образовательные инструменты: Изучение концепций компьютерного зрения с использованием модели с обширной документацией и примерами сообщества.
  • Обнаружение общего назначения: Надежная работа для стандартных приложений безопасности и мониторинга.

Узнайте больше о YOLOv8

Прямое сравнение производительности

Наиболее существенное различие между этими двумя моделями заключается в их эффективности. YOLO11 достигает «улучшения по Парето» по сравнению с YOLOv8 — предлагая более высокую точность при меньших вычислительных затратах.

Анализ эффективности и скорости

Архитектурные оптимизации в YOLO11 (C3k2, C2PSA) позволяют ей быстрее обрабатывать изображения, сохраняя при этом более детализированные признаки. Это наиболее заметно при выводе на CPU, где модели YOLO11 демонстрируют значительное увеличение скорости. Например, модель YOLO11n примерно на 30% быстрее на CPU, чем YOLOv8n, и при этом достигает более высокого mAP.

С точки зрения вывода на GPU, модели YOLO11 также демонстрируют более низкую задержку для большинства размеров, что делает их очень эффективными для конвейеров обработки видео в реальном времени.

Эффективность памяти

Ultralytics YOLO11 и YOLOv8 разработаны для низкого потребления памяти во время обучения и логического вывода по сравнению с моделями на основе transformer, такими как RT-DETR. Это делает их гораздо более доступными для разработчиков, использующих оборудование потребительского класса или облачные среды с ограниченным объемом памяти CUDA.

Сравнительные метрики

В таблице ниже показаны улучшения производительности. Обратите внимание на уменьшение количества параметров и FLOPs для YOLO11 наряду с увеличением mAP.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Преимущество экосистемы Ultralytics

Выбор модели Ultralytics означает получение доступа к комплексной экосистеме, предназначенной для оптимизации всего жизненного цикла MLOps.

  • Простота использования: Обе модели имеют одинаковые Python API и интерфейс командной строки (CLI). Переход с YOLOv8 на YOLO11 часто требует изменения только одного символа в строке кода (например, "yolov8n.pt" в "yolo11n.pt").
  • Эффективность обучения: Модели Ultralytics используют продвинутые методы обучения, включая мозаичную аугментацию и эволюцию гиперпараметров. Предварительно обученные веса легко доступны, что обеспечивает эффективное трансферное обучение на пользовательских наборах данных.
  • Универсальность: В отличие от многих конкурентов, ограниченных конкретными задачами, модели Ultralytics предлагают встроенную поддержку detect, segment, classification, pose и OBB в рамках унифицированного пакета.
  • Развертывание: Легко экспортируйте модели в такие форматы, как ONNX, TensorRT, CoreML и OpenVINO для оптимизированного развертывания на различном оборудовании.

Пример унифицированного использования

Общий дизайн API обеспечивает возможность легкой экспериментировать. Вот как вы можете загрузить и запустить предсказание с любой из моделей:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Заключение: какую модель вам следует выбрать?

Для подавляющего большинства новых проектов YOLO11 является рекомендуемым выбором. Его архитектурные усовершенствования обеспечивают явное преимущество как в точности, так и в скорости, особенно для приложений периферийных вычислений, где эффективность имеет решающее значение. Уменьшенное количество параметров также подразумевает меньшие требования к хранилищу и более быстрое время загрузки для мобильных развертываний.

YOLOv8 остается мощным и актуальным инструментом, особенно для команд с существующими конвейерами, глубоко интегрированными с определенными версиями YOLOv8, или для тех, кто полагается на абсолютную зрелость ее экосистемы документации. Однако переход на YOLO11, как правило, прост и дает немедленные преимущества в производительности.

Обе модели выпущены под лицензией AGPL-3.0, что способствует сотрудничеству с открытым исходным кодом, с корпоративными лицензиями, доступными для коммерческих продуктов, требующих проприетарных возможностей.

Изучите другие модели

Хотя YOLO11 и YOLOv8 являются превосходными детекторами общего назначения, конкретные требования могут выиграть от других архитектур в семействе Ultralytics:

  • YOLOv10: Ориентирована на обучение без NMS для снижения задержки.
  • YOLOv9: Подчеркивает программируемую градиентную информацию для обучения глубоких моделей.
  • RT-DETR: Детектор на основе трансформера, обеспечивающий высокую точность, хотя и с более высокими требованиями к памяти и вычислениям.

Ознакомьтесь с полным спектром наших сравнений моделей, чтобы найти идеальное решение для вашего проекта.


Комментарии