Перейти к содержанию

YOLO11 против YOLOv8: эволюция архитектуры и анализ производительности

Выбор оптимальной модели компьютерного зрения - критически важное решение для разработчиков и исследователей, стремящихся найти баланс между точностью, скоростью и эффективностью использования ресурсов. На этой странице представлено всестороннее техническое сравнение между Ultralytics YOLO11 и Ultralytics YOLOv8две ведущие в отрасли архитектуры, предназначенные для обнаружения объектов и решения задач расширенного зрения. Мы проанализируем их архитектурные инновации, эталонные показатели и идеальные сценарии развертывания, чтобы помочь вам определить, что лучше всего подходит для ваших приложений искусственного интеллекта.

Ultralytics YOLO11

Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 представляет собой новейшую разработку в знаменитой серии YOLO , в которой значительно улучшены извлечение признаков и эффективность обработки. Благодаря усовершенствованию архитектур "позвоночника" и "шеи" YOLO11 достигает более высокой средней точности (mAP), используя при этом меньшее количество параметров, чем его предшественники. Он поддерживает широкий спектр задач, включая сегментацию объектов, классификацию изображений, оценку позы и ориентированные ограничительные рамки (OBB).

Архитектура и ключевые особенности

В архитектуре YOLO11 появился блок C3k2, оптимизированная версия узкого места CSP (Cross Stage Partial), и модуль C2PSA (Cross Stage Partial with Spatial Attention). Эти компоненты повышают способность модели улавливать сложные визуальные паттерны и пространственные отношения, минимизируя при этом вычислительные затраты. Такая философия дизайна обеспечивает превосходство YOLO11 в сценариях умозаключений в реальном времени, особенно на периферийных устройствах, где вычислительные ресурсы ограничены.

Сильные стороны

  • Современная точность: Обеспечивает превосходную производительность обнаружения во всех масштабах модели, постоянно превосходя предыдущие итерации на наборе данныхCOCO .
  • ЭффективностьCPU : Оптимизированные архитектурные решения позволяют значительно повысить скорость обработки выводов на центральных процессорах, что делает эту систему лучшим выбором для бессерверных и граничных развертываний.
  • Эффективность параметров: Достижение высокой точности при меньшем количестве параметров и FLOP, что снижает требования к хранению модели.
  • Унифицированный фреймворк: Бесшовная обработка множества задач технического зрения в рамках единого и простого в использовании API.

Слабые стороны

  • Зрелость экосистемы: Поскольку это более новая версия, объем сторонних руководств и контента, созданного сообществом, быстро растет, но может быть менее обширным, чем у YOLOv8.
  • Интенсивность использования ресурсов для больших моделей: Несмотря на свою эффективность, самые крупные варианты (например, YOLO11x) все еще требуют значительных ресурсов GPU для обучения и высокопроизводительных выводов.

Случаи использования

YOLO11 - это лучший выбор для приложений, требующих максимального соотношения точности и скорости:

  • Edge AI: развертывание высокопроизводительного обнаружения на устройствах NVIDIA Jetson или Raspberry Pi.
  • Робототехника в реальном времени: Обеспечение автономной навигации и взаимодействия с объектами с минимальной задержкой.
  • Медицинская визуализация: Помощь в точном анализе медицинских изображений для диагностики, где точность имеет первостепенное значение.

Узнайте больше о YOLO11

Ultralytics YOLOv8

Авторы: Гленн Джочер, Аюш Чаурасия, Цзин Цю
Организация:Ultralytics
Дата: 2023-01-10
GitHubultralytics
Docsyolov8

Выпущенная в начале 2023 года YOLOv8 изменила стандарты обнаружения объектов в реальном времени. В ней появилась головка обнаружения без якорей и магистральный модуль C2f, что ознаменовало значительный отход от подходов, основанных на якорях. YOLOv8 славится своей стабильностью, универсальностью и обширной экосистемой, которая развилась вокруг нее, что делает ее одной из самых широко распространенных моделей технического зрения во всем мире.

Архитектура и ключевые особенности

В YOLOv8 используется модификация основы CSPDarknet53, включающая в себя модули C2f, которые обеспечивают более богатый градиентный поток. Безъякорная конструкция упрощает процесс подавления без максимума (NMS) и снижает сложность настройки гиперпараметров, связанных с якорными ящиками. Модель хорошо масштабируется, предлагая варианты от Nano (n) до Extra Large (x) для различных вычислительных бюджетов.

Сильные стороны

  • Проверенная надежность: всестороннее тестирование в производственных условиях по всему миру гарантирует высокую стабильность.
  • Богатая экосистема: поддерживается тысячами руководств, интеграций и проектов сообщества.
  • Универсальность: Как и YOLO11, он поддерживает обнаружение, сегментацию, классификацию и оценку позы.
  • Сильная основа: продолжает предлагать конкурентоспособную производительность, превосходящую многие архитектуры, не относящиеся к YOLO .

Слабые стороны

  • Недостаток производительности: В целом превосходит YOLO11 как по точностиmAP), так и по скорости вывода, особенно на CPU оборудовании.
  • Более высокая стоимость вычислений: Для достижения сравнимой с YOLO11 точности требуется немного больше параметров и FLOP.

Случаи использования

YOLOv8 остается отличным вариантом для:

  • Устаревшие системы: Проекты, уже интегрированные с рабочими процессами YOLOv8 , для которых стабильность важнее передовой производительности.
  • Образовательные инструменты: Изучение концепций компьютерного зрения с помощью модели с обширной документацией и примерами из сообщества.
  • Обнаружение общего назначения: Надежная производительность для стандартных приложений безопасности и мониторинга.

Узнайте больше о YOLOv8

Прямое сравнение производительности

Наиболее существенное различие между этими двумя моделями заключается в их эффективности. YOLO11 достигает "улучшения Парето" по сравнению с YOLOv8более высокую точность при меньших вычислительных затратах.

Анализ эффективности и скорости

Архитектурные оптимизации в YOLO11 (C3k2, C2PSA) позволяют ему быстрее обрабатывать изображения, сохраняя при этом более тонкие характеристики. Это наиболее заметно при выводе данных наCPU , где модели YOLO11 демонстрируют значительное ускорение. Например, модель YOLO11n примерно на 30 % быстрее на CPU , чем YOLOv8n , при этом достигая более высокого mAP.

Что касается выводовGPU , модели YOLO11 также демонстрируют более низкую задержку в большинстве случаев, что делает их очень эффективными для конвейеров обработки видео в реальном времени.

Эффективность памяти

Модели Ultralytics YOLO11 и YOLOv8 рассчитаны на низкое потребление памяти при обучении и выводах по сравнению с моделями на основе трансформаторов, такими как RT-DETR. Это делает их гораздо более доступными для разработчиков, использующих оборудование потребительского класса или облачные среды с ограниченным объемом памяти CUDA .

Сравнительные показатели

Приведенная ниже таблица иллюстрирует улучшение производительности. Обратите внимание на уменьшение параметров и FLOPs для YOLO11 наряду с увеличением mAP.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Преимущество экосистемы Ultralytics

Выбор модели Ultralytics означает получение доступа к комплексной экосистеме, предназначенной для оптимизации всего жизненного цикла MLOps.

  • Простота использования: Обе модели имеют одинаковые Python API и интерфейс командной строкиCLI). Переход с YOLOv8 на YOLO11 часто требует изменения всего одного символа в строке кода (например, "yolov8n.pt" в "yolo11n.pt").
  • Эффективность обучения: В моделях Ultralytics используются передовые методы обучения, включая наращивание мозаики и эволюцию гиперпараметров. Предварительно обученные веса легко доступны, что позволяет эффективно проводить трансферное обучение на пользовательских наборах данных.
  • Универсальность: В отличие от многих конкурентов, ограничивающихся выполнением конкретных задач, модели Ultralytics предлагают встроенную поддержку обнаружения, сегментации, классификации, позирования и OBB в едином пакете.
  • Развертывание: Легко экспортируйте модели в такие форматы, как ONNX, TensorRT, CoreML и OpenVINO для оптимизированного развертывания на различном оборудовании.

Пример унифицированного использования

Общий дизайн API позволяет легко экспериментировать. Вот как можно загрузить и запустить предсказание с помощью любой из моделей:

from ultralytics import YOLO

# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt")  # or "yolov8n.pt"

# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Заключение: какую модель вам следует выбрать?

Для подавляющего большинства новых проектов рекомендуется использоватьYOLO11 . Его архитектурные усовершенствования обеспечивают явное преимущество в точности и скорости, особенно для приложений пограничных вычислений, где эффективность имеет решающее значение. Уменьшенное количество параметров также подразумевает меньшие требования к хранению данных и более быстрое время загрузки для мобильных развертываний.

YOLOv8 остается мощным и актуальным инструментом, особенно для команд с существующими конвейерами, глубоко интегрированными с конкретными версиями YOLOv8 , или для тех, кто полагается на абсолютную зрелость его экосистемы документации. Однако переход на YOLO11 в целом прост и дает немедленный выигрыш в производительности.

Обе модели выпускаются под AGPL-3.0 лицензией, способствующей сотрудничеству с открытым исходным кодом, а для коммерческих продуктов, требующих проприетарных возможностей, доступны корпоративные лицензии.

Изучите другие модели

Хотя YOLO11 и YOLOv8 являются отличными детекторами общего назначения, для специфических требований могут быть полезны другие архитектуры семейства Ultralytics :

  • YOLOv10: фокусируется на обучении NMS для снижения задержки.
  • YOLOv9: делает упор на программируемую градиентную информацию для обучения глубоких моделей.
  • RT-DETR: детектор на основе трансформатора, обеспечивающий высокую точность, но требующий больше памяти и вычислений.

Изучите наш полный ассортимент моделей, чтобы найти идеальный вариант для вашего проекта.


Комментарии