YOLO11 против YOLOv8: эволюция архитектуры и анализ производительности
Выбор оптимальной модели компьютерного зрения - критически важное решение для разработчиков и исследователей, стремящихся найти баланс между точностью, скоростью и эффективностью использования ресурсов. На этой странице представлено всестороннее техническое сравнение между Ultralytics YOLO11 и Ultralytics YOLOv8две ведущие в отрасли архитектуры, предназначенные для обнаружения объектов и решения задач расширенного зрения. Мы проанализируем их архитектурные инновации, эталонные показатели и идеальные сценарии развертывания, чтобы помочь вам определить, что лучше всего подходит для ваших приложений искусственного интеллекта.
Ultralytics YOLO11
Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11
YOLO11 представляет собой новейшую разработку в знаменитой серии YOLO , в которой значительно улучшены извлечение признаков и эффективность обработки. Благодаря усовершенствованию архитектур "позвоночника" и "шеи" YOLO11 достигает более высокой средней точности (mAP), используя при этом меньшее количество параметров, чем его предшественники. Он поддерживает широкий спектр задач, включая сегментацию объектов, классификацию изображений, оценку позы и ориентированные ограничительные рамки (OBB).
Архитектура и ключевые особенности
В архитектуре YOLO11 появился блок C3k2, оптимизированная версия узкого места CSP (Cross Stage Partial), и модуль C2PSA (Cross Stage Partial with Spatial Attention). Эти компоненты повышают способность модели улавливать сложные визуальные паттерны и пространственные отношения, минимизируя при этом вычислительные затраты. Такая философия дизайна обеспечивает превосходство YOLO11 в сценариях умозаключений в реальном времени, особенно на периферийных устройствах, где вычислительные ресурсы ограничены.
Сильные стороны
- Современная точность: Обеспечивает превосходную производительность обнаружения во всех масштабах модели, постоянно превосходя предыдущие итерации на наборе данныхCOCO .
- ЭффективностьCPU : Оптимизированные архитектурные решения позволяют значительно повысить скорость обработки выводов на центральных процессорах, что делает эту систему лучшим выбором для бессерверных и граничных развертываний.
- Эффективность параметров: Достижение высокой точности при меньшем количестве параметров и FLOP, что снижает требования к хранению модели.
- Унифицированный фреймворк: Бесшовная обработка множества задач технического зрения в рамках единого и простого в использовании API.
Слабые стороны
- Зрелость экосистемы: Поскольку это более новая версия, объем сторонних руководств и контента, созданного сообществом, быстро растет, но может быть менее обширным, чем у YOLOv8.
- Интенсивность использования ресурсов для больших моделей: Несмотря на свою эффективность, самые крупные варианты (например, YOLO11x) все еще требуют значительных ресурсов GPU для обучения и высокопроизводительных выводов.
Случаи использования
YOLO11 - это лучший выбор для приложений, требующих максимального соотношения точности и скорости:
- Edge AI: развертывание высокопроизводительного обнаружения на устройствах NVIDIA Jetson или Raspberry Pi.
- Робототехника в реальном времени: Обеспечение автономной навигации и взаимодействия с объектами с минимальной задержкой.
- Медицинская визуализация: Помощь в точном анализе медицинских изображений для диагностики, где точность имеет первостепенное значение.
Ultralytics YOLOv8
Авторы: Гленн Джочер, Аюш Чаурасия, Цзин Цю
Организация:Ultralytics
Дата: 2023-01-10
GitHubultralytics
Docsyolov8
Выпущенная в начале 2023 года YOLOv8 изменила стандарты обнаружения объектов в реальном времени. В ней появилась головка обнаружения без якорей и магистральный модуль C2f, что ознаменовало значительный отход от подходов, основанных на якорях. YOLOv8 славится своей стабильностью, универсальностью и обширной экосистемой, которая развилась вокруг нее, что делает ее одной из самых широко распространенных моделей технического зрения во всем мире.
Архитектура и ключевые особенности
В YOLOv8 используется модификация основы CSPDarknet53, включающая в себя модули C2f, которые обеспечивают более богатый градиентный поток. Безъякорная конструкция упрощает процесс подавления без максимума (NMS) и снижает сложность настройки гиперпараметров, связанных с якорными ящиками. Модель хорошо масштабируется, предлагая варианты от Nano (n) до Extra Large (x) для различных вычислительных бюджетов.
Сильные стороны
- Проверенная надежность: всестороннее тестирование в производственных условиях по всему миру гарантирует высокую стабильность.
- Богатая экосистема: поддерживается тысячами руководств, интеграций и проектов сообщества.
- Универсальность: Как и YOLO11, он поддерживает обнаружение, сегментацию, классификацию и оценку позы.
- Сильная основа: продолжает предлагать конкурентоспособную производительность, превосходящую многие архитектуры, не относящиеся к YOLO .
Слабые стороны
- Недостаток производительности: В целом превосходит YOLO11 как по точностиmAP), так и по скорости вывода, особенно на CPU оборудовании.
- Более высокая стоимость вычислений: Для достижения сравнимой с YOLO11 точности требуется немного больше параметров и FLOP.
Случаи использования
YOLOv8 остается отличным вариантом для:
- Устаревшие системы: Проекты, уже интегрированные с рабочими процессами YOLOv8 , для которых стабильность важнее передовой производительности.
- Образовательные инструменты: Изучение концепций компьютерного зрения с помощью модели с обширной документацией и примерами из сообщества.
- Обнаружение общего назначения: Надежная производительность для стандартных приложений безопасности и мониторинга.
Прямое сравнение производительности
Наиболее существенное различие между этими двумя моделями заключается в их эффективности. YOLO11 достигает "улучшения Парето" по сравнению с YOLOv8более высокую точность при меньших вычислительных затратах.
Анализ эффективности и скорости
Архитектурные оптимизации в YOLO11 (C3k2, C2PSA) позволяют ему быстрее обрабатывать изображения, сохраняя при этом более тонкие характеристики. Это наиболее заметно при выводе данных наCPU , где модели YOLO11 демонстрируют значительное ускорение. Например, модель YOLO11n примерно на 30 % быстрее на CPU , чем YOLOv8n , при этом достигая более высокого mAP.
Что касается выводовGPU , модели YOLO11 также демонстрируют более низкую задержку в большинстве случаев, что делает их очень эффективными для конвейеров обработки видео в реальном времени.
Эффективность памяти
Модели Ultralytics YOLO11 и YOLOv8 рассчитаны на низкое потребление памяти при обучении и выводах по сравнению с моделями на основе трансформаторов, такими как RT-DETR. Это делает их гораздо более доступными для разработчиков, использующих оборудование потребительского класса или облачные среды с ограниченным объемом памяти CUDA .
Сравнительные показатели
Приведенная ниже таблица иллюстрирует улучшение производительности. Обратите внимание на уменьшение параметров и FLOPs для YOLO11 наряду с увеличением mAP.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Преимущество экосистемы Ultralytics
Выбор модели Ultralytics означает получение доступа к комплексной экосистеме, предназначенной для оптимизации всего жизненного цикла MLOps.
- Простота использования: Обе модели имеют одинаковые Python API и интерфейс командной строкиCLI). Переход с YOLOv8 на YOLO11 часто требует изменения всего одного символа в строке кода (например,
"yolov8n.pt"в"yolo11n.pt"). - Эффективность обучения: В моделях Ultralytics используются передовые методы обучения, включая наращивание мозаики и эволюцию гиперпараметров. Предварительно обученные веса легко доступны, что позволяет эффективно проводить трансферное обучение на пользовательских наборах данных.
- Универсальность: В отличие от многих конкурентов, ограничивающихся выполнением конкретных задач, модели Ultralytics предлагают встроенную поддержку обнаружения, сегментации, классификации, позирования и OBB в едином пакете.
- Развертывание: Легко экспортируйте модели в такие форматы, как ONNX, TensorRT, CoreML и OpenVINO для оптимизированного развертывания на различном оборудовании.
Пример унифицированного использования
Общий дизайн API позволяет легко экспериментировать. Вот как можно загрузить и запустить предсказание с помощью любой из моделей:
from ultralytics import YOLO
# Load YOLO11 or YOLOv8 by simply changing the model name
model = YOLO("yolo11n.pt") # or "yolov8n.pt"
# Train on a custom dataset
# model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display results
results[0].show()
Заключение: какую модель вам следует выбрать?
Для подавляющего большинства новых проектов рекомендуется использоватьYOLO11 . Его архитектурные усовершенствования обеспечивают явное преимущество в точности и скорости, особенно для приложений пограничных вычислений, где эффективность имеет решающее значение. Уменьшенное количество параметров также подразумевает меньшие требования к хранению данных и более быстрое время загрузки для мобильных развертываний.
YOLOv8 остается мощным и актуальным инструментом, особенно для команд с существующими конвейерами, глубоко интегрированными с конкретными версиями YOLOv8 , или для тех, кто полагается на абсолютную зрелость его экосистемы документации. Однако переход на YOLO11 в целом прост и дает немедленный выигрыш в производительности.
Обе модели выпускаются под AGPL-3.0 лицензией, способствующей сотрудничеству с открытым исходным кодом, а для коммерческих продуктов, требующих проприетарных возможностей, доступны корпоративные лицензии.
Изучите другие модели
Хотя YOLO11 и YOLOv8 являются отличными детекторами общего назначения, для специфических требований могут быть полезны другие архитектуры семейства Ultralytics :
- YOLOv10: фокусируется на обучении NMS для снижения задержки.
- YOLOv9: делает упор на программируемую градиентную информацию для обучения глубоких моделей.
- RT-DETR: детектор на основе трансформатора, обеспечивающий высокую точность, но требующий больше памяти и вычислений.
Изучите наш полный ассортимент моделей, чтобы найти идеальный вариант для вашего проекта.