YOLOv8 vs YOLO11: Эволюция обнаружения объектов в реальном времени
Выбор правильной архитектуры компьютерного зрения — это критически важное решение, которое влияет на скорость, точность и масштабируемость ваших AI-проектов. В этом руководстве представлено углубленное техническое сравнение между Ultralytics YOLOv8, широко распространенным отраслевым стандартом, выпущенным в 2023 году, и Ultralytics YOLO11, последней эволюцией в серии YOLO, разработанной для превосходной эффективности и производительности. Мы проанализируем их архитектурные различия, эталонные метрики и идеальные варианты использования, чтобы помочь вам выбрать лучшую модель для ваших нужд.
Ultralytics YOLOv8
Авторы: Гленн Джохер, Аюш Чаурасия и Цзин Цю
Организация:Ultralytics
Дата: 2023-01-10
GitHub:https://github.com/ultralytics/ultralytics
Документация:https://docs.ultralytics.com/models/yolov8/
Выпущенный в начале 2023 года YOLOv8 стал важной вехой в истории обнаружения объектов. В ней был представлен единый фреймворк, поддерживающий множество задач компьютерного зрения - обнаружение, сегментацию объектов, оценку позы и классификацию изображений - в рамкаходного хранилища. YOLOv8 перешел от обнаружения на основе якорей к безъякорному подходу, что упрощает конструкцию и улучшает обобщение для различных форм объектов.
Архитектура и ключевые особенности
YOLOv8 заменил модули C3, используемые в YOLOv5, на модуль C2f (Cross-Stage Partial bottleneck с двумя свертками). Это изменение улучшило распространение градиента и интеграцию признаков, сохранив при этом небольшой объем. Архитектура также имеет отделенную голову, разделяющую задачи определения объектности, классификации и регрессии для повышения точности.
Наследие надежности
YOLOv8 была протестирована в тысячах коммерческих приложений, от автоматизации производства до автономных транспортных средств, и заслужила репутацию стабильной и простой в развертывании.
Сильные и слабые стороны
- Преимущества:
- Развитая экосистема: Поддерживается огромным количеством обучающих материалов от сообщества, интеграциями и руководствами по развертыванию.
- Универсальность: Нативно поддерживает OBB (Oriented Bounding Box) и классификацию наряду со стандартным detect.
- Доказанная стабильность: Безопасный выбор для производственных сред, требующих модель с большим опытом работы.
- Слабые стороны:
- Эффективность скорости: Несмотря на быстродействие, YOLO11 уступает в скорости инференса на CPU и эффективности параметров.
- Вычислительные требования: Более крупные варианты (L, X) требуют больше VRAM и FLOPs по сравнению с оптимизированными эквивалентами YOLO11.
from ultralytics import YOLO
# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
Ultralytics YOLO11
Авторы: Гленн Джохер и Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Документация:https://docs.ultralytics.com/models/yolo11/
YOLO11 представляет собой передовую модель семейства Ultralytics. Разработанный для переопределения inference в реальном времени, он опирается на успехи YOLOv8, но вносит существенные архитектурные усовершенствования. YOLO11 фокусируется на максимизации точности при минимизации вычислительных затрат, что делает его лучшим выбором для современных приложений искусственного интеллекта, от периферийных устройств до облачных серверов.
Архитектура и ключевые особенности
YOLO11 представляет блок C3k2 и модуль C2PSA (Cross-Stage Partial with Spatial Attention). Эти компоненты повышают способность модели извлекать сложные признаки и более эффективно обрабатывать окклюзию, чем предыдущие итерации. Архитектура оптимизирована для скорости, обеспечивая значительно более быстрое время обработки на CPU — критический фактор для развертываний Edge AI, где ресурсы GPU могут быть недоступны.
Модель поддерживает унифицированный интерфейс, характерный для Ultralytics, гарантируя, что разработчики могут переключаться между такими задачами, как OBB или segment, не меняя свой рабочий процесс.
Сильные и слабые стороны
- Преимущества:
- Превосходная эффективность: Достигает более высокого mAP с на 22% меньшим количеством параметров, чем YOLOv8, что уменьшает размер модели и потребности в хранилище.
- Более быстрый вывод: Оптимизирован специально для современного оборудования, обеспечивая более высокую скорость как на CPU, так и на GPU.
- Улучшенное извлечение признаков: Новая архитектура backbone улучшает обнаружение небольших объектов и производительность в загроможденных сценах.
- Меньшее использование памяти: Требуется меньше памяти CUDA во время обучения по сравнению с моделями на основе трансформеров, такими как RT-DETR, что позволяет проводить обучение на более доступном оборудовании.
- Слабые стороны:
- Новый релиз: Поскольку это новая модель, для полной поддержки конкретных нишевых сторонних инструментов может потребоваться время, хотя основная экосистема Ultralytics поддерживает ее с первого дня.
from ultralytics import YOLO
# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()
Прямое сравнение производительности
В приведенном ниже сравнении выделены преимущества YOLO11 в эффективности. Хотя YOLOv8 остается мощным конкурентом, YOLO11 стабильно обеспечивает более высокую точность (mAP) при сниженной вычислительной сложности (FLOPs) и более высокой скорости inference. Это особенно заметно в моделях «Nano» и «Small», где YOLO11n достигает 39,5 mAP по сравнению с 37,3 у YOLOv8n, и при этом работает значительно быстрее на CPU.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Метрический анализ
YOLO11 демонстрирует явное преимущество в компромиссе между скоростью и точностью. Например, модель YOLO11l превосходит YOLOv8l по точности (+0,5 mAP), используя примерно на 42% меньше параметров и работая на 36% быстрее на CPU.
Экосистема и простота использования
Обе модели выигрывают от надежной экосистемы Ultralytics, которая предназначена для демократизации ИИ, делая современные технологии доступными для всех.
- Унифицированный API: Переключение между YOLOv8 и YOLO11 так же просто, как изменение строки модели с
yolov8n.ptвyolo11n.pt. Рефакторинг кода не требуется. - Эффективность обучения: Ultralytics предоставляет автоматическую загрузку наборов данных и предварительно обученные веса, оптимизируя конвейер от сбора данных до обучения модели.
- Универсальность развертывания: Обе модели поддерживают экспорт в один клик в такие форматы, как ONNX, TensorRT, CoreML и TFLite, что облегчает развертывание на различном оборудовании, включая Raspberry Pi, мобильные телефоны и облачные экземпляры.
- Хорошо поддерживается: Частые обновления обеспечивают совместимость с последними версиями PyTorch и CUDA, при поддержке активного сообщества в Discord и GitHub.
Заключение и рекомендации
В то время как YOLOv8 остается надежной и очень способной моделью, подходящей для поддержания устаревших систем, YOLO11 является явной рекомендацией для всех новых разработок.
- Выберите YOLO11, если: Вам нужна максимально возможная точность, более высокая скорость inference (особенно на CPU) или вы выполняете развертывание на периферийных устройствах с ограниченными ресурсами, где память и хранилище имеют первостепенное значение. Его архитектурные улучшения обеспечивают перспективную основу для коммерческих приложений.
- Выберите YOLOv8, если: У вас есть существующий конвейер, сильно настроенный на конкретное поведение v8, или вы ограничены строгими требованиями проекта, которые не позволяют обновить его до последней архитектуры.
Для тех, кто заинтересован в изучении других архитектур, документация Ultralytics также охватывает такие модели, как YOLOv9, YOLOv10 и RT-DETR. Вы можете просмотреть более широкие сравнения на нашей странице сравнения моделей.