YOLOv8 против YOLO11: Всестороннее техническое сравнение моделей компьютерного зрения реального времени
Быстрое развитие компьютерного зрения во многом обусловлено постоянными достижениями в области фреймворков для обнаружения объектов в реальном времени. Для разработчиков и исследователей, ориентирующихся в современном ландшафте, выбор правильной модели имеет решающее значение для баланса между точностью, скоростью и эффективностью использования ресурсов. В этом техническом сравнении мы рассмотрим различия между двумя фундаментальными моделями из экосистемы Ultralytics: Ultralytics YOLOv8 и Ultralytics YOLO11.
Обе модели демонстрируют отличительные особенности архитектур Ultralytics—простоту использования, хорошо поддерживаемую экосистему и беспрецедентную эффективность обучения с низкими требованиями к памяти. Давайте углубимся в их архитектурные проекты, бенчмарки производительности и идеальные сценарии развертывания.
Обзоры моделей
Прежде чем сравнивать их конкретные технические достоинства, полезно установить происхождение и основные характеристики обеих моделей.
Ultralytics YOLOv8
Выпущенный как значительный прорыв в начале 2023 года, YOLOv8 представил безанкерное detect и значительные улучшения функций потерь, быстро став золотым стандартом для широкого спектра задач машинного обучения.
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 2023-01-10
- GitHub:ultralytics/ultralytics
Ultralytics YOLO11
Основываясь на успехе своих предшественников, YOLO11 усовершенствовал основную архитектуру, чтобы еще дальше продвинуть границу Парето точности и задержки, представив высокооптимизированное количество параметров без ущерба для предсказательной способности.
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 2024-09-27
- GitHub:ultralytics/ultralytics
Другие архитектуры
Если вы изучаете альтернативные подходы, Ultralytics также поддерживает модели на основе трансформеров, такие как RT-DETR, и детекторы с открытым словарем без обучения (zero-shot), такие как YOLO-World. Однако для оптимальной задержки и эффективности памяти стандартные архитектуры YOLO обычно остаются предпочтительным выбором.
Архитектурные и методологические различия
Переход от YOLOv8 к YOLO11 представляет собой тщательную эволюцию в проектировании нейронных сетей, а не полную переработку, обеспечивая стабильность хорошо поддерживаемой экосистемы вокруг моделей.
Оптимизации Backbone и Neck
YOLOv8 представил оптимизированный CNN-бэкбон, который отошел от традиционных якорных рамок, рассматривая обнаружение объектов исключительно как задачу предсказания центральной точки. Этот безъякорный подход значительно снизил сложность регрессии ограничивающих рамок. YOLO11 взял эту основу и представил оптимизированную сеть пирамиды признаков (FPN), а также модифицировал блоки C2f в модули C3k2. Эта модификация позволяет YOLO11 извлекать более богатые пространственные признаки, что приводит к лучшей точности на более мелких объектах, обычно встречающихся в наборе данных COCO.
Требования к памяти и эффективность обучения
Одним из наиболее заметных преимуществ как YOLOv8, так и YOLO11 являются их низкие требования к памяти во время обучения. В отличие от ресурсоемких vision-трансформеров, которые могут легко исчерпать видеопамять на потребительском оборудовании, эти модели оптимизированы для доступного обучения на стандартных GPU с использованием PyTorch. YOLO11 обеспечивает существенное сокращение общего числа параметров — до 22% меньше параметров в большом (L) варианте по сравнению с YOLOv8 — при одновременном увеличении средней точности (mAP). Это означает более быстрые эпохи и меньший углеродный след при обучении моделей.
Метрики производительности
Чтобы по-настоящему оценить баланс производительности этих моделей, мы должны обратиться к объективным бенчмаркам. В таблице ниже сравниваются YOLOv8 и YOLO11 по стандартным вариантам масштабирования (от nano до extra-large).
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Как показано, YOLO11 стабильно превосходит YOLOv8 по точности, при этом используя меньше параметров и FLOPs. Скорость инференции на CPU, измеренная с использованием ONNX Runtime, подчеркивает превосходную эффективность YOLO11 для граничных развертываний. При экспорте в NVIDIA TensorRT обе модели обеспечивают исключительную задержку менее 15 мс, что крайне важно для анализа видеопотоков в реальном времени.
Экосистема и простота использования
Обе модели получают огромную выгоду от унифицированной ultralytics Пакет python. Этот простота использования позволяет инженерам бесшовно переключаться между YOLOv8 и YOLO11. Обучение, валидация и экспорт могут быть выполнены всего в нескольких строках кода.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model (you can simply swap to "yolov8n.pt")
model = YOLO("yolo11n.pt")
# Train the model efficiently on a local dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)
# Export the optimized model to ONNX
model.export(format="onnx")
Бесшовная интеграция распространяется на Ultralytics Platform, которая упрощает облачное обучение, мониторинг моделей и развертывание без необходимости глубоких знаний в области DevOps.
Универсальность и применение в реальных условиях
Основной отличительной чертой фреймворка Ultralytics является его присущая универсальность. Как YOLOv8, так и YOLO11 поддерживают широкий спектр задач компьютерного зрения, выходящих за рамки стандартного обнаружения объектов:
- Сегментация экземпляров: Высокоточные маски на уровне пикселей, полезные для медицинской визуализации и автономного вождения.
- Оценка позы: Обнаружение ключевых точек, адаптированное для спортивной аналитики и человеко-машинного взаимодействия.
- Классификация изображений: Легковесная категоризация с использованием базовых моделей, обученных на ImageNet.
- Ориентированные ограничивающие прямоугольники (obb): Критически важны для идентификации повернутых объектов на спутниковых снимках.
YOLOv8, будучи доступным дольше, может похвастаться обширным хранилищем обучающих материалов сообщества и тщательно протестированных корпоративных развертываний. Если вы интегрируетесь с устаревшими конвейерами, которые строго ожидают форм tensor'ов YOLOv8, он остается весьма надежным выбором. Однако для новых проектов, приоритетом которых является максимальная эффективность — например, развертывание на встраиваемых периферийных устройствах, таких как Raspberry Pi — YOLO11 является очевидным операционным победителем благодаря превосходному соотношению скорости к количеству параметров.
Сценарии использования и рекомендации
Выбор между YOLOv8 и YOLO11 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.
Когда выбирать YOLOv8
YOLOv8 является отличным выбором для:
- Универсальное многозадачное развертывание: Проекты, требующие проверенной модели для обнаружения, сегментации, классификации и оценки позы в экосистеме Ultralytics.
- Устоявшиеся производственные системы: Существующие производственные среды, уже построенные на архитектуре YOLOv8 со стабильными, хорошо протестированными конвейерами развертывания.
- Широкая поддержка сообщества и экосистемы: Приложения, использующие обширные учебные пособия, сторонние интеграции и активные ресурсы сообщества YOLOv8.
Когда следует выбирать YOLO11
YOLO11 рекомендуется для:
- Промышленное периферийное развертывание: Коммерческие приложения на таких устройствах, как Raspberry Pi или NVIDIA Jetson, где надежность и активное обслуживание имеют первостепенное значение.
- Многозадачные приложения компьютерного зрения: Проекты, требующие detect, сегментации, оценки позы и obb в рамках единой унифицированной среды.
- Быстрое прототипирование и развертывание: Команды, которым необходимо быстро перейти от сбора данных к производству, используя оптимизированный Ultralytics Python API.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Передовой край: Преимущество YOLO26
Хотя YOLOv8 и YOLO11 являются феноменальными архитектурами, ландшафт ИИ постоянно меняется. Для разработчиков, стремящихся к абсолютному передовому уровню в 2026 году, Ultralytics YOLO26 представляет собой следующий монументальный шаг вперед.
YOLO26 фундаментально переосмысливает конвейер развертывания. Он обладает сквозной архитектурой без NMS, прорывным подходом, впервые примененным в YOLOv10, который устраняет сложные этапы постобработки. Кроме того, исключение DFL (Distribution Focal Loss) значительно упрощает логику экспорта и улучшает совместимость с маломощными периферийными устройствами, что приводит к до 43% более быстрой инференции на CPU по сравнению с его предшественниками.
Стабильность обучения и скорость сходимости значительно улучшены благодаря новому оптимизатору MuSGD, гибриду, вдохновленному методами обучения LLM. Кроме того, новые формулировки функций потерь, такие как ProgLoss + STAL, значительно улучшают распознавание мелких объектов — исторически сложную задачу для IoT и робототехники. Благодаря улучшениям, специфичным для задач, таким как RLE для оценки позы и многомасштабный прототип для segment, YOLO26 не имеет себе равных.
Выбор подходящей модели
Начните свой путь с YOLOv8, если вам нужна обширная поддержка сообщества для устаревших версий. Обновитесь до YOLO11 для высокоточной балансировки скорости и уменьшенного количества параметров. Переходите к YOLO26 для совершенной, оптимизированной для периферийных устройств архитектуры будущего без NMS.
Заключение
Выбор между YOLOv8 и YOLO11 в конечном итоге сводится к срокам вашего проекта и аппаратным ограничениям. YOLOv8 — это проверенный временем титан индустрии, предлагающий непревденную стабильность. Напротив, YOLO11 улучшает эту архитектуру, обеспечивая более высокий mAP при меньшем количестве параметров, что делает его чрезвычайно привлекательным для граничных приложений с ограниченными ресурсами. Независимо от вашего выбора, бесшовный Ultralytics Python API гарантирует, что ваш рабочий процесс разработки останется гибким, эффективным и полностью поддерживаемым. А когда вы будете готовы расширить границы возможного на граничных устройствах, YOLO26 будет готов и ждать.