Ultralytics YOLOv8 YOLO11: эволюция архитектуры и анализ производительности
Архитектуры обнаружения объектов быстро развиваются, и каждая новая версия приносит значительные улучшения в точности, скорости и удобстве использования. Ultralytics YOLOv8, выпущенная в начале 2023 года, установила новый стандарт универсальности и простоты использования в компьютерном зрении. В конце 2024 года Ultralytics YOLO11 , усовершенствовав архитектуру для еще большей эффективности и производительности в более широком спектре задач.
В этом подробном руководстве сравниваются эти две мощные модели, анализируются их архитектурные различия, показатели производительности и идеальные варианты использования, чтобы помочь вам выбрать подходящий инструмент для вашего следующего проекта в области компьютерного зрения.
Обзор модели
Прежде чем углубляться в технические характеристики, необходимо понять контекст и цели, стоящие за разработкой каждой модели. Обе модели являются результатом стремления Ultralytics создать доступную, современную систему искусственного интеллекта для обработки изображений.
Ultralytics YOLOv8
Выпущенный в январе 2023 года, YOLOv8 важной вехой, объединив несколько задач — обнаружение, сегментацию, классификацию, оценку позы и OBB — в рамках единого, удобного для пользователя API. Он представил новую основу и анкерную головку обнаружения, что сделало его очень универсальным для различных приложений.
Ключевые детали:
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 10 января 2023 г.
- Документация:Документация YOLOv8
- GitHub:Репозиторий Ultralytics
Ultralytics YOLO11
Запущенная в сентябре 2024 года, YOLO11 на прочной основе YOLOv8. Она фокусируется на усовершенствовании архитектуры для повышения эффективности извлечения признаков и скорости обработки. YOLO11 для обеспечения более высокой точности с меньшим количеством параметров, что делает ее особенно эффективной для приложений реального времени.
Ключевые детали:
- Авторы: Гленн Джочер и Цзин Цю
- Организация:Ultralytics
- Дата: 27 сентября 2024 г.
- Документация:Документация YOLO11
- GitHub:Репозиторий Ultralytics
Последняя инновация: YOLO26
Хотя YOLO11 значительный скачок по сравнению с YOLOv8, разработчики, стремящиеся к абсолютному передовому уровню, должны изучить YOLO26. Выпущенная в 2026 году, она представляет собой комплексную конструкцию NMS, оптимизатор MuSGD и до 43% более быстрое CPU , устанавливая новый стандарт для искусственного интеллекта производственного уровня.
Архитектурные различия
Переход от YOLOv8 YOLO11 несколькими ключевыми изменениями в архитектуре, направленными на оптимизацию соотношения между вычислительными затратами и точностью.
Базовая сеть и извлечение признаков
YOLOv8 модифицированную основу CSPDarknet53 с модулями C2f, которые заменили модули C3 предыдущих поколений. Такая конструкция улучшила градиентный поток и богатство функций.
YOLO11 этот эффект за счет усовершенствования структур узких мест и механизмов внимания в основной структуре. Эти изменения позволяют модели улавливать более сложные паттерны и пространственные иерархии с меньшими вычислительными затратами. Это особенно полезно для сложных задач, таких как обнаружение мелких объектов на аэрофотоснимках или контроль качества производства.
Архитектура головки
Обе модели используют головы без якорей, что упрощает процесс обучения и улучшает обобщение для объектов различной формы. Однако YOLO11 более продвинутые методы слияния характеристик в шее и голове, что обеспечивает лучшую точность локализации и разделение классов по сравнению с YOLOv8.
Анализ производительности
При выборе модели для производства важную роль играют такие показатели, как средняя точность (mAP), скорость вывода и размер модели. В таблице ниже приведено подробное сравнение предварительно обученных весов на COCO .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Основные выводы по производительности
- Эффективность: YOLO11 всегда легче (меньше параметров) и быстрее (меньшая задержка) своих YOLOv8 , при этом обеспечивая более высокую точность. Например, YOLO11n примерно на 22 % быстрееONNX CPU , чем YOLOv8n демонстрируя более высокий mAP.
- Вычисления: YOLO11 уменьшенному количеству FLOP в YOLO11 эта система YOLO11 отличным выбором для устройств с батарейным питанием или ограниченными ресурсами, таких как мобильные телефоны или встроенные датчики IoT.
- Точность: mAP в YOLO11, особенно в более компактных вариантах модели (Nano и Small), имеют большое значение для приложений, требующих высокой надежности без использования тяжелого оборудования.
Обучение и простота использования
Одной из определяющих сильных сторон Ultralytics является унифицированный и упрощенный пользовательский интерфейс. YOLOv8 YOLO11 один и тот же интуитивно понятный API, что позволяет разработчикам переключаться между архитектурами с помощью одной строки кода.
Преимущество Ultralytics
В отличие от сложных моделей трансформаторов, которые часто требуют огромного объема GPU и сложной настройки, Ultralytics оптимизированы для эффективности обучения. Их можно эффективно обучать на графических процессорах потребительского класса, что делает высокопроизводительный ИИ доступным для всех.
Обе модели имеют следующие общие характеристики:
- Простой Python : загрузка, обучение и развертывание моделей за считанные минуты.
- Подробная документация: исчерпывающие руководства по настройке гиперпараметров, увеличению объема данных и развертыванию.
- Интеграция в экосистему: беспроблемная совместимость с Ultralytics для управления наборами данных, удаленного обучения и экспорта моделей в один клик.
Пример обучения:
Следующий код демонстрирует, как легко можно переключаться между обучением YOLOv8 YOLO11.
from ultralytics import YOLO
# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Train YOLOv8
model_v8.train(data="coco8.yaml", epochs=100, imgsz=640)
# Load a YOLO11 model - Same API!
model_11 = YOLO("yolo11n.pt")
# Train YOLO11
model_11.train(data="coco8.yaml", epochs=100, imgsz=640)
Идеальные варианты использования
Хотя обе модели обладают высокой производительностью, их специфические преимущества делают их подходящими для разных сценариев.
Когда выбирать YOLOv8
YOLOv8 надежным и проверенным выбором, особенно для:
- Устаревшие проекты: существующие конвейеры, уже оптимизированные для YOLOv8 требуют стабильности без немедленной необходимости архитектурных обновлений.
- Широкие ресурсы сообщества: благодаря более длительному присутствию на рынке, YOLOv8 обширной библиотекой сторонних учебных материалов, видеороликов и реализаций сообщества.
- Общее назначение: отлично подходит для стандартных задач обнаружения объектов, где экстремальная оптимизация краев не является основным ограничением.
Когда следует выбирать YOLO11
YOLO11 рекомендуемым выбором для большинства новых развертываний, особенно для:
- Edge Computing: благодаря меньшему количеству параметров и более высокой скорости вывода, эта технология идеально подходит для Raspberry Pi, Jetson Nano и мобильных устройств.
- Приложения реального времени: критически важные для таких задач, как автономное вождение или высокоскоростные производственные линии, где важна каждая миллисекунда задержки.
- Сложные задачи: усовершенствования архитектуры повышают производительность в сложных сценариях, таких как оценка позы для спортивной аналитики или сегментация экземпляров для медицинской визуализации.
Универсальность в различных задачах
YOLOv8 YOLO11 широкий спектр задач, выходящих за рамки простого обнаружения ограничивающих рамок, включая сегментацию экземпляров, оценку позы, ориентированные ограничивающие рамки (OBB) и классификацию. Такая универсальность позволяет разработчикам решать многогранные проблемы с помощью одной единственной платформы.
Заключение
Как YOLOv8 YOLO11 вершину эффективного компьютерного зрения. YOLOv8 установил универсальный, удобный для пользователя стандарт, который лежит в основе бесчисленных приложений искусственного интеллекта по всему миру. YOLO11 усовершенствует это наследие, предлагая оптимизированную, более быструю и точную архитектуру, которая расширяет границы возможностей периферийных устройств.
Для разработчиков, начинающих сегодня новые проекты, YOLO11 предлагает превосходный баланс скорости и точности. Однако тем, кто требует самых последних инноваций, таких как сквозное обнаружение NMS и оптимизированные функции потерь, мы настоятельно рекомендуем ознакомиться с недавно выпущенным YOLO26, который представляет собой будущее искусственного интеллекта в области зрения в реальном времени.
Дополнительная литература
- Показатели производительности YOLO: объяснение
- Руководство по экспорту моделей (ONNX, TensorRT, CoreML)
- Ultralytics : простое обучение и развертывание
- Применение искусственного интеллекта в реальном мире
Другие модели для изучения
- YOLO26: новейшая ультрасовременная модель от Ultralytics январь 2026 г.) с дизайном NMS.
- RT-DETR: Детектор на основе трансформера, обеспечивающий высокую точность для сценариев, где скорость менее критична.
- SAM 2: Модель Segment Anything от Meta, идеально подходящая для задач сегментации с нулевым обучением.