YOLO11 против YOLOv8: Подробное сравнение
При выборе модели компьютерного зрения, особенно для обнаружения объектов, важно понимать сильные и слабые стороны различных архитектур. На этой странице представлено подробное техническое сравнение Ultralytics YOLO11 и Ultralytics YOLOv8, двух современных моделей, предназначенных для обнаружения объектов и других задач компьютерного зрения. Мы проанализируем их архитектурные нюансы, эталонные показатели производительности и подходящие приложения, чтобы помочь вам принять обоснованное решение для вашего следующего AI проекта.
Ultralytics YOLO11
Авторы: Гленн Джокер, Цзин Цю
Организация: Ultralytics
Дата: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo11/
Ultralytics YOLO11 представляет собой новейшую эволюцию в серии YOLO, разработанную для повышения точности и эффективности. Основываясь на прочном фундаменте предыдущих моделей YOLO, YOLO11 представляет архитектурные усовершенствования, направленные на улучшение точности обнаружения при сохранении исключительной производительности в реальном времени. Это очень универсальная модель, поддерживающая широкий спектр задач, включая сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Архитектура и ключевые особенности
YOLO11 включает в себя достижения в структуре сети для оптимизации извлечения и обработки признаков. Он достигает более высокой точности с меньшим количеством параметров и FLOPs по сравнению со своими предшественниками, такими как YOLOv8, как показано в таблице производительности ниже. Эта эффективность приводит к более высокой скорости инференса и снижению вычислительных требований, что делает его пригодным для развертывания на различных платформах, от периферийных устройств до мощной облачной инфраструктуры. Ключевым преимуществом YOLO11 является его полная интеграция в хорошо поддерживаемую экосистему Ultralytics, которая обеспечивает эффективные процессы обучения, легкодоступные предварительно обученные веса и меньшее использование памяти по сравнению со многими другими типами моделей.
Сильные стороны
- Превосходная точность: Достигает самых современных показателей mAP, постоянно превосходя YOLOv8 при аналогичных размерах моделей.
- Высокоэффективный инференс: Обеспечивает значительно более высокую скорость обработки, особенно на CPU, что критически важно для приложений реального времени в средах с ограниченными ресурсами.
- Универсальность в многозадачности: Единая унифицированная платформа поддерживает несколько задач компьютерного зрения, упрощая процессы разработки.
- Оптимизированный и масштабируемый: Хорошо работает на различном оборудовании, эффективно используя память и имея меньшую вычислительную нагрузку.
- Простота использования: Преимущества упрощенного API Ultralytics, обширной документации и активной поддержки сообщества на GitHub и в Discord.
Слабые стороны
- Как более новая модель, она может изначально иметь меньше интеграций со сторонними инструментами по сравнению с более устоявшейся YOLOv8.
- Самые большие модели (например, YOLO11x) по-прежнему требуют значительных вычислительных ресурсов, что является общей чертой детекторов высокой точности.
Случаи использования
Исключительный баланс точности и эффективности YOLO11 делает ее идеальным выбором для приложений, требующих точного и быстрого обнаружения объектов, таких как:
- Робототехника: Обеспечение навигации и взаимодействия с объектами в динамических средах для автономных систем.
- Системы безопасности: Улучшение передовых систем безопасности для обнаружения вторжений и мониторинга в реальном времени.
- Розничная аналитика: Улучшение управления запасами и анализа поведения клиентов для использования ИИ в розничной торговле.
- Промышленная автоматизация: Поддержка контроля качества и обнаружения дефектов в производстве.
Ultralytics YOLOv8
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/
Ultralytics YOLOv8 установила новый стандарт для обнаружения объектов в реальном времени после своего выпуска, быстро став одной из самых популярных моделей компьютерного зрения в мире. Она представила ключевые архитектурные изменения, такие как голова обнаружения без якорей и модуль магистральной сети C2f, которые обеспечили значительный скачок в производительности по сравнению с предыдущими версиями. Как и YOLO11, YOLOv8 — это универсальная многозадачная модель, которая была тщательно проверена в бесчисленных реальных приложениях.
Архитектура и ключевые особенности
В основе конструкции YOLOv8 лежит баланс между скоростью и точностью. Отсутствие anchor-ов уменьшает количество предсказаний bounding box-ов, упрощая конвейер постобработки и повышая скорость вывода. Модель обладает высокой масштабируемостью, с вариантами от легкой версии 'n' (nano) для мобильных и периферийных вычислений до мощной версии 'x' (extra-large) для максимальной точности. YOLOv8 полностью интегрирована в экосистему Ultralytics, используя простой API, подробные руководства и такие инструменты, как Ultralytics HUB для обучения и развертывания без программирования.
Сильные стороны
- Проверенная производительность: Высоконадежная и широко используемая модель, обеспечивающая отличные результаты во всех поддерживаемых задачах.
- Превосходный компромисс между скоростью и точностью: Обеспечивает фантастический баланс, что делает его отличным выбором для широкого спектра приложений.
- Развитая экосистема: Преимуществами являются обширная поддержка сообщества, учебные пособия и интеграции со сторонними разработчиками, созданные с момента ее выпуска.
- Универсальность: Поддерживает тот же широкий спектр задач компьютерного зрения, что и YOLO11, что делает его мощным универсальным решением.
Слабые стороны
- Хотя она по-прежнему является одним из лидеров, ее обычно превосходит YOLO11 как по точности, так и по скорости логического вывода на CPU для всех размеров моделей.
- Более крупные модели имеют большее количество параметров и FLOPs по сравнению со своими аналогами YOLO11, что приводит к более высоким вычислительным требованиям.
Случаи использования
YOLOv8 остается мощной и весьма актуальной моделью, превосходно проявляющей себя в приложениях, где она широко развернута и протестирована:
- Сельское хозяйство: Используется для мониторинга посевов, обнаружения вредителей и оценки урожайности в интеллектуальном сельском хозяйстве.
- Здравоохранение: Помогает в анализе медицинских изображений для таких задач, как обнаружение клеток или аномалий.
- Экологический мониторинг: Используется для отслеживания дикой природы и мониторинга изменений окружающей среды.
- Умные города: Обеспечивает работу таких приложений, как управление трафиком и мониторинг общественной безопасности.
Прямое сравнение производительности: YOLO11 против YOLOv8
Основное различие между YOLO11 и YOLOv8 заключается в их метриках производительности. YOLO11 стабильно обеспечивает более высокую точность (mAP) с более эффективной архитектурой, что приводит к меньшему количеству параметров и FLOPs. Эта архитектурная оптимизация особенно заметна в скорости инференса на CPU, где модели YOLO11 значительно быстрее, чем их эквиваленты YOLOv8. В то время как YOLOv8n имеет небольшое преимущество в задержке GPU, модели YOLO11 от 's' до 'x' также быстрее на GPU, что делает YOLO11 лучшим выбором для большинства новых проектов.
Модель | размер (пиксели) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4 TensorRT10 (мс) |
параметры (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
Архитектурная Эволюция и Экосистема
YOLO11 является прямым развитием YOLOv8, опираясь на его успешные принципы проектирования и внедряя целевые оптимизации. Обе модели разделяют одну и ту же основную философию: быть быстрыми, точными и простыми в использовании. Они разрабатываются и поддерживаются в рамках унифицированного репозитория Ultralytics, обеспечивая единообразный и оптимизированный пользовательский интерфейс.
Эта общая экосистема является большим преимуществом для разработчиков. Перенос проекта с YOLOv8 на YOLO11 не представляет сложности, что позволяет командам использовать преимущества более новой модели с минимальными изменениями в коде. Экосистема предоставляет:
- Простой и последовательный API для обучения, валидации и прогнозирования.
- Обширная документация с многочисленными руководствами и примерами.
- Эффективные процессы обучения с готовыми предварительно обученными весами на наборах данных, таких как COCO.
- Более низкие требования к памяти во время обучения и инференса по сравнению с другими типами моделей, такими как Transformers.
- Активное сообщество с открытым исходным кодом для поддержки и сотрудничества.
Заключение: какую модель вам следует выбрать?
Для новых проектов или проектов, требующих максимально возможной производительности, YOLO11 — очевидный выбор. Он предлагает превосходную точность и более высокую скорость логического вывода, особенно на CPU, с более эффективной архитектурой. Его усовершенствования делают его новым современным решением для обнаружения объектов в реальном времени.
YOLOv8 остается превосходной и очень надежной моделью. Это отличный вариант для существующих проектов, которые уже оптимизированы для ее архитектуры, или в сценариях, где ее обширный послужной список и большое количество сторонних интеграций являются ключевым фактором.
В конечном счете, обе модели представляют собой вершину обнаружения объектов в реальном времени, и выбор зависит от конкретных потребностей вашего проекта. Однако, благодаря своим явным преимуществам в производительности и бесшовной интеграции в экосистему Ultralytics, YOLO11 готова стать новым стандартом для разработчиков и исследователей.
Изучите другие модели
Хотя YOLO11 и YOLOv8 являются лидерами, область компьютерного зрения постоянно развивается. Вам также может быть интересно сравнить их с другими мощными моделями, доступными в экосистеме Ultralytics, такими как YOLOv10, YOLOv9 и RT-DETR на основе трансформеров. Изучите наш полный спектр сравнений моделей, чтобы найти идеальный вариант для вашего проекта.