YOLOv8 против YOLO11: техническое сравнение
Сравнение Ultralytics YOLOv8 и YOLO11 для обнаружения объектов показывает достижения в области компьютерного зрения в реальном времени. Обе модели, разработанные компанией Ultralytics, отличаются скоростью и точностью, но удовлетворяют несколько разным потребностям и основаны на различных архитектурных решениях. На этой странице представлено подробное техническое сравнение, которое поможет пользователям понять их ключевые различия и идеальные области применения.
YOLOv8 Обзор
YOLOv8представленный компанией Ultralytics 2023-01-10, представляет собой значительную итерацию в серии YOLO . В YOLOv8 , авторами которого являются Гленн Джочер, Аюш Чаурасия и Цзин Цю, основное внимание уделяется универсальности и простоте использования в ряде задач технического зрения, включая обнаружение объектов, сегментацию, классификацию и оценку позы. Она построена на основе предыдущих архитектур YOLO , но включает в себя усовершенствования для повышения производительности и гибкости. В документацииYOLOv8 подчеркивается удобство использования, что делает его доступным как для новичков, так и для опытных специалистов в области обнаружения объектов.
Архитектура и ключевые особенности:
YOLOv8 поддерживает одноэтапную парадигму обнаружения без якорей, оптимизируя архитектуру модели и упрощая процесс обучения. Ключевые архитектурные особенности включают:
- Магистраль: Использует усовершенствованную основу CSPDarknet, оптимизированную для эффективности извлечения признаков.
- Шея: Используется кросс-ступенчатая парциальная сеть C2f в шее для улучшения слияния признаков, улучшения потока информации и распространения градиента.
- Головка: головка с раздельным обнаружением разделяет задачи классификации и регрессии, способствуя повышению точности и ускорению сходимости.
Метрики производительности:
YOLOv8 достигает наилучшей производительности при различных размерах модели. Для обнаружения объектов на наборе данных COCO YOLOv8x, самый большой вариант, достигает 53,9 mAPval50-95, а нановерсия YOLOv8n- 37,3 mAPval50-95, обеспечивая баланс между точностью и скоростью. Скорость вычислений варьируется от 80,4 мс на CPU ONNX для YOLOv8n до 479,1 мс для YOLOv8x, что дает возможность выбора для различных вычислительных ограничений. Изучите подробные показатели производительностиYOLOv8 .
Примеры использования:
Универсальность YOLOv8 позволяет использовать его в широком спектре приложений, от систем охранной сигнализации и развертывания "умных городов" до передовых приложений в здравоохранении и производстве. Сбалансированные характеристики делают его отличным выбором для проектов, требующих сочетания точности и скорости.
Сильные стороны:
- Универсальная поддержка задач: Обнаружение, сегментация, классификация и оценка позы.
- Высокая точность и скорость: Обеспечивает хороший баланс между mAP и скоростью вывода.
- Удобство для пользователя: хорошо документированная и простая в использовании система Ultralytics Python и CLI Интерфейсы.
- Активное сообщество: Benefits from a large community and continuous updates from Ultralytics.
Слабые стороны:
- Ресурсоемкость: Большие модели требуют значительных вычислительных ресурсов для обучения и развертывания.
- Необходимость оптимизации: Может потребоваться дополнительная оптимизация в условиях крайней ограниченности ресурсов.
Обзор YOLO11
YOLO11Последняя модель от Ultralytics, выпущенная 2024-09-27, авторами которой являются Гленн Джочер и Цзин Цю, развивает серию YOLO , стремясь к дальнейшему повышению эффективности и производительности. Разделяя основную философию скорости и точности, YOLO11 вводит архитектурные усовершенствования, направленные на оптимизацию скорости вывода без существенного ущерба для точности. В документации кYOLO11 подчеркивается его передовой характер и пригодность для использования в приложениях реального времени.
Архитектура и ключевые особенности:
YOLO11 также использует одноэтапный подход без использования якорей, фокусируясь на упрощенном дизайне и эффективных вычислениях. Ключевые архитектурные аспекты включают:
- Эффективная магистраль: Используется оптимизированная архитектура магистрали, которая снижает вычислительные затраты при сохранении возможностей извлечения признаков.
- Дизайн шеи: Усовершенствованная структура шеи, которая улучшает агрегирование признаков с меньшим количеством параметров, способствуя более быстрому выводу.
- Оптимизированная головка: головка обнаружения разработана для минимальной задержки, приоритет отдается скорости на последних слоях предсказания.
Метрики производительности:
YOLO11 демонстрирует конкурентоспособную производительность с акцентом на повышение скорости. При обнаружении объектов на наборе данных COCO модель YOLO11x достигает немного более высокого показателя mAPval50-95 - 54,7 по сравнению с YOLOv8x, сохраняя при этом более высокую скорость вывода на CPU и достигая сопоставимой скорости на GPU. Модель YOLO11n достигает 39,5 mAPval50-95, демонстрируя улучшения по сравнению с YOLOv8n. Скорость вычислений заметно выше на CPU: у YOLO11n она составляет 56,1 мс, а у YOLO11x - 462,8 мс, что делает ее подходящей для приложений, CPU. Подробные бенчмарки см. в метрике производительностиYOLO11 .
Примеры использования:
YOLO11 особенно хорошо подходит для приложений, где скорость вывода данных имеет первостепенное значение, таких как анализ видео в реальном времени, робототехника и краевые устройства с ограниченными вычислительными ресурсами. Благодаря своей эффективности он идеально подходит для применения в сценариях, требующих быстрого обнаружения объектов без ущерба для точности. Сферы применения включают утилизацию отходов, охрану окружающей среды и автомобильные решения.
Сильные стороны:
- Превосходная скорость вывода: Разработан для более быстрого вывода, особенно на CPU.
- Конкурентоспособная точность: Поддерживает высокую точность, часто превышающую точность YOLOv8 в моделях меньшего размера.
- Эффективная архитектура: Оптимизирована для сред с ограниченными ресурсами и пограничного развертывания.
- Новейшая модель Ultralytics : Преимущества самых последних достижений и поддержки Ultralytics.
Слабые стороны:
- Незначительный прирост точности в больших моделях: Более крупные модели YOLO11 демонстрируют лишь незначительное повышение точности по сравнению с YOLOv8 , но при этом требуют больших вычислительных затрат.
- Более новая модель: По сравнению с YOLOv8, эта новая модель может иметь меньшее сообщество и меньшее количество сторонних интеграций.
Сравнительная таблица моделей
Модель | размер (пикселей) |
mAPval 50-95 |
Скорость CPU ONNX (мс) |
Скорость T4TensorRT10 (мс) |
params (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Заключение
Выбор между YOLOv8 и YOLO11 зависит от конкретных требований к применению. YOLOv8 - это надежное и универсальное решение, подходящее для широкого спектра задач и обеспечивающее эффективный баланс между точностью и скоростью. Это зрелая и хорошо поддерживаемая модель, идеально подходящая для задач обнаружения объектов общего назначения. YOLO11, с другой стороны, разработан для оптимизации скорости, что делает его лучшим выбором, когда время вывода критически важно, особенно в сценариях CPU или пограничных вычислений. Для приложений, требующих максимально возможной производительности в реальном времени при конкурентоспособной точности, YOLO11 является предпочтительным выбором.
Пользователи, заинтересованные в изучении других моделей, также могут рассмотреть этот вариант:
- YOLOv5: Для хорошо зарекомендовавшей себя и широко используемой модели с большим сообществом. СравнениеYOLOv5 и YOLOv8 .
- YOLOv9: Для моделей, ориентированных на повышение точности и архитектурные инновации. Документация YOLOv9.
- FastSAM: Для задач чрезвычайно быстрой сегментации. Документация поFastSAM .