DAMO-YOLO против YOLO11: техническое сравнение
В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха приложения. В этом комплексном сравнении анализируются две важные архитектуры: YOLO, разработанная компанией Alibaba Group, и Ultralytics YOLO11новейшая современная модель от Ultralytics. Хотя обе модели нацелены на оптимизацию компромисса между скоростью и точностью, они служат разным основным целям и предлагают различные преимущества в зависимости от сценария развертывания.
В этом руководстве подробно рассматриваются их архитектуры, показатели производительности и идеальные варианты использования, чтобы помочь разработчикам и исследователям принять обоснованное решение.
DAMO-YOLO
Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
Organization:Alibaba Group
Date: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO
DocsYOLO
YOLO - это система обнаружения объектов, объединяющая несколько передовых технологий для достижения высокой производительности. Он ориентирован на снижение задержки при сохранении конкурентоспособной точности за счет ряда архитектурных инноваций, разработанных на основе исследований Alibaba.
Архитектура и инновации
YOLO использует подход "Distill-and-Select" и включает в себя следующие ключевые компоненты:
- MAE-NAS Backbone: Используя нейронную архитектуру поиска (NAS), магистраль оптимизируется под определенные ограничения, чтобы обеспечить эффективное извлечение признаков.
- Эффективная RepGFPN: Обобщенная сеть пирамид признаков (GFPN) в значительной степени использует механизмы репараметризации для улучшения слияния признаков в различных масштабах без больших вычислительных затрат при выводе.
- ZeroHead: эта легкая головка обнаружения разделяет задачи классификации и регрессии, стремясь максимизировать скорость вывода.
- AlignedOTA: стратегия присвоения меток, которая решает проблему несоответствия между целями классификации и регрессии, улучшая сходимость в процессе обучения.
Хотя YOLO демонстрирует впечатляющие теоретические достижения, это в первую очередь исследовательский фреймворк, ориентированный на обнаружение объектов. В нем, как правило, отсутствует встроенная поддержка многозадачности, характерная для более комплексных экосистем.
Ultralytics YOLO11
Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11
Ultralytics YOLO11 представляет собой вершину компьютерного зрения в реальном времени, совершенствуя наследие серии YOLO со значительными улучшениями в архитектуре, эффективности и простоте использования. Он создан не просто как модель, а как универсальный инструмент для практического применения в различных аппаратных средах.
Архитектура и экосистема
YOLO11 опирается на предыдущие успехи благодаря усовершенствованной безъякорной архитектуре. Она имеет улучшенную основу для превосходного извлечения функций и модифицированный дизайн шеи, который улучшает поток информации на разных уровнях.
Ключевые преимущества системы Ultralytics YOLO11 включают:
- Универсальность: В отличие от многих конкурентов, YOLO11 поддерживает широкий спектр задач, включая обнаружение объектов, сегментацию объектов, оценку позы, классификацию изображений и ориентированные ограничительные рамки (OBB).
- Простота использования: модель обернута в удобный API на Python и CLIчто делает ее доступной как для новичков, так и для экспертов.
- Эффективность обучения: Оптимизированный для ускорения сходимости, YOLO11 использует эффективное увеличение данных и функции потерь, позволяя пользователям обучать пользовательские модели на таких наборах данных, как COCO с меньшими затратами ресурсов.
- Хорошо поддерживаемая экосистема: Опираясь на Ultralytics пользователи получают преимущества от частых обновлений, обширной документации и бесшовной интеграции с такими инструментами MLOps, как Ultralytics HUB.
Знаете ли вы?
YOLO11 разработан для высокоэффективной работы на устройствах Edge AI. Его оптимизированная архитектура обеспечивает низкое потребление памяти и высокую скорость вычислений на таком оборудовании, как NVIDIA Jetson и Raspberry Pi, что делает его лучшим выбором для встраиваемых приложений по сравнению с более тяжелыми моделями на основе трансформаторов.
Сравнение производительности
Следующие диаграмма и таблица иллюстрируют различия в производительности между YOLO и YOLO11. Ultralytics YOLO11 неизменно демонстрирует превосходную точностьmAP) и высокую скорость вывода, особенно на CPU оборудовании, где YOLO не имеет официальных бенчмарков.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Анализ результатов
- Точность: YOLO11 значительно превосходит сопоставимые модели YOLO . Например, YOLO11m достигает 51,5 mAP, что заметно выше, чем у DAMO-YOLOm с 49,2 mAP, несмотря на меньшее количество параметров (20,1M против 28,2M).
- Скорость вывода: На GPU (T4 TensorRT) YOLO11 предлагает конкурентоспособную задержку. YOLO11n невероятно быстр - 1,5 мс, что делает его подходящим для приложений с ультранизкой задержкой.
- ПроизводительностьCPU : Основным преимуществом моделей Ultralytics является их прозрачность в отношении производительности CPU . YOLO11 оптимизирована для выводов на CPU с помощью ONNX и OpenVINO, в то время как YOLO в значительной степени ориентирован на GPU, часто оставляя производительность развертывания на CPU неопределенной.
- Эффективность модели: YOLO11 демонстрирует лучшее соотношение параметров и производительности. Архитектурная эффективность позволяет уменьшить размер файлов моделей, что приводит к ускорению загрузки и снижению требований к хранению данных на устройствах.
Ключевые отличия и варианты использования
Сильные стороны Ultralytics YOLO11
Разработчики, использующие Ultralytics YOLO11 получают доступ к надежной среде производственного уровня.
- Баланс производительности: Архитектура модели тщательно настраивается, чтобы обеспечить оптимальный компромисс между скоростью и точностью выводов, что очень важно для видеоаналитики в реальном времени.
- Многозадачность: Если объем вашего проекта расширяется от обнаружения до отслеживания или сегментации, YOLO11 легко справится с этим в рамках одной и той же кодовой базы.
- Простота использования: Параметр
ultralyticsПакет упрощает весь процесс. Загрузка модели, выполнение прогнозов и экспорт в такие форматы, как CoreML, TFLite или TensorRT , могут быть выполнены с помощью всего нескольких строк кода. - Меньшие требования к памяти: По сравнению с детекторами на основе трансформаторов или неоптимизированными архитектурами, YOLO11 обычно требует меньше памяти CUDA во время обучения, что позволяет исследователям проводить обучение на графических процессорах потребительского класса.
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
Сильные стороны YOLO
YOLO - сильный соперник в академических исследовательских кругах.
- Инновационные исследования: Такие функции, как MAE-NAS и ZeroHead, предлагают интересные идеи в области поиска нейронных архитектур и развязки голов.
- Пропускная способностьGPU : Для специфических промышленных приложений, работающих исключительно на поддерживаемых графических процессорах, YOLO обеспечивает высокую производительность, хотя часто отстает от YOLO11 по чистому показателю точности на параметр.
Заключение
В то время как YOLO представляет новые концепции от исследовательской группы Alibaba, Ultralytics YOLO11 является лучшим выбором для подавляющего большинства разработчиков и предприятий. Его превосходство определяется не только более высокими mAP и более быстрым выводом, но и обширной экосистемой, которая ее поддерживает.
Простота использования и универсальность, хорошо поддерживаемая кодовая база и активная поддержка сообщества - YOLO11 снижает барьер для создания передовых решений в области ИИ. Вне зависимости от того, развертывается ли YOLO11 на облачных серверах или на граничных устройствах с ограниченными ресурсами, он обеспечивает надежность и производительность, необходимые для современных приложений компьютерного зрения.
Изучите другие сравнения моделей
Чтобы лучше понять, как модели Ultralytics сравниваются с другими архитектурами, изучите наши подробные страницы сравнения:
- YOLO11 против YOLOv10
- YOLO11 vs. RT-DETR
- DAMO-YOLO против YOLOv8
- YOLO против YOLOv9
- YOLO11 vs. EfficientDet