YOLO11 против DAMO-YOLO: техническое сравнение
В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. На этой странице представлено подробное техническое сравнение между Ultralytics YOLO11 и YOLO, двух высокопроизводительных архитектур, созданных для обеспечения скорости и точности. В то время как YOLO представляет инновационные методы из академических исследований, YOLO11 выделяется как универсальное, готовое к производству решение, поддерживаемое надежной экосистемой.
Исполнительное резюме
Ultralytics YOLO11 Представляет собой новейшую разработку в серии YOLO , оптимизирующую вывод данных в реальном времени на различных аппаратных средствах, от пограничных устройств до облачных серверов. Она поддерживает множество задач, включая обнаружение, сегментацию и оценку позы, что делает ее унифицированным решением для сложных конвейеров искусственного интеллекта.
YOLO, разработанный компанией Alibaba Group, нацелен на достижение баланса между скоростью и точностью обнаружения с помощью нейронной архитектуры поиска (NAS) и новых методов объединения признаков. Это в первую очередь ориентированный на исследования детектор, оптимизированный для работы с GPU .
Ultralytics YOLO11
Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11
YOLO11 совершенствует современные технологии, внедряя архитектурные улучшения, которые улучшают извлечение признаков при сохранении высокой эффективности. Он использует модифицированную основу CSPNet и усовершенствованную безъякорную головку для обеспечения высокой точности при меньшем количестве параметров по сравнению с предыдущими поколениями.
Ключевые особенности и преимущества
- Универсальность: В отличие от многих специализированных моделей, YOLO11 является многозадачным фреймворком. Он поддерживает обнаружение объектов, сегментацию объектов, классификацию изображений, оценку позы и ориентированные ограничительные рамки (OBB).
- Усовершенствованная архитектура: Включает в себя блоки C3k2 и модули C2PSA (Cross-Stage Partial with Spatial Attention) для эффективного захвата сложных паттернов, улучшая производительность при работе с мелкими объектами и сложными фонами.
- Широкая поддержка аппаратного обеспечения: Оптимизировано для CPU и GPU , предлагая различные масштабы моделей (от Nano до X-Large), чтобы соответствовать ограничениям от Raspberry Pi до кластеров NVIDIA A100.
- Простота использования: API и CLI Ultralytics Python позволяют разработчикам обучать, проверять и развертывать модели с минимальным количеством кода.
Экосистема, готовая к производству
YOLO11 легко интегрируется с экосистемойUltralytics , включая инструменты для управления данными, обучения моделей через Ultralytics HUB и экспорта в такие форматы, как ONNX, TensorRT, TensorRT и CoreML.
DAMO-YOLO
Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
Organization:Alibaba Group
Date: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO
YOLO разработан с акцентом на низкую задержку и высокую пропускную способность для промышленных приложений. В семействе YOLO появилось несколько "новых технологий", позволяющих расширить границы компромисса между скоростью и точностью.
Архитектурные инновации
- MAE-NAS Backbone: Использует нейронный поиск архитектуры (NAS), ориентируясь на среднюю абсолютную ошибку (MAE), для автоматического определения эффективной топологии сети.
- Эффективная RepGFPN: Обобщенная сеть пирамид признаков (GFPN), использующая повторную параметризацию, что позволяет объединять сложные признаки в процессе обучения и сворачивать их в более быструю и простую структуру в процессе вывода.
- ZeroHead: облегченная головка обнаружения, которая разделяет задачи классификации и регрессии, значительно снижая вычислительные затраты на конечные выходные слои.
- AlignedOTA: усовершенствованная стратегия присвоения меток, которая решает проблему несоответствия между достоверностью классификации и точностью регрессии во время обучения.
Несмотря на то, что YOLO превосходит всех в определенных метриках, это в первую очередь исследовательский репозиторий. Ему не хватает обширной документации, постоянных обновлений и широкой поддержки сообщества, которые есть в экосистеме Ultralytics .
Метрики производительности: Head-to-Head
В следующей таблице приведено сравнение производительности YOLO11 и YOLO на наборе данныхCOCO val2017. Ключевые показатели включают среднюю точностьmAP) и скорость вычислений на CPU и GPU .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Анализ результатов
- Превосходство в эффективности: YOLO11 демонстрирует превосходство в эффективности использования параметров. Например, модель YOLO11m достигает 51,5 mAP при использовании всего 20,1 миллиона параметров, в то время как сопоставимая модель DAMO-YOLOm отстает на 49,2 mAP при большем объеме в 28,2 миллиона параметров.
- Предельная точность: Самый большой вариант, YOLO11x, достигает поразительной точности 54,7 mAP, превосходя самую большую модель YOLO из перечисленных. Это делает YOLO11 предпочтительным выбором для высокоточных задач, таких как медицинская визуализация или дефектоскопия.
- Граничное развертывание: Модель YOLO11n (Nano) исключительно легкая (2,6 М параметров) и быстрая (1,5 мс на T4), что делает ее идеальной для встраиваемых систем, где не хватает памяти. В отличие от этого, самая маленькая модель YOLO значительно тяжелее (8,5 М параметров).
- ПроизводительностьCPU : Ultralytics предоставляет прозрачные бенчмарки CPU , подчеркивая жизнеспособность YOLO11 для развертывания без специальных ускорителей. YOLO официально не сообщает о скорости CPU , что ограничивает его оценку для маломощных IoT-приложений.
Техническое погружение
Обучение и архитектура
YOLO в значительной степени полагается на нейронный поиск архитектуры (NAS) для определения своей основы. Хотя теоретически это может дать оптимальные структуры, в результате часто получаются нерегулярные блоки, которые могут не подходить для аппаратного обеспечения всех устройств. В отличие от этого, в YOLO11 используются вручную созданные, уточненные блоки (C3k2, C2PSA), которые интуитивно понятны для стандартных GPU и библиотек ускорения CPU .
YOLO11 также уделяет особое внимание эффективности обучения. Она быстро сходится благодаря оптимизированным гиперпараметрам и стратегиям дополнения данных. Его требования к памяти во время обучения в целом ниже, чем у сложных архитектур на основе трансформаторов или NAS, что позволяет исследователям обучать эффективные модели на аппаратном обеспечении потребительского класса.
Экосистема и удобство использования
Одним из наиболее значимых отличий является экосистема. YOLO - это прежде всего репозиторий кода для воспроизведения результатов научных исследований.
Ultralytics YOLO11, однако, является платформой полного цикла:
- Документация: Исчерпывающие руководства по каждому аспекту работы трубопровода.
- Интеграции: Встроенная поддержка MLFlow, TensorBoard и Weights & Biases для отслеживания экспериментов.
- Сообщество: Массивное, активное сообщество на GitHub и Discord, которое обеспечивает быстрое исправление ошибок и ответы на вопросы.
from ultralytics import YOLO
# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for deployment
path = model.export(format="onnx")
Рекомендации по применению
Когда стоит выбирать Ultralytics YOLO11
- Развертывание в реальных условиях: Если вам нужно развернуть систему на различных аппаратных средствах (например, наiOS, Android, Edge TPU, Jetson), возможности экспорта YOLO11 не имеют себе равных.
- Сложные конвейеры технического зрения: Если вашему проекту требуется нечто большее, чем просто ограничивающие рамки - например, отслеживание объектов или оценка позы тела, -YOLO11 справляется с этим нативно.
- Быстрое создание прототипов: Простота использования позволяет разработчикам за считанные минуты перейти от данных к рабочей демонстрации.
- Ограниченность ресурсов: Модели Nano и Small обеспечивают наилучшее соотношение точности и размера для устройств с батарейным питанием.
Когда стоит рассмотреть DAMO-YOLO
- Академические исследования: Исследователи, изучающие эффективность NAS в методах обнаружения объектов или перепараметризации, могут найти YOLO в качестве ценного базового уровня.
- Специфические конфигурации GPU : В сценариях, когда конкретные архитектурные блоки YOLO идеально совпадают с иерархией кэша целевого ускорителя, он может предложить конкурентоспособную пропускную способность.
Заключение
В то время как YOLO представляет такие впечатляющие академические концепции, как MAE-NAS и RepGFPN, Ultralytics YOLO11 остается лучшим выбором для подавляющего большинства разработчиков и предприятий. Его сочетание современной точности, легкой архитектуры и процветающей экосистемы обеспечивает не только высокую производительность, но и удобство обслуживания и масштабирования проектов.
Разработчикам, которые ищут надежное, универсальное и высокопроизводительное решение для компьютерного зрения, YOLO11 предоставляет инструменты и метрики, необходимые для достижения успеха в 2025 году и далее.
Изучите другие сравнения моделей
Чтобы лучше понять ландшафт моделей обнаружения объектов, изучите эти сравнения:
- YOLO11 против YOLOv10
- YOLO11 vs. YOLOv8
- DAMO-YOLO vs. RT-DETR
- DAMO-YOLO против YOLOX
- YOLO11 vs. EfficientDet