Перейти к содержанию

YOLO11 против DAMO-YOLO: техническое сравнение

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. На этой странице представлено подробное техническое сравнение между Ultralytics YOLO11 и YOLO, двух высокопроизводительных архитектур, созданных для обеспечения скорости и точности. В то время как YOLO представляет инновационные методы из академических исследований, YOLO11 выделяется как универсальное, готовое к производству решение, поддерживаемое надежной экосистемой.

Исполнительное резюме

Ultralytics YOLO11 Представляет собой новейшую разработку в серии YOLO , оптимизирующую вывод данных в реальном времени на различных аппаратных средствах, от пограничных устройств до облачных серверов. Она поддерживает множество задач, включая обнаружение, сегментацию и оценку позы, что делает ее унифицированным решением для сложных конвейеров искусственного интеллекта.

YOLO, разработанный компанией Alibaba Group, нацелен на достижение баланса между скоростью и точностью обнаружения с помощью нейронной архитектуры поиска (NAS) и новых методов объединения признаков. Это в первую очередь ориентированный на исследования детектор, оптимизированный для работы с GPU .

Ultralytics YOLO11

Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 совершенствует современные технологии, внедряя архитектурные улучшения, которые улучшают извлечение признаков при сохранении высокой эффективности. Он использует модифицированную основу CSPNet и усовершенствованную безъякорную головку для обеспечения высокой точности при меньшем количестве параметров по сравнению с предыдущими поколениями.

Ключевые особенности и преимущества

  • Универсальность: В отличие от многих специализированных моделей, YOLO11 является многозадачным фреймворком. Он поддерживает обнаружение объектов, сегментацию объектов, классификацию изображений, оценку позы и ориентированные ограничительные рамки (OBB).
  • Усовершенствованная архитектура: Включает в себя блоки C3k2 и модули C2PSA (Cross-Stage Partial with Spatial Attention) для эффективного захвата сложных паттернов, улучшая производительность при работе с мелкими объектами и сложными фонами.
  • Широкая поддержка аппаратного обеспечения: Оптимизировано для CPU и GPU , предлагая различные масштабы моделей (от Nano до X-Large), чтобы соответствовать ограничениям от Raspberry Pi до кластеров NVIDIA A100.
  • Простота использования: API и CLI Ultralytics Python позволяют разработчикам обучать, проверять и развертывать модели с минимальным количеством кода.

Экосистема, готовая к производству

YOLO11 легко интегрируется с экосистемойUltralytics , включая инструменты для управления данными, обучения моделей через Ultralytics HUB и экспорта в такие форматы, как ONNX, TensorRT, TensorRT и CoreML.

Узнайте больше о YOLO11

DAMO-YOLO

Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang, and Xiuyu Sun
Organization:Alibaba Group
Date: 2022-11-23
Arxiv:https://arxiv.org/abs/2211.15444v2
GitHubYOLO

YOLO разработан с акцентом на низкую задержку и высокую пропускную способность для промышленных приложений. В семействе YOLO появилось несколько "новых технологий", позволяющих расширить границы компромисса между скоростью и точностью.

Архитектурные инновации

  • MAE-NAS Backbone: Использует нейронный поиск архитектуры (NAS), ориентируясь на среднюю абсолютную ошибку (MAE), для автоматического определения эффективной топологии сети.
  • Эффективная RepGFPN: Обобщенная сеть пирамид признаков (GFPN), использующая повторную параметризацию, что позволяет объединять сложные признаки в процессе обучения и сворачивать их в более быструю и простую структуру в процессе вывода.
  • ZeroHead: облегченная головка обнаружения, которая разделяет задачи классификации и регрессии, значительно снижая вычислительные затраты на конечные выходные слои.
  • AlignedOTA: усовершенствованная стратегия присвоения меток, которая решает проблему несоответствия между достоверностью классификации и точностью регрессии во время обучения.

Несмотря на то, что YOLO превосходит всех в определенных метриках, это в первую очередь исследовательский репозиторий. Ему не хватает обширной документации, постоянных обновлений и широкой поддержки сообщества, которые есть в экосистеме Ultralytics .

Узнайте больше о DAMO-YOLO

Метрики производительности: Head-to-Head

В следующей таблице приведено сравнение производительности YOLO11 и YOLO на наборе данныхCOCO val2017. Ключевые показатели включают среднюю точностьmAP) и скорость вычислений на CPU и GPU .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Анализ результатов

  1. Превосходство в эффективности: YOLO11 демонстрирует превосходство в эффективности использования параметров. Например, модель YOLO11m достигает 51,5 mAP при использовании всего 20,1 миллиона параметров, в то время как сопоставимая модель DAMO-YOLOm отстает на 49,2 mAP при большем объеме в 28,2 миллиона параметров.
  2. Предельная точность: Самый большой вариант, YOLO11x, достигает поразительной точности 54,7 mAP, превосходя самую большую модель YOLO из перечисленных. Это делает YOLO11 предпочтительным выбором для высокоточных задач, таких как медицинская визуализация или дефектоскопия.
  3. Граничное развертывание: Модель YOLO11n (Nano) исключительно легкая (2,6 М параметров) и быстрая (1,5 мс на T4), что делает ее идеальной для встраиваемых систем, где не хватает памяти. В отличие от этого, самая маленькая модель YOLO значительно тяжелее (8,5 М параметров).
  4. ПроизводительностьCPU : Ultralytics предоставляет прозрачные бенчмарки CPU , подчеркивая жизнеспособность YOLO11 для развертывания без специальных ускорителей. YOLO официально не сообщает о скорости CPU , что ограничивает его оценку для маломощных IoT-приложений.

Техническое погружение

Обучение и архитектура

YOLO в значительной степени полагается на нейронный поиск архитектуры (NAS) для определения своей основы. Хотя теоретически это может дать оптимальные структуры, в результате часто получаются нерегулярные блоки, которые могут не подходить для аппаратного обеспечения всех устройств. В отличие от этого, в YOLO11 используются вручную созданные, уточненные блоки (C3k2, C2PSA), которые интуитивно понятны для стандартных GPU и библиотек ускорения CPU .

YOLO11 также уделяет особое внимание эффективности обучения. Она быстро сходится благодаря оптимизированным гиперпараметрам и стратегиям дополнения данных. Его требования к памяти во время обучения в целом ниже, чем у сложных архитектур на основе трансформаторов или NAS, что позволяет исследователям обучать эффективные модели на аппаратном обеспечении потребительского класса.

Экосистема и удобство использования

Одним из наиболее значимых отличий является экосистема. YOLO - это прежде всего репозиторий кода для воспроизведения результатов научных исследований.

Ultralytics YOLO11, однако, является платформой полного цикла:

  • Документация: Исчерпывающие руководства по каждому аспекту работы трубопровода.
  • Интеграции: Встроенная поддержка MLFlow, TensorBoard и Weights & Biases для отслеживания экспериментов.
  • Сообщество: Массивное, активное сообщество на GitHub и Discord, которое обеспечивает быстрое исправление ошибок и ответы на вопросы.
from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for deployment
path = model.export(format="onnx")

Рекомендации по применению

Когда стоит выбирать Ultralytics YOLO11

  • Развертывание в реальных условиях: Если вам нужно развернуть систему на различных аппаратных средствах (например, наiOS, Android, Edge TPU, Jetson), возможности экспорта YOLO11 не имеют себе равных.
  • Сложные конвейеры технического зрения: Если вашему проекту требуется нечто большее, чем просто ограничивающие рамки - например, отслеживание объектов или оценка позы тела, -YOLO11 справляется с этим нативно.
  • Быстрое создание прототипов: Простота использования позволяет разработчикам за считанные минуты перейти от данных к рабочей демонстрации.
  • Ограниченность ресурсов: Модели Nano и Small обеспечивают наилучшее соотношение точности и размера для устройств с батарейным питанием.

Когда стоит рассмотреть DAMO-YOLO

  • Академические исследования: Исследователи, изучающие эффективность NAS в методах обнаружения объектов или перепараметризации, могут найти YOLO в качестве ценного базового уровня.
  • Специфические конфигурации GPU : В сценариях, когда конкретные архитектурные блоки YOLO идеально совпадают с иерархией кэша целевого ускорителя, он может предложить конкурентоспособную пропускную способность.

Заключение

В то время как YOLO представляет такие впечатляющие академические концепции, как MAE-NAS и RepGFPN, Ultralytics YOLO11 остается лучшим выбором для подавляющего большинства разработчиков и предприятий. Его сочетание современной точности, легкой архитектуры и процветающей экосистемы обеспечивает не только высокую производительность, но и удобство обслуживания и масштабирования проектов.

Разработчикам, которые ищут надежное, универсальное и высокопроизводительное решение для компьютерного зрения, YOLO11 предоставляет инструменты и метрики, необходимые для достижения успеха в 2025 году и далее.

Изучите другие сравнения моделей

Чтобы лучше понять ландшафт моделей обнаружения объектов, изучите эти сравнения:


Комментарии