Перейти к содержанию

YOLO11 YOLO: эволюция архитектур обнаружения объектов в реальном времени

Исследования в области компьютерного зрения продвигаются с огромной скоростью, а новые архитектуры постоянно пересматривают пределы скорости и точности. Двумя значительными вкладами в эту область являются YOLO11 от Ultralytics YOLO от Alibaba Group. Хотя обе модели направлены на решение проблемы обнаружения объектов в реальном времени, они подходят к ней с разными философиями: одна сосредоточена на беспроблемном использовании и внедрении, а другая — на тщательном поиске нейронной архитектуры (NAS) и академических исследованиях.

В этом руководстве представлено подробное техническое сравнение, которое поможет разработчикам, исследователям и инженерам выбрать подходящий инструмент для конкретных приложений компьютерного зрения.

Обзоры моделей

YOLO11

YOLO11 представляет собой кульминацию многолетней работы по совершенствованию семейства YOLO You Only Look Once). Выпущенный в конце 2024 года компанией Ultralytics, он основан на успехе YOLOv8 , в котором были внедрены усовершенствования архитектуры, повышающие эффективность извлечения признаков, при этом сохраняя философию «bag-of-freebies» — обеспечение высокой производительности без необходимости сложных настроек обучения.

Узнайте больше о YOLO11

DAMO-YOLO

YOLO — это ориентированная на исследования модель, разработанная DAMO Academy (Alibaba Group). В ней представлено несколько новых технологий, в том числе поиск нейронной архитектуры (NAS) для оптимизации базовой структуры, эффективная перепараметризованная обобщенная FPN (RepGFPN) и структура обучения на основе дистилляции. Основное внимание уделяется максимальному соотношению между задержкой и точностью за счет автоматического поиска конструкции.

Техническое сравнение

Архитектура и философия проектирования

Основное различие между этими двумя моделями заключается в их конструктивных особенностях. YOLO11 разработана вручную с целью обеспечить универсальность и простоту использования. В ней используется усовершенствованная основа C3k2 (Cross Stage Partial) и улучшенная detect , которая обеспечивает баланс между количеством параметров и представлением функций. Такая конструкция гарантирует надежность модели при выполнении широкого спектра задач — не только обнаружения объектов, но и сегментации экземпляров, оценки позы, классификации и задач Oriented Bounding Box (OBB).

YOLO, напротив, использует MAE-NAS (метод автоматического эффективного поиска нейронной архитектуры) для определения своей основной структуры. В результате получается топология сети, которая теоретически оптимальна для конкретных аппаратных ограничений, но может быть непрозрачной и сложной для ручной модификации. Кроме того,YOLO в значительной степениYOLO на сложный конвейер обучения, включающий дизайн «ZeroHead» и дистилляцию из более крупных моделей-учителей, что увеличивает сложность обучения на пользовательских наборах данных.

Метрики производительности

В таблице ниже сравниваются характеристики различных масштабов моделей. YOLO11 превосходную эффективность, особенно в сценариях с низкой задержкой (модели N/S/M), при этом сохраняя высочайшую точность.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Анализ производительности

YOLO11 постоянно достигает более высоких mAP с меньшим количеством параметров по сравнению с эквивалентнымиYOLO . Например, YOLO11s превосходит DAMO-YOLOs на 1,0 mAP используя mAP почти на 40% меньше параметров (9,4 млн против 16,3 млн). Эта эффективность напрямую приводит к снижению использования памяти и ускорению вывода на периферийных устройствах.

Эффективность и удобство обучения

YOLO11 выделяется своей доступностью. Интегрированный в ultralytics Python , обучение модели так же просто, как определение файла YAML с набором данных и запуск одной команды. Экосистема обрабатывает настройку гиперпараметров, дополнение данных и отслеживание экспериментов автоматически.

from ultralytics import YOLO

# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")

# Train on a custom dataset with one line of code
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Напротив, YOLO использует многоэтапный процесс обучения. Часто требуется сначала обучить «учительскую» модель, чтобы затем перенести знания в меньшую «ученическую» модель. Это значительно увеличивает время GPU и объем VRAM, необходимый для обучения. Хотя это эффективно для достижения максимальной точности в академических тестах, такая сложность может стать препятствием для гибких инженерных команд.

Идеальные варианты использования

Почему стоит выбрать модели Ultralytics?

Для подавляющего большинства реальных приложений YOLO11 (и более новая версия YOLO26) обеспечивает оптимальный баланс между производительностью и практичностью.

  • Простота использования: Ultralytics разработан для удобства разработчиков. Подробные руководства и унифицированный CLI переход от прототипа к производству.
  • Хорошо поддерживаемая экосистема: в отличие от многих исследовательских репозиториев, которые после публикации перестают обновляться, Ultralytics активно поддерживаются. Регулярные обновления обеспечивают совместимость с последними версиями PyTorch версиями, CUDA и форматами экспорта, такими как OpenVINO и CoreML.
  • Универсальность: в то время какYOLO исключительно детектором объектов, YOLO11 изначально YOLO11 оценку положения (ключевые точки) и сегментацию экземпляров. Это позволяет одной архитектурной семье обрабатывать различные задачи зрительного восприятия в сложных конвейерах.
  • Эффективность использования памяти:YOLO Ultralytics YOLO оптимизированы для низкого потребления VRAM. Они позволяют избежать значительных затрат памяти, часто связанных с архитектурами на основе трансформаторов или сложными конвейерами дистилляции, что делает их пригодными для обучения на потребительском оборудовании.

Когда использовать DAMO-YOLO

  • Академические исследования: если ваша цель — изучить поиск нейронной архитектуры (NAS) или воспроизведение конкретных методов параметризации репрезентаций, представленных в YOLO .
  • Особые аппаратные ограничения: если у вас есть ресурсы для проведения обширных поисков NAS, чтобы найти магистраль, идеально подходящую для очень специфического, нестандартного аппаратного ускорителя.

Приложения в реальном мире

YOLO11 широко используется в различных отраслях благодаря своей надежности:

  • Умная розничная торговля:анализ поведения покупателей и автоматизированное управление запасами с помощью обнаружения объектов.
  • Здравоохранение:обнаружение опухолей с помощью медицинской визуализации, где скорость позволяет проводить быстрое скрининг-обследование.
  • Производство: Системыконтроля качества, требующие высокоскоростного вывода на периферийных устройствах для detect на сборочных линиях.

Двигаясь вперед: преимущества YOLO26

Хотя YOLO11 отличной моделью, в этой области продолжаются разработки. Для новых проектов, начинающихся в 2026 году, рекомендуется использовать YOLO26.

Узнайте больше о YOLO26

YOLO26 представляет несколько революционных функций:

  • Полная NMS: благодаря устранению немаксимального подавления (NMS) YOLO26 упрощает логику развертывания и снижает изменчивость задержки, концепция, впервые примененная в YOLOv10.
  • MuSGD Optimizer: гибридный оптимизатор, вдохновленный обучением LLM, который обеспечивает стабильную конвергенцию.
  • Улучшенное обнаружение мелких объектов: функции потерь, такие как ProgLoss и STAL, значительно улучшают производительность при обнаружении мелких целей, что имеет решающее значение для изображений с дронов и датчиков IoT.

Заключение

Оба YOLO11 и YOLO внесли значительный вклад в развитие технологии обнаружения объектов.YOLO потенциал автоматизированного поиска архитектуры. Однако YOLO11 остается лучшим выбором для практического применения благодаря упрощенному рабочему процессу, широкой поддержке задач и эффективному использованию параметров.

Для разработчиков, стремящихся оставаться на передовом крае технологий, переход на YOLO26 обеспечивает еще большую скорость и простоту, гарантируя, что ваши проекты в области компьютерного зрения останутся актуальными в будущем.

Начните свой проект

Готовы начать обучение? Посетите Ultralytics , чтобы за считанные минуты аннотировать, обучить и развернуть свои модели без необходимости управления сложной инфраструктурой.


Комментарии