Meet YOLO26: next-gen vision AI.

Link to this sectionСравнение DAMO-YOLO и YOLOv5#

Эволюция computer vision сопровождается постоянными инновациями в области обнаружения объектов в реальном времени. Сегодня разработчики и исследователи сталкиваются с огромным выбором архитектур при проектировании систем компьютерного зрения. В этом подробном техническом сравнении рассматриваются нюансы между DAMO-YOLO и Ultralytics YOLOv5, а также подчеркиваются их архитектурные особенности, методологии обучения, метрики производительности и сценарии оптимального развертывания.

Link to this sectionВведение в DAMO-YOLO#

DAMO-YOLO, выпущенная Alibaba Group, представила ряд инновационных методов, направленных на расширение границ скорости и точности обнаружения.

Узнай больше о DAMO-YOLO

Link to this sectionАрхитектурные инновации#

DAMO-YOLO построена на базе нейронного архитектурного поиска (NAS). Авторы использовали MAE-NAS для автоматической разработки бэкбонов, которые балансируют между задержкой и точностью. Модель представляет эффективную архитектуру RepGFPN (Reparameterized Generalized Feature Pyramid Network), которая улучшает слияние признаков на разных масштабах. Кроме того, DAMO-YOLO использует дизайн «ZeroHead», отказываясь от сложных многоветвевых голов предсказания в пользу более простой и эффективной структуры, которая во многом полагается на репараметризацию во время инференса.

Для улучшения обучения модель использует AlignedOTA для распределения меток и процесс интенсивного дистилляционного усиления, где более крупная модель-«учитель» направляет меньшую модель-«студента» для достижения более высокой точности.

Link to this sectionВведение в Ultralytics YOLOv5#

Ultralytics YOLOv5 — одна из самых широко используемых архитектур компьютерного зрения в мире, известная своей стабильностью, простотой использования и обширной экосистемой для развертывания.

Узнай больше о YOLOv5

Link to this sectionСтандарт экосистемы#

YOLOv5 переопределила отраслевой стандарт удобства использования. Созданная на базе PyTorch, она использует высокооптимизированный бэкбон CSPNet и шею PANet для надежной агрегации признаков. Хотя она появилась раньше тренда на модели без якорей (anchor-free), её тщательно проработанный подход на основе якорей в сочетании с автоматическим обучением якорей обеспечивает отличную производительность «из коробки».

Истинная сила YOLOv5 заключается в её хорошо поддерживаемой экосистеме. Она легко интегрируется с инструментами отслеживания, такими как Comet и Weights & Biases, и поддерживает экспорт в один клик в такие форматы, как ONNX, TensorRT и CoreML.

Начало работы с YOLOv5

YOLOv5 невероятно легко обучать на пользовательских наборах данных. Оптимизированный API снижает трение при переходе от прототипа к продакшену, что делает её фаворитом среди гибких инженерных команд.

Link to this sectionСравнение производительности и метрик#

При сравнении этих моделей критически важно учитывать баланс между средней точностью (mAP), скоростью инференса и количеством параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionАнализ компромиссов#

DAMO-YOLO достигает впечатляющих показателей mAP для своих размеров параметров, значительно выигрывая от фазы дистилляционного обучения. Однако это достигается за счет эффективности обучения. Многоэтапный процесс дистилляции требует сначала обучения тяжелой модели-учителя, что значительно увеличивает необходимое время GPU compute и потребление VRAM.

Напротив, YOLOv5 предлагает отличные требования к памяти. Модели Ultralytics YOLO известны меньшим потреблением памяти как во время обучения, так и во время инференса по сравнению со сложными конвейерами дистилляции или моделями на базе трансформеров, такими как RT-DETR. Это позволяет эффективно обучать YOLOv5 на потребительском оборудовании или доступных облачных средах, таких как Google Colab.

Link to this sectionПрименение в реальных условиях и универсальность#

Выбор правильной архитектуры часто зависит от среды развертывания.

Link to this sectionВ чем сильна DAMO-YOLO#

DAMO-YOLO — это строго модель для object detection. Это отличный выбор для академических исследований, особенно для команд, изучающих нейронный архитектурный поиск или стремящихся воспроизвести методы репараметризации, описанные в статье. Если у проекта есть обширные вычислительные ресурсы для выполнения фазы дистилляционного обучения и цель состоит исключительно в том, чтобы выжать последнюю долю точности для 2D ограничивающих рамок, DAMO-YOLO — сильный конкурент.

Link to this sectionПреимущество Ultralytics#

Для реального продакшена простота использования и универсальность моделей Ultralytics делают их предпочтительным выбором. Хотя YOLOv5 остается стандартом для обнаружения и image classification, более широкая экосистема Ultralytics позволяет разработчикам легко переключаться между задачами.

Например, новые итерации в семействе Ultralytics нативно поддерживают instance segmentation, pose estimation и Oriented Bounding Box (OBB). Эта многозадачность гарантирует, что команды могут использовать единый API Python для сложных конвейеров, например, для объединения automated number plate recognition с сегментацией транспортных средств.

Link to this sectionСценарии использования и рекомендации#

Выбор между DAMO-YOLO и YOLOv5 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда выбирать DAMO-YOLO#

DAMO-YOLO — сильный выбор для:

  • Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
  • Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
  • Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.

Link to this sectionКогда стоит выбрать YOLOv5#

YOLOv5 рекомендуется для:

  • Проверенных производственных систем: существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
  • Обучения с ограниченными ресурсами: сред с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и более низкие требования к памяти являются преимуществом.
  • Обширной поддержки форматов экспорта: проектов, требующих развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionБудущее: переход на YOLO26#

Хотя YOLOv5 легендарна, а DAMO-YOLO дает интересные академические инсайты, современные технологии развиваются. Выпущенная в январе 2026 года, Ultralytics YOLO26 представляет собой огромный шаг вперед для сообщества компьютерного зрения.

Узнай больше о YOLO26

YOLO26 решает традиционные проблемы развертывания на периферии (edge) и нестабильности обучения:

  • Дизайн без NMS (End-to-End): YOLO26 нативно исключает пост-обработку Non-Maximum Suppression. Это прорыв упрощает логику развертывания и радикально снижает вариативность задержек, что делает её идеальной для высокоскоростной robotics и автономных систем.
  • Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM (такими как Kimi K2 от Moonshot AI), YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon). Это обеспечивает высокую стабильность обучения и значительно более быструю сходимость.
  • До 43% более быстрый инференс на CPU: Благодаря стратегическому удалению Distribution Focal Loss (DFL), YOLO26 достигает значительно более высоких скоростей на CPU и edge-устройствах по сравнению со своими предшественниками, такими как YOLO11 и YOLOv8.
  • ProgLoss + STAL: Эти передовые функции потерь дают заметные улучшения в распознавании мелких объектов, что критично для анализа aerial drone imagery и потоков с IoT-датчиков.

Link to this sectionПример кода: Простота в действии#

Пакет Ultralytics позволяет тебе обучать и развертывать модели всего за несколько строк кода. Независимо от того, используешь ли ты YOLOv5 или переходишь на рекомендуемую YOLO26, интерфейс остается последовательным и интуитивно понятным.

from ultralytics import YOLO

# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

# Export the model for edge deployment
model.export(format="onnx")

Link to this sectionЗаключение#

И DAMO-YOLO, и YOLOv5 внесли значительный вклад в развитие компьютерного зрения. DAMO-YOLO демонстрирует силу нейронного архитектурного поиска и дистилляции, что делает её интересным объектом для изучения исследователями. Однако YOLOv5 остается практической «рабочей лошадкой» благодаря своему балансу производительности, низким требованиям к памяти и непревзойденной простоте использования.

Разработчикам, начинающим новые проекты сегодня, рекомендуется использовать Ultralytics Platform и внедрять YOLO26. Она объединяет полюбившуюся удобную экосистему YOLOv5 с прорывными архитектурными достижениями, обеспечивая высочайшую точность и молниеносный инференс как для облачных, так и для edge AI приложений. Разработчики также могут изучить другие эффективные модели, такие как YOLOv6 или YOLOX, в зависимости от конкретных ограничений устаревшего оборудования.

Комментарии