Link to this sectionСравнение DAMO-YOLO и YOLOv5#
Эволюция computer vision сопровождается постоянными инновациями в области обнаружения объектов в реальном времени. Сегодня разработчики и исследователи сталкиваются с огромным выбором архитектур при проектировании систем компьютерного зрения. В этом подробном техническом сравнении рассматриваются нюансы между DAMO-YOLO и Ultralytics YOLOv5, а также подчеркиваются их архитектурные особенности, методологии обучения, метрики производительности и сценарии оптимального развертывания.
Link to this sectionВведение в DAMO-YOLO#
DAMO-YOLO, выпущенная Alibaba Group, представила ряд инновационных методов, направленных на расширение границ скорости и точности обнаружения.
- Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
- Организация: Alibaba Group
- Дата: 23 ноября 2022 г.
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
- Документация: README.md
Link to this sectionАрхитектурные инновации#
DAMO-YOLO построена на базе нейронного архитектурного поиска (NAS). Авторы использовали MAE-NAS для автоматической разработки бэкбонов, которые балансируют между задержкой и точностью. Модель представляет эффективную архитектуру RepGFPN (Reparameterized Generalized Feature Pyramid Network), которая улучшает слияние признаков на разных масштабах. Кроме того, DAMO-YOLO использует дизайн «ZeroHead», отказываясь от сложных многоветвевых голов предсказания в пользу более простой и эффективной структуры, которая во многом полагается на репараметризацию во время инференса.
Для улучшения обучения модель использует AlignedOTA для распределения меток и процесс интенсивного дистилляционного усиления, где более крупная модель-«учитель» направляет меньшую модель-«студента» для достижения более высокой точности.
Link to this sectionВведение в Ultralytics YOLOv5#
Ultralytics YOLOv5 — одна из самых широко используемых архитектур компьютерного зрения в мире, известная своей стабильностью, простотой использования и обширной экосистемой для развертывания.
- Авторы: Glenn Jocher
- Организация: Ultralytics
- Дата: 26 июня 2020 г.
- GitHub: ultralytics/yolov5
- Документация: документация YOLOv5
Link to this sectionСтандарт экосистемы#
YOLOv5 переопределила отраслевой стандарт удобства использования. Созданная на базе PyTorch, она использует высокооптимизированный бэкбон CSPNet и шею PANet для надежной агрегации признаков. Хотя она появилась раньше тренда на модели без якорей (anchor-free), её тщательно проработанный подход на основе якорей в сочетании с автоматическим обучением якорей обеспечивает отличную производительность «из коробки».
Истинная сила YOLOv5 заключается в её хорошо поддерживаемой экосистеме. Она легко интегрируется с инструментами отслеживания, такими как Comet и Weights & Biases, и поддерживает экспорт в один клик в такие форматы, как ONNX, TensorRT и CoreML.
YOLOv5 невероятно легко обучать на пользовательских наборах данных. Оптимизированный API снижает трение при переходе от прототипа к продакшену, что делает её фаворитом среди гибких инженерных команд.
Link to this sectionСравнение производительности и метрик#
При сравнении этих моделей критически важно учитывать баланс между средней точностью (mAP), скоростью инференса и количеством параметров.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionАнализ компромиссов#
DAMO-YOLO достигает впечатляющих показателей mAP для своих размеров параметров, значительно выигрывая от фазы дистилляционного обучения. Однако это достигается за счет эффективности обучения. Многоэтапный процесс дистилляции требует сначала обучения тяжелой модели-учителя, что значительно увеличивает необходимое время GPU compute и потребление VRAM.
Напротив, YOLOv5 предлагает отличные требования к памяти. Модели Ultralytics YOLO известны меньшим потреблением памяти как во время обучения, так и во время инференса по сравнению со сложными конвейерами дистилляции или моделями на базе трансформеров, такими как RT-DETR. Это позволяет эффективно обучать YOLOv5 на потребительском оборудовании или доступных облачных средах, таких как Google Colab.
Link to this sectionПрименение в реальных условиях и универсальность#
Выбор правильной архитектуры часто зависит от среды развертывания.
Link to this sectionВ чем сильна DAMO-YOLO#
DAMO-YOLO — это строго модель для object detection. Это отличный выбор для академических исследований, особенно для команд, изучающих нейронный архитектурный поиск или стремящихся воспроизвести методы репараметризации, описанные в статье. Если у проекта есть обширные вычислительные ресурсы для выполнения фазы дистилляционного обучения и цель состоит исключительно в том, чтобы выжать последнюю долю точности для 2D ограничивающих рамок, DAMO-YOLO — сильный конкурент.
Link to this sectionПреимущество Ultralytics#
Для реального продакшена простота использования и универсальность моделей Ultralytics делают их предпочтительным выбором. Хотя YOLOv5 остается стандартом для обнаружения и image classification, более широкая экосистема Ultralytics позволяет разработчикам легко переключаться между задачами.
Например, новые итерации в семействе Ultralytics нативно поддерживают instance segmentation, pose estimation и Oriented Bounding Box (OBB). Эта многозадачность гарантирует, что команды могут использовать единый API Python для сложных конвейеров, например, для объединения automated number plate recognition с сегментацией транспортных средств.
Link to this sectionСценарии использования и рекомендации#
Выбор между DAMO-YOLO и YOLOv5 зависит от конкретных требований твоего проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда выбирать DAMO-YOLO#
DAMO-YOLO — сильный выбор для:
- Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
- Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
- Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.
Link to this sectionКогда стоит выбрать YOLOv5#
YOLOv5 рекомендуется для:
- Проверенных производственных систем: существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
- Обучения с ограниченными ресурсами: сред с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и более низкие требования к памяти являются преимуществом.
- Обширной поддержки форматов экспорта: проектов, требующих развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionБудущее: переход на YOLO26#
Хотя YOLOv5 легендарна, а DAMO-YOLO дает интересные академические инсайты, современные технологии развиваются. Выпущенная в январе 2026 года, Ultralytics YOLO26 представляет собой огромный шаг вперед для сообщества компьютерного зрения.
YOLO26 решает традиционные проблемы развертывания на периферии (edge) и нестабильности обучения:
- Дизайн без NMS (End-to-End): YOLO26 нативно исключает пост-обработку Non-Maximum Suppression. Это прорыв упрощает логику развертывания и радикально снижает вариативность задержек, что делает её идеальной для высокоскоростной robotics и автономных систем.
- Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM (такими как Kimi K2 от Moonshot AI), YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon). Это обеспечивает высокую стабильность обучения и значительно более быструю сходимость.
- До 43% более быстрый инференс на CPU: Благодаря стратегическому удалению Distribution Focal Loss (DFL), YOLO26 достигает значительно более высоких скоростей на CPU и edge-устройствах по сравнению со своими предшественниками, такими как YOLO11 и YOLOv8.
- ProgLoss + STAL: Эти передовые функции потерь дают заметные улучшения в распознавании мелких объектов, что критично для анализа aerial drone imagery и потоков с IoT-датчиков.
Link to this sectionПример кода: Простота в действии#
Пакет Ultralytics позволяет тебе обучать и развертывать модели всего за несколько строк кода. Независимо от того, используешь ли ты YOLOv5 или переходишь на рекомендуемую YOLO26, интерфейс остается последовательным и интуитивно понятным.
from ultralytics import YOLO
# Load the state-of-the-art YOLO26 small model
model = YOLO("yolo26s.pt")
# Train on a custom dataset effortlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image and display results
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()
# Export the model for edge deployment
model.export(format="onnx")Link to this sectionЗаключение#
И DAMO-YOLO, и YOLOv5 внесли значительный вклад в развитие компьютерного зрения. DAMO-YOLO демонстрирует силу нейронного архитектурного поиска и дистилляции, что делает её интересным объектом для изучения исследователями. Однако YOLOv5 остается практической «рабочей лошадкой» благодаря своему балансу производительности, низким требованиям к памяти и непревзойденной простоте использования.
Разработчикам, начинающим новые проекты сегодня, рекомендуется использовать Ultralytics Platform и внедрять YOLO26. Она объединяет полюбившуюся удобную экосистему YOLOv5 с прорывными архитектурными достижениями, обеспечивая высочайшую точность и молниеносный инференс как для облачных, так и для edge AI приложений. Разработчики также могут изучить другие эффективные модели, такие как YOLOv6 или YOLOX, в зависимости от конкретных ограничений устаревшего оборудования.