Link to this sectionDAMO-YOLO против YOLOv6-3.0#
Стремительное развитие компьютерного зрения привело к созданию узкоспециализированных архитектур, предназначенных для промышленных приложений. Среди них выделяются два тяжеловеса, ориентированных на производительность в реальном времени и эффективность развертывания: DAMO-YOLO и YOLOv6-3.0. Эта страница содержит подробное техническое сравнение их архитектур, показателей производительности и методик обучения, чтобы помочь тебе определиться с выбором при развертывании.
Link to this sectionDAMO-YOLO: нейросетевой архитектурный поиск в задачах детектирования объектов#
Разработанный исследователями из Alibaba Group, DAMO-YOLO предлагает новый подход к семейству YOLO, активно внедряя нейросетевой архитектурный поиск (NAS) в проектирование своего бэкбона.
- Авторы: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang и Xiuyu Sun
- Организация: Alibaba Group
- Дата: 23.11.2022
- Arxiv: 2211.15444v2
- GitHub: tinyvision/DAMO-YOLO
Link to this sectionАрхитектурные инновации#
DAMO-YOLO использует оптимизированный с помощью NAS бэкбон под названием MAE-NAS, который автоматически ищет оптимальные структуры сети с учетом заданных ограничений по задержке. Это обеспечивает эффективное масштабирование модели под разные типы аппаратного обеспечения. Для улучшения слияния признаков архитектура использует Efficient RepGFPN (перепараметризованная обобщенная пирамида признаков), что значительно улучшает представление объектов на разных масштабах.
Кроме того, в модели представлена концепция «ZeroHead». Исключая сложные многоветвевые структуры в «голове» детектора, она более эффективно сохраняет пространственную информацию, снижая при этом вычислительную нагрузку. Методика обучения также использует AlignedOTA (Aligned Optimal Transport Assignment) и надежную дистилляцию знаний, позволяя меньшим моделям-ученикам учиться на более тяжелых сетях-учителях.
Хотя дистилляция знаний помогает DAMO-YOLO достигать высокой точности, она требует многоэтапного конвейера обучения. Это значительно увеличивает затраты на GPU compute по сравнению с обучением стандартных одноэтапных моделей.
Link to this sectionYOLOv6-3.0: максимизация промышленной пропускной способности#
Разработанный отделом Meituan Vision AI, YOLOv6-3.0 позиционируется как промышленный детектор объектов, созданный специально для максимизации пропускной способности на аппаратном обеспечении NVIDIA.
- Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionКлючевые особенности и улучшения#
YOLOv6-3.0 построен на базе эффективного бэкбона EfficientRep, что делает его исключительно быстрым при использовании таких оптимизаций, как TensorRT на современных GPU. В итерации v3.0 сеть интегрирует модуль двунаправленной конкатенации (BiC) для улучшения локализации объектов разного размера.
Еще одна выдающаяся особенность — стратегия Anchor-Aided Training (AAT). AAT сочетает в себе стабильность anchor-based detectors во время обучения со скоростью инференса безъякорного дизайна. Этот гибридный подход обеспечивает превосходную сходимость без ущерба для задержки развертывания, что делает его мощным выбором для обработки массивных видеопотоков в аналитике «умных городов» и системах автоматизированных касс.
Link to this sectionСравнение производительности#
При оценке этих моделей для real-time inference крайне важно сбалансировать параметры, FLOPs и точность. Ниже приведена подробная оценка сравнения их производительности.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Хотя DAMO-YOLO имеет небольшое преимущество в малом сегменте (46.0 mAP против 45.0 mAP), YOLOv6-3.0 демонстрирует превосходную масштабируемость, выигрывая в среднем и большом сегментах, сохраняя при этом минимальное количество параметров в своей конфигурации nano.
Если твое аппаратное окружение позволяет проводить тяжелые автоматизированные поиски для настройки бэкбона, подход NAS в DAMO-YOLO будет весьма эффективен. Однако, если ты полностью полагаешься на стандартное ускорение GPU (например, T4 или A100), структуры EfficientRep в YOLOv6 часто дают более высокий показатель FPS.
Link to this sectionСценарии использования и рекомендации#
Выбор между DAMO-YOLO и YOLOv6 зависит от требований твоего конкретного проекта, ограничений при развертывании и предпочтений в экосистеме.
Link to this sectionКогда выбирать DAMO-YOLO#
DAMO-YOLO — сильный выбор для:
- Высокопроизводительной видеоаналитики: обработки видеопотоков с высоким FPS на фиксированной инфраструктуре NVIDIA GPU, где пропускная способность при batch-1 является основной метрикой.
- Промышленных производственных линий: сценариев с жесткими ограничениями по задержке GPU на специализированном оборудовании, таких как проверка качества в реальном времени на сборочных линиях.
- Исследований Neural Architecture Search: изучения влияния автоматизированного поиска архитектуры (MAE-NAS) и эффективных репараметризованных бэкендов на производительность детекции.
Link to this sectionКогда выбирать YOLOv6#
YOLOv6 рекомендуется для:
- Промышленного внедрения с учетом оборудования: сценарии, где аппаратная ориентированность модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
- Быстрого одноэтапного обнаружения: приложения, где приоритетом является чистая скорость вывода на GPU для обработки видео в реальном времени в контролируемых условиях.
- Интеграции в экосистему Meituan: команды, которые уже работают в рамках технологического стека и инфраструктуры развертывания Meituan.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionПреимущество Ultralytics: представляем YOLO26#
Хотя DAMO-YOLO и YOLOv6-3.0 являются весьма функциональными, они страдают от фрагментированных экосистем, ограничений одной задачей и сложных конвейеров развертывания. Для современных команд разработчиков Ultralytics models предоставляют значительно лучший опыт, кульминацией которого стала революционная YOLO26.
Выпущенная в январе 2026 года, YOLO26 представляет собой новый стандарт для развертывания на Edge и в облаке, существенно оптимизируя memory requirements и вычислительную эффективность.
Link to this sectionПочему стоит выбрать YOLO26?#
- Комплексный дизайн без NMS: Основываясь на концепциях YOLOv10, YOLO26 нативно исключает постобработку Non-Maximum Suppression. Это значительно упрощает код развертывания и уменьшает вариативность задержки инференса на всех Edge-устройствах.
- Превосходная оптимизация: YOLO26 использует оптимизатор MuSGD, гибрид SGD и Muon (вдохновленный большими языковыми моделями), который обеспечивает очень стабильное обучение и более быструю сходимость.
- Аппаратная универсальность: Благодаря реализации DFL Removal (Distribution Focal Loss), выходные головы упрощены, что повышает совместимость с Edge-устройствами. На самом деле, YOLO26 достигает до 43% более быстрого инференса на CPU, что делает её значительно лучше YOLOv6 для мобильных или IoT-сред.
- Улучшенная точность: Используя ProgLoss + STAL, YOLO26 показывает значительные улучшения в small object detection, что делает её оптимальным выбором для aerial imagery и инспекции дефектов.
- Непревзойденная универсальность: В отличие от промышленных моделей, работающих только с bounding boxes, семейство YOLO26 поддерживает мультимодальные задачи, включая Image Classification, Instance Segmentation, Pose Estimation и Oriented Bounding Boxes (OBB).
Link to this sectionБесшовный опыт работы с экосистемой#
Платформа Ultralytics Platform трансформирует весь жизненный цикл машинного обучения. Обучение модели больше не является многоэтапной головной болью с дистилляцией. Благодаря автоматической аугментации данных, унифицированной настройке гиперпараметров и экспорту в один клик в такие форматы, как ONNX, OpenVINO и CoreML, ты переходишь от набора данных к производству за часы, а не недели.
Кроме того, модели Ultralytics известны своей memory efficiency, позволяя избежать огромных узких мест VRAM, которые преследуют архитектуры трансформеров, такие как RT-DETR.
Link to this sectionПример кода быстрого старта#
Обучение и инференс с моделью Ultralytics, такой как YOLO26, удивительно просты. Следующий скрипт на Python демонстрирует, как ты можешь немедленно начать отслеживать объекты всего с помощью нескольких строк кода:
from ultralytics import YOLO
# Load the highly efficient, NMS-free YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on your custom dataset seamlessly
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on a sample image
prediction = model("https://ultralytics.com/images/bus.jpg")
# Export to TensorRT for maximum GPU throughput
model.export(format="engine", dynamic=True)Link to this sectionЗаключение#
И DAMO-YOLO, и YOLOv6-3.0 являются впечатляющими инженерными достижениями, расширяющими границы промышленного детектирования объектов. Однако это узкоспециализированные инструменты, которые часто требуют сложной настройки и жестких аппаратных ограничений.
Для разработчиков и исследователей, которым нужен идеальный баланс производительности, возможности многозадачности и активно well-maintained ecosystem, модель Ultralytics YOLO26 остается непревзойденной. Сочетая оптимизаторы, вдохновленные LLM, с чистой архитектурой без NMS, YOLO26 упрощает AI deployment, обеспечивая при этом современную точность в Edge и облачных средах.
Если ты оцениваешь модели для нового проекта по компьютерному зрению, мы настоятельно рекомендуем изучить возможности экосистемы Ultralytics YOLO. Возможно, тебе также будет полезно сравнить их с другими архитектурами, такими как EfficientDet, или предыдущими вехами, например YOLO11, чтобы полностью осознать эволюцию ИИ в области зрения реального времени.