YOLOv6.0 противYOLO: техническое противостояние
Область обнаружения объектов в реальном времени характеризуется быстрой итерацией и конкуренцией за оптимальный баланс скорости и точности. Двумя значительными вкладами в эту область являются YOLOv6.YOLOv6, разработанный Meituan, и YOLO от DAMO Academy компании Alibaba. В этом сравнении исследуются архитектурные инновации, тесты производительности и идеальные сценарии развертывания для обеих моделей, а также подчеркивается, как современная Ultralytics продолжает расширять границы компьютерного зрения.
Бенчмарк производительности
Обе модели предназначены для промышленного применения в режиме реального времени, но достигают своих результатов с помощью разных стратегий оптимизации. В таблице ниже подробно описаны их характеристики на наборе данных COCO .
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv6-3.0 Обзор
Выпущенный Meituan в начале 2023 года, YOLOv6.YOLOv6 представляет собой «полномасштабную переработку» их предыдущей архитектуры. Он в значительной степени ориентирован на инженерные модели, оптимизированные для развертывания на специализированном оборудовании, таком как графические процессоры, что делает его фаворитом для промышленной автоматизации.
Основные характеристики:
- Двунаправленное соединение (BiC): усовершенствованный метод слияния характеристик в области шеи, который повышает точность локализации без значительных вычислительных затрат.
- Обучение с помощью якорей (AAT): гибридная стратегия обучения, сочетающая в себе парадигмы с использованием якорей и без них для стабилизации конвергенции и повышения конечной точности.
- Разделенная головка: разделяет задачи классификации и регрессии, что является стандартом в современных детекторах, позволяя более точно уточнять границы ограничивающих прямоугольников.
- Подходит для квантования: архитектура специально разработана для минимизации потери точности при квантовании до INT8 с использованием таких технологий, как RepOptimizer и дистилляция по каналам.
Обзор DAMO-YOLO
Разработанный Alibaba Group и выпущенный в конце 2022 года, YOLO представляет несколько новых технологий, направленных на преодоление ограничений компромисса между скоростью и точностью, в частности, с помощью Neural Architecture Search (NAS).
Основные характеристики:
- MAE-NAS Backbone: использует магистраль, обнаруженную с помощью Neural Architecture Search (NAS) на основе принципа максимальной энтропии, обеспечивая высокий поток информации и эффективность.
- Эффективная RepGFPN: конструкция heavyneck, которая заменяет стандартную PANet на обобщенную сеть пирамиды признаков (GFPN), обеспечивая лучшее многомасштабное слияние признаков.
- ZeroHead: чрезвычайно легкая головка обнаружения, разработанная для снижения вычислительных затрат, обычно связанных с «тяжелыми» развязанными головками.
- AlignedOTA: обновленная стратегия присвоения меток, которая более эффективно согласовывает задачи классификации и регрессии во время обучения.
Сравнительный анализ
Архитектура и философия проектирования
Основное различие заключается в происхождении их конструкции. YOLOv6.YOLOv6 разработан вручную с упором на «удобство развертывания» и специально ориентирован на TensorRT на NVIDIA . Использование стандартных сверток и блоков типа RepVGG делает его высокопредсказуемым в производственных средах.
В отличие от этого, YOLO в значительной степени опирается на автоматический поиск (NAS) для нахождения оптимальных структур. Хотя это приводит к отличной теоретической эффективности (FLOP), сложные ветвящиеся структуры, встречающиеся в базовых структурах, полученных с помощью NAS, иногда бывают сложнее оптимизировать для конкретных аппаратных компиляторов по сравнению с простым дизайном YOLOv6.
Производительность на периферийных устройствах
Для задач, связанных с пограничного ИИ, обе модели предлагают конкурентоспособные варианты «Tiny» или «Nano». YOLOv6 исключительно легкий (4,7 млн параметров), что делает его подходящим для устройств с серьезными ограничениями.YOLO, хотя и немного больше, часто дает более высокую точность (42,0 mAP) из коробки, что потенциально оправдывает дополнительные вычислительные затраты для приложений, требующих более тонкой детализации.
Методологии обучения
YOLOv6 широко YOLOv6 самодистилляцию, при которой более крупная модель-учитель направляет модель-ученик во время обучения. Это имеет решающее значение для его высокой производительности, но усложняет процесс обучения.YOLO модуль улучшения дистилляции, но делает акцент на присвоении меток AlignedOTA для более эффективной обработки сложных образцов в процессе обучения.
Рекомендации по развертыванию
При развертывании в производственной среде учитывайте, что YOLOv6 часто имеет лучшую готовую поддержку квантования INT8 через TensorRT, что может удвоить скорость вывода на совместимом оборудовании, таком как NVIDIA Orin.
Преимущество Ultralytics
ХотяYOLO YOLOv6 впечатляющими научными достижениями, Ultralytics предлагает явное преимущество для разработчиков, для которых приоритетными являются простота использования, удобство обслуживания и готовность к производству.
Безупречный опыт разработчика
Ultralytics , включая YOLO11 и передовой YOLO26, построены на единой платформе. Это означает, что вы можете обучать, проверять и развертывать модели с помощью простого и унифицированного API.
from ultralytics import YOLO
# Load a model (switch freely between versions)
model = YOLO("yolo26n.pt")
# Train on your custom dataset
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for deployment
model.export(format="onnx")
Универсальность в различных задачах
В отличие от многих специализированных хранилищ, Ultralytics поддерживает широкий спектр задач компьютерного зрения, выходящих за рамки простого обнаружения. Сюда входят сегментация экземпляров, оценка позы, классификация и обнаружение ориентированных ограничительных рамок (OBB). Такая универсальность позволяет командам объединить свои инструменты искусственного интеллекта в единый рабочий процесс.
Интеграция платформы
Платформа Ultralytics еще больше упрощает жизненный цикл, предоставляя инструменты для управления наборами данных, автоматической аннотации и обучения в облаке одним щелчком мыши. Этот интегрированный подход устраняет сложности, связанные с настройкой сложных локальных сред и управлением разрозненными наборами данных.
Будущее: Ultralytics YOLO26
Для разработчиков, стремящихся к абсолютной новейшей производительности и архитектурным инновациям, YOLO26 устанавливает новый стандарт.
- Полная NMS: благодаря устранению функции Non-Maximum Suppression (NMS) YOLO26 упрощает процесс развертывания и снижает вариативность задержки, что является критически важной характеристикой для систем безопасности, работающих в режиме реального времени.
- CPU : благодаря устранению распределительной фокальной потери (DFL) и оптимизации для граничных ограничений, YOLO26 достигает до 43% более быстрой CPU по сравнению с предыдущими поколениями, что делает его превосходным выбором для устройств без специальных графических процессоров.
- Улучшенная стабильность обучения: Внедрение оптимизатора MuSGD, вдохновленного методами обучения LLM, обеспечивает беспрецедентную стабильность обучения моделей зрения, гарантируя более быструю конвергенцию и лучшую обобщаемость.
- Улучшения для конкретных задач: будь то оценка остаточной логарифмической вероятности (RLE) для точной оценки положения или специализированные угловые потери для OBB, YOLO26 предлагает целевые улучшения для сложных случаев использования.
Обзор
- Выберите YOLOv6. YOLOv6, если вашей основной целью развертывания являются высокопроизводительные NVIDIA (например, T4, A100) и вам требуется зрелая поддержка квантования для промышленного контроля или видеоаналитики.
- ВыберитеYOLO, если вас интересуют архитектуры на основе NAS и вам нужна высокоэффективная магистральная сеть для исследований или конкретных сценариев, в которых RepGFPN предлагает лучшее слияние функций.
- Выберите Ultralytics для оптимального баланса скорости, точности и удобства разработки. Его конструкцияNMS, низкие требования к памяти во время обучения и обширная поддержка экосистемы делают его идеальным выбором для масштабирования от быстрых прототипов до производственных корпоративных решений.
Дополнительная литература
Более подробную информацию о сравнениях и моделях см. в Ultralytics :
- YOLOv8 против YOLOv6
- RT-DETR - Трансформер для обнаружения в реальном времени (Real-time DEtection TRansformer).
- YOLOv10 — обнаружение объектов в реальном времени от начала до конца.
- Набор данных COCO - Стандартный бенчмарк для обнаружения объектов.