Перейти к содержанию

YOLOX против YOLOv6-3.0: Всестороннее руководство по безанкерному и промышленному обнаружению объектов

Эволюция компьютерного зрения во многом определялась быстрыми достижениями в серии YOLO. Выбор правильной архитектуры для развертывания часто сводится к балансу между чистой пропускной способностью, архитектурной простотой и эффективностью обучения. Двумя заметными вехами на этом пути являются исследования YOLOX, сфокусированные на безанкерном подходе, и высокооптимизированная промышленная пропускная способность YOLOv6-3.0.

Это техническое сравнение анализирует их архитектурные различия, метрики производительности и идеальные сценарии использования, а также представляет возможности следующего поколения Ultralytics YOLO26 для разработчиков, ищущих идеальное решение для развертывания на периферии и в облаке.

YOLOX: Наведение мостов между исследованиями и промышленностью

Разработанный исследователями из Megvii, YOLOX был представлен как значительный шаг к упрощению архитектуры YOLO за счет полного отказа от якорей.

Архитектурные особенности

YOLOX успешно интегрировал безакорную архитектуру в семейство YOLO. Устранив предопределенные якорные боксы, модель значительно сокращает количество проектных параметров и эвристической настройки, необходимых во время обучения. Это делает YOLOX легко адаптируемым к разнообразным пользовательским наборам данных без ручного пересчета якорей.

Кроме того, YOLOX представил архитектуру разделенной головы. Разделяя задачи классификации и регрессии на разные ветви, модель разрешает внутренний конфликт между определением что является объектом и где он расположен. В сочетании со стратегией присвоения меток SimOTA YOLOX достигает более быстрой сходимости и улучшенной средней средней точности (mAP).

Узнайте больше о YOLOX

Преимущество безанкерного подхода

Безанкерные детекторы, такие как YOLOX, часто показывают лучшую производительность на пользовательских наборах данных с необычными соотношениями сторон объектов, поскольку они не полагаются на фиксированные априорные ограничивающие рамки, которые могут не соответствовать новым данным.

YOLOv6-3.0: Промышленный тяжеловес

Разработанный отделом Vision AI в Meituan, YOLOv6-3.0 бескомпромиссно разработан для максимальной промышленной пропускной способности, особенно на NVIDIA GPU с использованием аппаратных ускорителей, таких как TensorRT.

  • Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг и др.
  • Организация: Meituan
  • Дата: 2023-01-13
  • Arxiv:2301.05586
  • GitHub:meituan/YOLOv6

Оптимизация для развертывания

YOLOv6-3.0 ориентирован на максимальное использование GPU. Он включает модуль двунаправленной конкатенации (BiC) в шейку для улучшения слияния признаков при сохранении высокой скорости инференса. Хотя фаза инференса полностью безанкерная, YOLOv6-3.0 использует инновационную стратегию обучения с поддержкой якорей (AAT) для получения преимуществ от стабильности, основанной на якорях, во время фазы обучения.

Магистральная сеть построена с использованием аппаратно-оптимизированной архитектуры EfficientRep, специально разработанной для минимизации затрат на доступ к памяти и максимизации вычислительной плотности на современных ускорителях. Это делает YOLOv6 исключительно сильным кандидатом для серверной видеоаналитики.

Узнайте больше о YOLOv6

Сравнение производительности

При сравнении этих моделей разработчики должны сопоставлять чистую точность со скоростью инференса и количеством параметров. В следующей таблице показана производительность обоих семейств моделей для различных размеров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

В то время как YOLOv6-3.0 показывает превосходный mAP и отличные скорости TensorRT для более крупных вариантов, YOLOX остается высококонкурентным благодаря своей простоте и надежной производительности на устаревшем оборудовании.

Сценарии использования и рекомендации

Выбор между YOLOX и YOLOv6 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда следует выбирать YOLOX

YOLOX является отличным выбором для:

  • Исследования безъякорного detect: Академические исследования, использующие чистую, безъякорную архитектуру YOLOX в качестве основы для экспериментов с новыми головами detect или функциями потерь.
  • Сверхлегкие граничные устройства: Развертывание на микроконтроллерах или устаревшем мобильном оборудовании, где критически важен чрезвычайно малый объем (0,91 млн параметров) варианта YOLOX-Nano.
  • Исследования по назначению меток SimOTA: Исследовательские проекты, изучающие стратегии назначения меток на основе оптимального транспорта и их влияние на сходимость обучения.

Когда выбирать YOLOv6

YOLOv6 рекомендуется для:

  • Промышленное развертывание с учетом аппаратного обеспечения: Сценарии, где аппаратно-ориентированный дизайн модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
  • Быстрое одностадийное detect: Приложения, отдающие приоритет чистой скорости инференции на GPU для обработки видео в реальном времени в контролируемых средах.
  • Интеграция в экосистему Meituan: Команды, уже работающие в технологическом стеке и инфраструктуре развертывания Meituan.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Преимущество Ultralytics

Хотя Megvii и Meituan предоставляют мощные исследовательские репозитории, развертывание этих моделей в производстве часто требует значительных инженерных затрат. Интегрированная экосистема Ultralytics устраняет эти препятствия, предлагая унифицированный, обширно документированный API.

Используя пакет Ultralytics, разработчики получают доступ к беспрецедентному пользовательскому опыту. Это включает встроенную автоматическую аугментацию, высокоэффективное управление памятью во время обучения (значительно снижающее требования к VRAM по сравнению с моделями-трансформерами, такими как RTDETR) и бесшовные конвейеры экспорта в форматы, такие как ONNX и OpenVINO.

В отличие от специализированных моделей, архитектуры Ultralytics изначально универсальны, поддерживая обнаружение объектов, сегментацию экземпляров, оценку позы, классификацию изображений и ориентированные ограничивающие рамки (OBB) «из коробки».

Представляем YOLO26: Оптимальное периферийное решение

Для команд, начинающих новые проекты в области компьютерного зрения, мы настоятельно рекомендуем обновиться до недавно выпущенного Ultralytics YOLO26. Основываясь на успехах YOLO11 и YOLOv8, YOLO26 представляет инновации, меняющие парадигму:

  • Сквозная архитектура без NMS: Впервые исследованная в YOLOv10, YOLO26 изначально устраняет необходимость в постобработке подавления немаксимумов (NMS). Это гарантирует детерминированный вывод со сверхнизкой задержкой, что критически важно для робототехники реального времени.
  • Оптимизатор MuSGD: Вдохновленный методами обучения LLM, такими как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD (гибрид SGD и Muon) для достижения невероятно стабильной динамики обучения и более быстрой сходимости.
  • До 43% более быстрая инференция на CPU: За счет удаления Distribution Focal Loss (DFL) и оптимизации головной части сети, YOLO26 значительно оптимизирован для периферийных устройств, использующих выполнение на CPU, значительно превосходя YOLOv6 в периферийных сценариях.
  • ProgLoss + STAL: Эти передовые формулировки функций потерь обеспечивают значительные улучшения в detect мелких объектов, делая YOLO26 идеальным для аэрофотосъемки и микроскопического контроля дефектов.

Узнайте больше о YOLO26

Единый пример обучения

Используя Python API Ultralytics, обучение передовых моделей требует всего нескольких строк кода. Этот же чистый интерфейс применим независимо от того, тестируете ли вы устаревшую модель YOLO или развертываете передовой фреймворк YOLO26.

from ultralytics import YOLO

# Load the next-generation YOLO26 model (NMS-free, optimized for edge)
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The ecosystem handles downloading, caching, and auto-batching natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model and print mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Export the model for edge deployment
model.export(format="onnx")

Ultralytics Platform

Для еще более удобной работы управляйте своими наборами данных, отслеживайте эксперименты и обучайте модели в облаке, используя платформу Ultralytics без кода.

Рекомендации по вариантам использования

При выборе между этими архитектурами учитывайте специфические аппаратные ограничения и требования вашего проекта:

  • Выбирайте YOLOX, если вы проводите академические исследования стратегий присвоения меток или вам требуется чистая, легкопонимаемая anchor-free базовая модель для пользовательских архитектурных модификаций.
  • Выбирайте YOLOv6-3.0, если вы развертываете систему на промышленном серверном стеллаже, оснащенном высокопроизводительными NVIDIA GPU (такими как A100 или T4), где вы можете использовать большие размеры пакетов и оптимизации TensorRT для одновременной обработки сотен видеопотоков.
  • Выбирайте YOLO26 для подавляющего большинства современных приложений. Если вы разрабатываете приложения Edge AI для устройств IoT, дронов или мобильных телефонов, собственная NMS-free архитектура YOLO26, оптимизации для CPU и всесторонняя поддержка экосистемы делают его бесспорно лучшим выбором для сокращения разрыва между обучением и производством.

Комментарии