Перейти к содержанию

YOLOv6.0 против YOLO26: эволюция обнаружения объектов в реальном времени

Ландшафт компьютерного зрения характеризуется быстрой эволюцией, в которой архитектурные прорывы постоянно переопределяют возможности как периферийных устройств, так и облачных серверов. В этом сравнении рассматриваются два важных этапа этого пути: YOLOv6.YOLOv6, надежный промышленный детектор от Meituan, и YOLO26, новейшая ультрасовременная модель от Ultralytics для обеспечения сквозной эффективности.

YOLOv6.0: промышленная рабочая лошадка

Выпущенная в начале 2023 года, YOLOv6. YOLOv6 была разработана с единственной целью: промышленное применение. Исследователи из Meituan оптимизировали эту модель специально для GPU , что сделало ее популярным выбором для высокоскоростных производственных и автоматизированных систем контроля, работающих на таком оборудовании, как NVIDIA T4.

ОбзорYOLOv6
Авторы: Чуй Ли, Лулу Ли, Ифэй Гэн, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Кэ, Сяомин Сюй и Сянсян Чу
Организация: Meituan
Дата: 13.01.2023
Arxiv: YOLOv6 .0: полномасштабная перезагрузка
GitHub: YOLOv6

Ключевые особенности и преимущества

Архитектура YOLOv6. YOLOv6 использует модуль двунаправленной конкатенации (BiC) и стратегию обучения с помощью анкеров (AAT). Ее основная сила заключается в базовой структуре типа RepVGG, которая позволяет модели иметь сложные ветвления во время обучения, но объединяться в простую и быструю структуру во время вывода.

  • GPU : модель тщательно настроена для TensorRT и отлично работает в сценариях с выделенными GPU
  • Поддержка квантования: введены методы обучения с учетом квантования (QAT) для сохранения высокой точности даже при сжатии до INT8.
  • Промышленное применение: специально разработано для практических сред, где строгие ограничения по задержкам, но мощное оборудование.

Однако такая ориентация на GPU означает, что YOLOv6. YOLOv6 может быть менее эффективен на устройствах, CPU, по сравнению с более новыми моделями, разработанными для более широкой совместимости с периферийными устройствами.

Узнайте больше о YOLOv6

YOLO26: Революция в области сквозных решений для периферийных устройств

Выпущенная в январе 2026 года, Ultralytics представляет собой сдвиг парадигмы в архитектуре обнаружения. Устраняя необходимость в немаксимальном подавлении (NMS), YOLO26 оптимизирует весь процесс развертывания, предлагая нативный комплексный опыт, который снижает разброс задержек и упрощает интеграцию.

Обзор YOLO26
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 14.01.2026
Документация: ДокументацияUltralytics
GitHub: ultralytics

Революционные функции

YOLO26 включает в себя инновации как в области компьютерного зрения, так и в области обучения больших языковых моделей (LLM) для достижения превосходной производительности:

  • Комплексный дизайн NMS: основываясь на наследии YOLOv10, YOLO26 устраняет необходимость в NMS . Это приводит к более быстрым, детерминированным скоростям вывода и упрощает логику развертывания.
  • MuSGD Optimizer: вдохновленный Kimi K2 от Moonshot AI, этот гибрид SGD Muon обеспечивает стабильность обучения LLM для задач визуального восприятия, гарантируя более быструю конвергенцию.
  • СкоростьCPU : благодаря удалению Distribution Focal Loss (DFL) и оптимизированным архитектурным решениям YOLO26 работает на CPU на 43 % быстрее, что делает его идеальным выбором для IoT, мобильных устройств и робототехники.
  • ProgLoss + STAL: усовершенствованные функции потери (программная потеря и потеря мягкой целевой привязки) значительно улучшают обнаружение мелких объектов, что является критически важным требованием для аэрофотосъемки и безопасности.

Узнайте больше о YOLO26

Сравнение метрик производительности

В следующей таблице показаны различия в производительности двух архитектур. В то время как YOLOv6. YOLOv6 остается конкурентоспособным на графических процессорах, YOLO26 демонстрирует превосходную эффективность, особенно в CPU и по использованию параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Анализ данных

YOLO26 достигает значительно более высокой точности (mAP) с примерно половиной параметров и FLOPs эквивалентных YOLOv6 . Например, YOLO26s достигает 48,6 mAP всего 9,5 млн параметров, тогда как YOLOv6. YOLOv6 требует 18,5 млн параметров для достижения 45,0 mAP.

Архитектурное Глубокое Погружение

Фундаментальное различие между этими двумя моделями заключается в их подходе к прогнозированию и оптимизации.

YOLOv6.0: усовершенствован для графических процессоров

YOLOv6 EfficientRep Backbone, который хорошо поддается параллелизации на графических процессорах. Он использует стратегию обучения с помощью якорей, которая сочетает в себе парадигмы на основе якорей и без якорей для стабилизации обучения. Сильная зависимость от сверток 3x3 делает его невероятно быстрым на аппаратном обеспечении, которое ускоряет эти операции, таком как NVIDIA , но эта структура может быть вычислительно дорогостоящей на процессорах или нейропроцессорах, которые не имеют специальных оптимизаций.

YOLO26: оптимизирован для всех платформ

YOLO26 использует более универсальный подход. Благодаря удалению модуля Distribution Focal Loss (DFL) выходной слой упрощается, что облегчает экспорт в такие форматы, как CoreML и TFLite.

Отличительной особенностью является сквозная конструкция NMS. Традиционные детекторы объектов выводят тысячи перекрывающихся прямоугольников, которые необходимо фильтровать с помощью NMS — процесса, который является медленным и сложным для оптимизации на встроенных ускорителях. YOLO26 использует стратегию двойного назначения во время обучения, которая заставляет модель предсказывать один правильный прямоугольник для каждого объекта, NMS устраняя необходимость в NMS во время вывода.

Преимущество Ultralytics

Хотя YOLOv6. YOLOv6 является мощным репозиторием с открытым исходным кодом, выбор Ultralytics обеспечивает доступ к комплексной экосистеме, которая упрощает весь жизненный цикл ИИ.

1. Безупречный пользовательский опыт

Ultralytics опыту разработчиков. Независимо от того, используете ли вы CLI Python , обучение модели SOTA занимает всего несколько строк кода. Этот рабочий процесс «от нуля до героя» контрастирует с исследовательскими репозиториями, которые часто требуют сложной настройки среды и ручного форматирования данных.

from ultralytics import YOLO

# Load the latest YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer automatically engaged
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

2. Непревзойденная универсальность

YOLOv6.YOLOv6 — это в первую очередь модель обнаружения объектов. В отличие от нее, Ultralytics поддерживает широкий спектр задач машинного зрения. Если требования вашего проекта меняются с обнаружения на сегментацию экземпляров или оценку позы, вы можете переключаться между задачами без изменения рабочего процесса или библиотеки.

3. Эффективность обучения и память

Ultralytics оптимизированы с учетом аппаратных ограничений. YOLO26 обычно требует меньше CUDA во время обучения по сравнению со старыми архитектурами или гибридными моделями на основе трансформаторов, такими как RT-DETR. Это позволяет разработчикам обучать более крупные пакеты данных на потребительских графических процессорах, ускоряя цикл исследований.

4. Надежная экосистема

Ultralytics (ранее HUB) предлагает веб-интерфейс для управления наборами данных, обучения моделей в облаке и развертывания на периферийных устройствах. В сочетании с интеграцией для Weights & Biases, MLflow и другими, YOLO26 естественным образом вписывается в современные конвейеры MLOps.

Заключение: какую модель вам следует выбрать?

Выберите YOLOv6-3.0, если:

  • Вы развертываете исключительно на графических процессорахNVIDIA или V100.
  • У вас есть устаревшая конвейерная линия, построенная специально для архитектуры RepVGG.
  • Ваше приложение предназначено исключительно для обнаружения объектов в контролируемой промышленной среде, где CPU не имеет значения.

Выберите YOLO26, если:

  • Вам нужен оптимальный баланс скорости и точности на различном оборудовании (CPU, GPU, NPU, мобильные устройства).
  • Вам требуется сквозное выведение NMS для упрощения логики развертывания.
  • Вы работаете с периферийными устройствами, такими как Raspberry Pi, Jetson Nano или мобильные телефоны, где CPU имеет решающее значение.
  • Вам нужно перспективное решение, поддерживаемое активным обслуживанием, документацией и процветающим сообществом.
  • Ваш проект включает в себя сложные задачи, такие как OBB или сегментация, наряду с обнаружением.

Для большинства разработчиков и предприятий, начинающих сегодня новые проекты, YOLO26 предлагает превосходную универсальность, простоту использования и производительность, что делает его рекомендуемым выбором для приложений компьютерного зрения следующего поколения.

Узнайте больше о YOLO26

Пользователям, заинтересованным в изучении других высокоэффективных моделей, мы также рекомендуем ознакомиться с YOLO11 для надежного обнаружения общего назначения или YOLO для задач с открытым словарем.


Комментарии