Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 против YOLOv7#

Эволюция компьютерного зрения в реальном времени характеризуется стремительным прогрессом в эффективности архитектур и методологиях обучения. Две заметные модели, оказавшие значительное влияние на эту область — YOLOv6-3.0 и YOLOv7. Оба фреймворка представили инновационные методы для достижения баланса между скоростью логического вывода и точностью обнаружения, ориентируясь на развертывание от мощных серверных GPU до периферийных устройств.

Это всестороннее техническое сравнение исследует их архитектуры, метрики производительности и идеальные сценарии использования, а также подчеркивает, как современная платформа Ultralytics и новейшая модель YOLO26 развивают эти базовые концепции для обеспечения непревзойденного опыта разработчика.

Link to this sectionYOLOv6-3.0: Оптимизация промышленной пропускной способности#

Разработанная департаментом Vision AI в Meituan, модель YOLOv6-3.0 была спроектирована специально для промышленных приложений с высокой пропускной способностью. Она делает основной упор на максимальную производительность на аппаратных ускорителях, что делает её сильным кандидатом для сред, где возможна пакетная обработка на выделенных GPU.

  • Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
  • Организация: Meituan
  • Дата: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionАрхитектурные инновации#

YOLOv6-3.0 полагается на бэкенд EfficientRep — архитектуру, ориентированную на аппаратное обеспечение и разработанную для оптимизации затрат на доступ к памяти в GPU. Для улучшения слияния признаков на разных масштабах модель использует модуль Bi-directional Concatenation (BiC) в своем шейке (neck). Это позволяет сети более эффективно захватывать сложные пространственные иерархии по сравнению с предыдущими итерациями.

Более того, YOLOv6-3.0 реализует стратегию Anchor-Aided Training (AAT). Этот подход сочетает богатые градиентные сигналы обучения на основе анкоров с преимуществами оптимизированного развертывания логического вывода без анкоров, что помогает модели сходиться более стабильно без ущерба для скорости постобработки.

Узнай больше о YOLOv6

Аппаратные соображения

Хотя YOLOv6-3.0 отлично работает на серверных GPU (таких как NVIDIA T4), её сильная зависимость от специфической структурной репараметризации иногда может приводить к субоптимальной задержке на устройствах, где нагрузка ложится строго на CPU, по сравнению с более новыми архитектурами.

Link to this sectionYOLOv7: Пионер «наборов бесплатных улучшений»#

Выпущенная исследователями из Academia Sinica, модель YOLOv7 применила иной подход, сосредоточившись на анализе градиентных путей и оптимизациях времени обучения, которые не увеличивают стоимость логического вывода — концепция, которую авторы называют "обучаемым набором бесплатных улучшений" ("trainable bag-of-freebies").

  • Авторы: Chien-Yao Wang, Alexey Bochkovskiy и Hong-Yuan Mark Liao
  • Организация: Институт информационных наук, Academia Sinica, Тайвань
  • Дата: 2022-07-06
  • Arxiv: 2207.02696
  • GitHub: WongKinYiu/yolov7

Link to this sectionАрхитектурные инновации#

Основой YOLOv7 является сеть Extended Efficient Layer Aggregation Network (E-ELAN). E-ELAN оптимизирует градиентный путь, позволяя разным слоям изучать более разнообразные признаки, не нарушая оригинальную топологию сети. Это приводит к созданию высоковыразительной модели, способной достигать топовых значений mean average precision (mAP).

YOLOv7 также активно использует репараметризацию модели, объединяя сверточные слои с пакетной нормализацией во время логического вывода. Это уменьшает количество параметров и ускоряет прямой проход при развертывании с использованием таких фреймворков, как NVIDIA TensorRT или ONNX.

Узнай больше о YOLOv7

Link to this sectionСравнение производительности#

При оценке этих моделей на датасете MS COCO, мы наблюдаем четкий компромисс между ультралегкими вариантами YOLOv6 и сильно параметризованными, сфокусированными на точности архитектурами YOLOv7.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

Данные показывают, что YOLOv6-3.0n предлагает исключительную скорость логического вывода, что делает её подходящей для высокочастотной видеоаналитики. Напротив, YOLOv7x достигает наивысшего mAP, доминируя в задачах, где точность обнаружения важнее частоты кадров.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLOv6 и YOLOv7 зависит от специфических требований твоего проекта, ограничений по развертыванию и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLOv6#

YOLOv6 — сильный выбор для:

  • Промышленного внедрения с учетом оборудования: сценарии, где аппаратная ориентированность модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
  • Быстрого одноэтапного обнаружения: приложения, где приоритетом является чистая скорость вывода на GPU для обработки видео в реальном времени в контролируемых условиях.
  • Интеграции в экосистему Meituan: команды, которые уже работают в рамках технологического стека и инфраструктуры развертывания Meituan.

Link to this sectionКогда выбирать YOLOv7#

YOLOv7 рекомендуется для:

  • Академического бенчмаркинга: воспроизведение результатов уровня state-of-the-art 2022 года или изучение эффектов E-ELAN и методов trainable bag-of-freebies.
  • Исследований репараметризации: изучение плановых репараметризованных сверток и стратегий составного масштабирования моделей.
  • Существующих кастомных конвейеров: проектов с сильно модифицированными конвейерами, построенными вокруг специфической архитектуры YOLOv7, которые нельзя легко переработать.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionПреимущество Ultralytics: Шаг в будущее#

Хотя YOLOv6-3.0 и YOLOv7 представляют собой важные вехи, интеграция разрозненных репозиториев в производственные конвейеры часто создает сложности в развертывании моделей и настройке гиперпараметров. Экосистема Ultralytics решает эти проблемы, предлагая оптимизированный, унифицированный интерфейс.

Link to this sectionПочему стоит выбрать Ultralytics?#

  • Простота использования: Python API от Ultralytics позволяет тебе загружать, обучать и экспортировать модели всего за несколько строк кода. Переход со старой модели на новейшую архитектуру требует замены всего одной строки.
  • Хорошо поддерживаемая экосистема: Ultralytics предоставляет частые обновления, активную поддержку сообщества и надежную документацию.
  • Универсальность: В отличие от ранних моделей, которые фокусировались преимущественно на ограничивающих рамках (bbox), модели Ultralytics изначально поддерживают многозадачное обучение, включая сегментацию экземпляров, оценку позы и ориентированные ограничивающие рамки (OBB).
  • Требования к памяти: Модели Ultralytics YOLO поддерживают меньшее потребление памяти во время обучения по сравнению с трансформерными архитектурами, такими как RT-DETR, что позволяет тебе эффективно проводить обучение на потребительском оборудовании.

Link to this sectionОбновление до YOLO26#

Для разработчиков, стремящихся к вершине производительности, YOLO26 (выпущена в январе 2026 года) фундаментально меняет парадигму обнаружения объектов. Она представляет полностью End-to-End NMS-Free Design, устраняя сложную логику постобработки и значительно снижая вариативность задержек на периферийных устройствах.

Ключевые инновации в YOLO26 включают:

  • Оптимизатор MuSGD: Сложный гибрид SGD и Muon, который обеспечивает невероятно стабильную динамику обучения и более быструю сходимость.
  • Удаление DFL: Благодаря исключению Distribution Focal Loss, YOLO26 упрощает совместимость при экспорте и повышает производительность на маломощных устройствах.
  • ProgLoss + STAL: Продвинутые функции потерь, которые дают заметные улучшения в распознавании мелких объектов.
  • Непревзойденная скорость: Достигает до 43% более быстрого логического вывода на CPU по сравнению с предыдущими поколениями, что делает её идеальной для встраиваемых систем, таких как Raspberry Pi или для развертывания на Apple CoreML.

Другие высокоэффективные модели в экосистеме включают YOLO11 и YOLOv8, обе из которых предлагают отличный баланс производительности для интеграции с устаревшим оборудованием.

Подготовь свой конвейер к будущему

Создавая свои приложения компьютерного зрения на платформе Ultralytics, ты обеспечиваешь немедленный доступ к будущим передовым моделям без необходимости переписывать загрузчики датасетов или скрипты развертывания.

Link to this sectionПример кода: Оптимизированное обучение#

Следующий фрагмент кода иллюстрирует, насколько легко ты можешь обучить современную модель YOLO26, используя API Ultralytics. Этот точный рабочий процесс беспрепятственно применяется к YOLO11 или YOLOv8, абстрагируя шаблонный код, обычно требуемый более старыми репозиториями.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model for rapid training
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset
# The API handles dataset downloading, augmentation, and hyperparameter configuration
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cuda:0",  # Automatically utilizes PyTorch GPU acceleration
)

# Run an end-to-end, NMS-free inference on a test image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for cross-platform deployment
model.export(format="onnx")

Link to this sectionЗаключение#

YOLOv6-3.0 и YOLOv7 успешно решили разные аспекты проблемы обнаружения в реальном времени. YOLOv6-3.0 — это мощный инструмент для специализированных промышленных GPU-сред, в то время как YOLOv7 обеспечивает высокую точность за счет тщательной оптимизации градиентного пути.

Однако для современных приложений, требующих непревзойденной универсальности, минимальных сложностей при развертывании и передовой производительности, Ultralytics YOLO26 является окончательным выбором. Её архитектура без NMS, продвинутый оптимизатор MuSGD и глубокая интеграция с платформой Ultralytics гарантируют, что ты как разработчик сможешь развертывать мощные, масштабируемые решения Vision AI быстрее, чем когда-либо прежде.

Участники

Комментарии