Перейти к содержанию

YOLOv6.0 против YOLOv9: достижения в области высокопроизводительного обнаружения объектов

Эволюция архитектур обнаружения объектов характеризовалась постоянным стремлением к оптимальному балансу между скоростью вывода и точностью обнаружения. В этом сравнении подробно рассматриваются YOLOv6.YOLOv6, надежная модель промышленного уровня, разработанная Meituan, и YOLOv9, ориентированной на исследования архитектурой, в которой представлены новые концепции управления градиентной информацией. Анализируя их архитектуры, показатели производительности и идеальные сценарии использования, разработчики могут принимать обоснованные решения для своих конвейеров компьютерного зрения.

Сравнение метрик производительности

В следующей таблице представлено прямое сравнение ключевых показателей эффективности. YOLOv9 обычно обеспечивает более высокую точность (mAP) для моделей аналогичного размера, используя передовые методы агрегирования характеристик, в то время как YOLOv6.YOLOv6 остается конкурентоспособным в определенных средах GPU.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

YOLOv6-3.0: Промышленная точность

YOLOv6, в частности версия 3.0, был разработан с явным упором на промышленные приложения, где для развертывания оборудования часто используются графические процессоры, такие как NVIDIA T4. Он отличается простотой развертывания благодаря агрессивной оптимизации квантования и TensorRT .

  • Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
  • Организация:Meituan
  • Дата: 2023-01-13
  • Arxiv:YOLOv6 v3.0: A Full-Scale Reloading
  • GitHub:meituan/YOLOv6

Архитектура и сильные стороны

YOLOv6.YOLOv6 использует базовую архитектуру в стиле RepVGG, известную как EfficientRep, которая использует структурную перепараметризацию. Во время обучения модель использует многоветвленные блоки для обучения сложным особенностям, но во время вывода они сводятся к одиночным сверткам $3\times3$. Эта архитектура очень удобна для GPU , максимально увеличивая пропускную способность памяти и сокращая задержку.

Ключевые особенности включают:

  • Двунаправленное слияние: улучшает распространение характеристик по разным масштабам, повышая эффективность обнаружения объектов разных размеров.
  • Обучение с помощью якорей (AAT): сочетает преимущества парадигм с использованием якорей и без них во время обучения для стабилизации конвергенции.
  • Готовность к квантованию: специально разработано для минимизации потери точности при квантовании до INT8, что является критически важным требованием для периферийных устройств искусственного интеллекта в автоматизации производства.

Узнайте больше о YOLOv6

YOLOv9: устранение информационных узких мест

YOLOv9 использует теоретический подход к повышению эффективности глубокого обучения, решая проблему «информационного бутылочного горлышка», когда данные теряются при прохождении через глубокие сети. Он вводит механизмы для сохранения важной информации о градиенте на протяжении всего процесса обучения.

Архитектура и сильные стороны

Основная инновация YOLOv9 в двух основных компонентах:

  • GELAN (Generalized Efficient Layer Aggregation Network): новая архитектура, сочетающая в себе преимущества CSPNet и ELAN для максимальной эффективности параметров и скорости вычислений. Она позволяет модели обучаться более надежным функциям с меньшим количеством параметров по сравнению с предыдущими поколениями, такими как YOLOv8.
  • PGI (Programmable Gradient Information): вспомогательная система контроля, которая обеспечивает получение глубокими слоями сети надежной информации о градиенте во время обучения. Это особенно полезно для задач, требующих высокой точности, таких как анализ медицинских изображений.

YOLOv9 превосходную производительность с точки зрения эффективности параметров, достигая более высокого mAP меньшим количеством параметров, чем многие конкуренты, что делает его отличным выбором для исследований и сценариев, где размер веса модели является ограничением.

Узнайте больше о YOLOv9

Техническое сравнение и примеры использования

Выбор между YOLOv6. YOLOv6 и YOLOv9 зависит от конкретного аппаратного обеспечения и характера приложения.

Когда следует выбирать YOLOv6-3.0

YOLOv6.YOLOv6 отлично работает в средах,GPU. Его магистраль RepVGG оптимизирована для параллельной обработки, что делает ее более быстрой на таких устройствах, как NVIDIA или Jetson Orin, при использовании TensorRT. Она идеально подходит для:

  • Высокоскоростное производство: системы контроля качества на сборочных линиях, где пропускная способность имеет решающее значение.
  • Видеоаналитика: одновременная обработка нескольких видеопотоков в системах «умного города ».
  • Интеграция с существующими системами: системы, уже оптимизированные для архитектур типа RepVGG.

Когда выбирать YOLOv9

YOLOv9 для приложений и исследований, где важна точность. Ее усовершенствованная архитектура лучше сохраняет мелкие детали, чем многие предшественники. Она подходит для:

  • Академические исследования: прочная основа для изучения агрегации признаков и градиентного потока.
  • Обнаружение мелких объектов: структура PGI помогает сохранять информацию о мелких целях, которые в противном случае могли бы быть утеряны в глубоких слоях, что полезно для аэрофотоснимков.
  • Устройства с ограниченными параметрами: когда пространство для хранения ограничено, высокое соотношение точности к параметрам YOLOv9 является преимуществом.

Гибкость развертывания

Хотя обе модели имеют определенные преимущества, их преобразование для развертывания может быть различной сложности. Этап перепараметризации YOLOv6 требует тщательной обработки во время экспорта, тогда как вспомогательные ветви YOLOv9 для PGI удаляются во время вывода, что упрощает окончательную структуру модели.

Преимущество экосистемы Ultralytics

Хотя YOLOv6 YOLOv9 важные вехи, Ultralytics предлагает унифицированную платформу, которая упрощает весь жизненный цикл машинного обучения. Независимо от того, используете ли вы YOLOv6, YOLOv9 или современную YOLO26, Ultralytics стабильную и мощную работу.

Почему стоит развиваться вместе с Ultralytics?

  1. Простота использования: Python Ultralytics абстрагирует сложные циклы обучения в несколько строк кода. Вы можете переключаться между архитектурами, просто изменив строку имени модели, например, с yolov6n.pt в yolo26n.pt.
  2. Хорошо поддерживаемая экосистема: в отличие от исследовательских репозиториев, которые часто перестают обновляться после публикации, Ultralytics активно поддерживаются. Это обеспечивает совместимость с последними версиями PyTorch, CUDA и форматами экспорта, такими как ONNX.
  3. Универсальность: Ultralytics широкий спектр задач компьютерного зрения. В то время как YOLOv6 YOLOv9 сосредоточены на обнаружении, Ultralytics возможности до сегментации экземпляров, оценки позы и ориентированного обнаружения объектов (OBB).
  4. Эффективность обучения: конвейеры Ultralytics оптимизированы для эффективного использования памяти, что позволяет разработчикам обучать более крупные модели на потребительских графических процессорах по сравнению с гибридными трансформаторами, требующими большого объема памяти.

Пример кода: Беспрерывное обучение

Обучение любой из этих моделей в Ultralytics происходит одинаково, что сокращает время обучения вашей команды.

from ultralytics import YOLO

# Load a model: Switch between 'yolov6n.pt', 'yolov9c.pt', or 'yolo26n.pt'
model = YOLO("yolo26n.pt")

# Train on a dataset (e.g., COCO8)
# The system handles data augmentation, logging, and checkpointing automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Обновление до YOLO26: следующее поколение

Для разработчиков, стремящихся к абсолютному максимуму производительности, эффективности и простоте развертывания, YOLO26 представляет собой вершину YOLO . Выпущенная в январе 2026 года, она основана на опыте, полученном при разработке YOLOv6, YOLOv9 и YOLOv10 , чтобы обеспечить превосходный опыт.

Основные преимущества YOLO26

  • Сквозной дизайн NMS: в отличие от YOLOv6 YOLOv9, которые требуют постобработки с помощью Non-Maximum Suppression (NMS), YOLO26 изначально является сквозным. Это устраняет изменчивость задержки и упрощает конвейеры развертывания, особенно на периферийных устройствах.
  • MuSGD Optimizer: вдохновленный инновациями в области обучения LLM, MuSGD Optimizer (гибрид SGD Muon) стабилизирует обучение и ускоряет сходимость, сокращая время и вычислительные ресурсы, необходимые для обучения пользовательских моделей.
  • Оптимизированная производительность: благодаря устранению распределенной фокальной потери (DFL) и усовершенствованию архитектуры YOLO26 обеспечивает на 43 % более быстрое CPU по сравнению с предыдущими поколениями. Это делает его идеальным выбором для сред, CPU, таких как Raspberry Pi или мобильные телефоны.
  • Усовершенствованные функции потерь: интеграция ProgLoss и STAL значительно улучшает распознавание мелких объектов и точность ограничивающих рамок, устраняя общие недостатки ранних YOLO .
  • Освоение конкретных задач: YOLO26 предназначен не только для обнаружения; он обладает специализированными усовершенствованиями, такими как семантическая сегментационная потеря для задач сегментации и оценка остаточной логарифмической вероятности (RLE) для высокоточной оценки позы.

Изучите документацию YOLO26

Заключение

Как YOLOv6. YOLOv6, так и YOLOv9 явные преимущества для определенных ниш —YOLOv6 промышленных конвейеров GPU, а YOLOv9 высокоточных исследований. Однако для перспективного решения, которое обеспечивает баланс между скоростью, точностью и простотой развертывания на всех типах оборудования, Ultralytics выделяется как рекомендуемый выбор для современной разработки в области компьютерного зрения.


Комментарии