Перейти к содержанию

YOLOv6.0 против YOLOv9: промышленная скорость и современная эффективность

Выбор оптимальной модели обнаружения объектов - ключевое решение при разработке компьютерного зрения, требующее стратегического баланса между точностью, скоростью вывода и вычислительной эффективностью. В этом сравнении рассматриваются технические нюансы YOLOv6.0, модели, разработанной компанией Meituan для промышленного применения, и YOLOv9передовой архитектуры, в которой эффективность определяется сохранением информации.

YOLOv6.0: Оптимизирован для промышленных приложений

YOLOv6.0 в значительной степени ориентирован на практические сценарии развертывания, в которых аппаратная задержка является основным узким местом.

Философия архитектуры и дизайна

YOLOv6.0 разработана как аппаратно-ориентированная конволюционная нейронная сеть (CNN). Архитектура использует эффективную основу репараметризации и гибридные блоки (RepBi-PAN) для максимизации пропускной способности на GPU. Подстраивая структуру модели под конкретные аппаратные характеристики, YOLOv6 стремится обеспечить высокую скорость вычислений без существенного снижения точности. Он служит одноступенчатым детектором, оптимизированным для промышленной автоматизации и видеонаблюдения, где обработка данных в реальном времени не является обязательным условием.

Сильные стороны и ограничения

Преимущества:

  • Скорость вывода: модель отлично работает в средах с низкой задержкой, особенно на графических процессорах NVIDIA T4, что делает ее подходящей для высокоскоростных производственных линий.
  • Оптимизация аппаратного обеспечения: Дружественный к аппаратному обеспечению дизайн модели обеспечивает эффективное использование пропускной способности памяти и вычислительных блоков во время развертывания.

Слабые стороны:

  • Представление характеристик: Не хватает продвинутых методов сохранения градиентной информации, которые используются в новых моделях, таких как YOLOv9, что приводит к более резкому падению точности при уменьшении размера модели.
  • Поддержка экосистемы: Несмотря на эффективность, окружающая экосистема инструментов, поддержки сообщества и простой интеграции менее обширна по сравнению с фреймворком Ultralytics .
  • Ограниченная универсальность: В основном ориентирован на обнаружение ограничительных рамок, имеет меньшую поддержку сложных задач, таких как сегментация или оценка позы, по сравнению с универсальными моделями Ultralytics .

Узнайте больше о YOLOv6

YOLOv9: переопределение точности и потока информации

YOLOv9 представляет новые архитектурные концепции, которые решают фундаментальную проблему потери информации в глубоких сетях, достигая превосходных показателей производительности.

Архитектура: PGI и GELAN

YOLOv9 отличается двумя прорывными инновациями: Программируемая градиентная информация (PGI) и обобщенная эффективная сеть агрегирования слоев (GELAN).

  1. PGI борется с проблемой "узкого места" в информации, присущей глубоким нейронным сетям. Сохраняя важные данные о градиенте между слоями, PGI гарантирует, что модель обучается более надежным характеристикам, что приводит к повышению точности.
  2. GELAN оптимизирует использование параметров, позволяя модели достигать более высокой точности при меньшем количестве параметров и вычислительных затрат по сравнению с традиционными архитектурами.

Обзор инноваций: Программируемая градиентная информация (PGI)

Глубокие сети часто теряют информацию при прохождении данных через последовательные слои - явление, известное как "информационное узкое место". PGI в YOLOv9 действует как вспомогательный механизм наблюдения, обеспечивая сохранение важных данных для изучения целевых объектов по всей глубине сети. Это позволяет значительно улучшить сходимость и точность, особенно для detect объектов.

Преимущества экосистемы Ultralytics

Интеграция YOLOv9 в экосистему Ultralytics дает разработчикам явные преимущества:

  • Простота использования: Унифицированный Python API и CLI упрощают обучение, проверку и развертывание.
  • Баланс производительности: YOLOv9 достигает передового уровня mAP при сохранении конкурентоспособной скорости вычислений, предлагая отличный компромисс для различных приложений.
  • Эффективность памяти: Реализации Ultralytics оптимизированы для меньшего объема памяти при обучении, в отличие от высоких требований к VRAM, предъявляемых некоторыми моделями на основе трансформаторов.
  • Универсальность: Гибкость архитектуры в рамках Ultralytics позволяет не только обнаруживать, но и решать другие задачи, опираясь на активное сообщество и частые обновления.

Узнайте больше о YOLOv9

Сравнительный анализ производительности

Данные о производительности подчеркивают четкое различие: YOLOv6.0 оптимизирует сырую скорость на конкретном оборудовании, в то время как YOLOv9 доминирует в эффективности (точность на параметр).

Например, YOLOv9c достигает 53,0% mAP всего с 25,3M параметрами, превосходя YOLOv6.0l (52,8% mAP), который требует более чем вдвое больше параметров (59,6M) и значительно больше FLOPs. Это говорит о том, что архитектурные инновации YOLOv9(GELAN и PGI) позволяют ему "учиться большему с меньшими затратами", что делает его высокоэффективным выбором для сред с ограниченными ресурсами, где по-прежнему требуется высокая точность.

И наоборот, YOLOv6.0n обладает чрезвычайно низкой задержкой (1,17 мс), что делает его пригодным для сверхбыстрых выводов в реальном времени, где снижение точности (37,5% mAP) является приемлемым.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Рабочие процессы обучения и развертывания

Опыт разработчиков существенно различается между двумя моделями. YOLOv6.0 обычно опирается на специфический для репозитория рабочий процесс, включающий сценарии оболочки и файлы конфигурации, созданные вручную. Несмотря на свою мощь, эта модель может оказаться более сложной для новичков.

В отличие от этого, YOLOv9 использует преимущества оптимизированного Ultralytics рабочий процесс. Для обучения современной модели требуется минимум кода, а экосистема поддерживает беспрепятственный экспорт в такие форматы, как ONNX, TensorRTи CoreML для широкой совместимости с развертыванием.

Пример: Обучение YOLOv9 с помощью Ultralytics

Интерфейс Ultralytics Python позволяет запускать тренировки всего несколькими строками кода, автоматически обрабатывать данные, регистрировать и оценивать их.

from ultralytics import YOLO

# Load a pre-trained YOLOv9 model
model = YOLO("yolov9c.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Гибкость развертывания

Модели Ultralytics , включая YOLOv9, поддерживают экспорт одним щелчком мыши в различные форматы, подходящие для пограничного ИИ и облачного развертывания. Такая гибкость упрощает переход от исследований к производству.

Идеальные варианты использования

YOLOv6.0

  • Высокоскоростные сборочные линии: Системы контроля качества, где скорость конвейера требует задержек менее 2 мс.
  • Выделенное оборудование: Сценарии, выполняемые на специальных графических процессорах NVIDIA , где полностью задействована архитектура, ориентированная на аппаратное обеспечение.

YOLOv9

  • Автономные системы:самоуправляемые автомобили и робототехника, требующие высокой точности для безопасной навигации в сложных средах.
  • Медицинская визуализация: Такие приложения, как обнаружение опухолей, где пропуск небольшого признака (ложноотрицательный результат) недопустим.
  • Автобиография общего назначения: Разработчики, ищущие надежную, простую в использовании модель с отличной документацией и поддержкой сообщества для решения различных задач.

Заключение

Хотя YOLOv6.0 остается мощным инструментом для специализированных промышленных приложений, в которых приоритет отдается сырой пропускной способности на конкретном оборудовании, YOLOv9 является лучшим выбором для большинства современных проектов компьютерного зрения.

Инновационная архитектура PGI и GELAN в YOLOv9 обеспечивает лучший баланс точности и эффективности, часто превосходя YOLOv6 по показателям производительности на один параметр. Кроме того, интеграция с экосистемойUltralytics обеспечивает разработчикам оптимизированный рабочий процесс, активное сопровождение и набор инструментов, ускоряющих переход от данных к развертыванию. Тем, кто ищет перспективную, универсальную и высокопроизводительную модель, рекомендуем YOLOv9 .

Изучите другие модели

Если вы изучаете современные возможности, обратите внимание на другие мощные модели в библиотеке Ultralytics :

  • YOLO11: новейшая разработка в серии YOLO , обеспечивающая передовую производительность при обнаружении, сегментации и оценке позы.
  • YOLOv8: популярная и универсальная модель, известная своим балансом скорости и точности при выполнении различных задач.
  • RT-DETR: Извещатель на основе трансформатора, который отличается высокой точностью без необходимости использования немаксимального подавленияNMS).

Комментарии