Перейти к содержанию

YOLOv6.0 против YOLOv8: технический анализ современных методов обнаружения объектов

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. В этом сравнении рассматриваются две важные вехи в YOLO : YOLOv6.YOLOv6, мощный детектор, оптимизированный для промышленных приложений, и Ultralytics YOLOv8, современная модель, разработанная с учетом универсальности, простоты использования и высокой производительности на широком спектре оборудования. Мы анализируем их архитектуру, показатели производительности и методологии обучения, чтобы помочь вам решить, какая модель лучше всего подходит для ваших потребностей.

Сравнение метрик производительности

В следующей таблице представлены ключевые показатели эффективности обеих моделей. YOLOv8 демонстрирует превосходный баланс точности и скорости, особенно в моделях среднего и большого размера, при этом сохраняя конкурентоспособное количество параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOv6.0: точность промышленного уровня

YOLOv6.YOLOv6, выпущенный Meituan в январе 2023 года, разработан специально для промышленных приложений, где аппаратные ограничения и пропускная способность имеют первостепенное значение. В нем представлено несколько архитектурных нововведений, направленных на максимальное увеличение скорости вывода на специализированных графических процессорах, таких как NVIDIA T4.

Ключевые архитектурные особенности

  • Репараметризуемая основа: использует основу в стиле VGG, которая эффективна при выводе, но может быть сложной для обучения. Подход «RepVGG» позволяет выполнять масштабное слияние ветвей во время экспорта.
  • Двунаправленное слияние: улучшает распространение характеристик по разным масштабам, повышая эффективность обнаружения объектов разных размеров.
  • Обучение с помощью якорей: использует стратегию обучения с помощью якорей (AAT) для стабилизации конвергенции без ущерба для гибкости вывода без якорей.

Преимущества:

  • Высокая пропускная способность: чрезвычайно быстрая работа на GPU благодаря аппаратно-ориентированной архитектуре.
  • Поддержка квантования: особое внимание уделяется квантованию после обучения (PTQ) и обучению с учетом квантования (QAT) для развертывания.

Слабые стороны:

  • Ограниченная поддержка задач: в основном ориентирован на обнаружение объектов, не имеет встроенной поддержки сегментации или оценки позы.
  • Сложность обучения: процесс перепараметризации усложняет процесс обучения и экспорта.

Узнайте больше о YOLOv6

Ultralytics YOLOv8: универсальный стандарт

Ultralytics YOLOv8, запущенный всего за несколько дней до YOLOv6. YOLOv6, представляет собой значительный скачок вперед в плане удобства использования и универсальности. Он разработан не просто как модель, а как платформа для различных задач компьютерного зрения. YOLOv8 анкерного подхода к обнаружению в пользу анкерного, упрощая архитектуру модели и улучшая обобщение.

Архитектурные инновации

  • Обнаружение без анкоров: устраняет необходимость в ручной настройке анкор-боксов, сокращая настройку гиперпараметров и улучшая производительность на различных наборах данных.
  • Модуль C2f: межэтапное частичное узкое место с двумя свертками, которое улучшает градиентный поток и уменьшает размер модели, сохраняя при этом точность.
  • Разделенная головка: разделяет задачи классификации и регрессии, позволяя каждой ветви сосредоточиться на своей конкретной цели для достижения более высокой точности.

Преимущества YOLOv8

Узнайте больше о YOLOv8

Оптимизированный рабочий процесс

Обучение YOLOv8 невероятно просто. Следующий фрагмент кода демонстрирует, как загрузить предварительно обученную модель и начать обучение на пользовательском наборе данных:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Сравнительный анализ: варианты использования и внедрение

При выборе между этими двумя мощными архитектурами решение часто зависит от конкретных требований вашей среды развертывания и объема задач, которые вам необходимо выполнять.

Приложения в реальном мире

YOLOv6.0 превосходит:

  • Высокоскоростная промышленная инспекция: идеально подходит для производственных линий, использующих специализированные графические процессоры, где важна каждая миллисекунда пропускной способности.
  • Развертывание с фиксированным оборудованием: сценарии, в которых оборудование известно и оптимизировано для конкретных задач (например, серверы NVIDIA ).

Ultralytics YOLOv8 превосходит:

  • Edge AI и мобильные устройства: эффективная архитектура модели и простой экспорт в TFLite и CoreML делают ее идеальной для Android iOS Android .
  • Робототехника и автономные системы: способность одновременно выполнять несколько задач, таких как сегментация и оценка положения, обеспечивает роботам более глубокое понимание окружающей среды.
  • Быстрое прототипирование: простота использования и исчерпывающая документация позволяют разработчикам быстро выполнять итерации и быстрее выводить продукты на рынок.

Защита ваших проектов от устаревания

Хотя обе модели являются превосходными, область искусственного интеллекта развивается невероятно быстро. Разработчикам, которые сегодня начинают новые проекты и которым требуется абсолютная передовая производительность и эффективность, Ultralytics обратить внимание на YOLO26.

YOLO26 основан на успехе YOLOv8 несколькими революционными функциями:

  • Полное NMS: благодаря устранению функции Non-Maximum Suppression (NMS) YOLO26 упрощает развертывание и снижает разброс задержек.
  • Оптимизатор MuSGD: вдохновленный обучением LLM, этот оптимизатор обеспечивает стабильную конвергенцию.
  • Улучшенная производительность на периферии: до 43 % более быстрое CPU , что критически важно для устройств с питанием от батареи.
  • Специфичность задачи: Специализированные функции потерь, такие как ProgLoss и STAL, значительно улучшают обнаружение мелких объектов.

Узнайте больше о YOLO26

Заключение

Как YOLOv6.0, так и YOLOv8 представляют собой вершины в истории обнаружения объектов. YOLOv6. YOLOv6 предлагает специализированное решение для промышленных GPU с высокой пропускной способностью. Однако для подавляющего большинства пользователей Ultralytics YOLOv8 (и более новая версия YOLO26) предлагает превосходный опыт благодаря своей универсальности, простоте использования и всесторонней поддержке задач. Возможность плавного переключения между обнаружением, сегментацией и оценкой позы в рамках одной платформы значительно сокращает затраты на разработку и ускоряет окупаемость.

Разработчики, заинтересованные в других архитектурах, могут также изучить YOLOv9 для получения информации о программируемом градиенте или YOLO для возможностей обнаружения открытого словаря.

Подробности

YOLOv6-3.0

  • Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
  • Организация: Meituan
  • Дата: 2023-01-13
  • Arxiv:2301.05586
  • GitHub:YOLOv6

YOLOv8


Комментарии