YOLOv6.0 против YOLOv8: технический анализ современных методов обнаружения объектов

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. В этом сравнении рассматриваются две важные вехи в YOLO : YOLOv6.YOLOv6, мощный детектор, оптимизированный для промышленных приложений, и Ultralytics YOLOv8, современная модель, разработанная с учетом универсальности, простоты использования и высокой производительности на широком спектре оборудования. Мы анализируем их архитектуру, показатели производительности и методологии обучения, чтобы помочь вам решить, какая модель лучше всего подходит для ваших потребностей.

Сравнение метрик производительности

В следующей таблице представлены ключевые показатели эффективности обеих моделей. YOLOv8 демонстрирует превосходный баланс точности и скорости, особенно в моделях среднего и большого размера, при этом сохраняя конкурентоспособное количество параметров.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv8n	640	37.3	80.4	1.47	3.2	8.7
YOLOv8s	640	44.9	128.4	2.66	11.2	28.6
YOLOv8m	640	50.2	234.7	5.86	25.9	78.9
YOLOv8l	640	52.9	375.2	9.06	43.7	165.2
YOLOv8x	640	53.9	479.1	14.37	68.2	257.8

YOLOv6.0: точность промышленного уровня

YOLOv6.YOLOv6, выпущенный Meituan в январе 2023 года, разработан специально для промышленных приложений, где аппаратные ограничения и пропускная способность имеют первостепенное значение. В нем представлено несколько архитектурных нововведений, направленных на максимальное увеличение скорости вывода на специализированных графических процессорах, таких как NVIDIA T4.

Ключевые архитектурные особенности

Репараметризуемая основа: использует основу в стиле VGG, которая эффективна при выводе, но может быть сложной для обучения. Подход «RepVGG» позволяет выполнять масштабное слияние ветвей во время экспорта.
Двунаправленное слияние: улучшает распространение характеристик по разным масштабам, повышая эффективность обнаружения объектов разных размеров.
Обучение с помощью якорей: использует стратегию обучения с помощью якорей (AAT) для стабилизации конвергенции без ущерба для гибкости вывода без якорей.

Преимущества:

Высокая пропускная способность: чрезвычайно быстрая работа на GPU благодаря аппаратно-ориентированной архитектуре.
Поддержка квантования: особое внимание уделяется квантованию после обучения (PTQ) и обучению с учетом квантования (QAT) для развертывания.

Слабые стороны:

Ограниченная поддержка задач: в основном ориентирован на обнаружение объектов, не имеет встроенной поддержки сегментации или оценки позы.
Сложность обучения: процесс перепараметризации усложняет процесс обучения и экспорта.

Узнайте больше о YOLOv6

Ultralytics YOLOv8: универсальный стандарт

Ultralytics YOLOv8, запущенный всего за несколько дней до YOLOv6. YOLOv6, представляет собой значительный скачок вперед в плане удобства использования и универсальности. Он разработан не просто как модель, а как платформа для различных задач компьютерного зрения. YOLOv8 анкерного подхода к обнаружению в пользу анкерного, упрощая архитектуру модели и улучшая обобщение.

Архитектурные инновации

Обнаружение без анкоров: устраняет необходимость в ручной настройке анкор-боксов, сокращая настройку гиперпараметров и улучшая производительность на различных наборах данных.
Модуль C2f: межэтапное частичное узкое место с двумя свертками, которое улучшает градиентный поток и уменьшает размер модели, сохраняя при этом точность.
Разделенная головка: разделяет задачи классификации и регрессии, позволяя каждой ветви сосредоточиться на своей конкретной цели для достижения более высокой точности.

Преимущества YOLOv8

Универсальность: встроенная поддержка обнаружения объектов, сегментации экземпляров, оценки позы, классификации и ориентированных ограничивающих прямоугольников (OBB).
Простота использования: Python Ultralytics позволяет проводить обучение, валидацию и развертывание всего за несколько строк кода.
Эффективность обучения: оптимизировано для быстрого обучения на потребительских графических процессорах с меньшими требованиями к памяти, чем у многих альтернативных решений на основе трансформеров.
Экосистема: Поддерживается надежной Ultralytics , включая бесшовную интеграцию с такими инструментами, как Ultralytics и Comet .

Узнайте больше о YOLOv8

Оптимизированный рабочий процесс

Обучение YOLOv8 невероятно просто. Следующий фрагмент кода демонстрирует, как загрузить предварительно обученную модель и начать обучение на пользовательском наборе данных:

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Сравнительный анализ: варианты использования и внедрение

При выборе между этими двумя мощными архитектурами решение часто зависит от конкретных требований вашей среды развертывания и объема задач, которые вам необходимо выполнять.

Приложения в реальном мире

YOLOv6.0 превосходит:

Высокоскоростная промышленная инспекция: идеально подходит для производственных линий, использующих специализированные графические процессоры, где важна каждая миллисекунда пропускной способности.
Развертывание с фиксированным оборудованием: сценарии, в которых оборудование известно и оптимизировано для конкретных задач (например, серверы NVIDIA ).

Ultralytics YOLOv8 превосходит:

Edge AI и мобильные устройства: эффективная архитектура модели и простой экспорт в TFLite и CoreML делают ее идеальной для Android iOS Android .
Робототехника и автономные системы: способность одновременно выполнять несколько задач, таких как сегментация и оценка положения, обеспечивает роботам более глубокое понимание окружающей среды.
Быстрое прототипирование: простота использования и исчерпывающая документация позволяют разработчикам быстро выполнять итерации и быстрее выводить продукты на рынок.

Защита ваших проектов от устаревания

Хотя обе модели являются превосходными, область искусственного интеллекта развивается невероятно быстро. Разработчикам, которые сегодня начинают новые проекты и которым требуется абсолютная передовая производительность и эффективность, Ultralytics обратить внимание на YOLO26.

YOLO26 основан на успехе YOLOv8 несколькими революционными функциями:

Полное NMS: благодаря устранению функции Non-Maximum Suppression (NMS) YOLO26 упрощает развертывание и снижает разброс задержек.
Оптимизатор MuSGD: вдохновленный обучением LLM, этот оптимизатор обеспечивает стабильную конвергенцию.
Улучшенная производительность на периферии: до 43 % более быстрое CPU , что критически важно для устройств с питанием от батареи.
Специфичность задачи: Специализированные функции потерь, такие как ProgLoss и STAL, значительно улучшают обнаружение мелких объектов.

Узнайте больше о YOLO26

Заключение

Как YOLOv6.0, так и YOLOv8 представляют собой вершины в истории обнаружения объектов. YOLOv6. YOLOv6 предлагает специализированное решение для промышленных GPU с высокой пропускной способностью. Однако для подавляющего большинства пользователей Ultralytics YOLOv8 (и более новая версия YOLO26) предлагает превосходный опыт благодаря своей универсальности, простоте использования и всесторонней поддержке задач. Возможность плавного переключения между обнаружением, сегментацией и оценкой позы в рамках одной платформы значительно сокращает затраты на разработку и ускоряет окупаемость.

Разработчики, заинтересованные в других архитектурах, могут также изучить YOLOv9 для получения информации о программируемом градиенте или YOLO для возможностей обнаружения открытого словаря.

Подробности

YOLOv6-3.0

Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
Организация: Meituan
Дата: 2023-01-13
Arxiv:2301.05586
GitHub:YOLOv6

YOLOv8

Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
Организация:Ultralytics
Дата: 2023-01-10
Документация:Документация YOLOv8
GitHub:Ultralytics