YOLOv6.0 против YOLOv8: технический анализ современных методов обнаружения объектов
В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха проекта. В этом сравнении рассматриваются две важные вехи в YOLO : YOLOv6.YOLOv6, мощный детектор, оптимизированный для промышленных приложений, и Ultralytics YOLOv8, современная модель, разработанная с учетом универсальности, простоты использования и высокой производительности на широком спектре оборудования. Мы анализируем их архитектуру, показатели производительности и методологии обучения, чтобы помочь вам решить, какая модель лучше всего подходит для ваших потребностей.
Сравнение метрик производительности
В следующей таблице представлены ключевые показатели эффективности обеих моделей. YOLOv8 демонстрирует превосходный баланс точности и скорости, особенно в моделях среднего и большого размера, при этом сохраняя конкурентоспособное количество параметров.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
| YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
| YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
| YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
| YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOv6.0: точность промышленного уровня
YOLOv6.YOLOv6, выпущенный Meituan в январе 2023 года, разработан специально для промышленных приложений, где аппаратные ограничения и пропускная способность имеют первостепенное значение. В нем представлено несколько архитектурных нововведений, направленных на максимальное увеличение скорости вывода на специализированных графических процессорах, таких как NVIDIA T4.
Ключевые архитектурные особенности
- Репараметризуемая основа: использует основу в стиле VGG, которая эффективна при выводе, но может быть сложной для обучения. Подход «RepVGG» позволяет выполнять масштабное слияние ветвей во время экспорта.
- Двунаправленное слияние: улучшает распространение характеристик по разным масштабам, повышая эффективность обнаружения объектов разных размеров.
- Обучение с помощью якорей: использует стратегию обучения с помощью якорей (AAT) для стабилизации конвергенции без ущерба для гибкости вывода без якорей.
Преимущества:
- Высокая пропускная способность: чрезвычайно быстрая работа на GPU благодаря аппаратно-ориентированной архитектуре.
- Поддержка квантования: особое внимание уделяется квантованию после обучения (PTQ) и обучению с учетом квантования (QAT) для развертывания.
Слабые стороны:
- Ограниченная поддержка задач: в основном ориентирован на обнаружение объектов, не имеет встроенной поддержки сегментации или оценки позы.
- Сложность обучения: процесс перепараметризации усложняет процесс обучения и экспорта.
Ultralytics YOLOv8: универсальный стандарт
Ultralytics YOLOv8, запущенный всего за несколько дней до YOLOv6. YOLOv6, представляет собой значительный скачок вперед в плане удобства использования и универсальности. Он разработан не просто как модель, а как платформа для различных задач компьютерного зрения. YOLOv8 анкерного подхода к обнаружению в пользу анкерного, упрощая архитектуру модели и улучшая обобщение.
Архитектурные инновации
- Обнаружение без анкоров: устраняет необходимость в ручной настройке анкор-боксов, сокращая настройку гиперпараметров и улучшая производительность на различных наборах данных.
- Модуль C2f: межэтапное частичное узкое место с двумя свертками, которое улучшает градиентный поток и уменьшает размер модели, сохраняя при этом точность.
- Разделенная головка: разделяет задачи классификации и регрессии, позволяя каждой ветви сосредоточиться на своей конкретной цели для достижения более высокой точности.
Преимущества YOLOv8
- Универсальность: встроенная поддержка обнаружения объектов, сегментации экземпляров, оценки позы, классификации и ориентированных ограничивающих прямоугольников (OBB).
- Простота использования: Python Ultralytics позволяет проводить обучение, валидацию и развертывание всего за несколько строк кода.
- Эффективность обучения: оптимизировано для быстрого обучения на потребительских графических процессорах с меньшими требованиями к памяти, чем у многих альтернативных решений на основе трансформеров.
- Экосистема: Поддерживается надежной Ultralytics , включая бесшовную интеграцию с такими инструментами, как Ultralytics и Comet .
Оптимизированный рабочий процесс
Обучение YOLOv8 невероятно просто. Следующий фрагмент кода демонстрирует, как загрузить предварительно обученную модель и начать обучение на пользовательском наборе данных:
from ultralytics import YOLO
# Load a model
model = YOLO("yolov8n.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
Сравнительный анализ: варианты использования и внедрение
При выборе между этими двумя мощными архитектурами решение часто зависит от конкретных требований вашей среды развертывания и объема задач, которые вам необходимо выполнять.
Приложения в реальном мире
YOLOv6.0 превосходит:
- Высокоскоростная промышленная инспекция: идеально подходит для производственных линий, использующих специализированные графические процессоры, где важна каждая миллисекунда пропускной способности.
- Развертывание с фиксированным оборудованием: сценарии, в которых оборудование известно и оптимизировано для конкретных задач (например, серверы NVIDIA ).
Ultralytics YOLOv8 превосходит:
- Edge AI и мобильные устройства: эффективная архитектура модели и простой экспорт в TFLite и CoreML делают ее идеальной для Android iOS Android .
- Робототехника и автономные системы: способность одновременно выполнять несколько задач, таких как сегментация и оценка положения, обеспечивает роботам более глубокое понимание окружающей среды.
- Быстрое прототипирование: простота использования и исчерпывающая документация позволяют разработчикам быстро выполнять итерации и быстрее выводить продукты на рынок.
Защита ваших проектов от устаревания
Хотя обе модели являются превосходными, область искусственного интеллекта развивается невероятно быстро. Разработчикам, которые сегодня начинают новые проекты и которым требуется абсолютная передовая производительность и эффективность, Ultralytics обратить внимание на YOLO26.
YOLO26 основан на успехе YOLOv8 несколькими революционными функциями:
- Полное NMS: благодаря устранению функции Non-Maximum Suppression (NMS) YOLO26 упрощает развертывание и снижает разброс задержек.
- Оптимизатор MuSGD: вдохновленный обучением LLM, этот оптимизатор обеспечивает стабильную конвергенцию.
- Улучшенная производительность на периферии: до 43 % более быстрое CPU , что критически важно для устройств с питанием от батареи.
- Специфичность задачи: Специализированные функции потерь, такие как ProgLoss и STAL, значительно улучшают обнаружение мелких объектов.
Заключение
Как YOLOv6.0, так и YOLOv8 представляют собой вершины в истории обнаружения объектов. YOLOv6. YOLOv6 предлагает специализированное решение для промышленных GPU с высокой пропускной способностью. Однако для подавляющего большинства пользователей Ultralytics YOLOv8 (и более новая версия YOLO26) предлагает превосходный опыт благодаря своей универсальности, простоте использования и всесторонней поддержке задач. Возможность плавного переключения между обнаружением, сегментацией и оценкой позы в рамках одной платформы значительно сокращает затраты на разработку и ускоряет окупаемость.
Разработчики, заинтересованные в других архитектурах, могут также изучить YOLOv9 для получения информации о программируемом градиенте или YOLO для возможностей обнаружения открытого словаря.
Подробности
YOLOv6-3.0
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг, Хунлян Цзян, Мэн Чэн, Бо Чжан, Зайдан Ке, Сяомин Сюй и Сянсян Чу
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv:2301.05586
- GitHub:YOLOv6
YOLOv8
- Авторы: Гленн Джокер, Аюш Чаурасия и Цзин Цю
- Организация:Ultralytics
- Дата: 2023-01-10
- Документация:Документация YOLOv8
- GitHub:Ultralytics