Перейти к содержанию

YOLOv6.0 против YOLOv8: всестороннее техническое сравнение

Выбор оптимальной архитектуры обнаружения объектов является ключевым решением при разработке компьютерного зрения, влияющим на все аспекты - от задержки вывода до гибкости развертывания. В этом руководстве представлен глубокий технический анализ сравнения YOLOv6.0, разработанного компанией Meituan, и Ultralytics YOLOv8передовой модели от Ultralytics. Мы рассмотрим их архитектурные особенности, показатели производительности и пригодность для использования в реальных приложениях, чтобы помочь вам сделать осознанный выбор.

Хотя оба фреймворка обеспечивают впечатляющие результаты, YOLOv8 отличается непревзойденной универсальностью, экосистемой, ориентированной на разработчиков, и превосходным балансом скорости и точности на различных аппаратных платформах.

YOLOv6.0

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics

YOLOv6.0 - это одноэтапный фреймворк для обнаружения объектов, разработанный с упором на промышленные приложения. Приоритет отдается аппаратно-дружественным сетевым конструкциям, что позволяет максимизировать пропускную способность выводов на выделенных графических процессорах и делает его сильным соперником в средах, где задержка строго ограничена скоростью производственной линии.

Архитектура и ключевые особенности

Архитектура YOLOv6.0 построена на концепции репараметризации. В ней используется основа EfficientRep и шейка Rep-PAN, которые позволяют сети иметь сложную структуру во время обучения, но упрощают ее до упорядоченных конволюционных слоев во время вывода. Такая "структурная перепараметризация" помогает снизить задержку без ущерба для возможностей извлечения признаков.

Кроме того, в YOLOv6.0 применена раздельная конструкция головы, разделяющая задачи классификации и регрессии, и интегрированы стратегии присвоения меток SimOTA. В фреймворке также сделан акцент на обучении с учетом квантования (QAT) для облегчения развертывания на устройствах, требующих более низкой точности арифметики.

Сильные и слабые стороны

Модель отлично проявляет себя в сценариях промышленного производства, где доступны высокопроизводительные графические процессоры, обеспечивая конкурентоспособную скорость вычислений. Ее ориентация на квантование также помогает в развертывании на конкретных аппаратных ускорителях. Однако YOLOv6 предназначен в первую очередь для обнаружения объектов и не имеет встроенной, бесшовной поддержки более широких задач компьютерного зрения, таких как оценка позы или ориентированные ограничительные рамки, которые можно найти в более комплексных фреймворках. Кроме того, экосистема менее обширна, что может означать больше сложностей при интеграции со сторонними инструментами MLOps или поиске поддержки сообщества.

Узнайте больше о YOLOv6

Ultralytics YOLOv8

Авторы: Гленн Джочер, Аюш Чаурасия и Цзин Цю
Организация: Ultralytics
Дата: 2023-01-10
Arxiv: Нет
GitHub: ultralytics
Docs: https:yolov8

Ultralytics YOLOv8 Представляет собой значительный скачок вперед в серии YOLO , разработанной не просто как модель, а как единая основа для практического ИИ. Она переосмысливает современную производительность (SOTA), сочетая архитектурную эффективность с интуитивно понятным пользовательским интерфейсом, делая передовое компьютерное зрение доступным как для исследователей, так и для разработчиков.

Архитектура и ключевые особенности

YOLOv8 представляет высокоэффективный механизм обнаружения без якорей, который устраняет необходимость в ручном расчете якорных ящиков и улучшает обобщение на различных наборах данных. Его архитектура включает новую основу, использующую модули C2f (Cross-Stage Partial connections with fusion), которые улучшают градиентный поток и богатство признаков, сохраняя при этом легкий вес.

Разделенная голова в YOLOv8 обрабатывает объектность, классификацию и регрессию независимо друг от друга, что приводит к более высокой точности сходимости. Важно отметить, что модель поддерживает полный спектр задач -обнаружение объектов, сегментацию объектов, классификацию изображений, оценку позы и ориентированные ограничительные рамки (ООБ)- в рамках единого, устанавливаемого пакета Python .

Почему стоит выбрать YOLOv8?

  • Простота использования: С помощью простого pip install ultralyticsРазработчики получают доступ к мощному CLI и Python API. Этот оптимизированный опыт пользователей сокращает время от установки до первой тренировки с нескольких часов до нескольких минут.
  • Хорошо поддерживаемая экосистема: Ultralytics обеспечивает надежную экосистему, включая Ultralytics HUB для управления моделями, активные обсуждения на GitHub и бесшовную интеграцию с такими инструментами, как TensorBoard и MLflow.
  • Баланс производительности: Как видно из приведенных ниже показателей, YOLOv8 достигает превосходного mAP при меньшем количестве параметров и FLOP, предлагая оптимальный компромисс для развертывания в реальном времени как на пограничных устройствах, так и на облачных серверах.
  • Универсальность: В отличие от конкурентов, ориентированных исключительно на обнаружение, YOLOv8 обрабатывает сегментацию, отслеживание и классификацию, позволяя вам переключаться между задачами без изучения нового фреймворка.

Узнайте больше о YOLOv8

Сравнение производительности

В следующей таблице представлено подробное сравнение показателей производительности на наборе данных COCO val2017. Выделены лучшие показатели в каждой категории.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Критический анализ

Полученные данные свидетельствуют о явных преимуществах архитектуры Ultralytics :

  1. Эффективность и использование ресурсов: YOLOv8 постоянно использует значительно меньшее количество параметров и операций FLOP для достижения сопоставимой или более высокой точности. Например, YOLOv8s соответствует точности YOLOv6.0s (около 45 mAP), но требует на ~40% меньше параметров и на ~37% меньше FLOP. Это уменьшение напрямую связано с меньшим потреблением памяти и более быстрым временем обучения.
  2. Лидерство в точности: В верхней части спектра модели YOLOv8 (M, L, X) расширяют границы точности: YOLOv8x достигает 53,9 mAP, опережая самые крупные варианты YOLOv6 из перечисленных.
  3. Выводы поCPU : YOLOv8 предоставляет прозрачные бенчмарки для анализа CPU через ONNXдемонстрируя возможность его развертывания на стандартном оборудовании без специализированных ускорителей. Это очень важно для масштабируемых приложений в логистике и розничной торговле, где GPU могут быть не всегда доступны.

Эффективность памяти

Эффективная архитектура YOLOv8 позволяет снизить требования к памяти GPU при обучении по сравнению со многими моделями на основе трансформаторов или более тяжелыми конволюционными сетями. Это позволяет разработчикам обучать большие объемы партий или использовать более высокие разрешения на оборудовании потребительского класса.

Случаи использования и приложения

Выбор между этими моделями часто зависит от конкретной среды развертывания и требований задачи.

В чем YOLOv8 преуспевает

Благодаря своей адаптивности YOLOv8 является рекомендуемым выбором для подавляющего большинства проектов в области компьютерного зрения:

  • Edge AI & IoT: Благодаря малому количеству параметров и высокой эффективности YOLOv8 идеально подходит для таких устройств, как Raspberry Pi или NVIDIA Jetson.
  • Многозадачные системы: Проекты, требующие отслеживания объектов (например, мониторинг дорожного движения) или сегментации (например, медицинская визуализация), выигрывают от унифицированной кодовой базы YOLOv8.
  • Быстрое создание прототипов: Простота использования и большое количество предварительно обученных весов позволяют стартапам и исследовательским группам быстро создавать итерации.
  • Корпоративные решения: Благодаря интеграции в такие платформы, как Roboflow и поддержкой таких форматов, как CoreML и TFLiteYOLOv8 легко масштабируется от прототипа до производства.

Куда подходит YOLOv6.0

YOLOv6.0 остается сильным вариантом для нишевых промышленных сценариев:

  • Выделенные конвейеры GPU : На предприятиях с установленными конвейерами, использующими графические процессоры NVIDIA T4/A10 для работы с TensorRT, специальные аппаратные оптимизации YOLOv6 позволяют добиться незначительного выигрыша в задержке.
  • Интеграция с предыдущими версиями: Для систем, уже построенных на основе магистралей в стиле RepVGG, интеграция YOLOv6 может потребовать меньших архитектурных изменений.

Обучение и опыт разработчиков

Одним из наиболее значимых отличий является опыт разработчиков. Приоритетом Ultralytics является подход с низким содержанием кода и высокой функциональностью.

Бесшовные тренировки с YOLOv8

Обучение модели YOLOv8 очень простое. Фреймворк автоматически справляется с дополнением данных, изменением гиперпараметров и построением графиков.

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")  # load a pretrained model

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results = model("path/to/image.jpg")

В отличие от этого, хотя YOLOv6 предлагает скрипты для обучения, это часто требует более ручной настройки переменных окружения и зависимостей. Интеграция YOLOv8 с Ultralytics HUB еще больше упрощает эту задачу, предлагая управление набором данных через Интернет и обучение модели одним щелчком мыши.

Поддержка экосистемы

Сообщество Ultralytics - одно из самых активных в области ИИ. Если вам нужна помощь в работе с пользовательскими наборами данных или расширенными опциями экспорта, ресурсы легко доступны через подробную документацию и форумы сообщества.

Заключение

В то время как YOLOv6.0 предлагает надежное решение для специфических промышленных задач обнаружения GPU, Ultralytics YOLOv8 выделяется как превосходное, всеобъемлющее решение для современного компьютерного зрения. Его архитектурная эффективность обеспечивает более высокую точность на каждый параметр, а универсальность в задачах обнаружения, сегментации и классификации делает его перспективным. В сочетании с непревзойденной экосистемой и простотой использования YOLOv8 позволяет разработчикам уверенно создавать, внедрять и масштабировать решения в области ИИ.

Изучите другие модели

Для тех, кто интересуется более широким ландшафтом обнаружения объектов, Ultralytics поддерживает широкий спектр моделей. Вы можете сравнить YOLOv8 с устаревшей моделью YOLOv5 для понимания эволюции архитектуры, или изучить передовую модель YOLO11 для получения информации о новейших достижениях в области производительности. Кроме того, для подходов, основанных на трансформаторах, можно использовать RT-DETR предлагает уникальные преимущества при обнаружении в реальном времени.


Комментарии