YOLOv6-3.0 против YOLOv5: техническое сравнение для detect объектов

Выбор правильной архитектуры для вашего проекта компьютерного зрения является ключевым решением, которое влияет на производительность, простоту развертывания и долгосрочное обслуживание. Двумя видными претендентами в области detectирования объектов в реальном времени являются YOLOv6-3.0 от Meituan и YOLOv5 от Ultralytics. В этом руководстве представлено подробное техническое сравнение, чтобы помочь разработчикам и исследователям выбрать модель, которая наилучшим образом соответствует их конкретным требованиям, будь то приоритет необработанной пропускной способности GPU или универсальная, простая в использовании экосистема.

Анализ метрик производительности

В таблице ниже представлено прямое сравнение показателей производительности на наборе данных COCO. В то время как YOLOv6-3.0 расширяет границы пиковой точности на устройствах GPU, Ultralytics YOLOv5 сохраняет репутацию исключительной эффективности, особенно на CPU, и значительно более низкой сложности модели (параметры и FLOPs) для своих облегченных вариантов.

Модель	размер ^{(пиксели)}	mAP^val 50-95	Скорость ^{CPU ONNX (мс)}	Скорость ^{T4 TensorRT10 (мс)}	параметры ^(M)	FLOPs ^(B)
YOLOv6-3.0n	640	37.5	-	1.17	4.7	11.4
YOLOv6-3.0s	640	45.0	-	2.66	18.5	45.3
YOLOv6-3.0m	640	50.0	-	5.28	34.9	85.8
YOLOv6-3.0l	640	52.8	-	8.95	59.6	150.7

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Анализ: Данные показывают, что модель YOLOv5n (Nano) является выдающейся для сред с ограниченными ресурсами, обладая наименьшим количеством параметров (2,6M) и FLOPs (7,7B), что приводит к превосходной скорости инференса на CPU. Это делает ее очень подходящей для периферийных AI приложений, где память и мощность ограничены. И наоборот, YOLOv6-3.0 нацелена на более высокий mAP^val за счет увеличения размера модели, что делает ее сильным кандидатом для промышленных установок с выделенным GPU оборудованием.

Meituan YOLOv6-3.0: Промышленная точность

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
Организация: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: https://github.com/meituan/YOLOv6
Документация: https://docs.ultralytics.com/models/yolov6/

YOLOv6-3.0, разработанная Meituan, — это платформа обнаружения объектов, предназначенная для промышленных приложений. Она фокусируется на достижении благоприятного компромисса между скоростью и точностью вывода, специально оптимизируя производительность с учетом аппаратного обеспечения на GPU.

Архитектура и ключевые особенности

YOLOv6 включает в себя эффективный backbone и репараметризуемую структуру (в стиле RepVGG), которая упрощает модель во время inference, сохраняя при этом сложные возможности извлечения признаков во время обучения. В версии 3.0 были представлены такие методы, как self-distillation и стратегия обучения с помощью anchor, для дальнейшего повышения производительности.

Сильные и слабые стороны

Высокая точность на GPU: Обеспечивает конкурентоспособные показатели mAP на наборе данных COCO, что делает его подходящим для задач контроля качества в производстве.
Поддержка квантования: Предлагает специальную поддержку квантования моделей для ускорения развертывания.
Ограниченная универсальность: В первую очередь предназначен для object detection, ему не хватает встроенной поддержки более широких задач, таких как instance segmentation или оценка позы, которые есть в других фреймворках.
Более высокие накладные расходы на ресурсы: Более крупные варианты требуют больше памяти и вычислительной мощности по сравнению с эквивалентными облегченными моделями YOLOv5.

Узнайте больше о YOLOv6

Ultralytics YOLOv5: Стандарт экосистемы

Авторы: Glenn Jocher
Организация: Ultralytics
Дата: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Документация: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 — легендарная модель в области компьютерного зрения, известная своим ориентированным на пользователя дизайном, надежностью и всеобъемлющей экосистемой, которая ее окружает. Он остается одной из самых развернутых моделей в мире благодаря балансу скорости, точности и простоты использования.

Архитектура и ключевые особенности

YOLOv5 использует основу CSPDarknet в сочетании с PANet neck для надежного объединения признаков. Он использует механизм обнаружения на основе якорей, который доказал свою высокую стабильность на различных наборах данных. Архитектура является очень модульной, предлагая пять масштабов (n, s, m, l, x), чтобы соответствовать всему, от встроенных устройств до облачных серверов.

Почему стоит выбрать YOLOv5?

Простота использования: Ultralytics уделяет первостепенное внимание опыту разработчиков, предлагая простой Python API, автоматическую настройку среды и обширную документацию.
Универсальность: В отличие от многих конкурентов, YOLOv5 поддерживает image classification и instance segmentation из коробки.
Эффективность обучения: Известна быстрой сходимостью и низким потреблением памяти во время обучения, что позволяет экономить на вычислительных ресурсах.
Гибкость развертывания: Легко экспортируется в такие форматы, как ONNX, TensorRT, CoreML и TFLite для интеграции с различным оборудованием.

Интегрированная экосистема

Одним из самых больших преимуществ использования YOLOv5 является экосистема Ultralytics. Интеграция с такими инструментами, как Ultralytics HUB, позволяет обучать и просматривать модели без написания кода, а встроенная поддержка отслеживания экспериментов через Comet и MLflow оптимизирует рабочий процесс MLOps.

Узнайте больше о YOLOv5

Подробное сравнение

Архитектура и философия проектирования

YOLOv6-3.0 в значительной степени опирается на аппаратно-ориентированный поиск нейронной архитектуры и reparameterization для максимизации пропускной способности на конкретных архитектурах GPU (например, Tesla T4). В отличие от этого, YOLOv5 фокусируется на универсальной конструкции, которая надежно работает на CPU, GPU и NPU. Детектор на основе anchor YOLOv5 часто легче настроить для пользовательских наборов данных с небольшими объектами по сравнению с некоторыми подходами без anchor.

Удобство использования и методология обучения

Модели Ultralytics разработаны как «готовые к обучению». С YOLOv5 такие функции, как AutoAnchor, автоматически настраивают anchor boxes в соответствии с метками вашего набора данных, а интеллектуальная эволюция гиперпараметров помогает найти оптимальные параметры обучения. YOLOv6 требует более ручной настройки, характерной для традиционных исследовательских репозиториев, что может представлять собой более крутую кривую обучения для новых пользователей.

Реальные примеры использования

Ultralytics YOLOv5: идеально подходит для быстрого прототипирования и разнообразных развертываний. Его легкая модель Nano идеально подходит для мониторинга на основе дронов или мобильных приложений, требующих вывода в реальном времени на CPU. Его поддержка segment также делает его ценным для задач медицинской визуализации, таких как segment клеток.
YOLOv6-3.0: Лучше всего подходит для фиксированных промышленных сред, где доступны высокопроизводительные GPU, и основным показателем является mAP. Примеры включают автоматизированный оптический контроль (AOI) в производстве электроники.

Пример кода: Запуск YOLOv5

Простота YOLOv5 лучше всего демонстрируется ее способностью запускать вывод всего несколькими строками кода с использованием PyTorch Hub. Это устраняет сложные этапы установки и позволяет разработчикам немедленно протестировать модель.

import torch

# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Perform inference
results = model(img)

# Display results
results.show()

# Print detailed results regarding detected objects
results.print()

Эта простота доступа является отличительной чертой философии Ultralytics, позволяя специалистам по computer vision сосредоточиться на решении проблем, а не на отладке проблем с окружающей средой.

Заключение

Обе архитектуры играют важную роль в современном ландшафте зрения. Meituan YOLOv6-3.0 предлагает убедительный вариант для пользователей, которые строго сосредоточены на максимизации точности detect на оборудовании GPU.

Тем не менее, Ultralytics YOLOv5 остается превосходным выбором для большинства разработчиков благодаря своей непревзойденной универсальности, эффективности обучения и надежной экосистеме. Возможность легкого развертывания на периферийных устройствах в сочетании с поддержкой segmentации и классификации делает YOLOv5 комплексным решением для реальных задач ИИ.

Для тех, кто ищет самые последние достижения в области производительности, мы рекомендуем изучить Ultralytics YOLO11. YOLO11 развивает наследие YOLOv5, обеспечивая еще большую точность, скорость и широкие возможности, представляя будущее vision AI. Другие специализированные модели, такие как RT-DETR, также доступны для приложений на основе трансформеров.

Ознакомьтесь с полным спектром инструментов и моделей в документации по моделям Ultralytics.

YOLOv6-3.0 против YOLOv5: техническое сравнение для detect объектов

Анализ метрик производительности

Meituan YOLOv6-3.0: Промышленная точность

Архитектура и ключевые особенности

Сильные и слабые стороны

Ultralytics YOLOv5: Стандарт экосистемы

Архитектура и ключевые особенности

Почему стоит выбрать YOLOv5?

Подробное сравнение

Архитектура и философия проектирования

Удобство использования и методология обучения

Реальные примеры использования

Пример кода: Запуск YOLOv5

Заключение

Комментарии