Перейти к содержанию

YOLOv6.0 против YOLOv5: техническое сравнение для обнаружения объектов

Выбор правильной архитектуры для проекта компьютерного зрения - это ключевое решение, которое влияет на производительность, простоту развертывания и долгосрочное обслуживание. В области обнаружения объектов в реальном времени выделяются YOLOv6.0 от Meituan и YOLOv5 от Ultralytics. YOLOv5. В данном руководстве приводится подробное техническое сравнение, которое поможет разработчикам и исследователям выбрать модель, наиболее соответствующую их специфическим требованиям, будь то приоритет производительности GPU или универсальная, простая в использовании экосистема.

Анализ показателей производительности

В таблице ниже представлено прямое сравнение показателей производительности на наборе данныхCOCO . В то время как YOLOv6.0 раздвигает границы пиковой точности на GPU , Ultralytics YOLOv5 сохраняет репутацию исключительной эффективности, особенно на CPU, и значительно меньшей сложности модели (параметры и FLOPs) для своих облегченных вариантов.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Анализ: Данные показывают, что модель YOLOv5n (Nano) является лидером в средах с ограниченными ресурсами, имея наименьшее количество параметров (2,6 М) и FLOPs (7,7 Б), что означает превосходную скорость вычислений на CPU . Это делает его очень подходящим для приложений краевого ИИ, где не хватает памяти и мощности. И наоборот, YOLOv6.0 нацелен на более высокий mAPval ценой увеличения размера модели, что делает его сильным кандидатом для промышленных систем с выделенным оборудованием GPU .

Meituan YOLOv6.0: Промышленная точность

Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics

Разработанный компанией Meituan фреймворк YOLOv6.0 предназначен для обнаружения объектов в промышленных приложениях. Он ориентирован на достижение благоприятного компромисса между скоростью и точностью вывода, в частности, оптимизирован для аппаратно-ориентированной производительности на графических процессорах.

Архитектура и ключевые особенности

В YOLOv6 реализована эффективная магистральная конструкция и репараметризуемая структура (в стиле RepVGG), которая упрощает модель в процессе вывода, сохраняя при этом возможности извлечения сложных признаков в процессе обучения. В версии 3.0 были внедрены такие техники, как саморасширение и стратегия обучения с использованием якорей, что позволило еще больше повысить производительность.

Сильные и слабые стороны

  • Высокая точность GPU : Обеспечивает конкурентоспособные показатели mAP на наборе данныхCOCO , что делает его подходящим для задач контроля качества в производстве.
  • Поддержка квантования: Предлагает специальную поддержку квантования моделей для ускорения развертывания.
  • Ограниченная универсальность: Разработанный в первую очередь для обнаружения объектов, он не поддерживает более широкие задачи, такие как сегментация объектов или оценка позы, которые можно найти в других фреймворках.
  • Более высокая нагрузка на ресурсы: Большие варианты требуют больше памяти и вычислительных мощностей по сравнению с эквивалентными легкими моделями YOLOv5 .

Узнайте больше о YOLOv6

Ultralytics YOLOv5: стандарт экосистемы

Авторы: Гленн Джочер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: yolov5
Docs: https:yolov5

Ultralytics YOLOv5 Это легендарная модель в области компьютерного зрения, известная своим ориентированным на пользователя дизайном, надежностью и обширной экосистемой, которая ее окружает. Она остается одной из самых распространенных моделей во всем мире благодаря балансу скорости, точности и простоты использования.

Архитектура и ключевые особенности

В YOLOv5 используется основа CSPDarknet в сочетании с горловиной PANet для надежного объединения признаков. В ней используется механизм обнаружения на основе якорей, который доказал свою высокую стабильность в различных наборах данных. Архитектура является модульной и имеет пять масштабов (n, s, m, l, x), что позволяет использовать ее для любых устройств - от встраиваемых до облачных серверов.

Почему стоит выбрать YOLOv5?

  • Простота использования: Ultralytics уделяет большое внимание работе с разработчиками, предлагая простой API на Python , автоматическую настройку окружения и обширную документацию.
  • Универсальность: В отличие от многих конкурентов, YOLOv5 поддерживает классификацию изображений и сегментацию экземпляров "из коробки".
  • Эффективность обучения: Известен быстрой сходимостью и низким потреблением памяти во время обучения, что позволяет экономить вычислительные ресурсы.
  • Гибкость развертывания: Бесшовный экспорт в такие форматы, как ONNX, TensorRT, CoreML и TFLite для интеграции с различным оборудованием.

Интегрированная экосистема

Одним из главных преимуществ использования YOLOv5 является экосистема Ultralytics . Интеграция с такими инструментами, как Ultralytics HUB, позволяет проводить обучение и предварительный просмотр моделей без кода, а встроенная поддержка отслеживания экспериментов через Comet и MLflow упрощает рабочий процесс MLOps.

Узнайте больше о YOLOv5

Подробное сравнение

Философия архитектуры и дизайна

YOLOv6.0 в значительной степени опирается на аппаратно-ориентированный поиск и репараметризацию нейронной архитектуры, чтобы максимизировать производительность на специфических архитектурах GPU (например, Tesla T4). В отличие от этого, YOLOv5 сфокусирован на универсальном дизайне, который надежно работает на CPU, GPU и NPU. Детектор YOLOv5, основанный на якорях, часто легче настраивается для пользовательских наборов данных с небольшими объектами по сравнению с некоторыми подходами без якорей.

Юзабилити и методология обучения

Модели Ultralytics разработаны так, чтобы быть "готовыми к обучению". В YOLOv5 такие функции, как AutoAnchor, автоматически подстраивают якорные поля под метки вашего набора данных, а интеллектуальная эволюция гиперпараметров помогает найти оптимальные параметры обучения. YOLOv6 требует более ручной настройки, характерной для традиционных исследовательских хранилищ, что может оказаться более сложным для новых пользователей.

Реальные примеры использования

  • Ultralytics YOLOv5: идеально подходит для быстрого создания прототипов и различных развертываний. Его легкая модель "Nano" идеально подходит для мониторинга с помощью дронов или мобильных приложений, требующих выводов в реальном времени на CPU. Поддержка сегментации также делает его ценным для задач медицинской визуализации, таких как сегментация клеток.
  • YOLOv6.0: Лучше всего подходит для стационарных промышленных сред, где имеются высокопроизводительные графические процессоры, а основной метрикой является mAP. В качестве примера можно привести автоматизированную оптическую инспекцию (AOI) в производстве электроники.

Пример кода: Запуск YOLOv5

Простота YOLOv5 лучше всего проявляется в возможности запускать вычисления всего несколькими строками кода с помощью PyTorch Hub. Это избавляет от сложных этапов установки и позволяет разработчикам сразу же тестировать модель.

import torch

# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)

# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"

# Perform inference
results = model(img)

# Display results
results.show()

# Print detailed results regarding detected objects
results.print()

Такая простота доступа является отличительной чертой философии Ultralytics , позволяя специалистам по компьютерному зрению сосредоточиться на решении проблем, а не на отладке проблем среды.

Заключение

Обе архитектуры играют важную роль в современном зрении. Meituan YOLOv6.0 предлагает привлекательный вариант для пользователей, нацеленных на максимальное увеличение точности обнаружения на GPU .

Однако, Ultralytics YOLOv5 остается лучшим выбором для большинства разработчиков благодаря своей непревзойденной универсальности, эффективности обучения и надежной экосистеме. Возможность легкого развертывания на граничных устройствах в сочетании с поддержкой сегментации и классификации делает YOLOv5 комплексным решением для реальных задач ИИ.

Для тех, кто ищет абсолютное последнее слово в современной производительности, мы рекомендуем изучить Ultralytics YOLO11. YOLO11 опирается на наследие YOLOv5 с еще большей точностью, скоростью и широкими функциональными возможностями, представляя собой будущее искусственного интеллекта зрения. Другие специализированные модели, такие как RT-DETR также доступны для приложений на основе трансформаторов.

Ознакомьтесь с полным набором инструментов и моделей в документации по моделямUltralytics .


Комментарии