YOLOv6.0 против YOLOv5: техническое сравнение для обнаружения объектов
Выбор правильной архитектуры для проекта компьютерного зрения - это ключевое решение, которое влияет на производительность, простоту развертывания и долгосрочное обслуживание. В области обнаружения объектов в реальном времени выделяются YOLOv6.0 от Meituan и YOLOv5 от Ultralytics. YOLOv5. В данном руководстве приводится подробное техническое сравнение, которое поможет разработчикам и исследователям выбрать модель, наиболее соответствующую их специфическим требованиям, будь то приоритет производительности GPU или универсальная, простая в использовании экосистема.
Анализ показателей производительности
В таблице ниже представлено прямое сравнение показателей производительности на наборе данныхCOCO . В то время как YOLOv6.0 раздвигает границы пиковой точности на GPU , Ultralytics YOLOv5 сохраняет репутацию исключительной эффективности, особенно на CPU, и значительно меньшей сложности модели (параметры и FLOPs) для своих облегченных вариантов.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv6.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Анализ: Данные показывают, что модель YOLOv5n (Nano) является лидером в средах с ограниченными ресурсами, имея наименьшее количество параметров (2,6 М) и FLOPs (7,7 Б), что означает превосходную скорость вычислений на CPU . Это делает его очень подходящим для приложений краевого ИИ, где не хватает памяти и мощности. И наоборот, YOLOv6.0 нацелен на более высокий mAPval ценой увеличения размера модели, что делает его сильным кандидатом для промышленных систем с выделенным оборудованием GPU .
Meituan YOLOv6.0: Промышленная точность
Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
Organization: Meituan
Дата: 2023-01-13
Arxiv: https://arxiv.org/abs/2301.05586
GitHub: YOLOv6
Docs: https:ultralytics
Разработанный компанией Meituan фреймворк YOLOv6.0 предназначен для обнаружения объектов в промышленных приложениях. Он ориентирован на достижение благоприятного компромисса между скоростью и точностью вывода, в частности, оптимизирован для аппаратно-ориентированной производительности на графических процессорах.
Архитектура и ключевые особенности
В YOLOv6 реализована эффективная магистральная конструкция и репараметризуемая структура (в стиле RepVGG), которая упрощает модель в процессе вывода, сохраняя при этом возможности извлечения сложных признаков в процессе обучения. В версии 3.0 были внедрены такие техники, как саморасширение и стратегия обучения с использованием якорей, что позволило еще больше повысить производительность.
Сильные и слабые стороны
- Высокая точность GPU : Обеспечивает конкурентоспособные показатели mAP на наборе данныхCOCO , что делает его подходящим для задач контроля качества в производстве.
- Поддержка квантования: Предлагает специальную поддержку квантования моделей для ускорения развертывания.
- Ограниченная универсальность: Разработанный в первую очередь для обнаружения объектов, он не поддерживает более широкие задачи, такие как сегментация объектов или оценка позы, которые можно найти в других фреймворках.
- Более высокая нагрузка на ресурсы: Большие варианты требуют больше памяти и вычислительных мощностей по сравнению с эквивалентными легкими моделями YOLOv5 .
Ultralytics YOLOv5: стандарт экосистемы
Авторы: Гленн Джочер
Организация: Ultralytics
Дата: 2020-06-26
GitHub: yolov5
Docs: https:yolov5
Ultralytics YOLOv5 Это легендарная модель в области компьютерного зрения, известная своим ориентированным на пользователя дизайном, надежностью и обширной экосистемой, которая ее окружает. Она остается одной из самых распространенных моделей во всем мире благодаря балансу скорости, точности и простоты использования.
Архитектура и ключевые особенности
В YOLOv5 используется основа CSPDarknet в сочетании с горловиной PANet для надежного объединения признаков. В ней используется механизм обнаружения на основе якорей, который доказал свою высокую стабильность в различных наборах данных. Архитектура является модульной и имеет пять масштабов (n, s, m, l, x), что позволяет использовать ее для любых устройств - от встраиваемых до облачных серверов.
Почему стоит выбрать YOLOv5?
- Простота использования: Ultralytics уделяет большое внимание работе с разработчиками, предлагая простой API на Python , автоматическую настройку окружения и обширную документацию.
- Универсальность: В отличие от многих конкурентов, YOLOv5 поддерживает классификацию изображений и сегментацию экземпляров "из коробки".
- Эффективность обучения: Известен быстрой сходимостью и низким потреблением памяти во время обучения, что позволяет экономить вычислительные ресурсы.
- Гибкость развертывания: Бесшовный экспорт в такие форматы, как ONNX, TensorRT, CoreML и TFLite для интеграции с различным оборудованием.
Интегрированная экосистема
Одним из главных преимуществ использования YOLOv5 является экосистема Ultralytics . Интеграция с такими инструментами, как Ultralytics HUB, позволяет проводить обучение и предварительный просмотр моделей без кода, а встроенная поддержка отслеживания экспериментов через Comet и MLflow упрощает рабочий процесс MLOps.
Подробное сравнение
Философия архитектуры и дизайна
YOLOv6.0 в значительной степени опирается на аппаратно-ориентированный поиск и репараметризацию нейронной архитектуры, чтобы максимизировать производительность на специфических архитектурах GPU (например, Tesla T4). В отличие от этого, YOLOv5 сфокусирован на универсальном дизайне, который надежно работает на CPU, GPU и NPU. Детектор YOLOv5, основанный на якорях, часто легче настраивается для пользовательских наборов данных с небольшими объектами по сравнению с некоторыми подходами без якорей.
Юзабилити и методология обучения
Модели Ultralytics разработаны так, чтобы быть "готовыми к обучению". В YOLOv5 такие функции, как AutoAnchor, автоматически подстраивают якорные поля под метки вашего набора данных, а интеллектуальная эволюция гиперпараметров помогает найти оптимальные параметры обучения. YOLOv6 требует более ручной настройки, характерной для традиционных исследовательских хранилищ, что может оказаться более сложным для новых пользователей.
Реальные примеры использования
- Ultralytics YOLOv5: идеально подходит для быстрого создания прототипов и различных развертываний. Его легкая модель "Nano" идеально подходит для мониторинга с помощью дронов или мобильных приложений, требующих выводов в реальном времени на CPU. Поддержка сегментации также делает его ценным для задач медицинской визуализации, таких как сегментация клеток.
- YOLOv6.0: Лучше всего подходит для стационарных промышленных сред, где имеются высокопроизводительные графические процессоры, а основной метрикой является mAP. В качестве примера можно привести автоматизированную оптическую инспекцию (AOI) в производстве электроники.
Пример кода: Запуск YOLOv5
Простота YOLOv5 лучше всего проявляется в возможности запускать вычисления всего несколькими строками кода с помощью PyTorch Hub. Это избавляет от сложных этапов установки и позволяет разработчикам сразу же тестировать модель.
import torch
# Load the YOLOv5s model from the official Ultralytics Hub
model = torch.hub.load("ultralytics/yolov5", "yolov5s", pretrained=True)
# Define an image URL (or local path)
img = "https://ultralytics.com/images/zidane.jpg"
# Perform inference
results = model(img)
# Display results
results.show()
# Print detailed results regarding detected objects
results.print()
Такая простота доступа является отличительной чертой философии Ultralytics , позволяя специалистам по компьютерному зрению сосредоточиться на решении проблем, а не на отладке проблем среды.
Заключение
Обе архитектуры играют важную роль в современном зрении. Meituan YOLOv6.0 предлагает привлекательный вариант для пользователей, нацеленных на максимальное увеличение точности обнаружения на GPU .
Однако, Ultralytics YOLOv5 остается лучшим выбором для большинства разработчиков благодаря своей непревзойденной универсальности, эффективности обучения и надежной экосистеме. Возможность легкого развертывания на граничных устройствах в сочетании с поддержкой сегментации и классификации делает YOLOv5 комплексным решением для реальных задач ИИ.
Для тех, кто ищет абсолютное последнее слово в современной производительности, мы рекомендуем изучить Ultralytics YOLO11. YOLO11 опирается на наследие YOLOv5 с еще большей точностью, скоростью и широкими функциональными возможностями, представляя собой будущее искусственного интеллекта зрения. Другие специализированные модели, такие как RT-DETR также доступны для приложений на основе трансформаторов.
Ознакомьтесь с полным набором инструментов и моделей в документации по моделямUltralytics .