YOLOv5 против YOLOv6-3.0: Подробное руководство по моделям обнаружения объектов в реальном времени.
Ландшафт компьютерного зрения постоянно развивается, новые архитектуры расширяют границы скорости и точности. При выборе модели для следующего проекта в области ИИ-зрения разработчики часто сравнивают проверенные, универсальные фреймворки с узкоспециализированными промышленными детекторами. Этот углубленный анализ исследует технические нюансы между Ultralytics YOLOv5 и YOLOv6-3.0 от Meituan, помогая вам выбрать лучший инструмент для ваших потребностей развертывания.
Введение в модели
Ultralytics YOLOv5: Универсальный стандарт
Выпущенный в 2020 году, Ultralytics YOLOv5 быстро стал золотым стандартом для доступного, высокопроизводительного обнаружения объектов. Он известен своей невероятной простотой использования, надёжными конвейерами обучения и широкими возможностями интеграции для развёртывания.
- Автор: Гленн Джокер
- Организация:Ultralytics
- Дата: 2020-06-26
- GitHub:ultralytics/yolov5
YOLOv5 был разработан с нуля для обеспечения бесперебойной работы разработчиков в экосистеме PyTorch. Он предлагает благоприятный баланс производительности, достигая превосходной средней точности (mAP) при сохранении высоких скоростей инференса, подходящих для различных сценариев развертывания в реальном мире, от периферийных устройств до облачных серверов.
YOLOv6-3.0: Промышленная Пропускная Способность
Разработанный Отделом компьютерного зрения Meituan, YOLOv6-3.0 специально разработан для промышленных приложений, уделяя первостепенное внимание необработанной пропускной способности на специализированных аппаратных ускорителях.
- Авторы: Чуйи Ли, Лулу Ли, Ифэй Генг и др.
- Организация: Meituan
- Дата: 2023-01-13
- Arxiv:2301.05586
- GitHub:meituan/YOLOv6
YOLOv6 направлен на максимизацию скорости обработки на GPU, таких как NVIDIA T4. Он использует пользовательские методы квантования и специализированные бэкбоны для достижения своей производительности, что делает его сильным кандидатом для обработки на серверной стороне, где активно используется пакетный инференс.
Архитектурные различия
Понимание архитектурных решений, лежащих в основе этих моделей, имеет решающее значение для определения их идеальных сценариев использования.
Архитектура YOLOv5
YOLOv5 использует высокооптимизированный бэкбон CSPDarknet в сочетании с головой PANet (Path Aggregation Network). Эта структура тщательно настроена для обеспечения минимальных требований к памяти во время обучения и инференса. В отличие от больших трансформерных моделей, которые требуют огромных объёмов памяти CUDA и длительного времени обучения, YOLOv5 эффективно работает на стандартном потребительском оборудовании.
Эффективность памяти
Модели Ultralytics специально разработаны для эффективности обучения. Часто можно обучить модель YOLOv5 на одном GPU среднего уровня, что делает ее очень доступной как для исследователей, так и для стартапов.
Кроме того, YOLOv5 — это не просто детектор объектов. Его архитектура легко расширяется для других задач, предлагая надежную готовую поддержку для сегментации изображений и классификации изображений.
Архитектура YOLOv6-3.0
YOLOv6-3.0 оснащен бэкбоном EfficientRep, который разработан для аппаратной совместимости, особенно для выполнения на GPU. Он использует модуль двунаправленной конкатенации (BiC) в своей шейке для улучшения слияния признаков.
Во время обучения YOLOv6 использует стратегию обучения с использованием якорей (AAT) для стабилизации сходимости, хотя во время вывода он остается безаякорным детектором. Хотя эта архитектура превосходно справляется с задачами, ускоряемыми GPU, ее иногда сложнее адаптировать для различных периферийных устройств по сравнению с высокопортативным фреймворком YOLOv5.
Анализ производительности
При оценке этих моделей сырые метрики скорости и точности имеют решающее значение. Ниже представлена сравнительная таблица, демонстрирующая производительность моделей различных размеров на наборе данных COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Хотя YOLOv6-3.0 достигает более высоких показателей mAP в своих более крупных вариантах, YOLOv5 сохраняет невероятно легкий след. Например, YOLOv5n требует значительно меньше параметров и FLOPs, чем ее аналог YOLOv6, что делает ее оптимальной для мобильных или ограниченных CPU развертываний.
Экосистема и простота использования
Истинный определяющий фактор для многих инженерных команд — это экосистема, окружающая модель.
YOLOv6 представляет собой впечатляющий исследовательский репозиторий, но его развертывание в различных форматах требует значительного объема шаблонного кода. В отличие от этого, Ultralytics предлагает хорошо поддерживаемую экосистему, отличающуюся оптимизированным пользовательским интерфейсом. Благодаря унифицированному API на python и интуитивно понятной платформе Ultralytics разработчики получают доступ к бесшовному управлению наборами данных, обучению в один клик и прямому экспорту в такие форматы, как ONNX и TensorRT.
Пример кода: Унифицированный API Ultralytics
Ultralytics ultralytics Пакет pip позволяет загружать, обучать и развертывать модели всего в нескольких строках кода.
from ultralytics import YOLO
# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")
# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for edge deployment
model.export(format="onnx")
Сценарии использования и рекомендации
Выбор между YOLOv5 и YOLOv6 зависит от ваших конкретных требований к проекту, ограничений развертывания и предпочтений экосистемы.
Когда выбирать YOLOv5
YOLOv5 является оптимальным выбором для:
- Проверенные производственные системы: Существующие развертывания, где ценятся долгий track-рекорд стабильности YOLOv5, обширная документация и массивная поддержка сообщества.
- Обучение с ограниченными ресурсами: Среды с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и низкие требования к памяти являются преимуществом.
- Обширная поддержка форматов экспорта: Проекты, требующие развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.
Когда выбирать YOLOv6
YOLOv6 рекомендуется для:
- Промышленное развертывание с учетом аппаратного обеспечения: Сценарии, где аппаратно-ориентированный дизайн модели и эффективная репараметризация обеспечивают оптимизированную производительность на конкретном целевом оборудовании.
- Быстрое одностадийное detect: Приложения, отдающие приоритет чистой скорости инференции на GPU для обработки видео в реальном времени в контролируемых средах.
- Интеграция в экосистему Meituan: Команды, уже работающие в технологическом стеке и инфраструктуре развертывания Meituan.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Движение вперед: Преимущества YOLO26
Хотя YOLOv5 остается надежной рабочей лошадкой, а YOLOv6-3.0 обеспечивает высокую пропускную способность GPU в промышленных условиях, передовые технологии развились. Для разработчиков, начинающих новые проекты сегодня, рекомендуемый путь — Ultralytics YOLO26.
Выпущенный в январе 2026 года, YOLO26 представляет собой огромный шаг вперед. Он наследует непревзойденную универсальность экосистемы Ultralytics, одновременно представляя революционные архитектурные улучшения:
- Сквозная архитектура без NMS: YOLO26 исключает постобработку Non-Maximum Suppression, что значительно снижает вариативность задержки и упрощает логику развертывания.
- До 43% более быстрая инференция на CPU: Благодаря удалению DFL и оптимизированной головной части он значительно превосходит предыдущие поколения на периферийных и маломощных устройствах.
- MuSGD Optimizer: Используя инновации в обучении LLM, новый оптимизатор MuSGD обеспечивает высокостабильное обучение и исключительно быструю сходимость.
- Расширенная универсальность: YOLO26 бесшовно работает с ориентированными ограничивающими рамками (OBB), оценкой позы и сегментацией, используя специализированные функции потерь, такие как ProgLoss и STAL, для беспрецедентного распознавания мелких объектов.
Если вы изучаете другие варианты в экосистеме Ultralytics, вы также можете рассмотреть универсальную YOLO11 или инновационную YOLO-World для задач обнаружения с открытым словарем.
Заключение
Как YOLOv5, так и YOLOv6-3.0 оказали значительное влияние на область компьютерного зрения. YOLOv6-3.0 обеспечивает отличную пропускную способность для высокопроизводительного серверного оборудования, что делает его подходящим для специализированной офлайн-аналитики. Однако YOLOv5 остается лучшим выбором для разработчиков, которым нужна надежная, простая в использовании и очень универсальная модель, поддерживаемая платформой мирового класса.
Для достижения максимального баланса точности нового поколения, нативного развертывания без NMS и лучшего в отрасли опыта разработчиков, обновление до YOLO26 через Ultralytics Platform является окончательным выбором для современных решений в области компьютерного зрения.