YOLOv5 против YOLOv6-3.0: подробное руководство по моделям обнаружения объектов в реальном времени

Ландшафт компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы скорости и точности. Выбирая модель для своего следующего проекта в области ИИ для визуальных данных, разработчики часто сравнивают признанные универсальные фреймворки со специализированными промышленными детекторами. Этот глубокий анализ изучает технические нюансы между Ultralytics YOLOv5 и YOLOv6-3.0 от Meituan, помогая тебе выбрать лучший инструмент для твоих задач развертывания.

Знакомство с моделями

Ultralytics YOLOv5: универсальный стандарт

Выпущенная в 2020 году, Ultralytics YOLOv5 быстро стала золотым стандартом для доступного и высокопроизводительного обнаружения объектов. Она известна невероятной простотой использования, надежными конвейерами обучения и широкими возможностями интеграции при развертывании.

YOLOv5 была разработана с нуля, чтобы обеспечить бесшовный опыт для разработчика в экосистеме PyTorch. Она предлагает оптимальный баланс производительности, обеспечивая отличную среднюю точность (mAP) при сохранении высокой скорости вывода, подходящей для самых разных сценариев развертывания — от граничных устройств до облачных серверов.

Узнай больше о YOLOv5

YOLOv6-3.0: промышленная пропускная способность

Разработанная отделом Vision AI в Meituan, модель YOLOv6-3.0 адаптирована специально для промышленных приложений, делая упор на «сырую» пропускную способность на специализированных аппаратных ускорителях.

  • Авторы: Chuyi Li, Lulu Li, Yifei Geng и др.
  • Организация: Meituan
  • Дата: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

YOLOv6 стремится максимизировать скорость обработки на GPU, таких как NVIDIA T4. Она использует кастомные методы квантования и специализированные бэкбоны для достижения своей производительности, что делает её сильным кандидатом для серверной обработки, где активно используется пакетный вывод (batch inference).

Узнай больше о YOLOv6

Архитектурные различия

Понимание архитектурных решений, лежащих в основе этих моделей, критически важно для определения их идеальных вариантов использования.

Архитектура YOLOv5

YOLOv5 использует высокооптимизированный бэкбон CSPDarknet в сочетании с неком Path Aggregation Network (PANet). Эта структура тщательно настроена для обеспечения минимальных требований к памяти во время обучения и вывода. В отличие от крупных моделей Transformer, требующих огромного количества памяти CUDA и длительного времени обучения, YOLOv5 эффективно работает на стандартном потребительском оборудовании.

Эффективность использования памяти

Модели Ultralytics специально спроектированы для эффективности обучения. Ты часто можешь обучить модель YOLOv5 на одном GPU среднего уровня, что делает ее очень доступной как для исследователей, так и для стартапов.

Более того, YOLOv5 — это не просто детектор объектов. Ее архитектура легко масштабируется на другие задачи, предлагая надежную поддержку «из коробки» для сегментации изображений и классификации изображений.

Архитектура YOLOv6-3.0

YOLOv6-3.0 оснащена бэкбоном EfficientRep, который разработан для удобства работы с оборудованием, особенно при выполнении на GPU. В нейке используется модуль двунаправленной конкатенации (BiC) для улучшения слияния признаков.

Во время обучения YOLOv6 использует стратегию Anchor-Aided Training (AAT) для стабилизации сходимости, хотя при выводе она остается детектором без анкоров (anchor-free). Хотя эта архитектура превосходна в задачах с ускорением на GPU, ее порой сложнее адаптировать для различных граничных устройств по сравнению с очень портативным фреймворком YOLOv5.

Анализ производительности

При оценке этих моделей жизненно важны показатели скорости и точности. Ниже представлена сравнительная таблица производительности различных размеров моделей на датасете COCO.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Хотя YOLOv6-3.0 достигает более высоких показателей mAP в своих крупных вариантах, YOLOv5 сохраняет невероятно малый вес. Например, YOLOv5n требует значительно меньше параметров и FLOPs, чем ее аналог из YOLOv6, что делает ее оптимальной для мобильных устройств или систем с ограниченными ресурсами CPU.

Экосистема и простота использования

Истинным определяющим фактором для многих инженерных команд является экосистема вокруг модели.

YOLOv6 — это впечатляющий исследовательский репозиторий, но для развертывания в различных форматах он требует значительного количества шаблонного кода. В отличие от него, Ultralytics предлагает хорошо поддерживаемую экосистему, характеризующуюся оптимизированным пользовательским опытом. Через унифицированный Python API и интуитивно понятную платформу Ultralytics разработчики получают доступ к удобному управлению данными, обучению в один клик и прямому экспорту в такие форматы, как ONNX и TensorRT.

Пример кода: унифицированный API Ultralytics

Пакет ultralytics для pip позволяет тебе загружать, обучать и развертывать модели всего в несколько строк кода.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX for edge deployment
model.export(format="onnx")

Варианты использования и рекомендации

Выбор между YOLOv5 и YOLOv6 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Когда выбирать YOLOv5

YOLOv5 — отличный выбор для:

  • Проверенных производственных систем: Существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
  • Обучения в условиях ограниченных ресурсов: Сред с ограниченными GPU-ресурсами, где эффективный конвейер обучения YOLOv5 и меньшие требования к памяти являются преимуществом.
  • Широкой поддержки форматов экспорта: Проектов, требующих развертывания во множестве форматов, включая ONNX, TensorRT, CoreML и TFLite.

Когда выбирать YOLOv6

YOLOv6 рекомендуется для:

  • Развертывания с учетом промышленного оборудования: Сценарии, где аппаратная оптимизация модели и эффективная репараметризация обеспечивают наилучшую производительность на конкретном целевом оборудовании.
  • Быстрой одностадийной детекции: Приложения, ставящие во главу угла скорость логического вывода на GPU для обработки видео в реальном времени в контролируемых средах.
  • Интеграции в экосистему Meituan: Команды, уже работающие внутри технологического стека и инфраструктуры развертывания Meituan.

Когда выбирать Ultralytics (YOLO26)

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Двигаемся дальше: преимущество YOLO26

Хотя YOLOv5 остается надежной «рабочей лошадкой», а YOLOv6-3.0 предлагает мощную промышленную пропускную способность GPU, современные технологии ушли вперед. Для разработчиков, начинающих новые проекты сегодня, рекомендуемый путь — Ultralytics YOLO26.

Выпущенная в январе 2026 года, YOLO26 представляет собой огромный скачок вперед. Она наследует непревзойденную универсальность экосистемы Ultralytics, внедряя при этом революционные архитектурные улучшения:

  • End-to-End NMS-Free дизайн: YOLO26 исключает пост-процессинг Non-Maximum Suppression, что значительно снижает вариативность задержки и упрощает логику развертывания.
  • До 43% более быстрый вывод на CPU: Благодаря удалению DFL и оптимизированной «голове» (head), она радикально превосходит предыдущие поколения на граничных и маломощных устройствах.
  • Оптимизатор MuSGD: Используя инновации в обучении LLM, новый оптимизатор MuSGD обеспечивает очень стабильное обучение и удивительно быструю сходимость.
  • Расширенная универсальность: YOLO26 легко справляется с ориентированными ограничивающими рамками (OBB), оценкой позы и сегментацией со специализированными функциями потерь (loss), такими как ProgLoss и STAL, для непревзойденного распознавания мелких объектов.

Если ты рассматриваешь другие варианты в экосистеме Ultralytics, ты также можешь обратить внимание на универсальную YOLO11 или инновационную YOLO-World для задач обнаружения с открытым словарем.

Заключение

И YOLOv5, и YOLOv6-3.0 оказали значительное влияние на область компьютерного зрения. YOLOv6-3.0 обеспечивает отличную пропускную способность для высококлассного серверного оборудования, что делает ее подходящей для специализированной офлайн-аналитики. Однако YOLOv5 остается лучшим выбором для разработчиков, которым нужна надежная, простая в использовании и высокоуниверсальная модель, поддерживаемая платформой мирового класса.

Для достижения идеального баланса между точностью следующего поколения, нативным развертыванием без NMS и лучшим в отрасли опытом разработчика, обновление до YOLO26 через платформу Ultralytics является окончательным выбором для современных решений в области ИИ для визуальных данных.

Комментарии