Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 против YOLOv5#

Эволюция обнаружения объектов в реальном времени привела к созданию множества архитектур, оптимизированных для различных сценариев развертывания. В этом обзоре мы сравним две известные модели: ориентированную на индустриальные решения YOLOv6-3.0 и фундаментальную, крайне универсальную Ultralytics YOLOv5. Понимание архитектурных решений, метрик производительности и экосистемной поддержки каждой из них поможет тебе выбрать оптимальный фреймворк компьютерного зрения для твоих прикладных задач.

Link to this sectionYOLOv6-3.0: промышленная пропускная способность и аппаратная оптимизация#

Разработанная отделом Vision AI компании Meituan, модель YOLOv6-3.0 в значительной степени адаптирована для промышленных сред с высокой пропускной способностью. Она фокусируется на максимизации частоты кадров на аппаратных ускорителях, таких как специализированные графические процессоры NVIDIA.

  • Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
  • Организация: Meituan
  • Дата: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6
  • Документация: Документация YOLOv6

Link to this sectionАрхитектурные преимущества#

YOLOv6-3.0 представляет несколько структурных оптимизаций, предназначенных для повышения скорости. Модель использует бэкбон EfficientRep, специально разработанный для эффективной работы на уровне оборудования во время инференса на GPU. Это делает архитектуру особенно мощной для задач пакетной обработки в офлайн-режиме.

На этапе обучения модель включает стратегию Anchor-Aided Training (AAT). Этот подход пытается объединить стабильность обучения на основе анкоров со скоростью инференса без анкоров. Кроме того, архитектура «шеи» (neck) использует модуль Bi-directional Concatenation (BiC) для улучшения объединения признаков на различных масштабах. Хотя модель сильно оптимизирована для высокопроизводительных серверных GPU с использованием TensorRT, такая специализация иногда может приводить к увеличению задержки на устройствах только с CPU или на маломощных edge-устройствах.

Узнай больше о YOLOv6

Link to this sectionUltralytics YOLOv5: пионер доступного Vision AI#

Выпущенная компанией Ultralytics, YOLOv5 установила новый стандарт простоты использования, эффективности обучения и надежности развертывания. Она сделала высокопроизводительное обнаружение объектов доступным благодаря глубокой интеграции с современными рабочими процессами глубокого обучения.

Link to this sectionЭкосистема и универсальность#

Определяющей характеристикой YOLOv5 является её простота использования. Построенный на базе фреймворка PyTorch, репозиторий предоставляет унифицированный Python API, который значительно упрощает жизненный цикл машинного обучения. От настройки набора данных до финального развертывания — интегрированная экосистема гарантирует, что ты будешь тратить меньше времени на отладку окружений и больше на создание приложений.

YOLOv5 не ограничивается только обнаружением объектов. Она обладает исключительной универсальностью, поддерживая нативно классификацию изображений и сегментацию экземпляров. Более того, она предлагает непревзойденную эффективность обучения, включая умное кэширование, автоматизированные загрузчики данных и встроенную поддержку распределенного обучения на нескольких GPU.

Эффективность использования памяти в моделях Ultralytics

При сравнении архитектур моделей потребление памяти является критическим фактором. Модели Ultralytics YOLO требуют значительно меньше VRAM как во время обучения, так и при инференсе по сравнению с тяжелыми трансформерами, что делает их крайне доступными для разработчиков, использующих потребительское оборудование или облачные блокноты, такие как Google Colab.

Узнай больше о YOLOv5

Link to this sectionСравнение производительности и архитектуры#

В таблице ниже представлены метрики производительности обеих архитектур при оценке на стандартном наборе данных COCO. Обрати внимание, как модели балансируют между точностью mAP и скоростью инференса в различных средах.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Link to this sectionАнализ#

YOLOv6-3.0 достигает впечатляющих показателей mAP и сильно оптимизирована для конвейеров TensorRT на GPU T4. Однако YOLOv5 отвечает невероятно хорошо поддерживаемой экосистемой, которая обеспечивает немедленный экспорт в различные форматы, включая ONNX, CoreML и TFLite. Этот баланс производительности гарантирует, что YOLOv5 работает надежно не только на выделенных серверах, но и на мобильных устройствах, а также в средах периферийных вычислений, таких как Raspberry Pi.

Link to this sectionПример кода: легкое обучение с Ultralytics#

Одним из самых больших преимуществ экосистемы Ultralytics является оптимизированный пользовательский опыт. Обучение модели, её оценка и экспорт требуют всего несколько строк кода на Python.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
# The API automatically handles dataset downloads and hyperparameter configuration
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format for flexible deployment
model.export(format="onnx")

Link to this sectionИдеальные варианты использования и сценарии развертывания#

Выбор между этими архитектурами часто зависит от твоих специфических инфраструктурных ограничений:

  • Когда развертывать YOLOv6-3.0: идеально подходит для автоматизированных производственных линий и серверной аналитики с высокой пропускной способностью, где доступны выделенные GPU NVIDIA и требуется минимальная задержка. Её архитектура процветает в средах, где можно в полной мере использовать оптимизации TensorRT.
  • Когда развертывать YOLOv5: идеальный выбор для быстрого прототипирования, кроссплатформенного развертывания и команд, которые ищут унифицированный конвейер. Разнообразные возможности экспорта делают её идеальной для ритейл-аналитики на edge-устройствах, мониторинга с сельскохозяйственных дронов и оценки позы в фитнес-приложениях.

Link to this sectionБудущее обнаружения объектов: знакомство с YOLO26#

Хотя YOLOv5 и YOLOv6 представляют собой значительные вехи, область компьютерного зрения быстро развивается. Разработчикам, начинающим новые проекты или стремящимся к абсолютно передовым технологиям, мы настоятельно рекомендуем обновиться до Ultralytics YOLO26 (выпущена в январе 2026 года).

YOLO26 переопределяет edge-first Vision AI, представляя революционный End-to-End NMS-Free дизайн. Устраняя необходимость в пост-обработке Non-Maximum Suppression, она упрощает логику развертывания и радикально снижает дисперсию задержек.

Ключевые инновации в YOLO26 включают:

  • Оптимизатор MuSGD: гибрид SGD и Muon, привносящий передовую стабильность обучения LLM в компьютерное зрение для более быстрой и надежной сходимости.
  • До 43% быстрее инференс на CPU: сильно оптимизирована для сред без выделенных ускорителей.
  • Удаление DFL: удаление Distribution Focal Loss упрощает процесс экспорта и повышает совместимость с маломощными edge-устройствами.
  • ProgLoss + STAL: передовые функции потерь, которые значительно улучшают распознавание мелких объектов, что критически важно для аэросъемки и датчиков интернета вещей в «умных городах».

Для задач общего назначения YOLO11 также остается отличным, полностью поддерживаемым выбором в рамках семейства Ultralytics.

Узнай больше о YOLO26

Link to this sectionЗаключение#

И YOLOv6-3.0, и YOLOv5 сыграли ключевую роль в продвижении обнаружения в реальном времени. YOLOv6-3.0 предлагает узкоспециализированную архитектуру для GPU-ускоренной пропускной способности, в то время как YOLOv5 предоставляет непревзойденный опыт разработчика благодаря обширной документации, простоте использования и поддержке нескольких задач.

Для современных приложений использование интегрированной экосистемы Ultralytics гарантирует надежный рабочий процесс на будущее. Принимая новейшие архитектуры, такие как YOLO26, ты обеспечиваешь преимущество своих конвейеров развертывания за счет последних прорывов в скорости, точности и алгоритмической простоте.

Комментарии