Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv6-3.0 против YOLOv10: разбираемся в архитектурах детектирования объектов в реальном времени#

Ландшафт компьютерного зрения становится всё сложнее, что делает выбор оптимальной модели критически важным решением для разработчиков и ML-инженеров. Оценивая эволюцию детектирования объектов и моделей Ultralytics YOLO, важно понимать компромиссы между различными архитектурными подходами. Это руководство представляет собой подробное техническое сравнение между YOLOv6-3.0 и YOLOv10 — двумя моделями, которые предлагают свои уникальные преимущества для промышленного использования и развертывания на периферийных устройствах.

Link to this sectionРазбираем YOLOv6-3.0: создана для промышленной пропускной способности#

Разработанная для максимизации пропускной способности в промышленных серверных приложениях, модель YOLOv6-3.0 делает ставку на быстрое выполнение инференса на аппаратных ускорителях, особенно GPU. Используя оптимизированный бэкбон, она стремится найти баланс между высокоскоростной обработкой видео и конкурентной точностью.

Авторы: Chuyi Li, Lulu Li, Yifei Geng и др.
Организация: Meituan
Дата: 2023-01-13
Arxiv: 2301.05586
GitHub: meituan/YOLOv6

Link to this sectionКлючевые архитектурные особенности#

Основа YOLOv6-3.0 заключается в её дружественном к «железу» дизайне. Она включает модуль двунаправленной конкатенации (Bi-directional Concatenation, BiC) в архитектуре нек (neck) для улучшения объединения признаков разного масштаба. Кроме того, сеть использует стратегию обучения с поддержкой якорей (Anchor-Aided Training, AAT), которая ловко сочетает стабильность детекторов на основе якорей во время обучения со скоростью инференса безъякорной парадигмы.

Работающая на базе бэкбона EfficientRep, эта модель отлично показывает себя в тяжелых задачах автоматизации производства, где нормой является пакетная обработка на мощном оборудовании NVIDIA (таком как GPU T4 или A100). Хотя она великолепно работает в серверных кластерах, её зависимость от специфических аппаратных оптимизаций может сделать её менее эффективной на маломощных периферийных CPU.

Узнай больше о YOLOv6

Link to this sectionРазбираем YOLOv10: первопроходец без NMS#

Представленная более чем через год, модель YOLOv10 изменила парадигму, решив одну из самых упорных проблем в традиционных конвейерах детектирования: постобработку методом подавления немаксимумов (NMS).

Авторы: Ao Wang, Hui Chen, Lihao Liu и др.
Организация: Tsinghua University
Дата: 2024-05-23
Arxiv: 2405.14458
GitHub: THU-MIG/yolov10

Link to this sectionКлючевые архитектурные особенности#

Главный вклад YOLOv10 в развитие области — это сквозной (end-to-end) дизайн без NMS. Благодаря использованию последовательных двойных назначений (consistent dual assignments) во время обучения, сеть вынуждена выдавать ровно один высококачественный ограничивающий прямоугольник (BBox) на объект, что устраняет необходимость в эвристических операциях NMS во время инференса. Это нововведение значительно снижает сквозную задержку инференса и существенно упрощает логику развертывания на периферийных устройствах, таких как нейропроцессоры (NPUs).

Кроме того, модель отличается целостным дизайном, ориентированным на эффективность и точность. Благодаря всесторонней оптимизации различных слоев, YOLOv10 радикально сокращает вычислительную избыточность. Это делает её крайне подходящей для сред с ограниченными ресурсами, включая автономные транспортные средства и периферийную робототехнику.

Узнать больше о YOLOv10

Link to this sectionДетальное сравнение производительности#

При проведении бенчмаркинга этих моделей производительность обычно измеряется по точности, скорости и эффективности использования параметров. В таблице ниже показано, как работают различные масштабы этих архитектур.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionАнализ#

YOLOv10 неизменно достигает превосходной средней точности (mAP) в эквивалентных размерных категориях по сравнению с YOLOv6-3.0. Например, YOLOv10n достигает 39,5% mAP при использовании всего 2,3 млн параметров, в то время как YOLOv6-3.0n набирает 37,5%, используя более чем вдвое большее количество параметров. Однако YOLOv6-3.0n обеспечивает немного более быструю задержку инференса в чистом TensorRT на GPU T4 (1,17 мс), демонстрируя глубокую оптимизацию под оборудование для параллельной обработки.

Рекомендации по развертыванию

Хотя «сырые» показатели задержки на GPU могут в микробенчмарках немного склоняться в пользу YOLOv6, отсутствие NMS в YOLOv10 часто приводит к более высокой скорости сквозного конвейера в реальных условиях, особенно на периферийном оборудовании, где постобработка может создать «узкое место» для CPU.

Link to this sectionВарианты использования и рекомендации#

Выбор между YOLOv6 и YOLOv10 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда выбирать YOLOv6#

YOLOv6 — хороший выбор для:

  • Развертывания с учетом промышленного оборудования: Сценарии, где аппаратная оптимизация модели и эффективная репараметризация обеспечивают наилучшую производительность на конкретном целевом оборудовании.
  • Быстрой одностадийной детекции: Приложения, ставящие во главу угла скорость логического вывода на GPU для обработки видео в реальном времени в контролируемых средах.
  • Интеграции в экосистему Meituan: Команды, уже работающие внутри технологического стека и инфраструктуры развертывания Meituan.

Link to this sectionКогда выбирать YOLOv10#

YOLOv10 рекомендуется для:

  • Обнаружение в реальном времени без NMS: Приложения, которые выигрывают от комплексного обнаружения без Non-Maximum Suppression, что снижает сложность развертывания.
  • Сбалансированные компромиссы скорости и точности: Проекты, требующие хорошего баланса между скоростью вывода и точностью обнаружения для моделей различных масштабов.
  • Consistent-Latency Applications: Deployment scenarios where predictable inference times are critical, such as robotics or autonomous systems.

Link to this sectionКогда выбирать Ultralytics (YOLO26)#

Для большинства новых проектов Ultralytics YOLO26 предлагает лучшее сочетание производительности и опыта разработчика:

  • Периферийное развертывание без NMS: Приложениям требуется стабильный вывод с низкой задержкой без сложности постобработки Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного GPU-ускорения, где преимущество YOLO26 в виде до 43% более быстрого вывода на CPU является решающим.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэросъемка с дронов или анализ данных IoT-датчиков, где ProgLoss и STAL значительно повышают точность распознавания крошечных объектов.

Link to this sectionПреимущество Ultralytics: почему YOLO26 — лучший выбор#

Хотя YOLOv6-3.0 и YOLOv10 предоставляют надежные базовые архитектуры, современные производственные среды требуют моделей, сочетающих пиковую точность с исключительным удобством использования. Именно здесь модельный фреймворк Ultralytics YOLO26 фундаментально превосходит отдельные академические релизы.

Выпущенная в январе 2026 года, YOLO26 объединяет лучшие инновации прошлых лет и упаковывает их в тщательно поддерживаемую экосистему.

Link to this sectionКлючевые инновации YOLO26#

  • Сквозной дизайн без NMS: основываясь на концепции, впервые примененной в YOLOv10, YOLO26 нативно исключает постобработку NMS, что приводит к более плавному и предсказуемому времени инференса, которое гораздо проще отправить в продакшн.
  • Оптимизатор MuSGD: вдохновленный оптимизациями больших языковых моделей, таких как Kimi K2 от Moonshot AI, этот гибрид SGD и Muon обеспечивает невероятно стабильное обучение и значительно более быструю сходимость.
  • До 43% быстрее инференс на CPU: для периферийных устройств YOLO26 предлагает специфические архитектурные упрощения, что делает её намного лучше для развертывания на IoT-чипах и потребительских CPU.
  • Удаление DFL: отказ от Distribution Focal Loss упрощает экспорт головы, значительно улучшая совместимость с низкопотребляющими движками развертывания, такими как OpenVINO или NCNN.
  • ProgLoss + STAL: продвинутые формулировки функции потерь заметно повышают точность распознавания мелких объектов, что критически важно для операций с БПЛА и отслеживания далеких объектов.

Более того, в отличие от однозадачных репозиториев, экосистема Ultralytics «из коробки» поддерживает огромное количество задач компьютерного зрения, включая детектирование BBox, сегментацию экземпляров, классификацию изображений и оценку позы.

Link to this sectionЭффективность обучения и оптимизация памяти#

Важное преимущество моделей Ultralytics YOLO перед сложными архитектурами на основе трансформеров, такими как RT-DETR, — это их невероятно низкое потребление памяти CUDA во время обучения. Ты можешь комфортно дообучать YOLO26 на потребительском GPU или через бесплатные облачные ресурсы, что значительно демократизирует разработку ИИ.

Link to this sectionПример кода: начало работы с YOLO26#

Простота использования Python API от Ultralytics позволяет тебе загружать, обучать и тестировать модели всего в нескольких строках кода.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Evaluate model performance on validation data
metrics = model.val()

# Run real-time NMS-free inference on a target image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for cross-platform deployment
model.export(format="onnx")

Узнай больше о YOLO26

Link to this sectionЗаключение и альтернативные варианты#

При выборе между YOLOv6-3.0 и YOLOv10 решение зависит от среды развертывания. YOLOv6-3.0 остается жизнеспособной для серверных бэкендов с высокой пропускной способностью и мощными GPU, ориентированных на пакетную обработку видео. YOLOv10 предоставляет более умную архитектуру без NMS, лучше подходящую для сбалансированной точности и сложной периферийной интеграции.

Однако для разработчиков, ищущих бескомпромиссную производительность, подкрепленную исчерпывающей документацией, облачным логированием через платформу Ultralytics и многозадачностью, YOLO26 — это окончательная рекомендация.

Для требований к устаревшей инфраструктуре команды могут также рассмотреть предыдущее поколение — Ultralytics YOLO11, или изучить YOLO-World для уникальных возможностей детектирования с открытым словарем.

Контрибьюторы

Комментарии