Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 против YOLOv6-3.0#

Область computer vision быстро развивается, и выбор правильной архитектуры модели является критически важным решением для специалистов в области машинного обучения. Двумя значимыми вехами в развитии object detection в реальном времени стали YOLO11 и YOLOv6-3.0. Хотя обе модели предлагают впечатляющие возможности для извлечения инсайтов из визуальных данных, они были разработаны с разными основными целями и философиями проектирования.

Это руководство содержит глубокий технический анализ их архитектур, метрик производительности и идеальных сценариев развертывания, чтобы помочь тебе принять обоснованное решение для твоего следующего AI-проекта.

Link to this sectionОбзор моделей#

Прежде чем погружаться в технические бенчмарки, полезно понять происхождение и основную направленность каждой модели.

Link to this sectionUltralytics YOLO11#

YOLO11, разработанная в экосистеме Ultralytics, была создана для обеспечения плавного сквозного опыта разработки. Она делает упор не только на чистую скорость, но и на multi-task versatility, простоту использования и интеграцию с современными конвейерами развертывания.

Узнай больше о YOLO11

Link to this sectionMeituan YOLOv6-3.0#

YOLOv6-3.0 была специально адаптирована для промышленных приложений, где доступны выделенные graphics processing units (GPUs). Она глубоко оптимизирована для развертывания с TensorRT, фокусируясь на максимизации пропускной способности в контролируемых средах.

Узнай больше о YOLOv6

Link to this sectionАрхитектурные различия#

Фундаментальная архитектура определяет, как модель обучается и масштабируется. Оба фреймворка привносят уникальные улучшения в классическую формулу YOLO.

YOLO11 опирается на многолетние исследования, предлагая архитектуру, невероятно эффективную с точки зрения количества параметров. Она оснащена продвинутым бэкбоном и универсальной головой, способной решать разнообразные задачи компьютерного зрения — такие как instance segmentation и pose estimation — без необходимости масштабных структурных переработок. Более того, YOLO11 требует исключительно малого объема памяти CUDA во время обучения, что выгодно отличает ее от более громоздких transformer models, таких как RT-DETR.

Напротив, YOLOv6-3.0 использует модуль двунаправленной конкатенации (BiC) и стратегию обучения с поддержкой якорей (AAT). Эти механизмы разработаны для повышения точности локализации. Архитектура в основном является разделенной (decoupled) и сильно квантованной, чтобы отдавать предпочтение INT8 model inference, что делает ее сильным конкурентом для высокоскоростных производственных линий, работающих на старых стеках GPU.

Выбор подходящего фреймворка

Если твой проект требует быстрого прототипирования, поддержки разнообразных задач (например, сегментации или классификации) и развертывания на различном оборудовании (CPU, Edge TPU, Mobile), фреймворк Ultralytics обеспечит тебе значительно более комфортный опыт разработки.

Link to this sectionПроизводительность и метрики#

При оценке моделей mean Average Precision (mAP) и скорость вывода имеют первостепенное значение. В следующей таблице сравнивается производительность YOLO11 и YOLOv6-3.0 для моделей разных масштабов. Лучшие показатели выделены жирным шрифтом.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

Как показано, YOLO11 стабильно достигает более высокой точности (mAP) при значительно меньшем количестве параметров и FLOPs на эквивалентных уровнях. Эта эффективность использования параметров напрямую приводит к снижению требований к памяти как во время model training, так и при инференсе.

Link to this sectionПреимущество Ultralytics#

Выбор модели — это больше, чем просто сухие метрики; это касается всего machine learning lifecycle. Модели Ultralytics предоставляют явное преимущество как для разработчиков, так и для исследователей.

  1. Простота использования: Python API от Ultralytics позволяет тебе обучать, проверять и экспортировать модели всего за несколько строк кода. Нет необходимости вручную настраивать сложные деревья зависимостей.
  2. Хорошо поддерживаемая экосистема: Ultralytics предоставляет единую экосистему, которая часто получает обновления. Используя Ultralytics Platform, разработчики получают доступ к совместной разметке датасетов, облачному обучению и бесшовному мониторингу моделей.
  3. Универсальность: В отличие от YOLOv6-3.0, которая является преимущественно детектором ограничивающих рамок, YOLO11 нативно поддерживает image classification и oriented bounding boxes (OBB), позволяя тебе консолидировать твой технологический стек.
  4. Эффективность обучения: Используя современные оптимизации и автобатчинг, YOLO11 эффективно обучается на потребительском оборудовании, демократизируя доступ к передовым AI-технологиям компьютерного зрения.

Link to this sectionПример кода: обучение и инференс#

Работа с моделями Ultralytics очень интуитивна. Ниже приведен готовый к запуску пример, демонстрирующий, как обучать и запускать инференс с помощью пакета Ultralytics.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on an image from the web
prediction = model("https://ultralytics.com/images/bus.jpg")

# Export the model to ONNX format for easy deployment
model.export(format="onnx")

Link to this sectionИдеальные варианты использования#

Понимание сильных сторон каждой модели гарантирует, что ты выберешь правильный инструмент для своей задачи.

Когда выбирать YOLOv6-3.0: Если ты поддерживаешь старую промышленную систему, построенную специально вокруг специфических конвейеров TensorRT 7.x/8.x, и твое оборудование полностью состоит из выделенных GPU NVIDIA T4 или A100 для высокоскоростной manufacturing automation, YOLOv6 остается жизнеспособным и функциональным движком.

Когда выбирать YOLO11: Почти для всех современных приложений YOLO11 является лучшим выбором. Создаешь ли ты решения для smart manufacturing, развертываешь edge AI на устройствах Raspberry Pi или выполняешь многозадачные операции, такие как обнаружение и сегментация медицинских изображений, YOLO11 обеспечивает оптимальный баланс скорости, точности и гибкости развертывания.

Link to this sectionВзгляд в будущее: передовая YOLO26#

Хотя YOLO11 представляет собой огромный шаг вперед, Ultralytics постоянно расширяет границы компьютерного зрения. Выпущенная в январе 2026 года, новая серия моделей YOLO26 является абсолютным лидером технологий и рекомендуется для всех новых проектов.

YOLO26 представляет несколько революционных функций, разработанных специально для современных задач развертывания:

  • Сквозной дизайн без NMS: Опираясь на концепции, предложенные в YOLOv10, YOLO26 является нативно сквозной моделью. Она полностью исключает постобработку Non-Maximum Suppression (NMS), что приводит к более быстрым и радикально упрощенным конвейерам развертывания.
  • Удаление DFL: Благодаря удалению Distribution Focal Loss, YOLO26 упрощает голову сети, значительно повышая совместимость с маломощными устройствами Internet of Things (IoT) и периферийными устройствами (edge devices).
  • Оптимизатор MuSGD: Вдохновленная инновациями в обучении больших языковых моделей (LLM) (такими как Kimi K2 от Moonshot AI), YOLO26 использует гибридный оптимизатор Muon-SGD, обеспечивая непревзойденную стабильность обучения и более быструю сходимость.
  • До 43% быстрее инференс на CPU: Для приложений, работающих без выделенных GPU-ускорителей, YOLO26 была сильно оптимизирована для повышения производительности на CPU.
  • ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что критически важно для drone imagery и воздушного наблюдения.
  • Улучшения для конкретных задач: YOLO26 включает в себя специализированные улучшения для всех типов задач, такие как многомасштабное прототипирование для сегментации и Residual Log-Likelihood Estimation (RLE) для оценки позы.

Если ты начинаешь новую инициативу в области компьютерного зрения сегодня, использование Ultralytics Platform для обучения модели YOLO26 обеспечит твоему приложению работу на базе наиболее эффективной, точной и перспективной архитектуры из доступных.

Для разработчиков, заинтересованных в исследовании обнаружения с открытым словарем (open-vocabulary detection), ты также можешь изучить нашу документацию по YOLO-World.

Контрибьюторы

Комментарии