Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 против YOLOv8: Достижения в обнаружении объектов следующего поколения#

Эволюция компьютерного зрения всегда определялась стремлением к работе в режиме реального времени без ущерба для точности. Поскольку разработчики и исследователи работают в сфере современного машинного обучения, выбор правильной архитектуры модели имеет решающее значение. В этом подробном техническом сравнении исследуется переход от Ultralytics YOLOv8, невероятно популярной архитектуры, установившей новый стандарт в 2023 году, к передовой Ultralytics YOLO26, выпущенной в январе 2026 года.

Изучая их архитектуры, показатели производительности и методы обучения, мы покажем, почему переход на последние инновации дает заметные преимущества для обнаружения объектов, сегментации и других задач.

Link to this sectionИстория модели и метаданные#

Понимание происхождения этих архитектур дает контекст для их соответствующих прорывов. Обе модели были разработаны компанией Ultralytics, известной тем, что она делает передовые ИИ-решения доступными и простыми в развертывании.

Детали YOLO26:
Авторы: Glenn Jocher и Jing Qiu
Организация: Ultralytics
Дата: 2026-01-14
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo26/

Узнай больше о YOLO26

Детали YOLOv8:
Авторы: Glenn Jocher, Ayush Chaurasia и Jing Qiu
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Узнай больше о YOLOv8

Link to this sectionАрхитектурные инновации#

Переход с YOLOv8 на YOLO26 знаменует собой значительный сдвиг в парадигме того, как нейронные сети обрабатывают визуальные данные и вычисляют функцию потерь.

Link to this sectionYOLO26: Вершина эффективности для граничных устройств#

YOLO26 была спроектирована с нуля для устранения узких мест при развертывании и максимизации скорости вывода на аппаратном обеспечении с ограниченными ресурсами.

  • Дизайн без NMS (End-to-End): Основываясь на концепциях, впервые предложенных в YOLOv10, YOLO26 использует архитектуру «end-to-end». Полное исключение необходимости в пост-обработке через немаксимальное подавление (NMS) практически устраняет вариативность задержек. Это упрощает логику развертывания для приложений, требующих строгих гарантий работы в реальном времени.
  • Удаление DFL: Удаление функции потерь Distribution Focal Loss (DFL) радикально упрощает выходной слой. Такое архитектурное решение значительно улучшает совместимость с маломощными периферийными устройствами и упрощает экспорт в такие форматы, как ONNX и CoreML.
  • Оптимизатор MuSGD: Вдохновленная стабильностью обучения больших языковых моделей (LLM), таких как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD — гибрид стохастического градиентного спуска (SGD) и Muon. Это привносит инновации обучения масштаба LLM в компьютерное зрение, обеспечивая более быструю сходимость и высокую стабильность обучения.
  • ProgLoss + STAL: Для решения крайне сложной проблемы распознавания крошечных объектов YOLO26 внедряет прогрессивную функцию потерь (ProgLoss) в сочетании с функцией потерь, устойчивой к масштабу (STAL). Это дает критически важные улучшения для обнаружения малых объектов, что делает модель идеальной для использования на дронах.
Улучшения для конкретных задач

YOLO26 также содержит точечные обновления в различных областях компьютерного зрения. Модель использует функцию потерь для семантической сегментации и мультимасштабные прототипы для лучшей сегментации экземпляров, оценку остаточного логарифмического правдоподобия (RLE) для высокоточной оценки позы и специализированные алгоритмы угловых потерь для устранения проблем с границами в ориентированных ограничивающих рамках (OBB).

Link to this sectionYOLOv8: Высокоуниверсальная рабочая лошадка#

Выпущенная в 2023 году, YOLOv8 установила новый стандарт, полностью перейдя на архитектуру без использования якорей (anchor-free), что позволило модели лучше адаптироваться к разным соотношениям сторон в наборах данных.

  • Модуль C2f: Он заменил устаревший модуль C3 блоком C2f, что обеспечило лучший поток градиентов по всей магистрали сети (backbone).
  • Развязанный (Decoupled) заголовок: YOLOv8 оснащена развязанным заголовком, в котором классификация и регрессия ограничивающих рамок вычисляются независимо, что значительно повышает среднюю точность (mAP).
  • Универсальность задач: Это была одна из первых моделей, обеспечившая по-настоящему унифицированный API для классификации изображений, обнаружения, сегментации и оценки позы «из коробки».

Link to this sectionМетрики производительности и требования к ресурсам#

При оценке моделей для производства баланс между точностью, скоростью вывода и размером модели имеет первостепенное значение. YOLO26 демонстрирует явное преимущество нового поколения во всех размерах.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Примечание: Выделенные значения демонстрируют баланс производительности и выигрыш в эффективности архитектуры YOLO26 по сравнению с ее предшественницей.

Link to this sectionАнализ#

YOLO26 достигает впечатляющего прироста скорости вывода на CPU до 43% по сравнению с аналогичными моделями YOLOv8. Например, YOLO26n показывает результат 38.9 мс на CPU при использовании ONNX, по сравнению с 80.4 мс у YOLOv8n, и все это при повышении mAP с 37.3 до 40.9. Этот огромный скачок в эффективности CPU является прямым результатом удаления DFL и дизайна без NMS, что делает YOLO26 абсолютно мощным инструментом для сред, где нет выделенных GPU.

Кроме того, модели YOLO26 имеют меньшее количество параметров и операций (FLOPs) для соответствующих типоразмеров, что означает значительно меньшее потребление видеопамяти GPU во время вывода и обучения по сравнению с устаревшими архитектурами на базе Transformer.

Link to this sectionПреимущества экосистемы Ultralytics#

Важным фактором при выборе ИИ-модели является окружающая инфраструктура. Как YOLO26, так и YOLOv8 получают колоссальную пользу от унифицированной платформы Ultralytics Platform, обеспечивающей непревзойденный опыт разработки.

  1. Простота использования: Философия «от нуля до героя» гарантирует, что ты сможешь загружать, обучать и экспортировать модели с минимумом кода. Python API остается последовательным на протяжении всех поколений моделей.
  2. Эффективность обучения: Модели Ultralytics YOLO требуют значительно меньше памяти CUDA во время обучения по сравнению с моделями Transformer (например, RT-DETR). Это позволяет использовать более крупные размеры батчей на потребительском оборудовании, демократизируя исследования в области ИИ.
  3. Хорошо поддерживаемая экосистема: Подкрепленный постоянными обновлениями, строгими CI/CD пайплайнами и глубокими интеграциями с такими инструментами, как Weights & Biases и TensorRT, репозиторий Ultralytics является надежным и готовым к промышленной эксплуатации.
  4. Непревзойденная универсальность: Модели Ultralytics — это не узкоспециализированные инструменты; один импорт позволяет работать с разнообразными наборами данных, расширяя рабочие процессы для сложных систем, требующих одновременного трекинга, классификации и сегментации.
Упрощенное обновление

Поскольку API Ultralytics строго стандартизирован, обновление производственной системы с YOLOv8 до YOLO26 технически сводится к простой замене строки "yolov8n.pt" на "yolo26n.pt" в твоем скрипте.

Link to this sectionПрименение в реальных условиях#

Выбор между этими моделями часто зависит от твоих ограничений при развертывании, хотя для новых проектов мы повсеместно рекомендуем использовать YOLO26.

Link to this sectionПериферийные вычисления и IoT-сети#

Для граничных сред — таких как развертывания на Raspberry Pi или локальные сенсоры на производстве — YOLO26 является безоговорочным чемпионом. Благодаря нативно оптимизированной скорости работы на CPU и отсутствию NMS, умные камеры могут обрабатывать видео с высокой частотой кадров для управления парковкой, не теряя кадры из-за узких мест в пост-обработке.

Link to this sectionВысокогорная и аэрофотосъемка#

В сельскохозяйственном мониторинге или при инспекции инфраструктуры с помощью дронов обнаружение малых объектов имеет решающее значение. Внедрение ProgLoss + STAL в YOLO26 позволяет последовательно обнаруживать крошечных вредителей или микротрещины в трубопроводах, которые могут пропустить более старые архитектуры, такие как YOLOv8, предлагая превосходную полноту и точность на наборах данных, таких как VisDrone.

Link to this sectionУстаревшие системы с GPU#

YOLOv8 остается актуальной для систем, сильно привязанных к специфическим результатам регрессии рамок или корпоративных развертываний, которые заблокированы в рамках длительных циклов валидации и не могут легко сменить архитектуру.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLO26 и YOLOv8 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLO26#

YOLO26 — отличный выбор для:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionКогда выбирать YOLOv8#

YOLOv8 рекомендуется для:

  • Универсального развертывания с несколькими задачами: проектов, требующих проверенной модели для обнаружения, сегментации, классификации и оценки позы в рамках экосистемы Ultralytics.
  • Устоявшихся производственных систем: существующих производственных сред, уже построенных на архитектуре YOLOv8 со стабильными и хорошо протестированными пайплайнами развертывания.
  • Широкой поддержки сообщества и экосистемы: приложений, которым нужны обширные руководства по YOLOv8, сторонние интеграции и активные ресурсы сообщества.

Link to this sectionПример кода: с чего начать#

Использовать мощь новейших моделей Ultralytics невероятно просто. Следующий код на Python демонстрирует обучение модели YOLO26 на пользовательском наборе данных, показывая, как оптимизатор MuSGD автоматически обеспечивает быструю сходимость.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

Link to this sectionДругие модели для рассмотрения#

Хотя YOLO26 представляет собой текущее состояние технологий, разработчикам, создающим разнообразные приложения, стоит также рассмотреть:

  • YOLO11: Прямой предшественник YOLO26, предлагающий исключительную доработку по сравнению с YOLOv8 и до сих пор широко используемый в передовых производственных системах.
  • RT-DETR: Трансформер обнаружения реального времени от Baidu. Это отличный выбор для исследователей, изучающих механизм внимания (attention) в задачах компьютерного зрения, хотя он требует значительно больше памяти CUDA для обучения по сравнению со стандартными моделями Ultralytics YOLO.

Для полного набора инструментов по облачному обучению, разметке данных и моментальному развертыванию, изучи Ultralytics Platform уже сегодня.

Авторы

Комментарии