YOLOv8 против YOLO26: Эволюция детектирования объектов в реальном времени от Ultralytics

Область компьютерного зрения за последние несколько лет совершила значительный скачок. Среди самых популярных архитектур для приложений реального времени выделяются модели, разработанные Ultralytics. Это подробное руководство содержит детальное техническое сравнение инновационной Ultralytics YOLOv8 и новейшей передовой Ultralytics YOLO26. Мы проанализируем их архитектуры, метрики производительности и идеальные сценарии использования, чтобы помочь тебе выбрать подходящую модель для развертывания.

Обзор моделей

И YOLOv8, и YOLO26 представляют собой важные вехи в семействе моделей YOLO. Они разделяют ключевую философию Ultralytics: предоставление моделей, которые работают быстро, точно и невероятно просты в использовании благодаря унифицированной среде Python и API.

YOLOv8: Универсальный стандарт

Выпущенная в начале 2023 года, YOLOv8 привнесла значительные изменения в платформу YOLO, предложив архитектуру без анкоров и надежную поддержку множества задач компьютерного зрения.

YOLOv8 быстро стала отраслевым стандартом благодаря отличному балансу производительности и глубокой интеграции в экосистему Ultralytics. Она нативно поддерживает детектирование объектов, сегментацию экземпляров, оценку позы и классификацию изображений. Однако для постобработки она полагается на стандартное подавление немаксимумов (NMS), что может приводить к задержкам в сильно ограниченных по ресурсам граничных (edge) средах.

Узнай больше о YOLOv8

YOLO26: Мощный инструмент нового поколения для Edge AI

Выпущенная в январе 2026 года, YOLO26 использует фундамент своих предшественников и агрессивно оптимизирует его для современных сценариев развертывания, особенно для Edge AI и устройств с низким энергопотреблением.

YOLO26 внедряет несколько кардинальных технических улучшений. Самое примечательное из них — дизайн end-to-end без использования NMS. Эта архитектура, впервые предложенная в YOLOv10, устраняет необходимость в постобработке через NMS, значительно упрощая экспортные пайплайны и снижая вариативность задержек. Кроме того, отказ от Distribution Focal Loss (DFL) упрощает детектирующий слой, делая модель невероятно эффективной для развертывания на аппаратном обеспечении Edge AI.

Узнай больше о YOLO26

Другие модели Ultralytics

Хотя YOLOv8 и YOLO26 невероятно мощны, ты можешь также рассмотреть YOLO11, которая заполняет пробел между этими двумя поколениями за счет улучшенных архитектур, или YOLOv5 для специфических задач при работе с устаревшими интеграциями.

Архитектурные и тренировочные инновации

YOLO26 предлагает несколько внутренних усовершенствований, которые значительно превосходят базовую производительность YOLOv8.

Оптимизированное обучение с MuSGD

Эффективность обучения — отличительная черта моделей Ultralytics, которые обычно требуют гораздо меньше памяти по сравнению с громоздкими трансформерными архитектурами, такими как RT-DETR. YOLO26 еще больше усиливает это преимущество благодаря внедрению оптимизатора MuSGD. Вдохновленный методами обучения больших языковых моделей (LLM) (в частности, Kimi K2 от Moonshot AI), этот гибрид стохастического градиентного спуска (SGD) и Muon обеспечивает более быструю сходимость и высокую стабильность динамики обучения на сложных наборах данных.

Продвинутые функции потерь

Для задач, требующих высокой точности, таких как обработка изображений с дронов или работа с датчиками IoT, YOLO26 внедряет ProgLoss + STAL. Эти улучшенные функции потерь обеспечивают заметное повышение качества распознавания мелких объектов. Кроме того, YOLO26 приносит улучшения в специфические задачи: многомасштабный proto для превосходной генерации масок в сегментации, Residual Log-Likelihood Estimation (RLE) для более точной оценки позы и специализированную функцию потерь по углу для решения проблем границ при детектировании ориентированных ограничивающих рамок (OBB).

Анализ производительности и сравнение

В следующей таблице показаны различия в производительности между двумя моделями с использованием набора данных COCO. Лучшие значения в каждой категории размеров выделены жирным шрифтом.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv8n64037.380.41.473.28.7
YOLO26n64040.938.91.72.45.4
YOLOv8s64044.9128.42.6611.228.6
YOLO26s64048.687.22.59.520.7
YOLOv8m64050.2234.75.8625.978.9
YOLO26m64053.1220.04.720.468.2
YOLOv8l64052.9375.29.0643.7165.2
YOLO26l64055.0286.26.224.886.4
YOLOv8x64053.9479.114.3768.2257.8
YOLO26x64057.5525.811.855.7193.9

Анализ метрик

Данные показывают поколенческий скачок. YOLO26 значительно превосходит YOLOv8 по всем метрикам. Модель YOLO26 Nano (YOLO26n) достигает впечатляющих 40.9 mAP, что существенно выше 37.3 у YOLOv8n, при этом используя меньше параметров и операций FLOPs.

Одним из наиболее ярких улучшений является скорость вывода на CPU. Благодаря оптимизированной архитектуре и исключению DFL, YOLO26 обеспечивает до 43% более быструю работу на CPU через ONNX. Это делает YOLO26 непревзойденной для Raspberry Pi и других низкоресурсных устройств. В то время как скорость GPU при использовании TensorRT конкурентоспособна у обеих моделей, общая эффективность параметров YOLO26 приводит к снижению потребления памяти как во время обучения, так и при выводе.

Простота использования и экосистема

Обе модели получают огромную пользу от поддерживаемой экосистемы Ultralytics. Разработчики хвалят простоту использования унифицированного API, который позволяет переключаться между YOLOv8 и YOLO26, просто изменив строку с названием модели.

Независимо от того, занимаешься ли ты настройкой гиперпараметров, отслеживанием экспериментов или изучением новых наборов данных, документация Ultralytics предоставляет обширные ресурсы. Более того, платформа Ultralytics предлагает оптимизированный способ аннотирования, обучения и развертывания этих моделей — как в облаке, так и локально.

Пример кода

Начать обучение и вывод невероятно просто. Ниже приведен полный рабочий пример с использованием Python API от Ultralytics:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=50,
    imgsz=640,
    device="cpu",  # Use '0' for GPU training
)

# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
results[0].show()

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")
Простота развертывания

Экспорт YOLO26 в форматы вроде CoreML или OpenVINO проходит значительно легче, чем в случае со старыми моделями, благодаря архитектуре без NMS, которая удаляет сложные пользовательские операции из экспортированного графа.

Идеальные сценарии использования

Выбор правильной модели определяет успех твоего проекта.

Когда выбирать YOLO26:

  • Edge Computing и робототехника: Увеличенная на 43% скорость на CPU и отсутствие NMS делают ее абсолютно лучшим выбором для встраиваемых систем, мобильных устройств и автономных роботов.
  • Аэросъемка и спутниковые изображения: Реализация ProgLoss + STAL дает YOLO26 явное преимущество при обнаружении крошечных объектов в сложных высокодетализированных ландшафтах.
  • Новые проекты: Будучи последним стабильным релизом, YOLO26 является рекомендуемой моделью для любого нового пайплайна машинного обучения, предлагая превосходную универсальность для всех задач.

Когда оставить YOLOv8:

  • Устаревшая инфраструктура: Если твой текущий производственный пайплайн сильно завязан на конкретные выходные тензоры и механизмы анкоров YOLOv8, миграция может потребовать небольших адаптаций.
  • Академические исследования: YOLOv8 остается широко цитируемым и стабильным базисом для академических исследований в области компьютерного зрения, где требуется сравнение со старыми архитектурами.

В заключение, хотя YOLOv8 установила феноменальный стандарт для задач компьютерного зрения в реальном времени, YOLO26 переопределяет возможности этой области. Сочетая огромный прирост эффективности на CPU с инновационными оптимизаторами обучения, вдохновленными LLM, YOLO26 гарантирует, что ты сможешь развертывать высокоточные ИИ-решения практически на любом аппаратном обеспечении.

Комментарии