Перейти к содержанию

YOLOv8 против YOLO26: Эволюция обнаружения объектов в реальном времени от Ultralytics

За последние несколько лет область компьютерного зрения стала свидетелем значительных достижений. Среди наиболее популярных архитектур для приложений реального времени — модели, разработанные Ultralytics. Это всестороннее руководство представляет подробное техническое сравнение между новаторской Ultralytics YOLOv8 и новейшей передовой Ultralytics YOLO26. Мы проанализируем их архитектуры, метрики производительности и идеальные сценарии использования, чтобы помочь вам выбрать подходящую модель для вашего развертывания.

Обзоры моделей

И YOLOv8, и YOLO26 представляют собой важные вехи в семействе моделей YOLO. Они разделяют основную философию Ultralytics: предоставление моделей, которые быстры, точны и невероятно просты в использовании через унифицированную среду Python и API.

YOLOv8: Универсальный стандарт

Выпущенный в начале 2023 года, YOLOv8 представил значительную переработку фреймворка YOLO, внедряя безъякорный дизайн и надежную поддержку множества задач компьютерного зрения.

YOLOv8 быстро стал отраслевым стандартом благодаря отличному балансу производительности и глубокой интеграции в экосистему Ultralytics. Он изначально поддерживает обнаружение объектов, сегментацию экземпляров, оценку позы и классификацию изображений. Однако он полагается на стандартное не максимальное подавление (NMS) для постобработки, что может приводить к узким местам по задержке в сильно ограниченных периферийных средах.

Узнайте больше о YOLOv8

YOLO26: Мощное решение для периферийных устройств следующего поколения

Выпущенный в январе 2026 года, YOLO26 берет основу, заложенную его предшественниками, и агрессивно оптимизирует ее для современных сценариев развертывания, особенно в области граничного ИИ и устройств с низким энергопотреблением.

YOLO26 представляет несколько парадигмальных технических улучшений. Наиболее заметно, что он оснащен сквозной архитектурой без NMS. Эта архитектура, впервые примененная в YOLOv10, устраняет необходимость в постобработке NMS, значительно упрощая конвейеры экспорта и уменьшая вариативность задержки. Кроме того, удаление Distribution Focal Loss (DFL) оптимизирует головную часть детектора, делая ее невероятно удобной для развертывания на граничном оборудовании AI.

Узнайте больше о YOLO26

Другие модели Ultralytics

Хотя YOLOv8 и YOLO26 невероятно мощны, вы также можете рассмотреть YOLO11, которая устраняет разрыв между этими двумя поколениями благодаря усовершенствованным архитектурам, или YOLOv5 для узкоспециализированных устаревших интеграций.

Архитектурные и обучающие инновации

YOLO26 представляет несколько внутренних улучшений, которые значительно превосходят базовые показатели YOLOv8.

Оптимизированное обучение с MuSGD

Эффективность обучения — отличительная черта моделей Ultralytics, которые обычно требуют значительно меньше памяти по сравнению с громоздкими архитектурами на основе трансформеров, такими как RT-DETR. YOLO26 еще больше повышает ее благодаря внедрению оптимизатора MuSGD. Вдохновленный методами обучения больших языковых моделей (LLM) (в частности, Kimi K2 от Moonshot AI), этот гибрид стохастического градиентного спуска (SGD) и мюона обеспечивает более быструю сходимость и высокостабильную динамику обучения на сложных наборах данных.

Расширенные функции потерь

Для задач, требующих высокой точности, таких как изображения с дронов или IoT-датчики, YOLO26 представляет ProgLoss + STAL. Эти улучшенные функции потерь значительно повышают качество распознавания мелких объектов. Кроме того, YOLO26 предлагает общие улучшения для конкретных задач: многомасштабный прототип для превосходной генерации масок в сегментации, оценка остаточного логарифмического правдоподобия (RLE) для более точной оценки позы и специализированная угловая функция потерь для решения проблем границ в детектировании ориентированных ограничивающих рамок (OBB).

Анализ и сравнение производительности

В следующей таблице подчеркиваются различия в производительности между двумя моделями с использованием набора данных COCO. Наилучшие значения производительности в каждой категории размеров выделены жирным шрифтом.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLO26n64040.938.91.72.45.4
YOLOv8s64044.9128.42.6611.228.6
YOLO26s64048.687.22.59.520.7
YOLOv8m64050.2234.75.8625.978.9
YOLO26m64053.1220.04.720.468.2
YOLOv8l64052.9375.29.0643.7165.2
YOLO26l64055.0286.26.224.886.4
YOLOv8x64053.9479.114.3768.2257.8
YOLO26x64057.5525.811.855.7193.9

Анализ метрик

Данные показывают скачок поколений. YOLO26 значительно превосходит YOLOv8 по всем метрикам. Модель YOLO26 Nano (YOLO26n) достигает выдающегося mAP в 40.9, что существенно выше, чем 37.3 у YOLOv8n, при этом используя меньше параметров и FLOPs.

Одним из наиболее поразительных улучшений является скорость инференса на CPU. Благодаря оптимизированной архитектуре и удалению DFL, YOLO26 обеспечивает до 43% более быстрый инференс на CPU через ONNX. Это делает YOLO26 непревзойденным для Raspberry Pi и других периферийных устройств с низкими ресурсами. Хотя скорости на GPU с использованием TensorRT конкурентоспособны в обеих моделях, общая эффективность параметров YOLO26 приводит к меньшему потреблению памяти как во время обучения, так и во время инференса.

Простота использования и экосистема

Обе модели получают огромную выгоду от хорошо поддерживаемой экосистемы Ultralytics. Разработчики высоко оценивают простоту использования, обеспечиваемую унифицированным API, который позволяет переключаться между YOLOv8 и YOLO26, просто изменяя строку с именем модели.

Независимо от того, выполняете ли вы настройку гиперпараметров, проводите отслеживание экспериментов или исследуете новые наборы данных, документация Ultralytics предоставляет обширные ресурсы. Кроме того, платформа Ultralytics предлагает оптимизированный способ беспрепятственной аннотации, обучения и развертывания этих моделей в облаке или локально.

Пример кода

Начало работы с обучением и инференсом невероятно просто. Ниже приведен полный, исполняемый пример использования API Ultralytics Python:

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset for 50 epochs
# The MuSGD optimizer is automatically leveraged for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=50,
    imgsz=640,
    device="cpu",  # Use '0' for GPU training
)

# Run inference on a sample image
# The NMS-free design provides clean, rapid predictions
results = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
results[0].show()

# Export seamlessly to ONNX for CPU deployment
export_path = model.export(format="onnx")

Простота развертывания

Экспорт YOLO26 в такие форматы, как CoreML или OpenVINO, значительно проще, чем у старых моделей, благодаря ее архитектуре без NMS, которая исключает сложные пользовательские операции из экспортируемого графа.

Идеальные варианты использования

Выбор правильной модели определяет успех вашего проекта.

Когда выбрать YOLO26:

  • Периферийные вычисления и робототехника: Его 43% более высокая скорость CPU и отсутствие NMS делают его лучшим выбором для встраиваемых систем, мобильных устройств и автономных роботов.
  • Аэро- и спутниковая съемка: Реализация ProgLoss + STAL дает YOLO26 явное преимущество в обнаружении крошечных объектов в сложных ландшафтах высокого разрешения.
  • Новые проекты: Как последняя стабильная версия, YOLO26 является рекомендуемой моделью для любого нового машинного обучения, предлагая превосходную универсальность для всех задач.

Когда стоит придерживаться YOLOv8:

  • Устаревшая инфраструктура: Если ваш текущий производственный конвейер тесно связан с конкретными выходными тензорами и якорными механизмами YOLOv8, миграция может потребовать незначительной адаптации.
  • Базовые модели для академических исследований: YOLOv8 остаётся часто цитируемой и стабильной базовой моделью для академических исследований в области компьютерного зрения, сравнивающих более старые архитектуры.

В заключение, хотя YOLOv8 установил феноменальный стандарт для задач компьютерного зрения в реальном времени, YOLO26 переопределяет возможности. Сочетая значительное повышение эффективности на CPU с инновационными оптимизаторами обучения, вдохновленными LLM, YOLO26 гарантирует, что разработчики могут развертывать высокоточный ИИ практически в любой аппаратной среде.


Комментарии