Перейти к содержанию

YOLO26 против YOLOv8: Достижения в обнаружении объектов нового поколения

Эволюция компьютерного зрения определяется стремлением к производительности в реальном времени без ущерба для точности. Поскольку разработчики и исследователи ориентируются в ландшафте современного машинного обучения, выбор правильной архитектуры модели имеет решающее значение. Это всестороннее техническое сравнение исследует поколенческий скачок от Ultralytics YOLOv8, чрезвычайно популярной архитектуры, переопределившей стандарт в 2023 году, до передовой Ultralytics YOLO26, выпущенной в январе 2026 года.

Углубляясь в их архитектуры, метрики производительности и методологии обучения, мы подчеркиваем, почему обновление до последних инноваций предоставляет явные преимущества для object detection, segmentation и других задач.

Общие сведения о модели и метаданные

Понимание истоков этих архитектур дает контекст для их соответствующих прорывов. Обе модели были разработаны компанией Ultralytics, известной тем, что делает передовой ИИ доступным и простым в развертывании.

YOLO26 Подробности:
Авторы: Гленн Джочер и Цзин Цю
Организация: Ultralytics
Дата: 2026-01-14
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolo26/

Узнайте больше о YOLO26

Подробности о YOLOv8:
Авторы: Гленн Джочер, Аюш Чаурасия и Цзин Цю
Организация: Ultralytics
Дата: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Документация: https://docs.ultralytics.com/models/yolov8/

Узнайте больше о YOLOv8

Архитектурные инновации

Переход от YOLOv8 к YOLO26 вводит значительные изменения парадигмы в том, как нейронные сети обрабатывают визуальные данные и вычисляют функцию потерь.

YOLO26: Вершина эффективности периферийных вычислений

YOLO26 был разработан с нуля для устранения узких мест развертывания и максимизации скорости инференса на ограниченном оборудовании.

  • Сквозная архитектура без NMS: Основываясь на концепциях, впервые примененных в YOLOv10, YOLO26 изначально использует сквозную архитектуру. Полностью устраняя необходимость в постобработке Non-Maximum Suppression (NMS), вариативность задержки практически полностью исключается. Это упрощает логику развертывания для приложений, требующих строгих гарантий реального времени.
  • Удаление DFL: Удаление Distribution Focal Loss (DFL) значительно упрощает выходную часть. Это архитектурное решение обеспечивает значительно лучшую совместимость с маломощными периферийными устройствами и более простой экспорт в такие форматы, как ONNX и CoreML.
  • Оптимизатор MuSGD: Вдохновленный стабильностью обучения, наблюдаемой в больших языковых моделях (LLM), таких как Kimi K2 от Moonshot AI, YOLO26 использует оптимизатор MuSGD — гибрид SGD и Muon. Это переносит инновации в обучении масштаба LLM в компьютерное зрение, обеспечивая более быструю сходимость и высокостабильные циклы обучения.
  • ProgLoss + STAL: Для борьбы с общеизвестно сложной проблемой распознавания крошечных объектов YOLO26 реализует прогрессивную функцию потерь (ProgLoss) в сочетании с масштабно-устойчивой функцией потерь якорей (STAL). Это обеспечивает критически важные улучшения для обнаружения мелких объектов, делая его идеальным для применения в дронах.

Уточнения для конкретных задач

YOLO26 также предлагает целенаправленные улучшения в различных областях компьютерного зрения. Он использует функцию потерь для семантической сегментации и многомасштабный прототип для улучшения сегментации экземпляров, оценку остаточного логарифмического правдоподобия (RLE) для высокоточной оценки позы, и специализированные алгоритмы потерь угла для решения проблем границ в ориентированных ограничивающих прямоугольниках (OBB).

YOLOv8: Высокоуниверсальная рабочая лошадка

Выпущенный в 2023 году, YOLOv8 установил новый стандарт, полностью перейдя на безанкерную архитектуру, которая лучше обобщалась на наборах данных с различными соотношениями сторон.

  • Модуль C2f: Он заменил старый модуль C3 блоком C2f, обеспечивая лучший поток градиента по всей магистрали сети.
  • Декаплированная голова: YOLOv8 имеет декаплированную голову, где классификация и регрессия ограничивающих рамок вычисляются независимо, значительно повышая среднюю точность (mAP).
  • Универсальность задач: Это была одна из первых моделей, предоставивших по-настоящему унифицированный API для классификации изображений, detect, сегментации и задач позы "из коробки".

Метрики производительности и требования к ресурсам

При оценке моделей для производства баланс между точностью, скоростью инференса и размером модели имеет первостепенное значение. YOLO26 демонстрирует явное преимущество нового поколения для всех вариантов размеров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Примечание: Выделенные значения демонстрируют баланс производительности и прирост эффективности архитектуры YOLO26 по сравнению с ее предшественником.

Анализ

YOLO26 достигает выдающихся показателей до 43% более быстрый инференс на CPU по сравнению с аналогичными моделями YOLOv8. Например, YOLO26n достигает 38,9 мс на CPU с использованием ONNX, по сравнению с YOLOv8nсоставляет 80.4 мс, при этом увеличивая mAP с 37.3 до 40.9. Этот значительный скачок в эффективности CPU является прямым результатом удаления DFL и безалгометрической архитектуры NMS, что делает YOLO26 абсолютной мощью для сред, не имеющих выделенных GPU.

Кроме того, модели YOLO26 имеют меньшее количество параметров и FLOPs для своих соответствующих уровней размера, что означает значительно сниженное использование памяти GPU во время инференса и обучения по сравнению с устаревшими архитектурами на основе трансформеров.

Преимущество экосистемы Ultralytics

Важным фактором при выборе модели ИИ является окружающая инфраструктура. Как YOLO26, так и YOLOv8 получают огромную выгоду от унифицированной платформы Ultralytics, обеспечивая беспрецедентный опыт для разработчиков.

  1. Простота использования: Философия «от нуля до героя» гарантирует, что разработчики могут загружать, обучать и экспортировать модели с минимальным кодом. API python остается согласованным для всех поколений моделей.
  2. Эффективность обучения: Модели Ultralytics YOLO требуют исключительно меньше памяти CUDA во время обучения по сравнению с моделями-трансформерами (такими как RT-DETR). Это позволяет использовать большие размеры пакетов на потребительском оборудовании, демократизируя исследования в области ИИ.
  3. Хорошо поддерживаемая экосистема: Благодаря постоянным обновлениям, строгим конвейерам CI/CD и глубокой интеграции с такими инструментами, как Weights & Biases и TensorRT, репозиторий Ultralytics является надежным и готовым к производству.
  4. Непревзойденная универсальность: Модели Ultralytics не являются узкоспециализированными; один импорт обрабатывает разнообразные наборы данных, расширяя рабочие процессы для сложных систем, требующих одновременного отслеживания, классификации и сегментации.

Оптимизированные обновления

Поскольку API Ultralytics высоко стандартизирован, обновление производственной системы с YOLOv8 до YOLO26 буквально так же просто, как изменение строки "yolov8n.pt" в "yolo26n.pt" в вашем скрипте.

Приложения в реальном мире

Выбор между этими моделями часто сводится к вашим ограничениям развертывания, хотя YOLO26 повсеместно рекомендуется для новых проектов.

Граничные вычисления и сети IoT

Для периферийных сред — таких как развертывания на Raspberry Pi или локализованные датчики на заводском цеху — YOLO26 является бесспорным лидером. Его изначально оптимизированная скорость CPU и NMS-free структура означают, что умные камеры могут обрабатывать видео с высокой частотой кадров для управления парковкой без потери кадров из-за узких мест постобработки.

Высотная и аэрофотосъемка

В сельскохозяйственном мониторинге или инспекции инфраструктуры с помощью дронов обнаружение мелких объектов имеет первостепенное значение. Реализация ProgLoss + STAL в YOLO26 позволяет ей стабильно detect крошечных вредителей или микротрещины в трубопроводах, которые более старые архитектуры, такие как YOLOv8, могут пропустить, обеспечивая превосходные показатели полноты и точности на наборах данных, таких как VisDrone.

Устаревшие системы с GPU

YOLOv8 остается актуальным для систем, тесно связанных с его специфическими выходными данными регрессии ограничивающих рамок, или корпоративных развертываний, которые зафиксированы в длительных циклах валидации и не могут легко мигрировать на другие архитектуры.

Сценарии использования и рекомендации

Выбор между YOLO26 и YOLOv8 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.

Когда выбирать YOLO26

YOLO26 является отличным выбором для:

  • Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
  • Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
  • Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Когда выбирать YOLOv8

YOLOv8 рекомендуется для:

  • Универсальное многозадачное развертывание: Проекты, требующие проверенной модели для обнаружения, сегментации, классификации и оценки позы в экосистеме Ultralytics.
  • Устоявшиеся производственные системы: Существующие производственные среды, уже построенные на архитектуре YOLOv8 со стабильными, хорошо протестированными конвейерами развертывания.
  • Широкая поддержка сообщества и экосистемы: Приложения, использующие обширные учебные пособия, сторонние интеграции и активные ресурсы сообщества YOLOv8.

Пример кода: Начало работы

Использование возможностей новейших моделей Ultralytics невероятно просто. Следующий код на python демонстрирует обучение модели YOLO26 на пользовательском наборе данных, наблюдая, как оптимизатор MuSGD автоматически обеспечивает быструю сходимость.

from ultralytics import YOLO

# Load the highly efficient YOLO26 Nano model
model = YOLO("yolo26n.pt")

# Train on the standard COCO8 dataset
# The ecosystem handles hyperparameter tuning and augmentations natively
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Automatically utilizes CUDA if available
)

# Run end-to-end, NMS-free inference on a source image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Visualize the resulting detections
predictions[0].show()

Другие модели для рассмотрения

Хотя YOLO26 представляет собой текущее состояние дел в области передовых технологий, разработчики, создающие разнообразные приложения, могут также рассмотреть:

  • YOLO11: Непосредственный предшественник YOLO26, предлагающий исключительное усовершенствование по сравнению с YOLOv8 и до сих пор активно используемый в передовых производственных системах.
  • RT-DETR: Трансформер для обнаружения в реальном времени от Baidu. Это отличный выбор для исследователей, изучающих механизм внимания в задачах компьютерного зрения, хотя для обучения требуется значительно больше памяти CUDA по сравнению со стандартными моделями Ultralytics YOLO.

Для получения комплексного набора инструментов для облачного обучения, разметки наборов данных и немедленного развертывания изучите платформу Ultralytics уже сегодня.


Комментарии