Перейти к содержанию

Сравнение YOLOv8 и YOLO26: Эволюция ИИ для компьютерного зрения в реальном времени

Ландшафт компьютерного зрения быстро эволюционировал, и каждое поколение семейства You Only Look Once (YOLO) устанавливало новые стандарты скорости и точности. Двумя важными вехами в этой линии являются Ultralytics YOLOv8 и передовая Ultralytics YOLO26. В то время как YOLOv8 создала надежную экосистему и многозадачные возможности, на которые полагаются лидеры отрасли, YOLO26 представляет прорывные архитектурные изменения, такие как сквозной инференс и оптимизация для граничных устройств.

Это руководство предоставляет детальное техническое сравнение, чтобы помочь исследователям и разработчикам выбрать подходящую модель для их конкретных потребностей развертывания, начиная от облачного анализа и заканчивая IoT-приложениями с ограниченными ресурсами.

Обзоры моделей

Ultralytics YOLOv8

Выпущенная в январе 2023 года, YOLOv8 ознаменовала значительный сдвиг в сторону унифицированной структуры, поддерживающей задачи обнаружения объектов, сегментации экземпляров, оценки позы, классификации и ориентированных ограничивающих рамок (OBB). Она представила безанкерное detect и новую функцию потерь, что сделало ее универсальным выбором для различных отраслей.

Узнайте больше о YOLOv8

Ultralytics YOLO26

Запущенная в январе 2026 года, YOLO26 представляет собой следующий скачок в эффективности и производительности. Она разработана как нативно сквозная (E2E), что устраняет необходимость в подавлении немаксимумов (NMS) во время инференса. Это приводит к увеличению скорости, особенно на CPU и граничном оборудовании. С удалением Distribution Focal Loss (DFL) и внедрением оптимизатора MuSGD, YOLO26 оптимизирована для современных ограничений развертывания.

Узнайте больше о YOLO26

Архитектурные различия

Переход от YOLOv8 к YOLO26 включает фундаментальные структурные изменения, направленные на снижение задержки и повышение стабильности обучения.

Сквозной дизайн без NMS

Одним из наиболее значительных узких мест в традиционных детекторах, таких как YOLOv8, является этап постобработки, известный как NMS, который отфильтровывает перекрывающиеся ограничивающие рамки.

  • YOLOv8: Использует высокооптимизированный, но необходимый шаг NMS. Это может усложнить конвейеры развертывания, особенно при экспорте в такие форматы, как ONNX или TensorRT, где поддержка эффективных плагинов NMS варьируется.
  • YOLO26: Применяет архитектуру без NMS, впервые предложенную в YOLOv10. Генерируя прямые предсказания «один к одному» из сети, она упрощает логику экспорта и снижает задержку вывода, что делает ее идеальной для приложений реального времени на Raspberry Pi или мобильных устройствах.

Функции потерь и оптимизация

YOLO26 представляет несколько новых компонентов в рецепте обучения:

  • Оптимизатор MuSGD: Гибрид SGD и Muon, вдохновленный методами обучения больших языковых моделей (LLM). Этот оптимизатор стабилизирует импульс обучения, что приводит к более быстрой сходимости по сравнению со стандартными AdamW или SGD, используемыми в предыдущих версиях.
  • Удаление DFL: Удаление Distribution Focal Loss упрощает регрессионную голову. Это снижение сложности является ключевым фактором, позволяющим YOLO26 работать до 43% быстрее на CPU.
  • ProgLoss + STAL: Прогрессивная балансировка потерь (Progressive Loss Balancing) и присвоение меток с учетом малых целей (Small-Target-Aware Label Assignment, STAL) значительно улучшают производительность на малых объектах, устраняя распространенную слабость универсальных детекторов, используемых для аэрофотосъемки или промышленного контроля.

Примечание: Развертывание на периферии

Удаление NMS и DFL в YOLO26 делает его исключительно удобным для 8-битной квантизации. При развертывании на периферийном оборудовании с использованием TFLite или CoreML, YOLO26 часто сохраняет более высокую точность при более низкой разрядности по сравнению с YOLOv8.

Метрики производительности

В следующей таблице сравнивается производительность моделей YOLOv8 и YOLO26 на наборе данных COCO. YOLO26 демонстрирует превосходную скорость и точность во всех масштабах моделей, особенно в средах CPU, где проявляются ее архитектурные оптимизации.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Примечание: Жирный шрифт указывает на лучший показатель производительности (более высокий mAP, более низкая скорость/параметры/FLOPs).

Эффективность обучения и простота использования

Обе модели выигрывают от зрелой экосистемы Ultralytics, известной своей простотой «от нуля до героя».

Оптимизированный API

Независимо от того, используете ли вы YOLOv8 или YOLO26, API Python остается неизменным. Это позволяет разработчикам переключаться между архитектурами, изменяя всего одну строку кода, что упрощает бенчмаркинг и A/B-тестирование.

from ultralytics import YOLO

# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")

# Load a YOLO26 model
model_26 = YOLO("yolo26n.pt")

# Train YOLO26 on your custom dataset
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)

Память и ресурсы

YOLO26 значительно более эффективно использует память во время обучения по сравнению с моделями на основе трансформеров, такими как RT-DETR, или более старыми версиями YOLO. Упрощенный ландшафт потерь и оптимизатор MuSGD позволяют использовать большие размеры пакетов на том же оборудовании GPU, снижая общую стоимость владения инфраструктурой обучения. Пользователи с ограниченным объемом VRAM могут комфортно дообучать yolo26s или yolo26m модели на стандартных потребительских GPU.

Идеальные варианты использования

Выбор между YOLOv8 и YOLO26 зависит от ваших конкретных ограничений и среды развертывания.

Когда выбирать YOLOv8

  • Совместимость с устаревшими системами: Если у вас есть существующие конвейеры, тесно интегрированные с логикой постобработки, специфичной для YOLOv8, которую невозможно легко обновить.
  • Специфические плагины сообщества: Некоторые старые сторонние инструменты или глубоко встроенные системы могут по-прежнему иметь жесткие зависимости от форматов экспорта YOLOv8, хотя модуль экспорта Ultralytics обрабатывает большинство преобразований без проблем.

Когда выбирать YOLO26

  • Периферийные вычисления: Для приложений на NVIDIA Jetson, мобильных телефонах или встроенных CPU, где важна каждая миллисекунда задержки. Увеличение скорости CPU на 43% меняет правила игры для устройств с батарейным питанием.
  • Обнаружение мелких объектов: Улучшения ProgLoss и STAL делают YOLO26 превосходным выбором для мониторинга дронами или сельскохозяйственного контроля, где цели часто находятся далеко и имеют крошечные размеры.
  • Упрощенное развертывание: Если вы хотите избежать проблем с реализацией NMS в нестандартных средах (например, пользовательские FPGA или специализированные ускорители ИИ), сквозной характер YOLO26 является идеальным решением.
  • Высокопроизводительные задачи: Для задач, требующих максимально возможной точности, таких как медицинская визуализация или критически важные для безопасности компоненты автономного вождения.

Заключение

В то время как YOLOv8 остается мощным и надежным инструментом в арсенале компьютерного зрения, YOLO26 представляет собой будущее эффективного, высокопроизводительного обнаружения. Его архитектурные инновации решают давние проблемы развертывания, такие как NMS, одновременно обеспечивая современную точность.

Для разработчиков, стремящихся оставаться на передовой, обновление до YOLO26 предлагает немедленные преимущества в скорости и размере модели без ущерба для простоты использования, которая определяет опыт работы с Ultralytics. Мы рекомендуем начинать новые проекты с YOLO26, чтобы в полной мере использовать эти достижения.

Другие модели для изучения

  • YOLO11: Непосредственный предшественник YOLO26, предлагающий баланс производительности и функциональности для тех, кто переходит со старых версий.
  • YOLOv10: Модель, впервые применившая подход без NMS, полезная для академического изучения архитектурного перехода.
  • YOLO-World: Детектор с открытым словарем, идеально подходящий для идентификации объектов без обучения на пользовательских наборах данных, использующий текстовые подсказки для обнаружения.

Комментарии