Перейти к содержанию

YOLO26 против YOLOv8: новая эра искусственного интеллекта в области зрения

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха. Двумя наиболее значимыми вехами в развитии YOLO You Only Look Once) являются широко используемые YOLOv8 и революционная YOLO26. В то время как YOLOv8 стандарт универсальности и простоты использования в 2023 году, YOLO26 представляет собой следующий скачок вперед, внедряя сквозные архитектуры и инновации в области оптимизации, вдохновленные обучением больших языковых моделей (LLM).

В этом всеобъемлющем руководстве сравниваются эти две мощные платформы, анализируются их архитектурные различия, показатели производительности и идеальные сценарии развертывания, чтобы помочь вам принять обоснованное решение для вашего следующего проекта в области искусственного интеллекта.

Эволюция архитектуры: от анкоров к сквозной архитектуре

Переход от YOLOv8 YOLO26 знаменует собой фундаментальное изменение в способе построения конвейеров обнаружения. Хотя обе модели используют надежные концепции базовой структуры CSPDarknet, их подход к проектированию головок и постобработке значительно различается.

YOLOv8: универсальный стандарт

Выпущен в начале 2023 года компанией Ultralytics, YOLOv8 парадигму обнаружения без анкоров. Он использует развязанную структуру головы, которая независимо обрабатывает задачи объектности, классификации и регрессии. Эта конструкция оказалась очень эффективной для задач общего назначения, YOLOv8 надежным инструментом YOLOv8 промышленных приложений, от аналитики розничной торговли до автономного вождения. Однако, как и его предшественники, он полагается на Non-Maximum Suppression (NMS) для фильтрации перекрывающихся ограничительных рамок, что влечет за собой изменчивость задержки и усложняет развертывание на некоторых пограничных ускорителях.

Узнайте больше о YOLOv8

YOLO26: Сквозная революция

YOLO26, выпущенный в январе 2026 года, напрямую решает проблему NMS . Благодаря использованию встроенной сквозной архитектуры NMS, YOLO26 предсказывает точный набор объектов на изображении без необходимости последующей обработки эвристическими алгоритмами. Эта инновация, впервые опробованная экспериментально в YOLOv10, полностью доработана в YOLO26.

Ключевые архитектурные достижения включают:

  • Устранение фокальной потери распределения (DFL): это упрощение оптимизирует процесс экспорта модели, делая YOLO26 значительно более совместимым с маломощными пограничными устройствами и ускорителями, которые испытывают трудности с сложными слоями потерь.
  • MuSGD Optimizer: вдохновленный технологиями обучения Kimi K2 и LLM от Moonshot AI, этот гибридный оптимизатор сочетает в себе стохастический градиентный спуск (SGD) и Muon, обеспечивая стабильную динамику обучения и более быструю конвергенцию, что сокращает количество GPU , необходимое для достижения высочайшей точности.
  • ProgLoss + STAL: новые функции потери улучшают обнаружение мелких объектов, что является важным усовершенствованием для изображений с дронов и датчиков IoT.

Узнайте больше о YOLO26

Сравнение производительности

При оценке этих моделей важнейшую роль играют три фактора: средняя точность (mAP), скорость вывода и вычислительная эффективность. YOLO26 демонстрирует явные преимущества по всем этим показателям, особенно в средах CPU.

Краткий обзор показателей

В следующей таблице представлены результаты работы вариантов Nano (n) – X-Large (x) на стандартном COCO .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

Анализ скорости и эффективности

YOLO26 отличается высокой эффективностью. Модель YOLO26n работает на процессорах на 43 % быстрее по сравнению с YOLOv8n достигая значительно более высокого показателя mAP +3,6). Такое ускорение в значительной степени обусловлено конструкцией NMS, которая устраняет последовательное узкое место сортировки и фильтрации тысяч кандидатов в окна. Для приложений, работающих на Raspberry Pi или мобильных процессорах, эта разница часто определяет, может ли приложение работать в режиме реального времени.

Оптимизация развертывания на границе

Устранение распределительной фокальной потери (DFL) в YOLO26 упрощает график для ONNX и TensorRT . Это приводит к уменьшению количества неподдерживаемых операторов на специализированном оборудовании, таком как ускорители NPU, что делает развертывание более плавным и предсказуемым.

Экосистема и простота использования

Одним из главных преимуществ выбора Ultralytics является окружающая экосистема. И YOLOv8 YOLO26 являются первоклассными гражданами в рамках ultralytics Python и Ultralytics Platform.

Оптимизированные рабочие процессы

Разработчики могут переключаться между моделями, просто изменив одну строку в своем коде. Этот подход «от нуля до героя» позволяет быстро проводить эксперименты без перезаписи обучающих конвейеров.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on your custom dataset
# The API remains consistent across model generations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Универсальность в различных задачах

В отличие от многих архитектур, ориентированных на исследования, которые поддерживают только обнаружение, YOLOv8 YOLO26 являются универсальными платформами. Они изначально поддерживают:

  • Обнаружение объектов: Идентификация и локализация объектов.
  • Сегментация экземпляров: маски на уровне пикселей для объектов.
  • Оценка позы: обнаружение ключевых точек (скелетов).
  • Ориентированные ограничительные рамки (OBB): обнаружение повернутых объектов (например, кораблей, аэрофотоснимков).
  • Классификация: Категоризация целых изображений.

YOLO26 представляет усовершенствования, специфичные для конкретных задач, такие как специализированная угловая потеря для OBB, позволяющая лучше обрабатывать разрывы границ, чем YOLOv8, и оценка остаточной логарифмической вероятности (RLE) для более точной оценки позы в сценах с большим количеством объектов.

Методы обучения: преимущества MuSGD

Эффективность обучения является основным фактором дифференциации. YOLOv8 стандартные методы оптимизации, которые, хотя и эффективны, могут быть требовательными к памяти.

YOLO26 представляет оптимизатор MuSGD, гибридный подход, адаптирующий инновации из обучения больших языковых моделей. Этот оптимизатор обеспечивает большую стабильность процесса обучения, часто позволяя достигать более высоких скоростей обучения и более быстрой конвергенции. Кроме того, улучшенные функции потерь (ProgLoss и STAL) помогают модели сосредоточиться на сложных для обучения примерах на более ранних этапах цикла обучения.

Для пользователей это означает меньшие требования к памяти во время обучения по сравнению с моделями, в которых широко используются трансформаторы, или более старыми YOLO . Вы можете обучать большие партии на потребительских графических процессорах, что делает доступ к созданию высокопроизводительных моделей более демократичным.

Идеальные варианты использования

Выбор подходящей модели зависит от ваших конкретных ограничений.

Выберите YOLO26, если:

  • Edge Computing является приоритетом: вы развертываете систему на процессорах, мобильных устройствах или устройствах IoT, где важна каждая миллисекунда задержки вывода.
  • Простота – залог успеха: вам нужно избежать сложностей, связанных с настройкой NMS для различных сред развертывания.
  • Обнаружение мелких объектов: Ваше приложение связано с аэрофотосъемкой или удаленным наблюдением, где новые функции потери обеспечивают ощутимое повышение точности.
  • Новейшие функции экосистемы: вы хотите использовать новейшие интеграции, доступные на Ultralytics .

Выберите YOLOv8 :

  • Сохранение преемственности: у вас есть существующий, тщательно настроенный конвейер, созданный специально для особенностей YOLOv8 , и вы не можете позволить себе немедленно перепроверять новую архитектуру.
  • Поддержка конкретного оборудования: Вы используете старое оборудование, для которого уже строго YOLOv8 конкретные проверенные пути экспорта для YOLOv8 (хотя YOLO26, как правило, экспортирует лучше).

Заключение

Обе архитектуры представляют собой вершину достижений своих поколений. YOLOv8 остается надежным и проверенным выбором, который используется в миллионах приложений по всему миру. Однако для новых проектов однозначно рекомендуется YOLO26. Его комплексная конструкция, превосходный компромисс между скоростью и точностью, а также эффективность обучения делают его окончательным передовым решением на 2026 год.

Благодаря обширной документации и активной поддержке сообщества разработчики могут без проблем перейти на YOLO26 и открыть для себя новый уровень производительности компьютерного зрения.

Для тех, кто заинтересован в изучении других последних моделей, YOLO11 также предлагает отличную производительность, хотя YOLO26 превосходит ее по оптимизации границ и простоте архитектуры.

Авторы и ссылки

YOLO26

YOLOv8


Комментарии