Перейти к содержанию

YOLO26 противYOLO: эволюция обнаружения объектов в реальном времени

Область компьютерного зрения быстро развивается, а новые архитектуры постоянно расширяют границы скорости и точности. Двумя важными вехами в этой истории являются YOLO, разработанная Alibaba Group в конце 2022 года, и YOLO26, ультрасовременная модель, выпущенная Ultralytics 2026 году.

В то время какYOLO инновационные концепции, такие как поиск нейронной архитектуры (NAS), для YOLO , YOLO26 представляет собой сдвиг парадигмы в сторону нативной сквозной обработки и дизайна, ориентированного на периферию. В этом подробном сравнении исследуются архитектурные различия, показатели производительности и реалии развертывания этих двух мощных моделей, чтобы помочь разработчикам выбрать подходящий инструмент для своих задач по обнаружению объектов.

Сравнение метрик производительности

В следующей таблице сравниваются характеристики YOLO26 иYOLO. Обратите внимание на значительное улучшение скорости вывода, особенно для операций CPU, что является отличительной чертой архитектуры YOLO26.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3

Ultralytics : новый стандарт

Выпущенный в январе 2026 года компанией Ultralytics, YOLO26 основан на наследии YOLO11 и YOLOv8, вводя радикальные изменения в конвейер обнаружения. Основная философия его разработки сосредоточена на устранении узких мест в развертывании и обучении, что делает его наиболее эффективной моделью как для высокопроизводительных графических процессоров, так и для ограниченных по мощности периферийных устройств.

Основные инновации

  1. Сквозной дизайн NMS: в отличие от предыдущих поколений и конкурентов, таких какYOLO, YOLO26 изначально является сквозным. Он устраняет необходимость в постобработке с помощью немаксимального подавления (NMS). Это снижает разброс задержек и упрощает конвейеры развертывания — прорывной подход, впервые примененный в YOLOv10.
  2. Оптимизатор MuSGD: вдохновленный последними достижениями в области обучения больших языковых моделей (LLM), YOLO26 использует гибрид SGD Muon. Этот оптимизатор обеспечивает большую стабильность во время обучения и более быструю сходимость, снижая вычислительные затраты, необходимые для достижения оптимальной точности.
  3. Оптимизация Edge-First: благодаря удалению Distribution Focal Loss (DFL) архитектура модели упрощена, что облегчает экспорт в такие форматы, как ONNX CoreML. Это способствует значительному увеличению скорости CPU на 43 % по сравнению с предыдущими версиями, что делает ее идеальной для таких устройств, как Raspberry Pi или мобильные телефоны.
  4. Улучшенное обнаружение мелких объектов: интеграция ProgLoss и STAL (Scale-Aware Training Adaptive Loss) значительно улучшает производительность при обнаружении мелких объектов, устраняя распространенный недостаток одноступенчатых детекторов.

Оптимизированное развертывание

Поскольку YOLO26 устраняет NMS , экспортируемые модели представляют собой чистые нейронные сети без сложного кода постобработки. Это значительно упрощает интеграцию в C++ или мобильные среды и снижает вероятность логических ошибок.

Пример кода

Пользовательский опыт с YOLO26 остается неизменным благодаря оптимизированному Ultralytics Python .

from ultralytics import YOLO

# Load the nano model
model = YOLO("yolo26n.pt")

# Run inference on an image without needing NMS configuration
results = model.predict("image.jpg", show=True)

# Export to ONNX for edge deployment
path = model.export(format="onnx")

Узнайте больше о YOLO26

YOLO: NAS-управляемый Challenger

YOLO, разработанная DAMO Academy компании Alibaba, произвела фурор в 2022 году, используя Neural Architecture Search (NAS) для проектирования своей основной структуры. Вместо того, чтобы вручную создавать структуру сети, авторы использовали MAE-NAS (Method of Auxiliary Edges) для автоматического поиска эффективных архитектур с учетом определенных ограничений по задержке.

Основные характеристики

  • MAE-NAS Backbone: Структура сети была математически оптимизирована для максимального увеличения потока информации при минимальных вычислительных затратах.
  • RepGFPN: эффективная сеть Feature Pyramid Network, которая использует перепараметризацию для улучшения слияния признаков в разных масштабах.
  • ZeroHead: Легкая конструкция детектирующей головки, предназначенная для уменьшения количества параметров на конце сети.
  • AlignedOTA: стратегия присвоения меток, которая помогает модели лучше понимать, какие анкерные рамки соответствуют объектам реальной действительности во время обучения.

ХотяYOLO отличную производительность для своего времени, его зависимость от сложного конвейера обучения дистилляцией, в котором более крупная модель-учитель направляет более мелкую модель-ученик, делает индивидуальное обучение более ресурсоемким по сравнению с возможностями «обучения с нуля» Ultralytics .

Подробное сравнение

Архитектура и стабильность обучения

Наиболее заметная разница заключается в подходе к оптимизации.YOLO на NAS для поиска оптимальной структуры, которая может обеспечить высокую теоретическую производительность по FLOP, но часто приводит к созданию архитектур, которые трудно модифицировать или отлаживать.

YOLO26, напротив, использует ручные, интуитивные архитектурные усовершенствования (такие как удаление DFL и NMS head), усиленные оптимизатором MuSGD. Этот оптимизатор привносит в компьютерное зрение стабильность, часто наблюдаемую в LLM. Для разработчиков это означает, что YOLO26 менее чувствителен к настройке гиперпараметров и надежно сходится на пользовательских наборах данных.

Скорость инференса и эффективность использования ресурсов

В то время какYOLO для GPU с использованием TensorRT, YOLO26 использует более широкий подход. Удаление DFL и NMS YOLO26 превосходить CPU, достигая скорости на 43% выше, чем у предшественников. Это имеет решающее значение для приложений в сфере розничной аналитики или умных городов, где пограничные устройства могут не иметь выделенных GPU.

Кроме того, требования YOLO26 к памяти во время обучения, как правило, ниже. В то время какYOLO требует обучения тяжелой модели-учителя для дистилляции, чтобы достичь максимальных результатов, YOLO26 достигает результатов SOTA напрямую, что позволяет значительно сэкономить GPU и электроэнергию.

Универсальность и экосистема

Одним из основных преимуществ Ultralytics является ее универсальность.YOLO в первую очередьYOLO детектором объектов. В отличие от него, архитектура YOLO26 изначально поддерживает широкий спектр задач компьютерного зрения, в том числе:

Это позволяет одной команде разработчиков использовать один API и одну платформу для решения нескольких различных задач, что значительно сокращает техническую задолженность.

Сравнительная таблица: Особенности

ФункциональностьYOLO26DAMO-YOLO
Дата выпускаЯнварь 2026Ноябрь 2022
АрхитектураСквозной, NMSНа базе NAS, без якорей
ПостобработкаНет (выход модели = окончательный)Non-Maximum Suppression (NMS) (Немаксимальное подавление)
ОптимизаторMuSGD (SGD мюон)SGD AdamW
Конвейер обученияОдноступенчатый, обучение с нуляКомплексная дистилляция (учитель-ученик)
Поддерживаемые задачиdetect, segment, Поза, obb, classifyОбнаружение
Оптимизация для периферийных устройствВысокая (без DFL, оптимизирована для CPU)Умеренный (TensorRT )

Заключение

Обе архитектуры представляют собой важные вехи в истории обнаружения объектов.YOLO возможности автоматического поиска архитектуры и перепараметризации. Однако YOLO26 представляет собой будущее практического внедрения искусственного интеллекта.

Устраняя NMS , внедряя оптимизаторы уровня LLM, такие как MuSGD, и предоставляя унифицированное решение для сегментации, определения положения и обнаружения, Ultralytics предлагает превосходный баланс производительности и простоты использования. Для разработчиков, создающих реальные приложения — от промышленной автоматизации до мобильных приложений — надежная экосистема, обширная документация и Ultralytics делают YOLO26 очевидным выбором.

Те, кто заинтересован в других сравнениях, могут изучить YOLO11 YOLO или рассмотреть альтернативы на основе трансформеров, такие как RT-DETR.

Авторство и ссылки

YOLO26

DAMO-YOLO

  • Авторы: Сяньчжэ Сюй, Ици Цзян, Вэйхуа Чэнь, Илунь Хуан, Юань Чжан, Сюю Сунь
  • Организация: Alibaba Group
  • Дата: 2022-11-23
  • Статья:arXiv:2211.15444

Комментарии