Перейти к содержанию

YOLOv9 YOLO26: эволюция обнаружения объектов в реальном времени

В быстро развивающейся области компьютерного зрения выбор правильной архитектуры модели имеет решающее значение для обеспечения баланса между производительностью, эффективностью и простотой развертывания. В этом сравнении рассматриваются технические различия между YOLOv9, мощной модели, представленной в начале 2024 года, и YOLO26, последней усовершенствованной версии от Ultralytics в январе 2026 года. Хотя обе модели представляют собой важные вехи в развитии YOLO , они удовлетворяют разные потребности в отношении скорости, стабильности обучения и сложности развертывания.

Обзор модели и авторство

Понимание происхождения этих архитектур позволяет понять контекст их философии проектирования.

YOLOv9: Программируемая градиентная информация

Авторы: Чень-Яо Ван, Хун-Юань Марк Ляо
Организация:Институт информационных наук, Академия Синика
Дата: 21.02.2024
Ссылки:Статья в Arxiv | Репозиторий GitHub

YOLOv9 концепцию программируемой градиентной информации (PGI) и обобщенной эффективной сети агрегации слоев (GELAN). Эти инновации решили проблему «информационного бутылочного горлышка» в глубоких нейронных сетях, где данные теряются при прохождении через последовательные слои. PGI обеспечивает сохранение важной информации о характеристиках на протяжении всей глубокой сети, что позволяет осуществлять высокоточные обнаружения, особенно в сложных сценах.

YOLO26: специалист по комплексным решениям для периферийных устройств

Авторы: Гленн Джочер, Цзин Цю
Организация:Ultralytics
Дата: 14.01.2026
Ссылки:Официальная документация | Репозиторий GitHub

Опираясь на наследие YOLOv8 и YOLO11, YOLO26 представляет собой переход к упрощенному высокоскоростному развертыванию. Он изначально NMS требует NMS, что устраняет необходимость в постобработке Non-Maximum Suppression. Этот выбор конструкции в сочетании с удалением Distribution Focal Loss (DFL) делает YOLO26 исключительно быстрым на CPU пограничных устройствах. Он также является пионером в использовании оптимизатора MuSGD, гибрида SGD Muon (вдохновленного обучением LLM), для обеспечения стабильной конвергенции.

Узнайте больше о YOLO26

Сравнение производительности и показателей

В следующей таблице сравниваются результаты работы стандартных моделей на наборе COCO . Обратите внимание на значительное преимущество YOLO26 по скорости на CPU , что является результатом оптимизации его архитектуры.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Анализ производительности

YOLO26 демонстрирует явное преимущество в задержке и вычислительной эффективности. Например, YOLO26n достигает более высокого mAP 40,9%) по сравнению с YOLOv9t (38,3%), при этом используя значительно меньше FLOP (5,4 млрд против 7,7 млрд). Такая эффективность имеет решающее значение для приложений, работающих на периферийных устройствах с батарейным питанием.

Архитектурное Глубокое Погружение

Архитектура YOLOv9

YOLOv9 на сохранении потока информации. Его магистраль GELAN сочетает в себе преимущества CSPNet (планирование градиентного пути) и ELAN (скорость вывода), создавая легкий, но мощный экстрактор признаков. Вспомогательная ветвь PGI предоставляет надежную информацию о градиенте во время обучения более глубоким слоям, которая затем удаляется во время вывода, чтобы сохранить легкость модели.

  • Плюсы: исключительная точность при выполнении сложных тестов; отличное сохранение информации для сложных сцен.
  • Недостатки: требует NMS ; архитектура может быть сложной для модификации под нестандартные задачи; более высокая вычислительная нагрузка для эквивалентной пропускной способности по сравнению с новыми поколениями.

Архитектура YOLO26

YOLO26 уделяет приоритетное внимание скорости вывода и простоте развертывания.

  1. ДизайнNMS: благодаря обучению модели прогнозировать соответствия один к одному в режиме реального времени, YOLO26 устраняет эвристический NMS . Это снижает изменчивость задержки и упрощает TensorRT , поскольку эффективные NMS больше не являются зависимостью.
  2. MuSGD Optimizer: вдохновленный Kimi K2 от Moonshot AI, этот оптимизатор сочетает в себе импульс SGD адаптивными свойствами оптимизатора Muon. Это обеспечивает стабильность обучения больших языковых моделей (LLM) в компьютерном зрении.
  3. ProgLoss + STAL: Внедрение прогрессивных потерь (Progressive Loss) и потерь при назначении мягких целей (Soft-Target Assignment Loss, STAL) значительно улучшает обнаружение мелких объектов, что является распространенным недостатком детекторов без якорей.

Обучение и экосистема

Опыт разработчиков значительно различается между этими двумя моделями, в основном из-за экосистем программного обеспечения, в которых они работают.

Простота использования с Ultralytics

В то время как YOLOv9 интегрирован в Ultralytics , YOLO26 является его родным компонентом. Это обеспечивает поддержку всех функций с самого первого дня, в том числе:

  • Унифицированный API: Переключайтесь между задачами, такими как Оценка позы или Ориентированные ограничивающие рамки (OBB) просто изменив файл веса модели (например, yolo26n-pose.pt).
  • Ultralytics : беспрепятственно загружайте наборы данных, добавляйте аннотации с помощью AI-помощников и обучайте в облаке с помощью Ultralytics .
  • Гибкость экспорта: встроенная поддержка экспорта в один клик в такие форматы, как CoreML для iOS, TFLite Android и OpenVINO Intel .
from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")

Эффективность использования памяти и ресурсов

YOLO26 обычно требует меньше GPU во время обучения по сравнению с архитектурой YOLOv9 с двумя ветвями (PGI). Это позволяет исследователям использовать более крупные пакеты данных на потребительском оборудовании, таком как NVIDIA 3060 или 4090, ускоряя цикл экспериментов.

Реальные примеры использования

Когда выбирать YOLOv9

YOLOv9 сильным конкурентом в сценариях, где максимальная точность на статических тестах является единственным приоритетом, а вычислительные ресурсы доступны в изобилии.

  • Академические исследования: изучение теории информационных узких мест и градиентного потока в CNN.
  • Обработка на стороне сервера: мощные GPU , анализирующие архивированные видеозаписи, где задержка в реальном времени не так критична.

Когда выбирать YOLO26

YOLO26 — рекомендуемый выбор для производственных сред и пограничных вычислений.

  • Встроенные системы: благодаря ускоренному на 43 % CPU , эта система идеально подходит для использования в робототехнике с Raspberry Pi или NVIDIA .
  • Аналитика в реальном времени: конструкция NMS обеспечивает детерминированную задержку, что критически важно для систем автономного вождения и безопасности.
  • Мультимодальные приложения: благодаря встроенной поддержке сегментации экземпляров и позы, он служит универсальной основой для сложных конвейеров, таких как анализ поведения людей в розничной торговле или спорте.

Заключение

В то время как YOLOv9 революционные теоретические концепции с PGI, YOLO26 усовершенствовал эти наработки, превратив их в прагматичный высокопроизводительный пакет. Его сквозная архитектура, устранение узких мест в постобработке и интеграция с надежной Ultralytics делают его лучшим выбором для разработчиков, создающих приложения искусственного интеллекта нового поколения.

Изучите другие модели

Если вы заинтересованы в изучении других вариантов, рекомендуем ознакомиться с YOLO11, предшественник YOLO26, или YOLOv10, который стал пионером в подходе NMS.


Комментарии