Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 против YOLOv9#

Ландшафт компьютерного зрения быстро развивается, и новые архитектуры постоянно расширяют границы скорости и точности. В этом техническом сравнении мы рассмотрим различия между YOLO26 и YOLOv9, двумя весьма влиятельными моделями в области real-time обнаружения объектов. Хотя обе модели предлагают уникальные архитектурные инновации, понимание их компромиссов в производительности, возможностей развертывания и аппаратных требований критически важно для выбора правильного инструмента для твоего следующего проекта в области зрения.

Link to this sectionYOLO26: мощное решение, оптимизированное для edge-устройств#

Выпущенная в начале 2026 года, Ultralytics YOLO26 представляет собой поколенческий скачок в эффективности развертывания и стабильности обучения моделей. Разработанная как нативная end-to-end структура, она напрямую решает проблемы развертывания, которые исторически преследовали приложения edge AI.

Детали модели:

Link to this sectionАрхитектура и инновации#

YOLO26 фундаментально перерабатывает конвейер постобработки, внедряя End-to-End NMS-Free дизайн. Устраняя необходимость в NMS (Non-Maximum Suppression), модель достигает значительно меньшей вариативности задержек. Это существенно упрощает развертывание на мобильных и edge-платформах, особенно при экспорте в такие фреймворки, как ONNX и Apple CoreML.

Кроме того, удаление Distribution Focal Loss (DFL) упрощает процесс экспорта и повышает совместимость с маломощными микроконтроллерами. Для улучшения стабильности обучения YOLO26 интегрирует инновационный оптимизатор MuSGD, гибрид Stochastic Gradient Descent (SGD) и Muon (вдохновленный инновациями в обучении больших языковых моделей). Это приводит к более быстрой сходимости и более надежному извлечению признаков на сложных наборах данных.

Вывод (inference) на edge-устройствах

Благодаря архитектурным упрощениям и удалению DFL, YOLO26 достигает до 43% более быстрого CPU-вывода, что делает её идеальным выбором для edge-устройств с ограниченными ресурсами, таких как Raspberry Pi или NVIDIA Jetson Nano.

Для обнаружения крайне сложных объектов в таких сценах, как аэрофотосъемка с дронов, YOLO26 использует обновленные функции потерь ProgLoss + STAL. Они обеспечивают заметное улучшение полноты (recall) распознавания мелких объектов. Более того, модель может похвастаться специфическими для задач улучшениями, включая multi-scale proto для сегментации экземпляров, Residual Log-Likelihood Estimation (RLE) для оценки позы и специализированную потерю угла для обнаружения ориентированных ограничивающих рамок (OBB).

Узнай больше о YOLO26

Link to this sectionYOLOv9: программируемая градиентная информация#

Представленная в начале 2024 года, YOLOv9 привнесла теоретические достижения в то, как нейронные сети обрабатывают градиентный поток во время фазы обучения, фокусируясь на параметрической эффективности и сохранении глубоких признаков.

Детали модели:

Link to this sectionАрхитектура и преимущества#

YOLOv9 построена вокруг концепции программируемой градиентной информации (PGI) и сети агрегации обобщенных эффективных слоев (GELAN). Эти концепции решают проблему «информационного бутылочного горлышка», часто наблюдаемую в глубоких нейронных сетях. Сохраняя важную информацию в процессе прямого распространения, GELAN гарантирует, что градиенты, используемые для обновления весов, остаются надежными. Эта архитектура обеспечивает высокую точность и делает YOLOv9 сильным кандидатом для академических исследований теории нейронных сетей и оптимизации градиентных путей с использованием фреймворка PyTorch.

Link to this sectionОграничения#

Несмотря на отличную параметрическую эффективность, YOLOv9 сильно полагается на традиционный NMS для постобработки ограничивающих рамок, что может создавать вычислительные узкие места во время вывода на edge-устройствах. Кроме того, официальный репозиторий в основном сфокусирован на обнаружении объектов, требуя значительной кастомной инженерной проработки для адаптации под специализированные задачи, такие как трекинг или оценка позы.

Узнай больше о YOLOv9

Link to this sectionСравнение производительности#

При оценке этих моделей для развертывания в реальных условиях критически важно сбалансировать точность (mAP), скорость вывода и использование памяти. Модели Ultralytics славятся своими низкими требованиями к памяти как во время обучения, так и во время вывода, требуя гораздо меньше CUDA-памяти, чем основанные на трансформерах альтернативы, такие как RT-DETR.

Ниже представлено прямое сравнение производительности YOLO26 и YOLOv9 на наборе данных COCO. Лучшие значения в каждом столбце выделены жирным.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Примечание: значения скорости для CPU для YOLOv9 опущены, так как они сильно варьируются в зависимости от конфигурации NMS и, как правило, медленнее, чем нативная реализация YOLO26 без NMS.

Link to this sectionСценарии использования и рекомендации#

Выбор между YOLO26 и YOLOv9 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.

Link to this sectionКогда стоит выбрать YOLO26#

YOLO26 — отличный выбор для:

  • Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
  • Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
  • Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.

Link to this sectionКогда стоит выбрать YOLOv9#

YOLOv9 рекомендуется для:

  • Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
  • Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
  • Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.

Link to this sectionПреимущество Ultralytics#

Выбор модели включает в себя нечто большее, чем просто чтение бенчмарка точности; окружающая программная экосистема диктует, как быстро ты сможешь пройти путь от сбора данных до продакшена.

Link to this sectionПростота использования и экосистема#

Python API от Ultralytics предлагает бесшовный опыт "от нуля до героя". Вместо клонирования сложных репозиториев или ручной настройки скриптов распределенного обучения, разработчики могут установить пакет через pip и немедленно начать обучение. Активно поддерживаемая экосистема Ultralytics гарантирует частые обновления, автоматические интеграции с ML-платформами, такими как Weights & Biases, и обширную документацию.

Другие модели Ultralytics

Если тебе интересно изучить другие модели в экосистеме Ultralytics, ты также можешь рассмотреть сравнение YOLO11 или классической YOLOv8, обе из которых обеспечивают исключительную гибкость для кастомных приложений.

Link to this sectionУниверсальность в задачах компьютерного зрения#

Хотя YOLOv9 — это прежде всего движок для обнаружения, YOLO26 — это универсальный инструмент для компьютерного зрения. Используя единый унифицированный синтаксис, ты можешь легко переключаться с обнаружения объектов на высокоточную сегментацию изображений или классификацию целых изображений. Эта универсальность снижает технический долг, связанный с поддержкой нескольких разрозненных кодовых баз для различных функций компьютерного зрения.

Link to this sectionЭффективное обучение и развертывание#

Эффективность обучения — краеугольный камень философии Ultralytics. YOLO26 использует легкодоступные предобученные веса и отличается значительно меньшим использованием памяти по сравнению с громоздкими трансформерами для зрения. После обучения встроенные конвейеры экспорта позволяют выполнять конвертацию в оптимизированные форматы, такие как TensorRT или TensorFlow Lite, в один клик, сглаживая путь к продакшену.

Link to this sectionПример кода: начало работы с YOLO26#

Реализация YOLO26 удивительно проста. Следующий фрагмент кода на Python демонстрирует, как загрузить предобученную модель, обучить её на собственных данных и запустить вывод с помощью API Ultralytics.

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Uses GPU 0, or use 'cpu' for CPU training
)

# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes and confidences
predictions[0].show()

Используя скорость, упрощенную архитектуру и надежную экосистему YOLO26, команды могут выводить передовые приложения AI для зрения на рынок быстрее и с меньшим количеством технических препятствий, чем когда-либо прежде.

Контрибьюторы

Комментарии