Link to this sectionYOLO26 против YOLOv9#
Ландшафт компьютерного зрения быстро развивается, и новые архитектуры постоянно расширяют границы скорости и точности. В этом техническом сравнении мы рассмотрим различия между YOLO26 и YOLOv9, двумя весьма влиятельными моделями в области real-time обнаружения объектов. Хотя обе модели предлагают уникальные архитектурные инновации, понимание их компромиссов в производительности, возможностей развертывания и аппаратных требований критически важно для выбора правильного инструмента для твоего следующего проекта в области зрения.
Link to this sectionYOLO26: мощное решение, оптимизированное для edge-устройств#
Выпущенная в начале 2026 года, Ultralytics YOLO26 представляет собой поколенческий скачок в эффективности развертывания и стабильности обучения моделей. Разработанная как нативная end-to-end структура, она напрямую решает проблемы развертывания, которые исторически преследовали приложения edge AI.
Детали модели:
- Авторы: Glenn Jocher и Jing Qiu
- Организация: Ultralytics
- Дата: 2026-01-14
- GitHub: репозиторий Ultralytics
- Документация: Документация YOLO26
Link to this sectionАрхитектура и инновации#
YOLO26 фундаментально перерабатывает конвейер постобработки, внедряя End-to-End NMS-Free дизайн. Устраняя необходимость в NMS (Non-Maximum Suppression), модель достигает значительно меньшей вариативности задержек. Это существенно упрощает развертывание на мобильных и edge-платформах, особенно при экспорте в такие фреймворки, как ONNX и Apple CoreML.
Кроме того, удаление Distribution Focal Loss (DFL) упрощает процесс экспорта и повышает совместимость с маломощными микроконтроллерами. Для улучшения стабильности обучения YOLO26 интегрирует инновационный оптимизатор MuSGD, гибрид Stochastic Gradient Descent (SGD) и Muon (вдохновленный инновациями в обучении больших языковых моделей). Это приводит к более быстрой сходимости и более надежному извлечению признаков на сложных наборах данных.
Благодаря архитектурным упрощениям и удалению DFL, YOLO26 достигает до 43% более быстрого CPU-вывода, что делает её идеальным выбором для edge-устройств с ограниченными ресурсами, таких как Raspberry Pi или NVIDIA Jetson Nano.
Для обнаружения крайне сложных объектов в таких сценах, как аэрофотосъемка с дронов, YOLO26 использует обновленные функции потерь ProgLoss + STAL. Они обеспечивают заметное улучшение полноты (recall) распознавания мелких объектов. Более того, модель может похвастаться специфическими для задач улучшениями, включая multi-scale proto для сегментации экземпляров, Residual Log-Likelihood Estimation (RLE) для оценки позы и специализированную потерю угла для обнаружения ориентированных ограничивающих рамок (OBB).
Link to this sectionYOLOv9: программируемая градиентная информация#
Представленная в начале 2024 года, YOLOv9 привнесла теоретические достижения в то, как нейронные сети обрабатывают градиентный поток во время фазы обучения, фокусируясь на параметрической эффективности и сохранении глубоких признаков.
Детали модели:
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Институт информатики, Academia Sinica, Тайвань
- Дата: 2024-02-21
- Arxiv: статья YOLOv9
- GitHub: репозиторий YOLOv9
- Документация: документация YOLOv9
Link to this sectionАрхитектура и преимущества#
YOLOv9 построена вокруг концепции программируемой градиентной информации (PGI) и сети агрегации обобщенных эффективных слоев (GELAN). Эти концепции решают проблему «информационного бутылочного горлышка», часто наблюдаемую в глубоких нейронных сетях. Сохраняя важную информацию в процессе прямого распространения, GELAN гарантирует, что градиенты, используемые для обновления весов, остаются надежными. Эта архитектура обеспечивает высокую точность и делает YOLOv9 сильным кандидатом для академических исследований теории нейронных сетей и оптимизации градиентных путей с использованием фреймворка PyTorch.
Link to this sectionОграничения#
Несмотря на отличную параметрическую эффективность, YOLOv9 сильно полагается на традиционный NMS для постобработки ограничивающих рамок, что может создавать вычислительные узкие места во время вывода на edge-устройствах. Кроме того, официальный репозиторий в основном сфокусирован на обнаружении объектов, требуя значительной кастомной инженерной проработки для адаптации под специализированные задачи, такие как трекинг или оценка позы.
Link to this sectionСравнение производительности#
При оценке этих моделей для развертывания в реальных условиях критически важно сбалансировать точность (mAP), скорость вывода и использование памяти. Модели Ultralytics славятся своими низкими требованиями к памяти как во время обучения, так и во время вывода, требуя гораздо меньше CUDA-памяти, чем основанные на трансформерах альтернативы, такие как RT-DETR.
Ниже представлено прямое сравнение производительности YOLO26 и YOLOv9 на наборе данных COCO. Лучшие значения в каждом столбце выделены жирным.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Примечание: значения скорости для CPU для YOLOv9 опущены, так как они сильно варьируются в зависимости от конфигурации NMS и, как правило, медленнее, чем нативная реализация YOLO26 без NMS.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLO26 и YOLOv9 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда стоит выбрать YOLO26#
YOLO26 — отличный выбор для:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionКогда стоит выбрать YOLOv9#
YOLOv9 рекомендуется для:
- Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.
Link to this sectionПреимущество Ultralytics#
Выбор модели включает в себя нечто большее, чем просто чтение бенчмарка точности; окружающая программная экосистема диктует, как быстро ты сможешь пройти путь от сбора данных до продакшена.
Link to this sectionПростота использования и экосистема#
Python API от Ultralytics предлагает бесшовный опыт "от нуля до героя". Вместо клонирования сложных репозиториев или ручной настройки скриптов распределенного обучения, разработчики могут установить пакет через pip и немедленно начать обучение. Активно поддерживаемая экосистема Ultralytics гарантирует частые обновления, автоматические интеграции с ML-платформами, такими как Weights & Biases, и обширную документацию.
Link to this sectionУниверсальность в задачах компьютерного зрения#
Хотя YOLOv9 — это прежде всего движок для обнаружения, YOLO26 — это универсальный инструмент для компьютерного зрения. Используя единый унифицированный синтаксис, ты можешь легко переключаться с обнаружения объектов на высокоточную сегментацию изображений или классификацию целых изображений. Эта универсальность снижает технический долг, связанный с поддержкой нескольких разрозненных кодовых баз для различных функций компьютерного зрения.
Link to this sectionЭффективное обучение и развертывание#
Эффективность обучения — краеугольный камень философии Ultralytics. YOLO26 использует легкодоступные предобученные веса и отличается значительно меньшим использованием памяти по сравнению с громоздкими трансформерами для зрения. После обучения встроенные конвейеры экспорта позволяют выполнять конвертацию в оптимизированные форматы, такие как TensorRT или TensorFlow Lite, в один клик, сглаживая путь к продакшену.
Link to this sectionПример кода: начало работы с YOLO26#
Реализация YOLO26 удивительно проста. Следующий фрагмент кода на Python демонстрирует, как загрузить предобученную модель, обучить её на собственных данных и запустить вывод с помощью API Ultralytics.
from ultralytics import YOLO
# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device=0, # Uses GPU 0, or use 'cpu' for CPU training
)
# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")
# Display the bounding boxes and confidences
predictions[0].show()Используя скорость, упрощенную архитектуру и надежную экосистему YOLO26, команды могут выводить передовые приложения AI для зрения на рынок быстрее и с меньшим количеством технических препятствий, чем когда-либо прежде.