Link to this sectionYOLOv9 против YOLO26#
Ландшафт обнаружения объектов в реальном времени значительно изменился за последние несколько лет. Поскольку специалисты по машинному обучению стремятся развертывать модели на самом разном оборудовании, выбор правильной архитектуры имеет решающее значение. В этом подробном техническом руководстве мы сравниваем две важные вехи в области компьютерного зрения: YOLOv9, представленную в начале 2024 года с акцентом на оптимизацию градиентного пути, и Ultralytics YOLO26, новейшую передовую архитектуру, выпущенную в начале 2026 года, которая полностью переосмысливает граничные вычисления (edge inference) и стабильность обучения.
Link to this sectionКраткий обзор: Происхождение моделей и авторы#
Понимание происхождения этих моделей глубокого обучения дает ценный контекст относительно их архитектурных решений и целевой аудитории.
Link to this sectionYOLOv9#
Созданная Чиен-Яо Ваном и Хун-Юань Марком Ляо из Института информационных наук Academia Sinica на Тайване, модель YOLOv9 была выпущена 21 февраля 2024 года. Она в значительной степени фокусируется на теоретических концепциях глубокого обучения, в частности, на решении проблемы «узкого места» информации в глубоких сверточных нейронных сетях (CNN).
Link to this sectionUltralytics YOLO26#
Созданная Гленном Джочером и Цзин Цю в Ultralytics, модель YOLO26 была выпущена 14 января 2026 года. Основываясь на колоссальном успехе предшественников, таких как YOLO11 и YOLOv8, YOLO26 была разработана с нуля, чтобы сделать приоритетом готовность к эксплуатации, развертывание на граничных устройствах и встроенную сквозную эффективность.
Готов обновить свой пайплайн компьютерного зрения? Ты можешь легко обучать и развертывать модели YOLO26 в облаке без написания кода, используя Ultralytics Platform.
Link to this sectionАрхитектурные инновации#
Обе модели привносят революционные изменения в то, как нейронные сети обрабатывают визуальные данные, но они подходят к решению проблемы с разных сторон.
Link to this sectionПрограммируемая градиентная информация в YOLOv9#
Основной вклад YOLOv9 в эту область — внедрение Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN). По мере того как нейронные сети становятся глубже, они часто страдают от потери информации в процессе прямого распространения. PGI гарантирует, что градиенты, используемые для обновления весов во время обратного распространения, остаются точными и надежными, что позволяет архитектуре GELAN достигать высокой точности с меньшим количеством параметров.
Однако YOLOv9 сильно полагается на традиционное подавление немаксимумов (NMS) для постобработки, что может стать узким местом по задержке при выводе в реальном времени.
Link to this sectionАрхитектура YOLO26, ориентированная на Edge-устройства#
YOLO26 использует принципиально иной подход, оптимизируя весь конвейер от обучения до развертывания в реальном времени. Она построена на базе End-to-End NMS-Free Design, впервые представленного в YOLOv10, полностью устраняя необходимость в постобработке NMS. Это обеспечивает невероятно низкую задержку, что делает модель максимально оптимизированной для граничных устройств, таких как Raspberry Pi или NVIDIA Jetson.
Более того, YOLO26 полностью удаляет Distribution Focal Loss (DFL). Это структурное изменение упрощает экспорт модели в ONNX и обеспечивает значительно лучшую совместимость с маломощными микроконтроллерами.
Для этапа обучения YOLO26 интегрирует новый MuSGD Optimizer, гибрид Stochastic Gradient Descent и Muon (вдохновленный методологиями обучения LLM от Kimi K2 компании Moonshot AI). Это сокращает разрыв между инновациями в обучении больших языковых моделей (LLM) и компьютерным зрением, обеспечивая значительно более стабильное обучение и ускоренное время сходимости.
Link to this sectionСравнение производительности и метрик#
При тестировании на широко используемом наборе данных COCO, обе модели демонстрируют исключительные возможности, но экосистема Ultralytics превосходит их по практической скорости вывода и эффективности параметров.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Link to this sectionАнализ результатов#
- Скорость и эффективность: Поскольку YOLO26 использует архитектуру без NMS и упрощенные функции потерь, она обеспечивает до 43% более быстрый вывод на CPU по сравнению с устаревшими архитектурами. Модель YOLO26n работает с поразительной скоростью 1,7 мс на GPU NVIDIA T4 с использованием TensorRT, что делает ее идеальным выбором для потоков видео в реальном времени.
- Точность: Модель YOLO26x достигает непревзойденного показателя 57.5 mAP, превосходя самую большую модель YOLOv9e при сохранении более низкой задержки.
- Требования к памяти: Модели Ultralytics известны своей эффективностью. YOLO26 требует значительно меньше памяти CUDA во время обучения модели и вывода по сравнению со сложными визионными моделями на основе трансформеров, что позволяет тебе использовать большие размеры пакетов (batch sizes) на потребительском оборудовании.
Link to this sectionЭкосистема, простота использования и универсальность#
Истинная сила экосистемы Ultralytics заключается в пользовательском опыте. В то время как исследователям, использующим базу кода GitHub YOLOv9, приходится преодолевать сложности настройки среды и ручного написания скриптов, YOLO26 полностью интегрирована в интуитивно понятный Python API от Ultralytics.
Link to this sectionУпрощенный пример API#
Обучение передовой модели YOLO26 требует всего несколько строк кода на Python:
from ultralytics import YOLO
# Load the latest native end-to-end YOLO26 model
model = YOLO("yolo26s.pt")
# Train the model effortlessly with the default MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export natively to ONNX format in a single command
model.export(format="onnx")Link to this sectionНепревзойденная универсальность задач#
В отличие от YOLOv9, которая в основном предназначена для стандартного обнаружения объектов, YOLO26 «из коробки» поддерживает широкий спектр задач компьютерного зрения. Архитектура включает специальные улучшения для разнообразных приложений:
- Instance Segmentation: Включает специализированную функцию потерь семантической сегментации и мультимасштабные прототипы для создания безупречных масок на уровне пикселей.
- Pose Estimation: Интегрирует Residual Log-Likelihood Estimation (RLE) для отслеживания ключевых точек скелета с исключительной точностью.
- Oriented Bounding Boxes (OBB): Включает специализированную функцию потерь по углу, разработанную специально для решения проблем границ при обнаружении повернутых объектов на аэрофотоснимках.
- Image Classification: Надежная категоризация для целых изображений по стандартам ImageNet.
Все модели YOLO26 получают преимущества от бесшовной интеграции с Ultralytics Platform, предлагающей встроенную разметку наборов данных, активное обучение и готовые пайплайны развертывания.
Link to this sectionПрименение в реальных условиях#
Выбор между этими моделями часто сводится к среде, в которой они будут развернуты.
Link to this sectionIoT и периферийная робототехника#
Для робототехники, автономных дронов и устройств умного дома IoT, YOLO26 является бесспорным чемпионом. Интеграция ProgLoss + STAL приносит заметные улучшения в распознавание мелких объектов, что критически важно для мониторинга сельского хозяйства с высотных дронов. В сочетании с 43% более быстрым выводом на CPU и архитектурой без NMS, YOLO26 может плавно работать на оборудовании без выделенных GPU.
Link to this sectionАкадемические исследования и градиентный анализ#
YOLOv9 остается весьма уважаемой моделью в академических кругах. Исследователи, изучающие теоретические границы градиентного потока, или те, кто стремится создавать пользовательские слои PyTorch на основе концепции PGI, найдут базу кода YOLOv9 отличным фундаментом для изучения теории глубокого обучения.
Link to this sectionВысокоскоростные производственные линии#
В промышленных условиях, таких как автоматизированное обнаружение дефектов на высокоскоростных конвейерных лентах, невероятно высокая скорость моделей YOLO26 в TensorRT гарантирует, что ни один кадр не будет пропущен, максимизируя пропускную способность систем контроля качества.
Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOv9 и YOLO26 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда стоит выбрать YOLOv9#
YOLOv9 — отличный выбор для:
- Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.
Link to this sectionКогда стоит выбрать YOLO26#
YOLO26 рекомендуется для:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionЗаключение#
Обе модели представляют собой невероятный шаг вперед для сообщества с открытым исходным кодом. YOLOv9 внесла жизненно важные теоретические улучшения в градиентный поток, которые будут вдохновлять архитектуры в течение многих лет. Однако для современных разработчиков, стартапов и корпоративных команд, ищущих идеальный баланс скорости, точности и легкости развертывания, Ultralytics YOLO26 является очевидной рекомендацией.
Устраняя NMS, внедряя мощный оптимизатор MuSGD и предоставляя непревзойденный набор инструментов для задач обнаружения, сегментации и оценки позы, YOLO26 гарантирует, что твои проекты в области компьютерного зрения будут построены на самой надежной и перспективной платформе из доступных сегодня.