Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv9 против YOLOv10: технический глубокий анализ эволюции обнаружения объектов в реальном времени#

Ландшафт компьютерного зрения в реальном времени претерпел огромные изменения, в основном благодаря исследователям, которые постоянно расширяют границы производительности и эффективности. При анализе эволюции самых современных моделей зрения YOLOv9 и YOLOv10 представляют собой две важные вехи. Выпущенные в начале 2024 года, обе модели представили меняющие парадигму архитектурные решения для устранения давних проблем в глубоких нейронных сетях: от узких мест в передаче информации до задержек при постобработке.

Этот подробный технический обзор исследует их архитектуры, показатели производительности и идеальные сценарии развертывания, помогая тебе ориентироваться в сложностях современных экосистем обнаружения объектов.

Link to this sectionПроисхождение моделей и архитектурные прорывы#

Понимание истории и теоретических основ этих моделей крайне важно для выбора подходящей архитектуры для твоего конкретного проекта в области компьютерного зрения.

Link to this sectionYOLOv9: освоение потока информации#

Представленная 21 февраля 2024 года, YOLOv9 решает теоретическую проблему потери информации при прохождении данных через глубокие нейронные сети.

YOLOv9 представляет Generalized Efficient Layer Aggregation Network (GELAN), которая максимизирует использование параметров, объединяя сильные стороны CSPNet и ELAN. Кроме того, она использует Programmable Gradient Information (PGI) — механизм вспомогательного контроля, гарантирующий, что глубокие слои сохраняют критически важную пространственную информацию. Это делает YOLOv9 исключительно мощной для задач, требующих высокой точности передачи признаков, таких как медицинский анализ изображений или дистанционное наблюдение.

Узнай больше о YOLOv9

Link to this sectionYOLOv10: эффективность в реальном времени от начала до конца#

Выпущенная вскоре после этого, 23 мая 2024 года, YOLOv10 переосмысливает конвейер развертывания, устраняя одну из самых известных причин задержек при обнаружении объектов: подавление немаксимумов (NMS).

YOLOv10 использует согласованные двойные назначения во время обучения, что позволяет создать архитектуру, изначально не требующую NMS. Это устраняет накладные расходы на постобработку во время вывода, значительно снижая задержку. В сочетании с целостным дизайном модели, ориентированным на эффективность и точность, YOLOv10 достигает выдающегося баланса, снижая вычислительные затраты (FLOPs) при сохранении конкурентоспособной точности, что делает её очень привлекательной для приложений периферийных вычислений.

Узнай больше о YOLOv10

Link to this sectionСравнение производительности и метрик#

При тестировании этих двух мощных решений на стандартном наборе данных MS COCO проявляются четкие компромиссы между чистой точностью и задержкой вывода.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionАнализ данных#

  1. Задержка против точности: Модели YOLOv10, как правило, предлагают более высокую скорость вывода. Например, YOLOv10s достигает 46.7% mAP всего за 2.66 мс на TensorRT, по сравнению с YOLOv9s, которой требуется 3.54 мс для практически идентичного показателя 46.8% mAP.
  2. Точность высшего уровня: Для исследовательских сценариев, требующих максимальной точности обнаружения, YOLOv9e остается грозным выбором, достигая впечатляющих 55.6% mAP. Её архитектура PGI гарантирует надежное извлечение тонких признаков.
  3. Эффективность: YOLOv10 превосходит аналоги в эффективности FLOPs. Это напрямую приводит к снижению энергопотребления, что является критически важным показателем для устройств с питанием от аккумулятора, использующих модели зрения на базе ИИ.
Совет по развертыванию

Если ты выполняешь развертывание на CPU или на аппаратном обеспечении с ограниченными ресурсами, таком как Raspberry Pi, архитектура YOLOv10 без NMS обычно обеспечит более плавный конвейер, устраняя недетерминированные шаги постобработки.

Link to this sectionПреимущество Ultralytics: обучение и экосистема#

Хотя архитектурные различия имеют решающее значение, окружающая экосистема программного обеспечения сильно влияет на успех проекта. Как YOLOv9, так и YOLOv10 полностью интегрированы в экосистему Ultralytics, обеспечивая непревзойденный опыт разработки.

Link to this sectionПростота использования и эффективность памяти#

В отличие от сложных архитектур на основе Transformer, которые страдают от огромного потребления памяти, модели Ultralytics YOLO разработаны для оптимального использования видеопамяти GPU. Это позволяет исследователям использовать большие размеры пакетов (batch sizes) на потребительском оборудовании, делая передовой ИИ доступным.

Унифицированный Python API абстрагирует сложности аугментации данных и настройки гиперпараметров. Ты можешь легко переключаться между архитектурами, просто изменяя строку файла весов.

from ultralytics import YOLO

# Load a YOLOv10 model (Easily swap to "yolov9c.pt" for YOLOv9)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)

# Validate the model's performance
metrics = model.val()

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

Если тебе нужно записывать метрики в MLflow или экспортировать модель в TensorRT для высокоскоростного аппаратного развертывания, платформа Ultralytics справится с этим нативно.

Link to this sectionИдеальные варианты использования#

Выбор между этими моделями зависит от ограничений твоего развертывания:

Link to this sectionВзгляд в будущее: переход к YOLO26#

Хотя YOLOv8, YOLOv9 и YOLOv10 являются отличными моделями, разработчикам, стремящимся создавать современные решения на базе ИИ, следует обратить внимание на Ultralytics YOLO26, выпущенную в январе 2026 года.

YOLO26 представляет собой совершенный синтез предыдущих поколений, объединяя лучшие аспекты точности YOLOv9 и эффективности YOLOv10.

Link to this sectionКлючевые инновации YOLO26#

  • Сквозной дизайн без NMS: Опираясь на фундамент, заложенный в YOLOv10, YOLO26 изначально устраняет постобработку NMS для более простого развертывания.
  • Оптимизатор MuSGD: Гибрид SGD и Muon, привносящий передовые инновации в обучение LLM в область компьютерного зрения для невероятно стабильной и быстрой сходимости.
  • До 43% более быстрый вывод на CPU: Специально оптимизировано для периферийных вычислений и устройств без выделенных GPU.
  • Удаление DFL: Distribution Focal Loss была удалена, чтобы упростить экспорт моделей и повысить совместимость с устройствами с низким энергопотреблением.
  • ProgLoss + STAL: Эти улучшенные функции потерь привносят значительные улучшения в распознавание мелких объектов, соответствующие возможностям YOLOv9 или превосходящие их.

Для исследователей, оценивающих устаревшие архитектуры, RT-DETR и YOLO11 также являются хорошо документированными альтернативами в экосистеме Ultralytics. Однако для максимальной универсальности во всех задачах зрения переход на YOLO26 на платформе Ultralytics гарантирует, что ты используешь вершину open-source ИИ в области зрения.

Авторы

Комментарии