Перейти к содержанию

YOLOv9 YOLO10: технический анализ эволюции систем обнаружения объектов

Область обнаружения объектов в реальном времени быстро развивается, и в 2024 году будут выпущены две важные архитектуры: YOLOv9 и YOLOv10. Хотя обе модели направлены на расширение границ точности и эффективности, они достигают этого с помощью принципиально разных архитектурных концепций. YOLOv9 на максимальном сохранении информации в глубине сети, тогда как YOLOv10 процесс развертывания, устраняя необходимость в немаксимальном подавлении (NMS).

В данном руководстве представлено всестороннее техническое сравнение, которое поможет исследователям и инженерам выбрать подходящий инструмент для конкретных задач компьютерного зрения.

YOLOv9: Программируемая градиентная информация

Выпущенная в феврале 2024 года Чень-Яо Ваном и Хун-Юанем Марком Ляо (командой, стоящей за YOLOv4 и YOLOv7), YOLOv9 проблему «информационного бутылочного горлышка», присущую глубоким нейронным сетям. По мере прохождения данных через последовательные слои входные данные часто теряются, что ухудшает способность модели обучаться конкретным особенностям.

Для решения этой проблемы YOLOv9 PGI (Programmable Gradient Information, программируемая информация о градиенте) и архитектура GELAN (Generalized Efficient Layer Aggregation Network, обобщенная сеть эффективной агрегации слоев). PGI предоставляет вспомогательную ветвь контроля, которая обеспечивает сохранение важной информации в основной ветви во время обучения, а GELAN оптимизирует использование параметров для более эффективного планирования пути градиента.

Узнайте больше о YOLOv9

YOLOv10: Обнаружение в реальном времени End-to-End

Выпущенная в мае 2024 года исследователями из Университета Цинхуа, YOLOv10 значительный сдвиг в YOLO . Исторически YOLO полагались на NMS для фильтрации перекрывающихся ограничительных рамок. YOLOv10 последовательную стратегию двойного назначения во время обучения — использование назначения «один ко многим» для богатого надзора и назначения «один к одному» для вывода — что позволяет модели стать изначально NMS.

Это архитектурное изменение сокращает задержку вывода и упрощает конвейеры развертывания, что делает его особенно привлекательным для пограничных вычислений, где CPU имеют большое значение.

Узнайте больше о YOLOv10

Сравнение производительности

При сравнении этих двух архитектур мы рассматриваем компромиссы между сырой способностью обнаружения (mAP) и эффективностью вывода (задержка и FLOP).

Метрический анализ

В следующей таблице представлены показатели производительности на COCO . Хотя YOLOv9e демонстрирует превосходную точность при решении сложных задач, YOLOv10 , как правило, обеспечивают более низкую задержку благодаря устранению NMS .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Основные выводы

  1. Задержка против точности: YOLOv10n достигает более высокого mAP 39,5%) по сравнению с YOLOv9t (38,3%), при этом работая значительно быстрее на GPU (1,56 мс против 2,3 мс). Это делает архитектуру v10 высокоэффективной для небольших развертываний.
  2. Высочайшая точность: для исследовательских сценариев, где важен каждый процент точности, YOLOv9e остается мощным инструментом с mAP 55,6%, используя свою программируемую градиентную информацию для извлечения тонких особенностей, которые другие модели могут упустить.
  3. Эффективность: YOLOv10 другие системы по эффективности FLOP. YOLOv10 требует всего 21,6 Г FLOP по сравнению с 26,4 Г для YOLOv9, что означает более низкое энергопотребление на устройствах, работающих от батарей.

Рекомендации по аппаратному обеспечению

Если вы развертываете систему на процессорах (таких как Intel процессоры Intel ) или специализированном периферийном оборудовании (Raspberry Pi, Jetson), конструкция YOLOv10 NMS обычно обеспечивает более плавную работу конвейера, поскольку устраняет недетерминированное время обработки на этапах постобработки.

Обучение и экосистема

Одним из самых весомых преимуществ использования Ultralytics является унифицированная экосистема. Независимо от того, выберете ли вы YOLOv9 YOLOv10, рабочие процессы обучения, валидации и экспорта остаются идентичными. Такая согласованность значительно сокращает время, необходимое разработчикам для освоения технологии.

Преимущество Ultralytics

  • Простота использования: Простой Python позволяет вам менять архитектуры, изменяя одну строку (например, с yolov9c.pt в yolov10m.pt).
  • Хорошо поддерживаемая экосистема: Ultralytics предоставляет частые обновления, обеспечивая совместимость с последними версиями PyTorch и драйверами CUDA.
  • Требования к памяти: в отличие от многих моделей на основе трансформаторов, которые страдают от перегрузки памяти, Ultralytics оптимизированы для эффективного использованияGPU . Это позволяет использовать более крупные пакеты данных на потребительском оборудовании.

Пример обучения

Обучение любой из моделей на пользовательском наборе данных не представляет сложности. Фреймворк автоматически обрабатывает увеличение объема данных, кэширование и регистрацию метрик.

from ultralytics import YOLO

# Load a model (Swap "yolov10n.pt" for "yolov9c.pt" to switch architectures)
model = YOLO("yolov10n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance
model.val()

# Export to ONNX for deployment
model.export(format="onnx")

Идеальные варианты использования

Когда выбирать YOLOv9

YOLOv9 лучший выбор для сценариев, требующих высокой точности распознавания объектов. Его архитектура GELAN устойчива к потере информации, что делает ее идеальной для:

  • Медицинская визуализация: обнаружение небольших опухолей или аномалий, когда отсутствие какой-либо особенности имеет критическое значение. Ознакомьтесь с нашим руководством по применению ИИ в здравоохранении.
  • Обнаружение мелких объектов: сценарии, включающие аэрофотосъемку или дистанционное наблюдение, когда объекты занимают очень мало пикселей.
  • Исходные данные исследования: при сравнении с передовыми архитектурами начала 2024 года.

Когда выбирать YOLOv10

YOLOv10 с учетом скорости и простоты развертывания. Удаление NMS его сильным конкурентом для:

  • Edge Computing: Работа на устройствах, таких как Raspberry Pi или мобильные телефоны, где CPU от постобработки вызывает узкие места.
  • Робототехника в реальном времени: приложения, требующие постоянных циклов обратной связи с низкой задержкой, например автономная навигация.
  • Сложные конвейеры: системы, в которых выходные данные детектора подаются в алгоритмы отслеживания; выходные данные NMS упрощают логику для последующих задач.

Взгляд в будущее: Мощь YOLO26

Хотя YOLOv9 YOLOv10 отличными моделями, область искусственного интеллекта быстро развивается. Для новых проектов, начинающихся в 2026 году, мы настоятельно рекомендуем оценить YOLO26.

Выпущенная в январе 2026 года, YOLO26 основана на прорывной технологии YOLOv10 , NMS, YOLOv10 имеет ряд значительных усовершенствований в архитектуре:

  1. Сквозной NMS: Как и v10, YOLO26 является сквозным по своей сути, но с дополнительными оптимизациями головки обнаружения для еще большей точности.
  2. MuSGD Optimizer: гибрид SGD Muon (вдохновленный обучением LLM), этот оптимизатор обеспечивает стабильность обучения больших языковых моделей в компьютерном зрении, гарантируя более быструю конвергенцию.
  3. Удаление DFL: благодаря удалению Distribution Focal Loss (распределение фокальной потери) YOLO26 упрощает экспортный граф, что значительно облегчает развертывание на устройствах с ограниченными возможностями NPU.
  4. ProgLoss + STAL: новые функции потерь, специально настроенные для улучшения распознавания мелких объектов, устраняющие распространенный недостаток детекторов реального времени.
  5. Производительность: оптимизированный специально для пограничных вычислений, YOLO26 обеспечивает до 43 % более быстрое CPU по сравнению с предыдущими поколениями.

Узнайте больше о YOLO26

Кроме того, YOLO26 — это не просто детектор; он включает в себя специализированные усовершенствования для оценки позы (с использованием RLE), сегментации экземпляров и задач Oriented Bounding Box (OBB), что делает его самым универсальным инструментом в Ultralytics .

Заключение

Как YOLOv9 YOLOv10 значительным прорывом в области компьютерного зрения. YOLOv9 , что глубокие сети можно сделать более эффективными без потери информации, а YOLOv10 , что NMS отказаться от десятилетиями сложившейся зависимости от NMS .

Для разработчиков сегодня выбор в значительной степени зависит от ограничений развертывания. Если вам требуется максимально высокая точность при работе со сложными данными, YOLOv9e является отличным кандидатом. Если приоритетными являются задержка и простота развертывания, YOLOv10 отличным YOLOv10 . Однако для достижения оптимального баланса между скоростью, точностью и перспективными функциями YOLO26 является современной рекомендацией для пользователей Ultralytics .


Комментарии