Перейти к содержанию

YOLO11 vs. YOLOv9: Всестороннее техническое сравнение

Ландшафт компьютерного зрения постоянно развивается, новые архитектуры расширяют границы возможного в обнаружении объектов в реальном времени. Двумя важными вехами на этом пути являются Ultralytics YOLO11 и YOLOv9. Хотя обе модели демонстрируют исключительную производительность, они представляют разные подходы к решению основных задач инференса и обучения глубокого обучения.

Это руководство предоставляет всестороннее техническое сравнение между YOLO11 и YOLOv9, анализируя их архитектуры, метрики производительности и идеальные сценарии развертывания, чтобы помочь вам выбрать подходящую модель для вашего следующего проекта в области искусственного интеллекта.

Обзор модели

Ultralytics YOLO11

YOLO11 — это высокооптимизированная, универсальная модель, разработанная для производственных сред. Она сочетает передовую точность с практическими требованиями граничных вычислений и крупномасштабного развертывания.

Узнайте больше о YOLO11

YOLOv9

YOLOv9 — это мощный академический вклад, который представляет новые концепции для уменьшения потери информации в глубоких нейронных сетях, уделяя особое внимание теоретическим достижениям в извлечении признаков.

Узнайте больше о YOLOv9

Архитектурные инновации

YOLOv9: Программируемая градиентная информация

YOLOv9 решает проблему «информационного узкого места»—где данные теряются по мере прохождения через последовательные слои глубокой сети. Для решения этой проблемы авторы представили Программируемую Градиентную Информацию (PGI) и Обобщенную Эффективную Сеть Агрегации Слоев (GELAN). PGI гарантирует, что градиенты, используемые для обновления весов во время обратного распространения, содержат полную информацию, что приводит к высокоточным представлениям признаков. Архитектура GELAN максимизирует эффективность параметров, позволяя YOLOv9 достигать высокой точности при относительно легкой структуре.

YOLO11: Экосистема и эффективность

Хотя YOLOv9 фокусируется на потоке градиентов, YOLO11 разработан для реальной надежности и универсальности. Он дорабатывает фундаментальную архитектуру YOLO, чтобы значительно сократить требования к памяти CUDA во время обучения по сравнению с альтернативами, сильно зависящими от трансформеров. Более того, YOLO11 — это не просто детектор объектов; он нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).

Оптимизированная разработка

Одна из величайших сильных сторон YOLO11 — это ее интеграция в платформу Ultralytics, которая абстрагирует сложности загрузки данных, аугментации и распределенного обучения в единый API.

Сравнение производительности

При выборе модели для продакшена крайне важна оценка компромисса между средней средней точностью (mAP), скоростью инференса и количеством параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Как видно из таблицы, YOLOv9e достигает наивысшей общей точности, что делает его отличным для академического бенчмаркинга. Однако YOLO11 обеспечивает превосходное соотношение скорости и точности по всем показателям. Например, YOLO11m достигает 51.5 mAP за 4.7 мс (TensorRT), превосходя по скорости аналогичный по размеру YOLOv9m.

Методологии обучения и экосистема

Опыт разработчика значительно различается между двумя фреймворками.

Обучение YOLOv9

Обучение YOLOv9 часто требует взаимодействия с сильно кастомизированным исследовательским кодом, управления конкретными версиями зависимостей и использования сложных аргументов командной строки. Хотя это мощный инструмент, он может быть сложным для быстроразвивающихся корпоративных сред.

Обучение YOLO11

YOLO11 использует хорошо поддерживаемый Ultralytics Python API, обеспечивая бесшовный опыт «от новичка до эксперта». Эффективные процессы обучения поддерживаются легкодоступными предварительно обученными весами и отличной поддержкой сообщества.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX format for deployment
model.export(format="onnx")

Всего тремя строками python-кода разработчики могут загрузить модель, инициировать обучение с оптимизированными значениями гиперпараметров по умолчанию и экспортировать обученную архитектуру в такие фреймворки, как ONNX или TensorRT, для развертывания на периферийных устройствах.

Приложения в реальном мире

Когда выбирать YOLOv9

YOLOv9 — отличный выбор для исследователей, стремящихся изучать архитектуры глубокого обучения. Его фреймворк PGI делает его идеальным кандидатом для высокоскоростной розничной аналитики, где требуется исключительная точность на плотных наборах данных, а сложность развертывания вторична по отношению к производительности алгоритма.

Когда следует выбирать YOLO11

YOLO11 — это идеальный инструмент для производства. Его оптимизированные возможности обнаружения объектов делают его идеальным для управления дорожным движением в умных городах и граничных устройств, таких как Raspberry Pi или NVIDIA Jetson. Более того, его универсальность в различных задачах означает, что единый конвейер разработки может обрабатывать сегментацию в производстве и оценку позы в спортивной аналитике.

Передовой край: Встречайте YOLO26

Хотя YOLO11 и YOLOv9 являются выдающимися, область искусственного интеллекта быстро развивается. Для разработчиков, начинающих новые проекты сегодня, Ultralytics настоятельно рекомендует YOLO26 (выпущенный в январе 2026 года), который еще больше расширяет границы компьютерного зрения.

YOLO26 объединяет лучшие из последних инноваций в готовую к производству мощную систему:

  • Сквозная архитектура без NMS: YOLO26 изначально исключает постобработку Non-Maximum Suppression (NMS), что приводит к значительному упрощению и ускорению конвейеров развертывания.
  • Удаление DFL: Удаление Distribution Focal Loss обеспечивает лучшую совместимость с маломощными микроконтроллерами и периферийными ускорителями ИИ.
  • Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM, оптимизатор MuSGD (гибрид SGD и Muon) обеспечивает стабильное обучение и более быструю сходимость.
  • До 43% более быстрый инференс на CPU: Специально оптимизирован для устройств периферийных вычислений без выделенных GPU.
  • ProgLoss + STAL: Эти улучшенные функции потерь значительно улучшают распознавание мелких объектов, что критически важно для мониторинга сельского хозяйства и аэрофотосъемки.

Пользователи, заинтересованные в изучении разнообразных архитектур, могут также рассмотреть RT-DETR для отслеживания на основе трансформеров или YOLO-World для обнаружения объектов с открытым словарем без предварительного обучения (zero-shot).

Заключение

Как YOLO11, так и YOLOv9 закрепили свое место в истории компьютерного зрения. YOLOv9 предлагает блестящие архитектурные инновации для максимального сохранения признаков. Однако для подавляющего большинства реальных развертываний — от корпоративных приложений ИИ до мобильных периферийных устройств — простота использования, эффективность памяти и универсальная поддержка задач YOLO11 обеспечивают непревзойденное преимущество. И по мере развития отрасли, внедрение новой YOLO26 гарантирует, что ваши системы будут работать с абсолютно самой быстрой и надежной инференс-моделью, доступной на сегодняшний день.


Комментарии