YOLO11 против YOLOv9: всестороннее техническое сравнение

Сфера компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы возможного в обнаружении объектов в реальном времени. Двумя важными этапами на этом пути стали Ultralytics YOLO11 и YOLOv9. Хотя обе модели демонстрируют исключительную производительность, они представляют собой различные подходы к решению ключевых задач обучения и вывода в глубоком обучении.

Это руководство представляет собой всестороннее техническое сравнение YOLO11 и YOLOv9, анализирующее их архитектуру, метрики производительности и оптимальные сценарии развертывания, чтобы помочь тебе выбрать подходящую модель для твоего следующего проекта в области искусственного интеллекта.

Обзор моделей

Ultralytics YOLO11

YOLO11 — это высокооптимизированная и универсальная модель, созданная для производственных сред. Она сочетает в себе передовую точность с практическими требованиями периферийных вычислений и крупномасштабного развертывания.

Узнай больше о YOLO11

YOLOv9

YOLOv9 — это мощный академический вклад, представляющий новые концепции для уменьшения потери информации в глубоких нейронных сетях с акцентом на теоретические достижения в области извлечения признаков.

Узнай больше о YOLOv9

Архитектурные инновации

YOLOv9: программируемая градиентная информация

YOLOv9 решает проблему «информационного узкого места», при которой данные теряются по мере прохождения через последовательные слои глубокой сети. Чтобы решить эту задачу, авторы внедрили Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN). PGI гарантирует, что градиенты, используемые для обновления весов во время обратного распространения ошибки, содержат полную информацию, что приводит к высокоточному представлению признаков. Архитектура GELAN максимизирует эффективность параметров, позволяя YOLOv9 достигать высокой точности при относительно легкой структуре.

YOLO11: экосистема и эффективность

В то время как YOLOv9 фокусируется на потоке градиентов, YOLO11 разработана для надежности и универсальности в реальных условиях. Она совершенствует базовую архитектуру YOLO для значительного снижения требований к памяти CUDA во время обучения по сравнению с тяжелыми альтернативами на базе Transformer. Кроме того, YOLO11 — это не просто детектор объектов; она нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).

Оптимизация разработки

Одно из главных преимуществ YOLO11 — интеграция в платформу Ultralytics, которая упрощает сложности загрузки данных, аугментации и распределенного обучения до единого API.

Сравнение производительности

При выборе модели для производства крайне важно оценивать компромисс между средним показателем точности (mAP), скоростью вывода и количеством параметров.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(М)
FLOPs
(Б)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Как видно из таблицы, YOLOv9e достигает самой высокой общей точности, что делает ее отличным выбором для академических бенчмарков. Однако YOLO11 обеспечивает лучшее соотношение скорости и точности во всех категориях. Например, YOLO11m достигает 51.5 mAP при 4.7 мс (TensorRT), превосходя по скорости сопоставимую по размеру YOLOv9m.

Методологии обучения и экосистема

Опыт разработчика существенно различается между этими двумя фреймворками.

Обучение YOLOv9

Обучение YOLOv9 часто требует взаимодействия с сильно кастомизированным исследовательским кодом, управления специфическими версиями зависимостей и использования сложных аргументов командной строки. Хотя это мощный инструмент, он может быть сложным для динамичных корпоративных сред.

Обучение YOLO11

YOLO11 использует хорошо поддерживаемый Python API от Ultralytics, обеспечивая бесшовный опыт работы с самого начала. Эффективные процессы обучения подкрепляются легкодоступными предобученными весами и отличной поддержкой сообщества.

from ultralytics import YOLO

# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")

# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX format for deployment
model.export(format="onnx")

Всего тремя строками кода на Python разработчики могут загрузить модель, запустить обучение с оптимизированными гиперпараметрами по умолчанию и экспортировать обученную архитектуру в такие фреймворки, как ONNX или TensorRT, для развертывания на периферийных устройствах.

Применение в реальных условиях

Когда выбирать YOLOv9

YOLOv9 — это фантастический выбор для исследователей, желающих изучать архитектуры глубокого обучения. Ее фреймворк PGI делает ее идеальным кандидатом для высокоскоростной розничной аналитики, где требуется экстремальная точность на плотных наборах данных, а сложность развертывания вторична по отношению к алгоритмической производительности.

Когда выбирать YOLO11

YOLO11 — идеальный инструмент для производства. Ее возможности обнаружения объектов делают её идеальной для управления дорожным движением в умных городах и периферийных устройств, таких как Raspberry Pi или NVIDIA Jetson. Более того, её универсальность в различных задачах означает, что единый конвейер разработки может справляться с сегментацией в производстве и оценкой позы в спортивной аналитике.

Передовой рубеж: встречай YOLO26

Хотя YOLO11 и YOLOv9 замечательны, область искусственного интеллекта развивается быстро. Для разработчиков, начинающих новые проекты сегодня, Ultralytics настоятельно рекомендует YOLO26 (выпущенную в январе 2026 года), которая еще дальше раздвигает границы компьютерного зрения.

YOLO26 сочетает в себе лучшие последние инновации в готовом к производству решении:

  • Сквозной дизайн без NMS: YOLO26 нативно исключает постпроцессинг Non-Maximum Suppression (NMS), что приводит к значительно более простым и быстрым конвейерам развертывания.
  • Удаление DFL: Отказ от Distribution Focal Loss обеспечивает лучшую совместимость с микроконтроллерами с низким энергопотреблением и ускорителями Edge AI.
  • Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM, оптимизатор MuSGD (гибрид SGD и Muon) обеспечивает стабильное обучение и более быструю сходимость.
  • До 43% быстрее вывод на CPU: Специально оптимизировано для устройств периферийных вычислений без выделенных GPU.
  • ProgLoss + STAL: Эти улучшенные функции потерь радикально улучшают распознавание мелких объектов, что критически важно для сельскохозяйственного мониторинга и аэрофотосъемки.

Пользователям, заинтересованным в изучении разнообразных архитектур, также стоит обратить внимание на RT-DETR для трекинга на основе Transformer или YOLO-World для zero-shot обнаружения с открытым словарем.

Заключение

И YOLO11, и YOLOv9 заняли свое место в истории компьютерного зрения. YOLOv9 предлагает блестящие архитектурные инновации для максимального сохранения признаков. Однако для подавляющего большинства реальных внедрений — от корпоративных ИИ-приложений до мобильных периферийных устройств — простота использования, эффективность памяти и поддержка разнообразных задач в YOLO11 обеспечивают непревзойденное преимущество. И поскольку индустрия движется вперед, принятие новой YOLO26 гарантирует, что твои системы используют самый быстрый и надежный вывод, доступный сегодня.

Комментарии