Link to this sectionYOLOv9 против YOLO11: Технический разбор современного обнаружения объектов#
Стремительная эволюция компьютерного зрения постоянно расширяет границы возможного в обнаружении объектов в реальном времени. При сравнении передовых архитектур YOLOv9 и Ultralytics YOLO11 выделяются как монументальные шаги вперед, каждый из которых отвечает своим техническим потребностям. YOLOv9 представила новые способы сохранения градиентного потока при обучении глубоких сетей, в то время как YOLO11 произвела революцию в экосистеме компьютерного зрения общего назначения благодаря непревзойденной эффективности, универсальности и простоте использования.
Этот всесторонний технический анализ изучает их архитектуры, метрики производительности, требования к памяти и оптимальные сценарии развертывания, чтобы помочь тебе выбрать подходящую модель для твоего следующего AI-проекта.
Хотя YOLOv9 и YOLO11 — отличные модели, недавно выпущенная YOLO26 представляет собой следующий скачок вперед. Она отличается дизайном без NMS для упрощенного развертывания, до 43% более быстрым CPU-инференсом и инновационным оптимизатором MuSGD для быстрой сходимости. Для всех новых производственных проектов настоятельно рекомендуется YOLO26.
Link to this sectionТехнические характеристики и авторство#
Понимание истории этих моделей дает необходимый контекст для их архитектурных решений и зависимостей от фреймворков.
Link to this sectionYOLOv9#
YOLOv9 сделала упор на академические исследования «узких мест» глубокого обучения, отдавая приоритет максимальной точности признаков за счет использования кастомных сетевых блоков.
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Institute of Information Science, Academia Sinica
- Дата: 21 февраля 2024 г.
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
Link to this sectionUltralytics YOLO11#
YOLO11 была спроектирована с нуля для производственных сред, с акцентом на баланс высочайшей точности, реальной скорости развертывания и многозадачности.
- Авторы: Glenn Jocher и Jing Qiu
- Организация: Ultralytics
- Дата: 27 сентября 2024 г.
- GitHub: https://github.com/ultralytics/ultralytics
Link to this sectionАрхитектурные инновации#
Link to this sectionПрограммируемая градиентная информация в YOLOv9#
YOLOv9 представляет концепцию программируемой градиентной информации (PGI) наряду с Generalized Efficient Layer Aggregation Network (GELAN). По мере углубления нейронных сетей они часто страдают от «узких мест» передачи информации, где важные детали теряются в процессе прямого прохода. PGI решает эту проблему, предоставляя надежные градиентные обновления, которые сохраняют детальную пространственную информацию, в то время как GELAN максимизирует эффективность параметров. Это делает YOLOv9 особенно эффективной в задачах, требующих высокой точности признаков, хотя она полагается на стандартное подавление немаксимумов (NMS) при постобработке, что может вызывать задержки на устройствах Edge.
Link to this sectionОптимизированная эффективность в YOLO11#
YOLO11 опирается на годы фундаментальных исследований для обеспечения высокооптимизированной архитектуры. Она улучшает предыдущие итерации, снижая вычислительные затраты при максимизации извлечения признаков. В отличие от традиционных конвейеров NMS, которые создают «узкое место» для производительности CPU, YOLO11 использует уточненные детекционные головы, достигающие невероятного баланса между задержкой и точностью. Кроме того, YOLO11 обладает существенно меньшим потреблением памяти как во время обучения модели, так и при инференсе по сравнению с тяжелыми моделями Transformer, которые часто медленнее обучаются и требуют огромных объемов памяти CUDA.
Link to this sectionСравнение метрик производительности#
При сравнении этих моделей на стандартном наборе данных COCO обе показывают невероятные возможности, но возникают компромиссы между количеством параметров и скоростью работы.
Ниже представлен подробный разбор метрик производительности YOLO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this sectionАнализ результатов#
- Скорость и аппаратная эффективность: YOLO11 стабильно превосходит YOLOv9 по скорости инференса. Например, YOLO11n достигает поразительных 1.5 мс на GPU NVIDIA T4 с использованием TensorRT, что делает ее крайне пригодной для жестких конвейеров реального времени.
- Вычислительные требования: Модели YOLO11 обычно требуют меньше FLOPs (например, 68.0B для YOLO11m против 76.3B для YOLOv9m), что приводит к меньшему энергопотреблению на аккумуляторных устройствах Edge, таких как Raspberry Pi или мобильное оборудование.
- Паритет точности: Хотя YOLOv9e немного превосходит YOLO11x по абсолютному mAP (55.6 против 54.7), YOLO11 достигает своей пиковой точности с существенно меньшей задержкой (11.3 мс против 16.77 мс), демонстрируя более выгодный баланс производительности для реальных развертываний.
Link to this sectionЭкосистема и простота использования#
Хотя «сырые» метрики важны, экосистема фреймворка часто определяет успех проекта. Именно здесь по-настоящему проявляется преимущество Ultralytics.
Оригинальный репозиторий YOLOv9 узкоспециализирован и предлагает внедрение передовых научных исследований. Однако платформа Ultralytics и соответствующий пакет с открытым исходным кодом обеспечивают оптимизированный пользовательский опыт, простой API и обширную документацию, которые значительно сокращают время выхода на рынок.
Link to this sectionМногозадачная универсальность#
YOLOv9 в основном фокусируется на обнаружении с помощью ограничивающих рамок. Напротив, YOLO11 — это унифицированная многозадачная мощная система, нативно поддерживающая:
- Сегментация экземпляров
- Оценка позы
- Ориентированные ограничивающие рамки (OBB)
- Классификацию изображений
Link to this sectionБесшовное развертывание#
Использование экосистемы Ultralytics позволяет разработчикам бесшовно экспортировать модели в множество форматов с помощью одной строки кода на Python. Независимо от того, нацеливаешься ли ты на ONNX, OpenVINO, TFLite или CoreML, переход от обучения к производству не составляет труда.
from ultralytics import YOLO
# Load a highly efficient YOLO11 model
model = YOLO("yolo11n.pt")
# Train rapidly on a custom dataset with minimal memory footprint
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to OpenVINO for Intel CPU acceleration
model.export(format="openvino")Link to this sectionИдеальные варианты использования#
Link to this sectionКогда стоит использовать YOLOv9#
YOLOv9 — отличный инструмент для научно-ориентированных сред или сценариев, где приоритетом является экстремальная точность признаков, а аппаратная задержка не является главным ограничением. Ее архитектура GELAN может быть крайне выгодна в анализе медицинских изображений, где обнаружение мельчайших вариаций пикселей имеет решающее значение.
Link to this sectionПочему YOLO11 — лучший выбор#
Для разработчиков, инженеров и производственных команд YOLO11 настоятельно рекомендуется. Она превосходна в средах, требующих высокоскоростного, масштабируемого развертывания:
- Смарт-аналитика в ритейле: Отслеживание продуктов и покупателей с помощью стандартных процессоров Intel.
- Автономные дроны: Где архитектуры с низким количеством FLOP экономят заряд аккумулятора, обеспечивая при этом надежное обнаружение мелких объектов.
- Динамические проекты: Рабочие процессы, которые могут начинаться с обнаружения, но в дальнейшем потребовать оценки позы или сегментации.
Link to this sectionВзгляд в будущее: следующая эволюция#
Хотя YOLO11 представляет собой современный стандарт для своего поколения, ландшафт компьютерного зрения продолжает развиваться. Пользователям, исследующим границы AI, также стоит обратить внимание на YOLO26.
Будучи первопроходцем в дизайне без NMS (впервые исследованном в YOLOv10), YOLO26 представляет оптимизатор MuSGD (гибрид SGD и Muon) для беспрецедентной стабильности обучения. Благодаря удалению Distribution Focal Loss (DFL) для упрощения экспорта и продвинутым механизмам функции потерь, таким как ProgLoss и STAL, YOLO26 достигает до 43% более быстрого CPU-инференса. Для современных проектов она предлагает идеальное сочетание академических инноваций и готовности к производству. Кроме того, команды, переходящие с устаревших систем, таких как Ultralytics YOLOv8, найдут переход на YOLO26 или YOLO11 полностью бесшовным благодаря унифицированному API Ultralytics.