Link to this sectionYOLO11 против YOLOv9: всестороннее техническое сравнение#
Сфера компьютерного зрения постоянно развивается, и новые архитектуры расширяют границы возможного в обнаружении объектов в реальном времени. Двумя важными этапами на этом пути стали Ultralytics YOLO11 и YOLOv9. Хотя обе модели демонстрируют исключительную производительность, они представляют собой различные подходы к решению ключевых задач обучения и вывода в глубоком обучении.
Это руководство представляет собой всестороннее техническое сравнение YOLO11 и YOLOv9, анализирующее их архитектуру, метрики производительности и оптимальные сценарии развертывания, чтобы помочь тебе выбрать подходящую модель для твоего следующего проекта в области искусственного интеллекта.
Link to this sectionОбзор моделей#
Link to this sectionUltralytics YOLO11#
YOLO11 — это высокооптимизированная и универсальная модель, созданная для производственных сред. Она сочетает в себе передовую точность с практическими требованиями периферийных вычислений и крупномасштабного развертывания.
- Авторы: Гленн Джочер (Glenn Jocher) и Цзин Цю (Jing Qiu)
- Организация: Ultralytics
- Дата: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Документация: https://docs.ultralytics.com/models/yolo11/
Link to this sectionYOLOv9#
YOLOv9 — это мощный академический вклад, представляющий новые концепции для уменьшения потери информации в глубоких нейронных сетях с акцентом на теоретические достижения в области извлечения признаков.
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Institute of Information Science, Academia Sinica, Тайвань
- Дата: 2024-02-21
- Arxiv: https://arxiv.org/abs/2402.13616
- GitHub: https://github.com/WongKinYiu/yolov9
- Документация: https://docs.ultralytics.com/models/yolov9/
Link to this sectionАрхитектурные инновации#
Link to this sectionYOLOv9: программируемая градиентная информация#
YOLOv9 решает проблему «информационного узкого места», при которой данные теряются по мере прохождения через последовательные слои глубокой сети. Чтобы решить эту задачу, авторы внедрили Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN). PGI гарантирует, что градиенты, используемые для обновления весов во время обратного распространения ошибки, содержат полную информацию, что приводит к высокоточному представлению признаков. Архитектура GELAN максимизирует эффективность параметров, позволяя YOLOv9 достигать высокой точности при относительно легкой структуре.
Link to this sectionYOLO11: экосистема и эффективность#
В то время как YOLOv9 фокусируется на потоке градиентов, YOLO11 разработана для надежности и универсальности в реальных условиях. Она совершенствует базовую архитектуру YOLO для значительного снижения требований к памяти CUDA во время обучения по сравнению с тяжелыми альтернативами на базе Transformer. Кроме того, YOLO11 — это не просто детектор объектов; она нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Одно из главных преимуществ YOLO11 — интеграция в платформу Ultralytics, которая упрощает сложности загрузки данных, аугментации и распределенного обучения до единого API.
Link to this sectionСравнение производительности#
При выборе модели для производства крайне важно оценивать компромисс между средним показателем точности (mAP), скоростью вывода и количеством параметров.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Как видно из таблицы, YOLOv9e достигает самой высокой общей точности, что делает ее отличным выбором для академических бенчмарков. Однако YOLO11 обеспечивает лучшее соотношение скорости и точности во всех категориях. Например, YOLO11m достигает 51.5 mAP при 4.7 мс (TensorRT), превосходя по скорости сопоставимую по размеру YOLOv9m.
Link to this sectionМетодологии обучения и экосистема#
Опыт разработчика существенно различается между этими двумя фреймворками.
Link to this sectionОбучение YOLOv9#
Обучение YOLOv9 часто требует взаимодействия с сильно кастомизированным исследовательским кодом, управления специфическими версиями зависимостей и использования сложных аргументов командной строки. Хотя это мощный инструмент, он может быть сложным для динамичных корпоративных сред.
Link to this sectionОбучение YOLO11#
YOLO11 использует хорошо поддерживаемый Python API от Ultralytics, обеспечивая бесшовный опыт работы с самого начала. Эффективные процессы обучения подкрепляются легкодоступными предобученными весами и отличной поддержкой сообщества.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train on a custom dataset with built-in augmentations
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX format for deployment
model.export(format="onnx")Всего тремя строками кода на Python разработчики могут загрузить модель, запустить обучение с оптимизированными гиперпараметрами по умолчанию и экспортировать обученную архитектуру в такие фреймворки, как ONNX или TensorRT, для развертывания на периферийных устройствах.
Link to this sectionПрименение в реальных условиях#
Link to this sectionКогда выбирать YOLOv9#
YOLOv9 — это фантастический выбор для исследователей, желающих изучать архитектуры глубокого обучения. Ее фреймворк PGI делает ее идеальным кандидатом для высокоскоростной розничной аналитики, где требуется экстремальная точность на плотных наборах данных, а сложность развертывания вторична по отношению к алгоритмической производительности.
Link to this sectionКогда выбирать YOLO11#
YOLO11 — идеальный инструмент для производства. Ее возможности обнаружения объектов делают её идеальной для управления дорожным движением в умных городах и периферийных устройств, таких как Raspberry Pi или NVIDIA Jetson. Более того, её универсальность в различных задачах означает, что единый конвейер разработки может справляться с сегментацией в производстве и оценкой позы в спортивной аналитике.
Link to this sectionПередовой рубеж: встречай YOLO26#
Хотя YOLO11 и YOLOv9 замечательны, область искусственного интеллекта развивается быстро. Для разработчиков, начинающих новые проекты сегодня, Ultralytics настоятельно рекомендует YOLO26 (выпущенную в январе 2026 года), которая еще дальше раздвигает границы компьютерного зрения.
YOLO26 сочетает в себе лучшие последние инновации в готовом к производству решении:
- Сквозной дизайн без NMS: YOLO26 нативно исключает постпроцессинг Non-Maximum Suppression (NMS), что приводит к значительно более простым и быстрым конвейерам развертывания.
- Удаление DFL: Отказ от Distribution Focal Loss обеспечивает лучшую совместимость с микроконтроллерами с низким энергопотреблением и ускорителями Edge AI.
- Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM, оптимизатор MuSGD (гибрид SGD и Muon) обеспечивает стабильное обучение и более быструю сходимость.
- До 43% быстрее вывод на CPU: Специально оптимизировано для устройств периферийных вычислений без выделенных GPU.
- ProgLoss + STAL: Эти улучшенные функции потерь радикально улучшают распознавание мелких объектов, что критически важно для сельскохозяйственного мониторинга и аэрофотосъемки.
Пользователям, заинтересованным в изучении разнообразных архитектур, также стоит обратить внимание на RT-DETR для трекинга на основе Transformer или YOLO-World для zero-shot обнаружения с открытым словарем.
Link to this sectionЗаключение#
И YOLO11, и YOLOv9 заняли свое место в истории компьютерного зрения. YOLOv9 предлагает блестящие архитектурные инновации для максимального сохранения признаков. Однако для подавляющего большинства реальных внедрений — от корпоративных ИИ-приложений до мобильных периферийных устройств — простота использования, эффективность памяти и поддержка разнообразных задач в YOLO11 обеспечивают непревзойденное преимущество. И поскольку индустрия движется вперед, принятие новой YOLO26 гарантирует, что твои системы используют самый быстрый и надежный вывод, доступный сегодня.