Link to this sectionYOLOv6-3.0 против YOLOv9#
Ландшафт обнаружения объектов в реальном времени продолжает развиваться, движимый спросом на более высокую точность, меньшую задержку и лучшее использование аппаратного обеспечения. Это подробное сравнение рассматривает две важные вехи в этой области: YOLOv6-3.0, разработанный для промышленной пропускной способности, и YOLOv9, который представил новые архитектуры для преодоления информационных узких мест глубокого обучения.
Хотя обе модели предлагают уникальные архитектурные инновации, разработчики, ищущие оптимальный баланс производительности и простоты развертывания, часто переходят на современные экосистемы. Для тех, кто начинает новые проекты, рекомендуется использовать нативно сквозную (end-to-end) модель Ultralytics YOLO26, предлагающую передовую точность при значительно более оптимизированном опыте разработки.
Link to this sectionYOLOv6-3.0: Оптимизация промышленной пропускной способности#
Разработанная отделом Vision AI компании Meituan, модель YOLOv6-3.0 была тщательно спроектирована для обеспечения максимальной пропускной способности в промышленных приложениях, особенно на аппаратном обеспечении GPU.
- Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
- Организация: Meituan
- Дата: 13 января 2023 г.
- Arxiv: 2301.05586
- GitHub: meituan/YOLOv6
Link to this sectionАрхитектурные инновации#
YOLOv6-3.0 представила несколько ключевых модификаций для улучшения слияния признаков и эффективности оборудования. Архитектура включает модуль Bi-directional Concatenation (BiC) в своей шейной части, который обеспечивает более точные сигналы локализации. Она также использует стратегию Anchor-Aided Training (AAT). Этот подход сочетает в себе богатые подсказки обучения на основе анкоров со скоростью вывода парадигмы без анкоров, обеспечивая лучшую производительность без замедления развертывания.
Бэкбон основан на дизайне EfficientRep, тщательно оптимизированном для эффективной работы на GPU. Это делает модель высокоэффективной для сценариев промышленного производства, где нормой является интенсивная пакетная обработка.
Link to this sectionСильные и слабые стороны#
Основная сила YOLOv6-3.0 заключается в высокой частоте кадров на GPU, таких как NVIDIA T4, что делает её подходящей для потоков видеоаналитики высокой плотности. Однако её сильная зависимость от специфических аппаратных оптимизаций может привести к субоптимальной задержке на устройствах только с CPU. Кроме того, настройка конвейера обучения может быть сложной по сравнению с более унифицированными фреймворками.
Link to this sectionYOLOv9: программируемая градиентная информация#
Выпущенная годом позже, модель YOLOv9 фокусируется на решении проблемы информационного узкого места, присущей глубоким нейронным сетям, раздвигая теоретические границы архитектур CNN.
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Институт информационных наук, Academia Sinica
- Дата: 21 февраля 2024 г.
- Arxiv: 2402.13616
- GitHub: WongKinYiu/yolov9
Link to this sectionАрхитектурные инновации#
Главный вклад YOLOv9 — это Programmable Gradient Information (PGI), который гарантирует, что важные данные сохраняются при прохождении через множество слоев сети, позволяя проводить более надежные обновления весов. Наряду с PGI, модель оснащена Generalized Efficient Layer Aggregation Network (GELAN). GELAN максимизирует эффективность параметров, позволяя YOLOv9 достигать превосходной точности при меньшем количестве вычислительных FLOP, чем у многих предшественников.
Link to this sectionСильные и слабые стороны#
YOLOv9 достигает выдающейся mean Average Precision (mAP) на эталонных наборах данных, таких как COCO, что делает её фаворитом для исследователей, отдающих приоритет чистой точности. Однако, как и YOLOv6, она всё ещё полагается на традиционное подавление немаксимумов (NMS) для постобработки. Это увеличивает задержку и усложняет конвейер развертывания модели, особенно при переносе на граничные устройства с использованием форматов вроде ONNX или TensorRT.
Link to this sectionСравнение производительности#
При сравнении этих моделей важно обратить внимание на баланс точности, количества параметров и скорости вывода.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Link to this sectionПреимущество Ultralytics: представляем YOLO26#
Хотя YOLOv6-3.0 и YOLOv9 предоставляют надежные архитектуры, производственные среды требуют хорошо поддерживаемой экосистемы, низких требований к памяти и исключительной простоты использования. Именно здесь преуспевают платформа Ultralytics и такие модели, как YOLO11 и передовая YOLO26.
Выпущенная в начале 2026 года, YOLO26 фундаментально переопределяет эффективность развертывания, устраняя устаревшие узкие места.
YOLO26 оснащена сквозным (End-to-End) дизайном без NMS, полностью устраняющим необходимость в постобработке методом подавления немаксимумов. Это значительно снижает вариативность задержки вывода и упрощает логику развертывания на граничных устройствах.
Link to this sectionКлючевые инновации YOLO26#
- Оптимизатор MuSGD: Вдохновленная обучением LLM (например, Kimi K2 от Moonshot AI), YOLO26 использует гибрид SGD и Muon. Это обеспечивает непревзойденную стабильность обучения и более быструю сходимость для задач компьютерного зрения.
- До 43% более быстрый вывод на CPU: В отличие от YOLOv6, сфокусированной на GPU, YOLO26 сильно оптимизирована для граничных устройств. Удаление Distribution Focal Loss (DFL) упрощает голову сети, делая её совместимой с маломощными CPU и оборудованием для граничных вычислений.
- ProgLoss + STAL: Усовершенствованные функции потерь значительно улучшают обнаружение мелких объектов, что критически важно для аэрофотосъемки и робототехники.
- Непревзойденная универсальность: В то время как YOLOv6 — это чисто движок для обнаружения, YOLO26 плавно справляется с сегментацией экземпляров, классификацией, оценкой позы и обнаружением ориентированных ограничивающих рамок (OBB).
Link to this sectionБесшовное обучение с Ultralytics#
Обучение самых современных моделей не должно требовать сложных bash-скриптов. Python API Ultralytics обеспечивает оптимизированный опыт с автоматической загрузкой данных, минимальным использованием памяти CUDA и встроенным трекингом.
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train on the COCO8 dataset using the robust MuSGD optimizer natively
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export the trained model to ONNX with a single command
model.export(format="onnx")Link to this sectionИдеальные варианты использования#
Выбор правильной архитектуры полностью зависит от вашей целевой среды развертывания:
- Используй YOLOv6-3.0 для: автоматизации заводов и обнаружения дефектов, где в изобилии серверные GPU (например, A100) и где пакетная обработка максимизирует пропускную способность.
- Используй YOLOv9 для: академических исследований или соревнований, где основной целью является достижение максимально возможного mAP на стандартизированных наборах данных, таких как COCO.
- Use YOLO26 for: Almost all modern commercial applications. Its NMS-free architecture, low memory footprint, and high-speed CPU inference make it perfect for security alarm systems, smart retail, and real-time object tracking on embedded devices.
Используя комплексную экосистему Ultralytics, разработчики могут легко экспериментировать с YOLOv8, YOLO11 и YOLO26, чтобы найти идеальный баланс производительности для своих конкретных реальных задач.