Link to this sectionYOLOv9 против YOLOv6-3.0#
Эволюция обнаружения объектов в реальном времени обусловлена постоянными инновациями в архитектурах нейронных сетей, оптимизирующими тонкий баланс между скоростью вывода, точностью и вычислительной эффективностью. Поскольку разработчики и исследователи ориентируются в насыщенной среде фреймворков компьютерного зрения, сравнение ведущих архитектур необходимо для выбора подходящего инструмента для поставленной задачи.
Это техническое руководство содержит углубленное сравнение двух высокопроизводительных моделей: YOLOv9, известной своим глубоким сохранением информации при обучении, и YOLOv6-3.0, модели, специально разработанной для промышленных приложений.
Link to this sectionОбзор YOLOv9: Максимизация сохранения признаков#
Представленная в начале 2024 года модель YOLOv9 решает одну из самых устойчивых проблем глубоких нейронных сетей: потерю информации во время процесса прямого прохода. Обеспечивая надежность градиентов и сохранение критически важных данных в картах признаков, она расширяет границы теоретической точности.
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Институт информатики, Academia Sinica, Тайвань
- Дата: 21 февраля 2024 г.
- Ссылки: Статья на Arxiv, Репозиторий на GitHub
Link to this sectionАрхитектура и методологии#
YOLOv9 представляет концепцию программируемой градиентной информации (PGI) наряду с Generalized Efficient Layer Aggregation Network (GELAN). PGI решает проблему информационного «узкого места», предоставляя вспомогательный надзор, который гарантирует, что основная сеть изучает надежные признаки без увеличения нагрузки на этапе вывода. Тем временем, GELAN оптимизирует использование параметров, позволяя модели достигать передовой средней точности (mAP) при сохранении вычислительных затрат на приемлемом уровне. Это делает её исключительным выбором для медицинского анализа изображений или обнаружения чрезвычайно малых объектов, где важна точность передачи признаков.
Link to this sectionОбзор YOLOv6-3.0: Создана для промышленного масштаба#
Разработанная компанией Meituan, модель YOLOv6-3.0 (также известная как v3.0) была спроектирована с нуля для обслуживания сложных промышленных задач. Выпущенная в начале 2023 года, она в значительной степени ориентирована на эффективность развертывания, предлагая набор моделей, адаптированных к квантованию и отлично работающих на граничном (edge) оборудовании.
- Авторы: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu и Xiangxiang Chu
- Организация: Meituan
- Дата: 13 января 2023 г.
- Ссылки: Статья на Arxiv, Репозиторий на GitHub
Link to this sectionАрхитектура и методологии#
YOLOv6-3.0 выделяется своими стратегиями RepOptimizer и Anchor-Aided Training (AAT). Модель использует аппаратную архитектуру нейронной сети, вдохновленную RepVGG, что позволяет ей работать исключительно быстро на графических процессорах во время вывода за счет объединения слоев. Обновление 3.0 дополнительно усовершенствовало архитектуру, внедрив модуль двунаправленной конкатенации (BiC) для повышения точности локализации. Поскольку модель оптимизирована для форматов развертывания, таких как TensorRT и OpenVINO, YOLOv6-3.0 часто используется в логистике, автоматизации производства и высоконагруженных серверных средах.
Link to this sectionСравнение производительности#
При оценке этих моделей на стандартном наборе данных COCO можно заметить явные компромиссы между точностью и скоростью прямого вывода.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
Link to this sectionТехнический анализ#
Хотя YOLOv6-3.0n является лидером по скорости на оборудовании T4 (1.17 мс), YOLOv9t удается достичь чуть более высокого mAP (38.3%), используя менее половины параметров (2.0 млн против 4.7 млн) и значительно меньше FLOPs. Для комплексных задач, требующих высокой точности, массивная модель YOLOv9e повышает точность до 55.6% mAP, демонстрируя мощь архитектуры PGI в глубоких сетях.
Если ты начинаешь новую инициативу в области компьютерного зрения, мы настоятельно рекомендуем использовать YOLO26. Выпущенная в 2026 году, она обладает нативной End-to-End NMS-Free архитектурой, которая полностью устраняет задержку постобработки, обеспечивая до 43% более быстрый вывод на CPU.
Link to this sectionПреимущества экосистемы Ultralytics#
Независимо от того, какая архитектурная философия модели тебе ближе, их нативная реализация через Ultralytics Python API обеспечивает превосходный опыт разработки.
Link to this sectionПростота использования и эффективность обучения#
Обучение сложных моделей глубокого обучения традиционно требует огромного количества шаблонного кода. Платформа Ultralytics абстрагирует эту сложность. Будь то дообучение YOLOv9 для обнаружения дефектов или экспорт YOLOv6 для мобильных приложений, рабочий процесс остается удивительно последовательным.
Кроме того, архитектуры Ultralytics, как правило, требуют меньше памяти CUDA во время обучения по сравнению с громоздкими моделями на основе Transformer. Это позволяет разработчикам использовать большие размеры пакетов (batch sizes) на потребительских GPU, значительно повышая эффективность обучения.
from ultralytics import YOLO
# Easily swap architectures by changing the weights file string
# model = YOLO("yolov6n.pt")
model = YOLO("yolov9c.pt")
# Train the model with built-in data augmentation and caching
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device="0")
# Export to ONNX or TensorRT seamlessly
model.export(format="engine", quantize=16)Link to this sectionНепревзойденная универсальность для различных задач#
Хотя YOLOv6-3.0 сильно оптимизирована для быстрого формирования ограничивающих рамок, современные проекты компьютерного зрения часто требуют многозадачного подхода. Модели Ultralytics славятся своей исключительной универсальностью. Благодаря таким инструментам, как Ultralytics YOLOv8 и новая YOLO26, один фреймворк легко справляется с обнаружением объектов, сегментацией экземпляров, классификацией изображений, оценкой позы и ориентированными ограничивающими рамками (OBB).
Link to this sectionПредставляем YOLO26: Новый стандарт#
Для организаций, стремящихся максимизировать как производительность, так и простоту развертывания, YOLO26 представляет собой идеальное сочетание скорости и точности.
Основываясь на успехах YOLO11, YOLO26 представляет несколько меняющих парадигму функций:
- Оптимизатор MuSGD: Вдохновленный методами обучения больших языковых моделей (LLM), такими как Kimi K2 от Moonshot AI, этот гибридный оптимизатор обеспечивает невероятно стабильное обучение и быструю сходимость.
- Удаление DFL: Убрав Distribution Focal Loss, YOLO26 упрощает граф экспорта, делая его значительно более совместимым с маломощными чипами для edge computing.
- ProgLoss + STAL: Эти продвинутые функции потерь дают заметные улучшения в распознавании мелких объектов, что критически важно для операций с дронами и IoT-приложений.
- Улучшения для конкретных задач: YOLO26 включает нативное многомасштабное прототипирование для сегментации, оценку остаточного логарифмического правдоподобия (RLE) для скелетного трекинга и специализированные алгоритмы угловых потерь для решения граничных случаев при обнаружении OBB.
Link to this sectionИдеальные сценарии развертывания#
Выбор правильной архитектуры в конечном итоге сводится к твоим производственным ограничениям.
Выбирай YOLOv6-3.0, если у тебя есть налаженный конвейер в промышленном производстве, ты активно полагаешься на квантование и используешь специализированные ускорители вывода, где требуется минимальная аппаратная задержка в субмиллисекундном диапазоне.
Выбирай YOLOv9, если ты занимаешься комплексной медицинской диагностикой или наблюдением на больших расстояниях, где пропуск мелких, пиксельных признаков недопустим.
Тем не менее, для идеально сбалансированного подхода, который предлагает передовую точность наряду с упрощенным развертыванием без NMS, Ultralytics YOLO26 является окончательной рекомендацией для современной инженерии компьютерного зрения. Её активный цикл разработки, исчерпывающая документация и активная поддержка сообщества делают её незаменимым инструментом как для исследователей, так и для разработчиков.