Link to this sectionYOLOv10 против YOLOv9#
Эволюция компьютерного зрения в реальном времени характеризуется постоянными прорывами в скорости, точности и эффективности архитектуры. При оценке современных решений для твоего следующего развертывания сравнение YOLOv10 и YOLOv9 дает захватывающий взгляд на два различных подхода к решению проблем глубокого обучения. В то время как YOLOv9 фокусируется на максимизации потока градиентной информации во время обучения, YOLOv10 является пионером в нативном сквозном (end-to-end) дизайне, который полностью устраняет традиционные барьеры постобработки.
В этом подробном руководстве анализируются их архитектурные инновации, показатели производительности и идеальные сценарии использования, чтобы помочь разработчикам и исследователям выбрать оптимальную модель для их конкретных задач компьютерного зрения.
Link to this sectionYOLOv10: Пионер сквозного проектирования без NMS#
Разработанная для устранения проблем с задержкой, характерных для традиционных детекторов объектов, YOLOv10 представляет революционную сквозную архитектуру, которая нативно устраняет необходимость в немаксимальном подавлении (NMS).
Технические детали и происхождение:
- Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
- Организация: Университет Цинхуа
- Дата: 23 мая 2024 г.
- Ссылки: Публикация на Arxiv, Репозиторий GitHub, Документация Ultralytics
Link to this sectionАрхитектура и преимущества#
Наиболее значительный вклад YOLOv10 в эту область — это стратегия согласованного двойного присвоения для обучения без NMS. Устраняя NMS, модель резко снижает задержку вывода, особенно на периферийных устройствах (edge devices), где постобработка может стать «узким местом» всего конвейера. Она оптимизирует различные компоненты с точки зрения эффективности и точности, в результате чего модель демонстрирует впечатляющий баланс между скоростью и параметрами. Например, вариант YOLOv10-S исключительно быстр, что делает его крайне подходящим для высокоскоростной видеоаналитики и навигации роботов в реальном времени.
Link to this sectionСлабые стороны#
Хотя дизайн без NMS является прорывным для детекции ограничивающих рамок (BBox), YOLOv10 в первую очередь оптимизирована как чистый детектор объектов. Ей не хватает универсальности новых экосистем, которые нативно поддерживают сегментацию экземпляров или оценку позы. Кроме того, ранние реализации требовали тщательной обработки экспорта, чтобы гарантировать, что такие операции, как cv2, были полностью оптимизированы вне графа вывода.
При подготовке YOLOv10 к работе в продакшене всегда убедись, что ты экспортируешь модель в оптимизированные форматы, такие как TensorRT или ONNX. Запуск «сырых» весов PyTorch при развертывании может привести к более медленному, чем ожидалось, выводу из-за неоптимизированных операций в графе.
Link to this sectionYOLOv9: программируемая градиентная информация#
До появления YOLOv10 модель YOLOv9 представила новые архитектурные концепции для решения проблемы «узкого места» информации, присущей глубоким нейронным сетям, что позволило добиться высокоэффективного использования параметров.
Технические детали и происхождение:
- Авторы: Chien-Yao Wang и Hong-Yuan Mark Liao
- Организация: Институт информатики, Academia Sinica, Тайвань
- Дата: 21 февраля 2024 г.
- Ссылки: Публикация на Arxiv, Репозиторий GitHub, Документация Ultralytics
Link to this sectionАрхитектура и преимущества#
YOLOv9 представляет программируемую градиентную информацию (PGI) наряду с сетью агрегирования обобщенных эффективных слоев (GELAN). PGI гарантирует, что важная целевая информация не будет потеряна по мере прохождения данных через глубокие слои сети, генерируя надежные градиенты для обновления весов. GELAN максимизирует эффективность параметров сети. Вместе эти инновации позволяют YOLOv9 достигать невероятно высокого среднего значения точности (mAP) на наборе данных MS COCO, часто превосходя более тяжелые модели при использовании меньшего количества FLOPs. Это исключительная модель для исследователей, сосредоточенных на максимизации теоретических метрик точности.
Link to this sectionСлабые стороны#
Несмотря на высокую точность, YOLOv9 по-прежнему полагается на стандартную постобработку NMS. Это означает, что хотя нейросетевые операции выполняются быстро, финальная фильтрация ограничивающих рамок может привносить переменную задержку в зависимости от плотности объектов в сцене. Кроме того, процесс обучения может быть очень требовательным к памяти по сравнению с более поздними моделями, что требует более надежных ресурсов GPU для дообучения на пользовательских наборах данных.
Link to this sectionСравнение производительности#
В таблице ниже показаны основные метрики для обеих моделей. Заметь, как YOLOv10 обычно достигает меньшей задержки через TensorRT, в то время как YOLOv9 достигает пределов точности в своей самой крупной конфигурации.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
Link to this sectionСледующее поколение: почему YOLO26 — наша главная рекомендация#
Хотя YOLOv9 и YOLOv10 — впечатляющие вехи, область машинного обучения развивается быстро. Для современных продакшен-сред разработчики все чаще полагаются на интегрированную, хорошо поддерживаемую экосистему Ultralytics Platform. По состоянию на 2026 год, очевидной рекомендацией как для исследований, так и для корпоративных задач является недавно выпущенная YOLO26.
YOLO26 берет фундаментальные концепции своих предшественников и улучшает их за счет оптимизированного пользовательского опыта, простого API и значительно меньших требований к памяти во время обучения по сравнению с громоздкими архитектурами на базе Transformer.
Link to this sectionКлючевые инновации в YOLO26#
- Сквозной дизайн без NMS: Основываясь на прорывах YOLOv10, YOLO26 является нативно сквозной моделью, полностью исключающей постобработку NMS для более простого развертывания и обеспечения высокой детерминированности задержек.
- До 43% быстрее вывод на CPU: Оптимизирована для Edge AI «из коробки», что делает её идеальным выбором для встроенных систем, лишенных выделенных GPU.
- Оптимизатор MuSGD: Революционный гибрид SGD и Muon (вдохновленный методами оптимизации больших языковых моделей), обеспечивающий крайне стабильные процессы обучения и невероятно быстрое время сходимости.
- Удаление DFL: Удалив Distribution Focal Loss, YOLO26 упрощает процесс экспорта модели, значительно улучшая совместимость с маломощными устройствами и различными фреймворками для развертывания на периферии.
- Улучшения для конкретных задач: В отличие от специализированных детекторов для одной задачи, YOLO26 — это универсальная мощная модель. Она использует функцию потерь для семантической сегментации для уточненной точности на уровне пикселей, Residual Log-Likelihood Estimation (RLE) для безупречной оценки позы и специализированную функцию потерь по углу для решения проблем границ OBB (Oriented Bounding Box).
Выбор модели Ultralytics, такой как YOLO11 или YOLO26, обеспечивает непревзойденную простоту использования. Ты получаешь доступ к активной разработке, процветающему сообществу и частым обновлениям, которые гарантируют, что твои модели останутся совместимыми с новейшими движками вывода, такими как OpenVINO и CoreML.
Link to this sectionПрактическая реализация#
Обучение и развертывание этих моделей просты при использовании Python SDK. Следующий пример демонстрирует, как использовать преимущества высокоэффективных процессов обучения экосистемы Ultralytics, которая автоматически обрабатывает планирование гиперпараметров и оптимальное распределение памяти.
from ultralytics import YOLO
# Load the recommended state-of-the-art model
model = YOLO("yolo26n.pt") # Also compatible with 'yolov10n.pt' or 'yolov9c.pt'
# Train the model efficiently on a custom dataset
train_results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0, batch=16)
# Run ultra-fast inference
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for simplified edge deployment
model.export(format="onnx")Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOv10 и YOLOv9 зависит от требований твоего конкретного проекта, ограничений развертывания и предпочтений в отношении экосистемы.
Link to this sectionКогда стоит выбрать YOLOv10#
YOLOv10 — отличный выбор для:
- Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
- Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
- Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.
Link to this sectionКогда стоит выбрать YOLOv9#
YOLOv9 рекомендуется для:
- Исследований информационных узких мест: Академические проекты по изучению архитектур Programmable Gradient Information (PGI) и Generalized Efficient Layer Aggregation Network (GELAN).
- Изучения оптимизации потока градиентов: Исследования, направленные на понимание и смягчение потери информации в глубоких слоях сети во время обучения.
- Бенчмаркинга обнаружения высокой точности: Сценарии, где высокие показатели производительности YOLOv9 в бенчмарке COCO необходимы в качестве точки отсчета для архитектурных сравнений.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionЗаключение#
И YOLOv9, и YOLOv10 предлагают уникальные преимущества. YOLOv9 — это свидетельство максимизации эффективности параметров сети и теоретического потока градиентов, что приводит к топовой точности. В то же время YOLOv10 выступает в качестве академического пионера сквозной детекции ограничивающих рамок без штрафа за задержку, связанного с NMS.
Однако для разработчиков, ищущих идеальный баланс производительности, универсальности и простоты использования, обновление до новейших моделей имеет первостепенное значение. Благодаря передовому оптимизатору MuSGD, функциональности ProgLoss + STAL для превосходного обнаружения мелких объектов и комплексной поддержке многозадачности, YOLO26 представляет собой окончательное современное решение для любой задачи компьютерного зрения в реальном мире.