Перейти к содержанию

YOLOv10 YOLOv8: достижения в области архитектуры обнаружения объектов в реальном времени

Область обнаружения объектов в реальном времени постоянно развивается, а новые архитектуры расширяют границы скорости, точности и эффективности. В этом техническом сравнении подробно рассматриваются YOLOv10, академического прорыва, направленного на устранение немаксимального подавления (NMS), и Ultralytics YOLOv8, надежной платформы, соответствующей отраслевым стандартам и предназначенной для решения различных задач в области машинного зрения.

Анализируя архитектурные различия, показатели производительности и методологии обучения, разработчики могут принимать обоснованные решения при выборе модели для приложений компьютерного зрения, от периферийного развертывания до высокопроизводительного облачного инференса.

Сравнение метрик производительности

В следующей таблице представлено подробное сравнение ключевых показателей производительности. Обратите внимание, что YOLOv10 конкурентоспособной задержки за счет удаления этапа NMS , в то время как YOLOv8 сбалансированный профиль, подходящий для более широкого спектра задач, выходящих за рамки простого обнаружения.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOv10: Пионер сквозных решений

YOLOv10 был представлен исследователями из Университета Цинхуа с основной целью устранения зависимости от немаксимального подавления (NMS) во время постобработки. Традиционные YOLO прогнозируют несколько ограничивающих рамок для одного объекта и полагаются на NMS отфильтровывания дубликатов. YOLOv10 последовательную стратегию двойного назначения во время обучения, что позволяет модели напрямую прогнозировать одну лучшую рамку для каждого объекта.

Архитектура и инновации

  • ОбучениеNMS: благодаря использованию двойных меток — «один ко многим» для тщательного контроля и «один к одному» для эффективного вывода —YOLOv10 задержку вывода, вызванную NMS.
  • Комплексный дизайн эффективности: архитектура включает в себя легкие классификационные головки и пространственно-канальное декуплированное понижающее дискретизирование для снижения вычислительных затрат (FLOP) без потери точности.
  • Свертки с большим ядром: целенаправленное использование сверток с большим ядром по глубине улучшает рецептивное поле, помогая в обнаружении небольших объектов.

Метаданные:

Узнайте больше о YOLOv10

Ultralytics YOLOv8: надежный отраслевой стандарт

Ultralytics YOLOv8 представляет собой зрелую, готовую к производству платформу, разработанную с учетом универсальности и простоты использования. Несмотря на то, что она использует стандартный NMS, ее высокооптимизированная архитектура и интеграция в Ultralytics делают ее предпочтительным выбором для разработчиков, которым требуется стабильность, поддержка многозадачности и беспроблемное развертывание.

Основные архитектурные преимущества

  • Единая структура: в отличие от многих академических моделей, ограниченных обнаружением, YOLOv8 поддерживает сегментацию экземпляров, оценку позы, OBB и классификацию в рамках одной кодовой базы.
  • Обнаружение без анкоров: отход от подходов, основанных на анкорах, для прямого прогнозирования центров объектов, упрощение процесса обучения и улучшение обобщения по различным наборам данных.
  • Мозаичное дополнение: усовершенствованное дополнение данных в режиме реального времени повышает устойчивость к заслонениям и изменяющимся условиям освещения.
  • Оптимизированная экосистема: пользователи получают преимущества от Ultralytics (ранее HUB) для управления наборами данных, обучения моделей и экспорта в форматы TensorRT, CoreML и ONNX одним щелчком мыши.

Метаданные:

Узнайте больше о YOLOv8

Будущее сквозного обнаружения

В то время как YOLOv10 в области обнаружения NMS, недавно выпущенный YOLO26 основан на этой технологии. YOLO26 является нативным сквозным решением, в котором устранены NMS Distribution Focal Loss (DFL), что позволяет ускорить CPU до 43 %. Он интегрирует оптимизатор MuSGD и функции ProgLoss, обеспечивая превосходную стабильность и обнаружение мелких объектов по сравнению с YOLOv8 YOLOv10.

Варианты использования и реальные применения

Выбор между этими моделями часто зависит от конкретных ограничений среды развертывания.

Идеальные сценарии для YOLOv10

YOLOv10 особенно хорошо YOLOv10 для приложений, в которых задержка постобработки является узким местом.

  • Анализ сцены с большим количеством объектов: в сценариях с плотными кластерами объектов, таких как обнаружение пешеходов, удаление NMS «пропуск» действительных обнаружений, которые значительно перекрываются.
  • Устройства с низким энергопотреблением: уменьшенное количество FLOP и параметров помогает в развертывании на устройствах с ограниченными вычислительными возможностями, таких как Raspberry Pi или Jetson Nano, где важна каждая миллисекунда обработки.

Идеальные сценарии для Ultralytics YOLOv8

YOLOv8 лучшим выбором для комплексных решений в области искусственного интеллекта, требующих надежности и многозадачности.

  • Комплексная промышленная инспекция: возможность сегментации позволяет точно обозначить дефекты, а не просто обвести их рамкой, что крайне важно для контроля качества в производстве.
  • Спортивная аналитика: благодаря встроенной поддержке оценки позы YOLOv8 track движения track и ключевые точки скелета для биомеханического анализа.
  • Аналитика розничной торговли: мощные возможности отслеживания объектов, интегрированные в Ultralytics , делают его идеальным инструментом для мониторинга потока покупателей и запасов товаров.

Простота использования и экосистема

Одним из наиболее значительных преимуществ выбора Ultralytics , такой как YOLOv8 или более новая YOLO26), является окружающая экосистема.

  • Простой Python : разработчики могут загружать, обучать и развертывать модели с помощью всего нескольких строк кода.

    from ultralytics import YOLO
    
    # Load a model
    model = YOLO("yolov8n.pt")
    
    # Train
    model.train(data="coco8.yaml", epochs=100)
    
  • Обширная документация: в документации Ultralytics представлены подробные руководства по всем вопросам, от настройки гиперпараметров до экспорта моделей для iOS Android.

  • Эффективность использования памяти: Ultralytics оптимизированы для более низкого использования CUDA во время обучения по сравнению со многими альтернативами на основе Transformer, такими как RT-DETR, что позволяет использовать более крупные пакеты данных на стандартных потребительских графических процессорах.

Заключение

Обе архитектуры имеют свои преимущества. YOLOv10 является отличным академическим вкладом, демонстрирующим потенциал обнаружения NMS и обеспечивающим высокую эффективность для конкретных задач, связанных только с обнаружением.

Ultralytics YOLOv8 выделяется как универсальный и многофункциональный выбор, подкрепленный поддерживаемой экосистемой, которая упрощает весь жизненный цикл машинного обучения. Он остается лучшим выбором для разработчиков, которым необходимо быстро перейти от прототипа к производству по целому ряду задач, включая сегментацию и оценку позы.

Для тех, кто ищет абсолютную новейшую производительность, YOLO26 является лучшим выбором. Он сочетает в себе преимущества YOLOv10 , такие как сквозное решение NMS YOLOv10 надежностью, поддержкой многозадачности и простотой использования Ultralytics . Благодаря инновациям, таким как оптимизатор MuSGD и усовершенствованные функции потери, YOLO26 обеспечивает современный баланс скорости и точности для 2026 года.

Дополнительная литература


Комментарии