Перейти к содержанию

YOLOv10 YOLOv6.0: сравнение систем обнаружения объектов в реальном времени нового поколения

В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха. Две известные архитектуры, YOLOv10 и YOLOv6.YOLOv6, добились значительных успехов в обеспечении баланса между скоростью и точностью. В этом подробном сравнении рассматриваются их архитектурные инновации, показатели производительности и идеальные варианты использования, чтобы помочь вам решить, какая модель лучше всего подходит для ваших потребностей.

Обе модели предлагают надежные решения для промышленного и научного применения, а Ultralytics предоставляет единую платформу для простого обучения, валидации и внедрения этих архитектур. Независимо от того, занимаетесь ли вы созданием инфраструктуры «умного города» или оптимизацией производственных линий, понимание нюансов этих моделей имеет ключевое значение.

Сравнение метрик производительности

В следующей таблице представлены результаты работы YOLOv10 YOLOv6. YOLOv6 для различных масштабов моделей. Обе модели оцениваются на COCO с акцентом на среднюю точность (mAP) и задержку вывода на стандартном оборудовании.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10: Сквозной инноватор

YOLOv10, представленный исследователями из Университета Цинхуа, представляет собой сдвиг парадигмы в YOLO . Его наиболее отличительной особенностью является устранение немаксимального подавления (NMS) во время постобработки, достигаемое за счет последовательной стратегии двойного назначения. Такая конструкция позволяет осуществлять полноценное сквозное обучение и развертывание, что значительно снижает изменчивость задержки в реальных приложениях.

Ключевые архитектурные особенности

  • ОбучениеNMS: благодаря использованию двойных меток — «один ко многим» для тщательного контроля и «один к одному» для эффективного вывода —YOLOv10 вычислительный «узкий проход» NMS.
  • Комплексный дизайн эффективности: архитектура отличается легкой классификационной головкой и пространственно-канальным декуплированным понижающим дискретизированием, что оптимизирует как количество параметров, так и FLOP.
  • Ранжированный блок-дизайн: чтобы уменьшить избыточность, YOLOv10 ранжированный блок-дизайн, который адаптирует сложность в зависимости от этапа сети.

Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
Организация:Университет Цинхуа
Дата: 23 мая 2024 г.
Ссылки:arXiv | GitHub | Документы

Узнайте больше о YOLOv10

YOLOv6-3.0: Промышленный тяжеловес

YOLOv6.YOLOv6, разработанный Meituan, в значительной степени ориентирован на промышленные сценарии применения, где пропускная способность специализированного оборудования (например, графических процессоров) имеет первостепенное значение. В нем представлено обновление «Reloading», которое совершенствует сеть для повышения точности и производительности квантования.

Ключевые архитектурные особенности

  • Двунаправленное соединение (BiC): новый модуль в шее, который повышает точность локализации за счет более эффективного объединения характеристик из разных масштабов.
  • Обучение с помощью якорей (AAT): эта стратегия позволяет модели использовать стабильность оптимизации на основе якорей, сохраняя при этом архитектуру без якорей для вывода.
  • Поддержка квантования: архитектура специально разработана для минимизации потери точности при квантовании до INT8, что делает ее идеальной для периферийных устройств, использующих TensorRT.

Авторы: Чуй Ли, Лулу Ли, Ифэй Гэн и др.
Организация:Meituan
Дата: 13 января 2023 г.
Ссылки:arXiv | GitHub | Документы

Узнайте больше о YOLOv6

Сравнительный анализ

1. Задержка и эффективность

YOLOv10 превосходит YOLOv6. YOLOv6 по эффективности параметров и FLOP. Например, модель YOLOv10s достигает более высокого mAP 46,3% против 45,0%) со значительно меньшим количеством параметров (7,2 млн против 18,5 млн) по сравнению с YOLOv6.YOLOv6. Удаление NMS YOLOv10 снижению и большей предсказуемости задержки, особенно на CPU, где накладные расходы на постобработку значительны. И наоборот, YOLOv6. YOLOv6 высоко оптимизирован для GPU , часто демонстрируя преимущества в скорости в сценариях с большими партиями на GPU T4.

2. Развертывание и простота использования

Обе модели поддерживаются Ultralytics , что обеспечивает разработчикам доступ к ним через унифицированный API. Однако нативная сквозная природа YOLOv10 упрощает экспорт в такие форматы, как ONNX и CoreML, поскольку нет необходимости добавлять сложные NMS к графу модели.

Совет по развертыванию

При развертывании на периферийных устройствах, таких как Raspberry Pi или NVIDIA , меньшее количество параметров YOLOv10 и конструкция NMS обычно приводят к меньшему потреблению памяти и более быстрому запуску по сравнению со старыми архитектурами.

3. Методика обучения

YOLOv6.YOLOv6 использует такие методы, как самодистилляция и обучение с помощью якорей, для повышения производительности, что может увеличить время обучения и использование памяти. YOLOv10 последовательные двойные назначения, которые оптимизируют расчет потерь и обеспечивают эффективную конвергенцию. Пользователи, использующие Ultralytics Platform может обучать обе модели, не беспокоясь об этих внутренних сложностях, благодаря абстрагированному model.train() интерфейс.

Преимущество Ultralytics

Выбор модели в Ultralytics гарантирует опыт «от нуля до героя». В отличие от автономных репозиториев, в которых может отсутствовать документация или обслуживание, Ultralytics обладают следующими преимуществами:

  • Единый API: переключайтесь между YOLOv10, YOLOv6 и другими, изменив одну строку в коде.
  • Универсальность задач: в то время как YOLOv10 YOLOv6 в основном YOLOv6 детекторами, Ultralytics оценку позы, сегментацию экземпляров и классификацию во всех своих основных моделях.
  • Надежный экспорт: беспрепятственный экспорт моделей в TensorRT, OpenVINO и TFLite развертывания в производственной среде.
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

Гарантия будущего с YOLO26

Хотя YOLOv10 YOLOv6. YOLOv6 являются отличным выбором, в этой области продолжаются активные разработки. Для разработчиков, стремящихся к абсолютному передовому уровню, YOLO26 основан на прорывной технологии YOLOv10 NMS, YOLOv10 включает важные усовершенствования для оборудования 2026 года.

Почему стоит перейти на YOLO26?

  • End-to-End Native: Как и YOLOv10, YOLO26 NMS использует NMS, что обеспечивает максимально простой процесс развертывания.
  • MuSGD Optimizer: вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную конвергенцию и снижает необходимость в обширной настройке гиперпараметров.
  • Edge-First Design: благодаря удалению Distribution Focal Loss (DFL) и оптимизированным блокам YOLO26 обеспечивает на 43 % более быстрое CPU , что делает его лучшим выбором для мобильных приложений и приложений IoT.
  • Специфичность задач: в отличие от своих предшественников, YOLO26 включает в себя специализированные функции потерь, такие как ProgLoss и STAL, улучшая обнаружение небольших объектов и обеспечивая встроенную поддержку задач OBB и Pose.

Узнайте больше о YOLO26

Заключение

YOLOv10 — рекомендуемый вариант для пользователей, для которых приоритетными являются эффективность параметров и простые конвейеры развертывания от начала до конца. Его способность обеспечивать высокую точность с меньшим количеством FLOP делает его идеальным для приложений реального времени на различном оборудовании.

YOLOv6.0 остается сильным конкурентом для промышленных установок со специальной GPU , где можно в полной мере использовать его специальные оптимизации для TensorRT .

Для тех, кому требуется максимальная производительность, универсальность при выполнении различных задач (сегментация, поза, OBB) и перспективная поддержка, YOLO26 является окончательной рекомендацией от Ultralytics.

Дополнительная литература


Комментарии