YOLOv10 YOLOv6.0: сравнение систем обнаружения объектов в реальном времени нового поколения
В быстро развивающейся области компьютерного зрения выбор правильной модели обнаружения объектов имеет решающее значение для успеха. Две известные архитектуры, YOLOv10 и YOLOv6.YOLOv6, добились значительных успехов в обеспечении баланса между скоростью и точностью. В этом подробном сравнении рассматриваются их архитектурные инновации, показатели производительности и идеальные варианты использования, чтобы помочь вам решить, какая модель лучше всего подходит для ваших потребностей.
Обе модели предлагают надежные решения для промышленного и научного применения, а Ultralytics предоставляет единую платформу для простого обучения, валидации и внедрения этих архитектур. Независимо от того, занимаетесь ли вы созданием инфраструктуры «умного города» или оптимизацией производственных линий, понимание нюансов этих моделей имеет ключевое значение.
Сравнение метрик производительности
В следующей таблице представлены результаты работы YOLOv10 YOLOv6. YOLOv6 для различных масштабов моделей. Обе модели оцениваются на COCO с акцентом на среднюю точность (mAP) и задержку вывода на стандартном оборудовании.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLOv6-3.0n | 640 | 37.5 | - | 1.17 | 4.7 | 11.4 |
| YOLOv6-3.0s | 640 | 45.0 | - | 2.66 | 18.5 | 45.3 |
| YOLOv6-3.0m | 640 | 50.0 | - | 5.28 | 34.9 | 85.8 |
| YOLOv6-3.0l | 640 | 52.8 | - | 8.95 | 59.6 | 150.7 |
YOLOv10: Сквозной инноватор
YOLOv10, представленный исследователями из Университета Цинхуа, представляет собой сдвиг парадигмы в YOLO . Его наиболее отличительной особенностью является устранение немаксимального подавления (NMS) во время постобработки, достигаемое за счет последовательной стратегии двойного назначения. Такая конструкция позволяет осуществлять полноценное сквозное обучение и развертывание, что значительно снижает изменчивость задержки в реальных приложениях.
Ключевые архитектурные особенности
- ОбучениеNMS: благодаря использованию двойных меток — «один ко многим» для тщательного контроля и «один к одному» для эффективного вывода —YOLOv10 вычислительный «узкий проход» NMS.
- Комплексный дизайн эффективности: архитектура отличается легкой классификационной головкой и пространственно-канальным декуплированным понижающим дискретизированием, что оптимизирует как количество параметров, так и FLOP.
- Ранжированный блок-дизайн: чтобы уменьшить избыточность, YOLOv10 ранжированный блок-дизайн, который адаптирует сложность в зависимости от этапа сети.
Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
Организация:Университет Цинхуа
Дата: 23 мая 2024 г.
Ссылки:arXiv | GitHub | Документы
YOLOv6-3.0: Промышленный тяжеловес
YOLOv6.YOLOv6, разработанный Meituan, в значительной степени ориентирован на промышленные сценарии применения, где пропускная способность специализированного оборудования (например, графических процессоров) имеет первостепенное значение. В нем представлено обновление «Reloading», которое совершенствует сеть для повышения точности и производительности квантования.
Ключевые архитектурные особенности
- Двунаправленное соединение (BiC): новый модуль в шее, который повышает точность локализации за счет более эффективного объединения характеристик из разных масштабов.
- Обучение с помощью якорей (AAT): эта стратегия позволяет модели использовать стабильность оптимизации на основе якорей, сохраняя при этом архитектуру без якорей для вывода.
- Поддержка квантования: архитектура специально разработана для минимизации потери точности при квантовании до INT8, что делает ее идеальной для периферийных устройств, использующих TensorRT.
Авторы: Чуй Ли, Лулу Ли, Ифэй Гэн и др.
Организация:Meituan
Дата: 13 января 2023 г.
Ссылки:arXiv | GitHub | Документы
Сравнительный анализ
1. Задержка и эффективность
YOLOv10 превосходит YOLOv6. YOLOv6 по эффективности параметров и FLOP. Например, модель YOLOv10s достигает более высокого mAP 46,3% против 45,0%) со значительно меньшим количеством параметров (7,2 млн против 18,5 млн) по сравнению с YOLOv6.YOLOv6. Удаление NMS YOLOv10 снижению и большей предсказуемости задержки, особенно на CPU, где накладные расходы на постобработку значительны. И наоборот, YOLOv6. YOLOv6 высоко оптимизирован для GPU , часто демонстрируя преимущества в скорости в сценариях с большими партиями на GPU T4.
2. Развертывание и простота использования
Обе модели поддерживаются Ultralytics , что обеспечивает разработчикам доступ к ним через унифицированный API. Однако нативная сквозная природа YOLOv10 упрощает экспорт в такие форматы, как ONNX и CoreML, поскольку нет необходимости добавлять сложные NMS к графу модели.
Совет по развертыванию
При развертывании на периферийных устройствах, таких как Raspberry Pi или NVIDIA , меньшее количество параметров YOLOv10 и конструкция NMS обычно приводят к меньшему потреблению памяти и более быстрому запуску по сравнению со старыми архитектурами.
3. Методика обучения
YOLOv6.YOLOv6 использует такие методы, как самодистилляция и обучение с помощью якорей, для повышения производительности, что может увеличить время обучения и использование памяти. YOLOv10 последовательные двойные назначения, которые оптимизируют расчет потерь и обеспечивают эффективную конвергенцию. Пользователи, использующие Ultralytics Platform может обучать обе модели, не беспокоясь об этих внутренних сложностях, благодаря абстрагированному model.train() интерфейс.
Преимущество Ultralytics
Выбор модели в Ultralytics гарантирует опыт «от нуля до героя». В отличие от автономных репозиториев, в которых может отсутствовать документация или обслуживание, Ultralytics обладают следующими преимуществами:
- Единый API: переключайтесь между YOLOv10, YOLOv6 и другими, изменив одну строку в коде.
- Универсальность задач: в то время как YOLOv10 YOLOv6 в основном YOLOv6 детекторами, Ultralytics оценку позы, сегментацию экземпляров и классификацию во всех своих основных моделях.
- Надежный экспорт: беспрепятственный экспорт моделей в TensorRT, OpenVINO и TFLite развертывания в производственной среде.
from ultralytics import YOLO
# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")
# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
Гарантия будущего с YOLO26
Хотя YOLOv10 YOLOv6. YOLOv6 являются отличным выбором, в этой области продолжаются активные разработки. Для разработчиков, стремящихся к абсолютному передовому уровню, YOLO26 основан на прорывной технологии YOLOv10 NMS, YOLOv10 включает важные усовершенствования для оборудования 2026 года.
Почему стоит перейти на YOLO26?
- End-to-End Native: Как и YOLOv10, YOLO26 NMS использует NMS, что обеспечивает максимально простой процесс развертывания.
- MuSGD Optimizer: вдохновленный обучением LLM, этот гибридный оптимизатор обеспечивает стабильную конвергенцию и снижает необходимость в обширной настройке гиперпараметров.
- Edge-First Design: благодаря удалению Distribution Focal Loss (DFL) и оптимизированным блокам YOLO26 обеспечивает на 43 % более быстрое CPU , что делает его лучшим выбором для мобильных приложений и приложений IoT.
- Специфичность задач: в отличие от своих предшественников, YOLO26 включает в себя специализированные функции потерь, такие как ProgLoss и STAL, улучшая обнаружение небольших объектов и обеспечивая встроенную поддержку задач OBB и Pose.
Заключение
YOLOv10 — рекомендуемый вариант для пользователей, для которых приоритетными являются эффективность параметров и простые конвейеры развертывания от начала до конца. Его способность обеспечивать высокую точность с меньшим количеством FLOP делает его идеальным для приложений реального времени на различном оборудовании.
YOLOv6.0 остается сильным конкурентом для промышленных установок со специальной GPU , где можно в полной мере использовать его специальные оптимизации для TensorRT .
Для тех, кому требуется максимальная производительность, универсальность при выполнении различных задач (сегментация, поза, OBB) и перспективная поддержка, YOLO26 является окончательной рекомендацией от Ultralytics.
Дополнительная литература
- Изучите возможности YOLO11, надежного предшественника YOLO26.
- Узнайте об основах обнаружения объектов в реальном времени.
- Понимание показателейYOLO , таких как mAP IoU.
- Ознакомьтесь с Руководством по обучению моделей, чтобы узнать о передовых методах.