Перейти к содержанию

Ultralytics YOLOv8 YOLOv10: эволюция обнаружения в реальном времени

Область компьютерного зрения развивается стремительными темпами, а новые архитектуры постоянно переопределяют современное состояние техники. Двумя важными вехами в этой хронологии являются Ultralytics YOLOv8 и YOLOv10. Хотя обе модели происходят от легендарной линейки YOLO You Only Look Once), они представляют разные философии дизайна и интеграции экосистем.

В данном руководстве представлено подробное техническое сравнение, которое поможет исследователям и разработчикам выбрать подходящий инструмент для своих конкретных нужд, учитывая такие факторы, как зрелость экосистемы, универсальность задач и архитектурные инновации.

Резюме: какую модель выбрать?

Прежде чем углубиться в архитектуру, рассмотрим общие отличия:

  • Ultralytics YOLOv8 — это надежный «швейцарский нож» компьютерного зрения. Он является предпочтительным выбором для развертывания в предприятиях благодаря обширной экосистеме, поддержке нескольких задач (обнаружение, сегментация, поза, OBB, классификация) и бесшовной интеграции с Ultralytics .
  • YOLOv10 — это специализированная модель обнаружения, которая представила миру обучение NMS. Она отлично подходит для исследований и конкретных сценариев, где основной целью является устранение постобработки.

Новейший стандарт: YOLO26

Хотя сравнение YOLOv8 YOLOv10 ценным, пользователи, которые ищут абсолютную лучшую производительность, должны обратить внимание на YOLO26. Выпущенная в январе 2026 года, YOLO26 объединяет в себе разработанную YOLOv10 конструкцию NMS YOLOv10 надежной экосистемой и многозадачной универсальностью Ultralytics. Она обеспечивает до 43 % более быстрое CPU и улучшенное обнаружение мелких объектов.

Ultralytics YOLOv8: Стандарт экосистемы

Выпущенная в начале 2023 года, YOLOv8 стала отраслевым стандартом для практического компьютерного зрения. Ее основная сила заключается не только в сырых показателях, но и в удобстве использования и универсальности.

Основные характеристики

Детали модели

Узнайте больше о YOLOv8

YOLOv10: пионер NMS

Разработанная исследователями из Университета Цинхуа, YOLOv10 особое внимание архитектурной эффективности и устранению узких мест в постобработке.

Основные инновации

  • Комплексное обучение: YOLOv10 последовательные двойные назначения, чтобы исключить необходимость в подавлении неактивных пиков (NMS) во время вывода. Это снижает изменчивость задержки в сценах с большим количеством объектов.
  • Комплексный дизайн эффективности: архитектура отличается легкими классификационными головками и пространственно-канальным декуплированным понижающим дискретизированием для снижения вычислительных затрат (FLOP).
  • Фокус: в первую очередь предназначен для задач обнаружения объектов.

Детали модели

Узнайте больше о YOLOv10

Техническое сравнение: метрики и производительность

В следующей таблице сравниваются результаты обеих моделей на наборе COCO .

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Анализ данных

  1. Точность против эффективности: YOLOv10 достигает более высокогоmAPval с меньшим количеством параметров и FLOP по сравнению с YOLOv8. Эта эффективность достигается за счет оптимизированных архитектурных блоков.
  2. Скорость вывода: хотя YOLOv10 NMS, YOLOv8 (особенно вариант Nano) остаются невероятно конкурентоспособными по сырой пропускной способности на стандартном оборудовании.
  3. Память для обучения: Ultralytics YOLOv8 высокоYOLOv8 для эффективности обучения, часто требуя меньше GPU , чем академические реализации, что позволяет использовать более крупные пакеты данных на потребительском оборудовании.

Архитектура и философия проектирования

Основное различие заключается в том, как эти модели обрабатывают окончательные прогнозы.

Архитектура YOLOv8

YOLOv8 Task-Aligned Assigner. Он отдельно прогнозирует границы рамок и оценки классов, но выравнивает их во время обучения. Важно, что он полагается на NMS для фильтрации дубликатов рамок. Это делает модель надежной и универсальной, позволяя легко адаптировать ее для сегментации и оценки позы.

Архитектура YOLOv10

YOLOv10 двойное присвоение меток. Во время обучения он использует головку «один ко многим» (как YOLOv8) для получения богатых сигналов контроля и головку «один к одному» для окончательного вывода. Такая структура позволяет модели научиться выбирать единственную лучшую рамку для объекта, делая NMS .

Последствия развертывания

Удаление NMS значительно NMS процесс развертывания. При экспорте моделей в такие форматы, как TensorRT или OpenVINOинженерам больше не нужно реализовывать сложные NMS , что снижает инженерные затраты.

Простота использования и экосистема

Именно здесь различие становится наиболее важным для разработчиков.

Ultralytics YOLOv8 поддерживается огромным, активным сообществом разработчиков открытого ПО. Его преимущества:

YOLOv10, хотя и доступен через Ultralytics , в первую очередь является академическим вкладом. Он может не получать такое же частое обслуживание или расширение функций (например, отслеживание или поддержка OBB), как основные Ultralytics .

Сравнение кода

Обе модели могут запускаться с помощью унифицированного Ultralytics , что демонстрирует простоту использования, обеспечиваемую экосистемой.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model (Official Ultralytics)
model_v8 = YOLO("yolov8n.pt")

# Load a pretrained YOLOv10 model (Community supported)
model_v10 = YOLO("yolov10n.pt")

# Train YOLOv8 on a custom dataset
model_v8.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference with YOLOv10 on an image
results = model_v10("https://ultralytics.com/images/bus.jpg")

Приложения в реальном мире

Когда использовать YOLOv8

  • Сложная робототехника: если вашему роботу необходимо ориентироваться (обнаружение) и манипулировать объектами (поза/сегментация), многозадачные возможности YOLOv8 являются незаменимыми.
  • Коммерческие продукты: для продуктов, требующих долгосрочного обслуживания, стабильность Ultralytics гарантирует, что ваша модель будет оставаться жизнеспособной в течение многих лет.
  • Спутниковые изображения: Специализированные модели OBB в YOLOv8 идеально YOLOv8 для обнаружения повернутых объектов, таких как корабли или транспортные средства, на аэрофотоснимках.

Когда использовать YOLOv10

  • Высокочастотная торговля визуальными данными: в сценариях, где важна каждая микросекунда задержки, исключение NMS обеспечивает детерминированное время вывода.
  • Встроенные устройства с ограниченным CPU: для устройств, в которых NMS на CPU узким местом, сквозной дизайн YOLOv10 разгружает процессор.

Заключение

Обе архитектуры являются отличным выбором. YOLOv8 остается универсальным лидером для большинства разработчиков, предлагая безопасный, надежный и многофункциональный путь к производству. YOLOv10 предлагает увлекательный взгляд в будущее обнаружения NMS.

Однако в этой области уже произошли изменения. Для разработчиков, начинающих сегодня новые проекты, YOLO26 является рекомендуемым выбором. Он использует преимущества YOLOv10 , NMS, YOLOv10 усовершенствует их с помощью оптимизатора MuSGD и улучшенных функций потерь (ProgLoss), обеспечивая лучшее из обоих миров: передовую архитектуру академических исследований, подкрепленную промышленной поддержкой Ultralytics.

Дополнительная литература


Комментарии