Перейти к содержанию

YOLOv5 YOLOv10: техническое сравнение детекторов объектов в реальном времени

Эволюция архитектуры You Only Look Once (YOLO) стала определяющим событием в истории компьютерного зрения. Двумя важными вехами в этой истории являются YOLOv5, отраслевой стандарт надежности и простоты использования, и YOLOv10, академический прорыв, направленный на устранение узких мест в постобработке. В этом руководстве представлено подробное техническое сравнение, которое поможет разработчикам выбрать подходящий инструмент для своих приложений, а также рассмотрено, как новейшая версия YOLO26 объединяет преимущества обеих архитектур.

Происхождение модели и технические характеристики

Прежде чем приступить к рассмотрению показателей производительности, необходимо понять суть каждой модели.

YOLOv5
Автор: Гленн Джочер
Организация: Ultralytics
Дата: 26.06.2020
GitHub: yolov5
Документация: YOLOv5

YOLOv10
Авторы: Ao Wang, Hui Chen, Lihao Liu и др.
Организация: Университет Цинхуа
Дата: 23.05.2024
Arxiv: arXiv:2405.14458
GitHub: THU-MIG/yolov10
Документация: YOLOv10

Узнайте больше о YOLOv5

Анализ производительности

В следующей таблице представлено сравнение моделей на наборе COCO , стандартном тесте для обнаружения объектов.

Модельразмер
(пиксели)
mAPval
50-95
Скорость
CPU ONNX
(мс)
Скорость
T4 TensorRT10
(мс)
параметры
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLOv10 достигает более высокой средней точности (mAP) с меньшим количеством параметров, что подчеркивает повышение эффективности благодаря новой архитектуре. Однако YOLOv5 конкурентоспособным по скорости GPU , особенно на устаревшем оборудовании, благодаря высокооптимизированным CUDA .

Узнайте больше о YOLOv10

Архитектура и Дизайн

YOLOv5: надежный стандарт

YOLOv5 на модифицированной основе CSPNet и шее PANet. Он использует стандартные анкерные головки обнаружения, которые требуют не максимального подавления (NMS) во время постобработки для фильтрации дублирующихся ограничительных рамок.

  • Преимущества: чрезвычайно зрелая кодовая база, широкая поддержка сторонними инструментами и стабильное развертывание на периферийных устройствах, таких как Raspberry Pi.
  • Недостатки: зависит от NMS, что может привести к изменчивости задержки в зависимости от количества объектов в сцене.

YOLOv10: пионер NMS

YOLOv10 радикальные изменения, используя последовательные двойные назначения для обучения NMS. Это позволяет модели предсказывать ровно одну рамку на объект, устраняя необходимость в шагах NMS .

  • Преимущества: более низкая задержка вывода в сценах с высокой плотностью благодаря NMS ; эффективная конструкция блоков с ранжированием снижает избыточность вычислений.
  • Недостатки: новая архитектура может потребовать специальных настроек экспорта для некоторых компиляторов; меньшая историческая поддержка сообщества по сравнению с v5.

Узкое место NMS

Немаксимальное подавление (NMS) — это этап постобработки, который фильтрует перекрывающиеся ограничительные рамки. Несмотря на свою эффективность, этот процесс является последовательным и требует больших вычислительных ресурсов процессоров. Его удаление, как это сделано в YOLOv10 YOLO26, имеет решающее значение для приложений, работающих в режиме реального времени на периферийном оборудовании.

Экосистема и простота использования

Одним из наиболее важных факторов для разработчиков является экосистема, окружающая модель. Именно здесь становится очевидным различие между репозиторием для исследований и производственной платформой.

Преимущество Ultralytics

Обе модели могут быть запущены через ultralytics Python , предоставляющий им доступ к надежному набору инструментов.

Пример кода

Переключение между моделями так же просто, как изменение строки имени модели.

from ultralytics import YOLO

# Load a pre-trained YOLOv5 model
model_v5 = YOLO("yolov5s.pt")
model_v5.train(data="coco8.yaml", epochs=100)

# Load a pre-trained YOLOv10 model
model_v10 = YOLO("yolov10n.pt")
model_v10.predict("path/to/image.jpg")

Идеальные варианты использования

Когда выбирать YOLOv5

  • Устаревшие системы: если у вас уже есть конвейер, построенный на основе форматов YOLOv5 .
  • Широчайшая совместимость: для развертывания на старых встроенных системах, где новые операторы могут еще не поддерживаться.
  • Ресурсы сообщества: когда вам нужен доступ к тысячам учебных материалов и сторонних интеграций, созданных за последние пять лет.

Когда выбирать YOLOv10

  • Обнаружение высокой плотности: сценарии, такие как подсчет количества людей в толпе или анализ трафика, в которых NMS обработку.
  • Строгие ограничения по задержке: робототехника в реальном времени или автономное вождение, где важна каждая миллисекунда задержки вывода.
  • Исследования: эксперименты с новейшими достижениями в области стратегий назначения и архитектурной обрезки.

Лучшая рекомендация: YOLO26

В то время как YOLOv5 стабильность, а YOLOv10 вывод NMS, недавно выпущенная Ultralytics объединяет эти преимущества в единую, превосходную структуру.

Почему стоит перейти на YOLO26? YOLO26 изначально является сквозной системой, в которой используется разработанная YOLOv10 конструкцияNMS YOLOv10 усовершенствованная с помощью надежного конвейера Ultralytics .

  1. MuSGD Optimizer: вдохновленный обучением LLM (в частности, Kimi K2 от Moonshot AI), этот оптимизатор обеспечивает стабильную конвергенцию и более быстрое обучение.
  2. Производительность: оптимизирована для пограничных вычислений, обеспечивая до 43 % более быстрое CPU по сравнению с предыдущими поколениями.
  3. Точность: Оснащен функциями ProgLoss и STAL (Semantic-Token Alignment Loss), значительно улучшающими обнаружение мелких объектов, что часто является слабым местом в более ранних моделях.
  4. Полная универсальность: в отличие от YOLOv10 фокусируется на обнаружении, YOLO26 предлагает современные модели для сегментации, определения позы, классификации и OBB.

Для любого нового проекта, начинающегося в 2026 году, рекомендуется выбрать YOLO26, который предлагает самый простой путь от аннотирования набора данных до экспорта модели.

Узнайте больше о YOLO26

Заключение

Как YOLOv5 YOLOv10 поворотные моменты в компьютерном зрении. YOLOv5 сделал ИИ доступным и надежным, а YOLOv10 расширил технические границы сквозной обработки. Однако эта область развивается очень быстро. С выпуском YOLO26 разработчикам больше не нужно выбирать между надежностью Ultralytics и скоростью архитектур NMS — YOLO26 обеспечивает и то, и другое.

Что касается других современных альтернатив, вы также можете рассмотреть возможность изучения YOLO11 для задач общего назначения в области компьютерного зрения или Real-Time DETR (RT-DETR) для обнаружения на основе трансформаторов.


Комментарии