YOLOv5 против YOLOv10: Всестороннее техническое сравнение.
Область компьютерного зрения в реальном времени за последние несколько лет пережила экспоненциальный рост, при этом различные архитектуры расширяют границы возможного на современном оборудовании. При оценке передовых архитектур сравнение между YOLOv5 и YOLOv10 подчеркивает значительный эволюционный шаг в области обнаружения объектов. Этот технический анализ исследует их архитектурные парадигмы, компромиссы в производительности и то, как разработчики могут использовать эти инструменты в производственных средах.
Архитектурное Глубокое Погружение
Понимание структурных различий между этими моделями имеет решающее значение для их эффективного развертывания в реальных условиях.
Ultralytics YOLOv5: Промышленный стандарт
Представленный Ultralytics, YOLOv5 давно признан за его непревзойденный баланс скорости, точности и доступности.
- Автор: Гленн Йочер
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: Репозиторий YOLOv5
- Документация: Документация YOLOv5
YOLOv5 использует механизм detect на основе якорей в сочетании с глубоко оптимизированным backbone CSPDarknet. Эта архитектура сильно зависит от стандартных операций, поддерживаемых практически всеми движками вывода, что делает ее невероятно универсальной. Ее основная сила заключается в Ultralytics Python SDK, который обеспечивает оптимизированный пользовательский опыт, простой API и обширную документацию. Кроме того, более низкие требования YOLOv5 к памяти по сравнению с моделями на основе трансформеров означают, что он быстро обучается на потребительских GPU без значительных накладных расходов VRAM.
YOLOv10: Развивая парадигму
Разработанный исследователями Университета Цинхуа, YOLOv10 был направлен на устранение специфических узких мест задержки, обнаруженных в предыдущих архитектурах.
- Авторы: Ao Wang, Hui Chen, Lihao Liu и др.
- Организация: Tsinghua University
- Дата: 2024-05-23
- ArXiv: 2405.14458
- GitHub: Репозиторий YOLOv10
- Документация: Документация YOLOv10
Отличительной особенностью YOLOv10 является ее изначально безальтернативная NMS-архитектура (подавление немаксимумов). Используя согласованные двойные назначения во время обучения, модель устраняет необходимость в постобработке NMS во время инференса. Это теоретическое снижение задержки очень выгодно для развертываний, работающих на высокопроизводительном оборудовании с мощным ускорением NVIDIA TensorRT, хотя оно может внести структурные сложности для периферийных устройств.
Преимущество экосистемы
Хотя YOLOv10 предлагает интересные архитектурные новшества, модели Ultralytics, такие как YOLOv5 и более новая YOLO26, изначально поддерживаются в платформе Ultralytics, предлагая превосходную эффективность обучения, автоматическую эволюцию гиперпараметров и обширные возможности экспорта из коробки.
Анализ производительности
При сравнении этих моделей баланс между точностью (mAP) и вычислительными затратами (задержка и параметры) определяет оптимальный вариант использования. Ниже приведено сравнение технических характеристик на наборе данных COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv10 явно достигает более высокого mAP50-95 в эквивалентных масштабах размера, используя свою модернизированную модель, ориентированную на эффективность и точность. Однако YOLOv5 демонстрирует невероятно конкурентоспособную задержку, особенно на уровнях Nano и Small, что делает ее очень надежной для ограниченных встроенных сред, таких как NVIDIA Jetson стандартные CPU через OpenVINO.
Методологии обучения и экосистема
Ценность модели тесно связана с окружающей ее экосистемой. Ultralytics поддерживает исключительно хорошо развитую экосистему, которая обеспечивает широкий спектр задач. В то время как YOLOv10 строго ориентирован на 2D обнаружение объектов, Ultralytics изначально поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Кроме того, обучение модели Ultralytics требует значительно меньших накладных расходов на память по сравнению с конкурирующими методами на основе трансформеров, что обеспечивает быстрый и экономически эффективный цикл разработки.
Бесшовное выполнение кода
Обучение, валидация и экспорт моделей объединены в рамках единого API. Переключаться между моделями можно, просто изменив строку.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")
# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")
# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Automatically utilizes PyTorch CUDA acceleration
batch=16,
)
# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)
Сценарии использования и рекомендации
Выбор между YOLOv5 и YOLOv10 зависит от конкретных требований вашего проекта, ограничений развертывания и предпочтений экосистемы.
Когда выбирать YOLOv5
YOLOv5 является оптимальным выбором для:
- Проверенные производственные системы: Существующие развертывания, где ценятся долгий track-рекорд стабильности YOLOv5, обширная документация и массивная поддержка сообщества.
- Обучение с ограниченными ресурсами: Среды с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и низкие требования к памяти являются преимуществом.
- Обширная поддержка форматов экспорта: Проекты, требующие развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.
Когда выбирать YOLOv10
YOLOv10 рекомендуется для:
- Обнаружение в реальном времени без NMS: Приложения, выигрывающие от сквозного обнаружения без Non-Maximum Suppression, что снижает сложность развертывания.
- Сбалансированный компромисс между скоростью и точностью: Проекты, требующие оптимального баланса между скоростью инференса и точностью обнаружения для моделей различных масштабов.
- Приложения с предсказуемой задержкой: Сценарии развертывания, где критически важны предсказуемые времена инференса, например, в робототехнике или автономных системах.
Когда выбирать Ultralytics (YOLO26)
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и удобства для разработчиков:
- Развертывание на периферии без NMS: Приложения, требующие стабильного вывода с низкой задержкой без сложности постобработки методом Non-Maximum Suppression.
- Среды только с CPU: Устройства без выделенного ускорения GPU, где до 43% более быстрая инференция YOLO26 на CPU обеспечивает решающее преимущество.
- Обнаружение мелких объектов: Сложные сценарии, такие как аэрофотосъемка с дронов или анализ данных с IoT-датчиков, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Будущее: Ultralytics YOLO26
Хотя YOLOv5 произвела революцию в доступности, а YOLOv10 расширила границы NMS-free архитектуры, передовые технологии продолжают развиваться. Для новых проектов мы настоятельно рекомендуем передовую Ultralytics YOLO26, выпущенную в январе 2026 года.
YOLO26 объединяет надежность экосистемы Ultralytics с новаторскими достижениями:
- Сквозная архитектура без NMS: Интегрируя парадигму без NMS непосредственно в фреймворк Ultralytics, YOLO26 упрощает развертывание и гарантирует более низкую задержку.
- До 43% более быстрая инференция на CPU: Благодаря удалению Distribution Focal Loss (DFL) YOLO26 значительно быстрее на периферийных устройствах без GPU.
- Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM от Moonshot AI, оптимизатор MuSGD обеспечивает беспрецедентную стабильность и быструю сходимость.
- ProgLoss + STAL: Эти новые функции потерь значительно улучшают распознавание мелких объектов, что жизненно важно для таких областей, как изображения с дронов и робототехника.
Вы можете управлять, обучать и развертывать YOLO26 непосредственно через Ultralytics Platform.
Заключение
Выбор между YOLOv5 и YOLOv10 часто сводится к конкретным ограничениям проекта. YOLOv10 предлагает превосходный mAP для исследователей и приложений, использующих необработанную пропускную способность GPU. Напротив, YOLOv5 остается надежной, высокосовместимой рабочей лошадкой для стандартных развертываний.
Однако область компьютерного зрения динамична. Чтобы достичь наилучшего баланса производительности, универсальности и простоты использования, разработчикам следует обратить внимание на Ultralytics YOLO26. Он объединяет скорость NMS-free инференса с надежной, хорошо документированной экосистемой Ultralytics, гарантируя перспективность ваших решений визуального ИИ. Для специализированных случаев использования разработчики также могут рассмотреть YOLO11 для общей надежности или RT-DETR для точности на основе трансформеров.