Link to this sectionYOLOv5 против YOLOv10#
Сфера компьютерного зрения в реальном времени демонстрирует экспоненциальный рост в последние несколько лет, причем различные архитектуры расширяют границы возможного на современном оборудовании. При оценке передовых архитектур сравнение YOLOv5 и YOLOv10 подчеркивает значительный эволюционный шаг в области детектирования объектов. В этом техническом обзоре исследуются их архитектурные парадигмы, компромиссы в производительности и способы, которыми ты можешь использовать эти инструменты в производственных средах.
Link to this sectionГлубокое изучение архитектуры#
Понимание структурных различий между этими моделями критически важно для их эффективного развертывания в реальных задачах.
Link to this sectionUltralytics YOLOv5: отраслевой стандарт#
Представленная компанией Ultralytics, модель YOLOv5 давно признана за непревзойденный баланс скорости, точности и доступности.
- Автор: Гленн Джочер
- Организация: Ultralytics
- Дата: 26.06.2020
- GitHub: репозиторий YOLOv5
- Документация: документация YOLOv5
YOLOv5 опирается на механизм детектирования на основе анкоров в сочетании с глубоко оптимизированным бэкбоном CSPDarknet. Эта архитектура сильно зависит от стандартных операций, поддерживаемых практически всеми движками вывода, что делает ее невероятно универсальной. Ее главная сила заключается в Python SDK от Ultralytics, который обеспечивает оптимизированный пользовательский опыт, простой API и обширную документацию. Кроме того, более низкие требования YOLOv5 к памяти по сравнению с моделями на базе Transformer означают, что она быстро обучается на потребительских GPU без высоких затрат VRAM.
Link to this sectionYOLOv10: развитие парадигмы#
Разработанная исследователями из Университета Цинхуа, модель YOLOv10 нацелена на устранение специфических «узких мест» задержки, обнаруженных в предыдущих архитектурах.
- Авторы: Ао Ван, Хуэй Чен, Лихао Лю и др.
- Организация: Tsinghua University
- Дата: 2024-05-23
- ArXiv: 2405.14458
- GitHub: репозиторий YOLOv10
- Документация: документация YOLOv10
Определяющей характеристикой YOLOv10 является ее нативная архитектура без NMS (Non-Maximum Suppression). Используя согласованные двойные назначения во время обучения, модель устраняет необходимость в постпроцессинге NMS при выводе. Это теоретическое сокращение задержки очень полезно для развертываний на высокопроизводительном оборудовании с мощным ускорением NVIDIA TensorRT, хотя это может привнести структурные сложности для периферийных (edge) устройств.
Хотя YOLOv10 предлагает интересные архитектурные новинки, модели Ultralytics, такие как YOLOv5 и более новая YOLO26, нативно поддерживаются в платформе Ultralytics, предлагая превосходную эффективность обучения, автоматическую эволюцию гиперпараметров и широкие возможности экспорта «из коробки».
Link to this sectionАнализ производительности#
При сравнении этих моделей баланс между точностью (mAP) и вычислительными затратами (задержка и параметры) определяет лучший вариант использования. Ниже представлено техническое сравнение производительности на датасете COCO.
| Модель | размер (пиксели) | mAPval 50-95 | Скорость CPU ONNX (мс) | Скорость T4 TensorRT10 (мс) | параметры (М) | FLOPs (Б) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
YOLOv10 явно достигает более высокого показателя mAP50-95 при эквивалентных масштабах размера, используя свою модернизированную модель дизайна, основанную на эффективности и точности. Однако YOLOv5 сохраняет невероятно конкурентоспособную задержку, особенно в уровнях Nano и Small, что делает ее крайне надежной для ограниченных встроенных сред, таких как линейка NVIDIA Jetson или стандартные CPU через OpenVINO.
Link to this sectionМетодологии обучения и экосистема#
Ценность модели глубоко связана с экосистемой, которая ее окружает. Ultralytics поддерживает исключительно хорошо проработанную экосистему, которая поддерживает невероятно широкий спектр задач. В то время как YOLOv10 фокусируется строго на 2D детектировании объектов, Ultralytics нативно поддерживает сегментацию экземпляров, классификацию изображений, оценку позы и ориентированные ограничивающие рамки (OBB).
Более того, обучение модели Ultralytics требует значительно меньших затрат памяти, чем конкурирующие методы на базе Transformer, что позволяет сохранять цикл разработки быстрым и экономически эффективным.
Link to this sectionБесшовное выполнение кода#
Обучение, валидация и экспорт моделей объединены под общим API. Ты можешь переключаться между моделями, просто меняя строку.
from ultralytics import YOLO
# Load a pre-trained YOLOv5 model for baseline testing
model_v5 = YOLO("yolov5s.pt")
# Load a YOLOv10 model for comparison
model_v10 = YOLO("yolov10s.pt")
# Train the model on the COCO8 dataset efficiently
results = model_v5.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Automatically utilizes PyTorch CUDA acceleration
batch=16,
)
# Export to ONNX for CPU inference deployment
model_v5.export(format="onnx", simplify=True)Link to this sectionСценарии использования и рекомендации#
Выбор между YOLOv5 и YOLOv10 зависит от твоих конкретных требований к проекту, ограничений развертывания и предпочтений в экосистеме.
Link to this sectionКогда стоит выбрать YOLOv5#
YOLOv5 — отличный выбор для:
- Проверенных производственных систем: существующих развертываний, где ценятся долгая история стабильности YOLOv5, обширная документация и огромная поддержка сообщества.
- Обучения с ограниченными ресурсами: сред с ограниченными ресурсами GPU, где эффективный конвейер обучения YOLOv5 и более низкие требования к памяти являются преимуществом.
- Обширной поддержки форматов экспорта: проектов, требующих развертывания во многих форматах, включая ONNX, TensorRT, CoreML и TFLite.
Link to this sectionКогда стоит выбрать YOLOv10#
YOLOv10 рекомендуется для:
- Детекции в реальном времени без NMS: Приложения, которым полезна сквозная (end-to-end) детекция без использования Non-Maximum Suppression, что снижает сложность развертывания.
- Сбалансированного соотношения скорости и точности: Проекты, требующие оптимального баланса между скоростью вывода и точностью детекции для различных масштабов моделей.
- Приложений с постоянной задержкой: Сценарии развертывания, где критически важна предсказуемость времени вывода, например, в робототехнике или автономных системах.
Link to this sectionКогда выбирать Ultralytics (YOLO26)#
Для большинства новых проектов Ultralytics YOLO26 предлагает наилучшее сочетание производительности и опыта разработчика:
- Развертывания на периферии без NMS: приложений, требующих стабильного вывода с низкой задержкой без сложности постобработки подавления немаксимумов.
- Среды только с CPU: устройств без выделенного GPU-ускорения, где до 43% более быстрый вывод на CPU у YOLO26 дает решающее преимущество.
- Детектирования мелких объектов: сложных сценариев, таких как аэросъемка с дронов или анализ датчиков IoT, где ProgLoss и STAL значительно повышают точность на крошечных объектах.
Link to this sectionБудущее: Ultralytics YOLO26#
В то время как YOLOv5 произвела революцию в доступности, а YOLOv10 расширила границы архитектуры без NMS, состояние технологий продолжает развиваться. Для новых проектов мы настоятельно рекомендуем передовую Ultralytics YOLO26, выпущенную в январе 2026 года.
YOLO26 объединяет надежность экосистемы Ultralytics с революционными достижениями:
- Сквозной дизайн без NMS: Включая парадигму без NMS непосредственно в фреймворк Ultralytics, YOLO26 упрощает развертывание и гарантирует более низкую задержку.
- До 43% быстрее вывод на CPU: Благодаря удалению Distribution Focal Loss (DFL), YOLO26 работает заметно быстрее на периферийных устройствах без GPU.
- Оптимизатор MuSGD: Вдохновленный инновациями в обучении LLM от Moonshot AI, оптимизатор MuSGD обеспечивает беспрецедентную стабильность и быструю сходимость.
- ProgLoss + STAL: Эти новые функции потерь радикально улучшают распознавание мелких объектов, что жизненно важно для таких областей, как изображения с дронов и робототехника.
Ты можешь управлять, обучать и развертывать YOLO26 напрямую через платформу Ultralytics.
Link to this sectionЗаключение#
Выбор между YOLOv5 и YOLOv10 часто сводится к конкретным ограничениям проекта. YOLOv10 предлагает отличный mAP для исследователей и приложений, использующих высокую пропускную способность GPU. Напротив, YOLOv5 остается надежной и высокосовместимой «рабочей лошадкой» для стандартных развертываний.
Однако область компьютерного зрения динамична. Чтобы использовать наилучший баланс производительности, универсальности и простоты использования, разработчикам следует обратить внимание на Ultralytics YOLO26. Она сочетает в себе скорость вывода без NMS с надежной и хорошо документированной экосистемой Ultralytics, гарантируя, что твои решения в области AI для зрения будут актуальны в будущем. Для специализированных задач разработчики также могут изучить YOLO11 для общей надежности или RT-DETR для точности на базе Transformer.