跳转至内容

YOLOv10 YOLOv6.0:新一代实时目标检测对决

在计算机视觉快速发展的领域中,选择合适的物体检测模型对成功至关重要。两种突出的架构—— YOLOv10YOLOv6在速度与精度的平衡上取得了重大突破。本文通过详细对比两者的架构创新、性能指标及理想应用场景,助您选择最契合部署需求的模型。

尽管两种模型都为工业和研究应用提供了强大的解决方案Ultralytics 却能提供统一平台,轻松实现这些架构的训练、验证与部署。无论是构建智慧城市基础设施还是优化生产线,理解这些模型的细微差别都至关重要。

性能指标比较

下表展示了YOLOv10 YOLOv6.YOLOv6在不同模型规模下的性能表现。两者均基于COCO 进行评估,重点关注标准硬件环境下的平均精度均值(mAP)与推理延迟。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7

YOLOv10:端到端创新者

YOLOv10由清华大学研究人员提出的YOLO 范式转变。其最显著的特征在于通过一致的双重分配策略,在后处理阶段消除了非最大抑制(NMS)。该设计实现了真正的端到端训练与部署,显著降低了实际应用中的延迟波动性。

主要架构特性

  • NMS训练:通过采用双标签分配机制——一标签多目标用于丰富监督,一标签一目标用于高效推理YOLOv10 NMS的计算瓶颈。
  • 整体效率设计:该架构采用轻量级分类头与空间-通道解耦下采样技术,同时优化参数数量与浮点运算量。
  • 基于层级的模块化设计:为减少冗余YOLOv10 基于层级的模块化设计,根据网络阶段动态调整复杂度。

作者:王洵、陈辉、刘立浩等。
机构:清华大学
日期:2024年5月23日
链接:arXiv|GitHub|文档

了解更多关于 YOLOv10

YOLOv6-3.0:工业级重量选手

美团YOLOv6.YOLOv6重点聚焦于工业应用场景,在专用硬件(如GPU)上追求极致吞吐量。该版本引入"Reloading"更新,通过优化网络结构显著提升了识别精度与量化性能。

主要架构特性

  • 双向拼接(BiC):颈部区域的新型模块,通过更有效地融合不同尺度特征来提升定位精度。
  • 锚点辅助训练(AAT):该策略使模型在保持无锚点架构进行推理的同时,能够受益于基于锚点的优化稳定性。
  • 量化友好:该架构专为最小化INT8量化过程中的精度损失而设计,使其成为采用TensorRT边缘设备的理想选择。

作者:李楚怡、李璐璐、耿一飞等。
机构:美团
日期:2023年1月13日
链接:arXiv|GitHub|文档

了解更多关于 YOLOv6

比较分析

1. 延迟与效率

YOLOv10 在参数效率和浮点运算性能方面YOLOv10 优于YOLOv6.YOLOv6。例如,YOLOv10s模型在参数数量显著减少(720万对1850万)的YOLOv6,实现了更高的mAP 46.3%对45.0%) YOLOv10 取消NMS YOLOv10 延迟YOLOv10 低且更可预测,尤其在后处理开销显著的CPU平台上。相反YOLOv6.YOLOv6 GPU 进行了高度优化,在T4 GPU的高批量场景中常展现出原始速度优势。

2. 部署与易用性

这两种模型均由Ultralytics 支持,确保开发者可通过统一API访问。然而,YOLOv10特性简化了导出流程,可轻松转换为ONNX等格式。 ONNXCoreML,因为无需在模型图上附加复杂的NMS 。

部署提示

在部署至树莓派或NVIDIA 等边缘设备时YOLOv10更少的参数数量和NMS的设计,通常能实现比旧架构更低的内存消耗和更快的启动速度。

3. 培训方法论

YOLOv6.YOLOv6 通过自我蒸馏和锚点辅助训练等技术提升性能,但可能增加训练时间和内存消耗。YOLOv10 一致性双重分配机制,简化了损失计算并实现高效收敛。用户利用该机制可 Ultralytics Platform 得益于抽象化的处理,可以同时训练这两个模型而无需担心这些内部复杂性。 model.train() 界面。

Ultralytics 优势

在Ultralytics 中选择模型,可确保获得"从零到英雄"的体验。与可能缺乏文档或维护的独立存储库不同,Ultralytics 具备以下优势:

  • 统一API:通过在代码中修改单个字符串,YOLOv10、YOLOv6间自由切换。
  • 任务多样性:虽然YOLOv10 YOLOv6 主要YOLOv6 检测器YOLOv6 ,Ultralytics 的核心模型Ultralytics 姿势估计 实例分割和 分类等多种任务。
  • 强大的导出功能:可无缝将模型导出至TensorRT、OpenVINO TFLite 生产环境部署。
from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Train on a custom dataset with a single command
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate performance
metrics = model.val()

用YOLO26实现未来保障

YOLOv6 YOLOv10 YOLOv6是绝佳选择,但该领域仍在持续进步。对于追求绝对尖端技术的开发者而言, YOLO26 在YOLOv10 NMS突破的基础上YOLOv10 针对2026硬件进行了关键性增强。

为何升级到 YOLO26?

  • 端到端原生:与YOLOv10类似,YOLOv26NMS,确保了最简化的部署流程。
  • MuSGD优化器:受大型语言模型训练启发,这款混合优化器确保稳定收敛,并减少了对大量超参数调优的需求。
  • 边缘优先设计:通过移除分布式焦点损失(DFL)并优化模块,YOLO26实现了最高达43%CPU 加速,使其成为移动和物联网应用的优选方案。
  • 任务特异性:与前代模型不同,YOLO26引入了ProgLoss和STAL等专用损失函数,增强了小目标检测能力,并原生支持旋转框检测 姿势估计 。

了解更多关于 YOLO26 的信息

结论

YOLOv10 是优先考虑参数效率和简单端到端部署管道用户的推荐选择。它能在较低浮点运算量下实现高精度,使其成为各类硬件上实时应用的理想选择。

YOLOv6.YOLOv6在配备专用GPU 的工业场景中仍具强大竞争力,其针对TensorRT 特定优化方案在此类场景中可得到充分利用。

对于追求巅峰性能、跨任务通用性(分割、姿势估计、旋转框检测)以及未来兼容支持的用户,YOLO26是Ultralytics的终极推荐方案。

延伸阅读


评论