Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 与 RTDETRv2:实时端到端目标检测器评估#

计算机视觉领域发展极其迅速,新的架构不断重新定义实时目标检测的行业基准。YOLOv10 和 RTDETRv2 是这一演进过程中的两个重要里程碑。这两个模型都旨在通过消除非极大值抑制(NMS)后处理的需求,来解决传统检测流水线中的一个根本瓶颈,但它们从完全不同的架构范式出发来应对这一挑战。

本技术对比深入分析了它们的架构、训练方法以及理想的部署场景,旨在帮助开发者和研究人员为他们的下一个视觉 AI 项目选择合适的工具。

Link to this sectionYOLOv10:无 NMS 先驱#

YOLOv10 由清华大学的研究人员开发,重点关注架构效率和消除后处理瓶颈。通过引入用于无 NMS 训练的一致性双重分配策略,它在显著降低推理延迟的同时实现了极具竞争力的性能。

Link to this section技术规格#

Link to this section架构与方法#

YOLOv10 的主要突破在于其全面以效率-精度为导向的模型设计。它从这两个角度优化了各个组件,极大地减少了计算开销。一致性双重分配策略使模型能够在不依赖 NMS 的情况下进行训练,从而实现精简的端到端部署流水线。当将模型导出为 ONNXTensorRT 等边缘格式时,这一点特别有利,因为后处理操作可能会引入意想不到的延迟。

Link to this section优势与不足#

该模型在速度与精度之间实现了出色的权衡,特别是在较小的变体(N 和 S)中。其极低的延迟使其非常适合高速边缘环境。然而,尽管 YOLOv10 在纯检测速度方面表现出色,但它仍然是一个专门的检测模型。需要实例分割姿态估计的团队将需要寻求更多功能的框架。

了解更多关于 YOLOv10 的信息

Link to this sectionRTDETRv2:完善检测 Transformer#

RTDETRv2 基于最初的实时检测 Transformer 构建,融入了一系列“免费午餐”技巧(bag of freebies)来改进其基准,展示了 Transformer 可以在实时场景中与 CNN 竞争。

Link to this section技术规格#

Link to this section架构与方法#

RTDETRv2 采用了混合架构,结合了用于视觉特征提取的卷积神经网络(CNN)主干和用于全面场景理解的 Transformer 编码器-解码器。Transformer 的自注意力机制允许模型从全局视角观察图像,使其在处理复杂场景、重叠对象和密集人群时非常有效。

Link to this section优势与不足#

Transformer 架构提供了出色的准确性,尤其是在较大的参数规模上,并且无需 NMS 即可原生输出最终检测结果。然而,这是有代价的。Transformer 模型在训练过程中通常需要更多的 CUDA 显存,并且与纯 CNN 架构相比收敛速度可能较慢。虽然 RTDETRv2 提高了推理速度,但它通常比轻量级的 YOLO 变体消耗更多的内存。

了解更多关于 RTDETRv2 的信息

Link to this section性能比较#

评估性能指标可以更清晰地了解每个模型的优势所在。下表重点介绍了它们在 COCO 数据集上的能力:

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259

分析数据时,YOLOv10 在参数效率和 TensorRT 推理速度方面保持着显著优势(在相当规模下)。RTDETRv2-x 在精度上与庞大的 YOLOv10x 相当,但需要多出近 2000 万个参数,并且 FLOPs(浮点运算次数)也显著更高。

Link to this section应用场景与建议#

在 YOLOv10 和 RT-DETR 之间进行选择,取决于你的具体项目需求、部署约束和生态系统偏好。

Link to this section何时选择 YOLOv10#

YOLOv10 是以下情况的有力选择:

  • 无需 NMS 的实时检测: 得益于无需非极大值抑制(Non-Maximum Suppression)的端到端检测,能够降低部署复杂性的应用。
  • 平衡的速度与精度权衡: 需要在推理速度和检测精度之间取得良好平衡的各类项目,适用于多种模型规模。
  • 延迟一致的应用:机器人或自动驾驶系统等对可预测推理时间有严格要求的部署场景中。

Link to this section何时选择 RT-DETR#

推荐使用 RT-DETR 的场景为:

  • 基于 Transformer 的检测研究: 探索注意力机制和 Transformer 架构以实现无 NMS 的端到端目标检测的项目。
  • 高精度、延迟要求宽松的场景: 将检测精度置于首位,且可以容忍稍高推理延迟的应用。
  • 大目标检测: 以中大型目标为主的场景,在这种场景下,Transformer 的全局注意力机制具有天然优势。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this sectionUltralytics 的优势:生态系统与创新#

尽管 YOLOv10 和 RTDETRv2 提供了强大的检测能力,但选择模型往往还涉及周边软件生态系统。Ultralytics Platform 提供了一个无缝、统一的界面,封装了深度学习的复杂性。

Link to this section新标准:Ultralytics YOLO26#

对于追求极致性能的开发者,Ultralytics YOLO26 代表了近期架构进步的巅峰。YOLO26 发布于 2026 年初,继承了由 YOLOv10 开创的端到端无 NMS 设计,彻底消除了 NMS 后处理,从而实现更快速、更简便的部署。

为什么选择 YOLO26?

YOLO26 通过 MuSGD 优化器(SGD 和 Muon 的混合体)将大语言模型(LLM)训练创新引入计算机视觉,从而实现更稳定的训练和更快的收敛。它还拥有高达 43% 的 CPU 推理速度提升,使其成为边缘计算的首选。

此外,YOLO26 引入了 ProgLoss + STAL,在小目标识别方面有显著改进;与专用的 YOLOv10 不同,它提供了极高的通用性。它原生支持目标检测、分割、姿态估计和旋转边界框 (OBB),并针对特定任务进行了改进,例如语义分割损失和用于姿态估计的残差对数似然估计 (RLE)。此外,取消分布焦点损失 (DFL) 确保了简化的导出流程和更好的低功耗设备兼容性。

了解更多关于 YOLO26 的信息

Link to this section易用性与训练效率#

无论你是尝试像 Ultralytics YOLO11 这样的老一代模型,还是尖端的 YOLO26,精简的 Python API 都能确保训练期间的内存使用率更低,工作流速度更快。

from ultralytics import RTDETR, YOLO

# Train the end-to-end YOLOv10 model
model_yolo = YOLO("yolov10n.pt")
model_yolo.train(data="coco8.yaml", epochs=100, imgsz=640)

# Alternatively, evaluate RTDETR within the same API
model_rtdetr = RTDETR("rtdetr-l.pt")
results = model_rtdetr.predict("https://ultralytics.com/images/bus.jpg")

维护良好的生态系统提供了用于轻松超参数调优的工具,并与广泛的追踪解决方案和模型部署选项完美集成。

Link to this section结论#

YOLOv10 和 RTDETRv2 都代表了追求无 NMS 目标检测过程中的巨大里程碑。RTDETRv2 证明了 Transformer 可以在具备出色的全局上下文理解能力的同时实现实时延迟,尽管对内存的要求更高。YOLOv10 提供了一种高效、快速的 CNN 替代方案,专为资源受限的检测任务量身定制。

然而,为了获得均衡的性能、多任务通用性和最成熟的生态系统,强烈建议开发者利用 Ultralytics YOLO26。它完美结合了其前身的架构创新与稳健、用户友好的工具,使部署视觉 AI 成为无缝的现实。

评论