Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 与 YOLOv10 对比#

计算机视觉的演进在很大程度上是由对速度与精度平衡的不懈追求所驱动的。传统上,实时目标检测流水线依赖非极大值抑制(NMS)作为后处理步骤来过滤重叠的边界框。然而,NMS 引入了延迟瓶颈和复杂的超参数调优问题。最近,出现了两种旨在原生解决该问题的架构方法:以 RTDETRv2 为代表的基于 Transformer 的模型,以及以 YOLOv10 为代表的基于 CNN 的模型。

本指南对这两款模型进行了详尽的技术对比,分析了它们的架构、性能指标和理想应用场景,同时也强调了 Ultralytics 生态系统 中的最新创新如何为现代部署提供终极解决方案。

Link to this sectionRTDETRv2:实时检测 Transformer#

RTDETRv2 基于原始的 RT-DETR 架构构建,旨在将视觉 Transformer 的全局上下文理解能力与传统上由 YOLO 模型主导的实时速度要求相结合。

主要特性:

Link to this section架构与训练方法论#

RTDETRv2 采用端到端 Transformer 架构,从本质上避免了 NMS。它在改进前代模型的基础上,引入了“Bag-of-Freebies”方法,优化了训练策略并集成了多尺度检测能力。该模型使用 CNN 主干网络来提取特征图(如边缘和纹理等视觉细节),然后由 Transformer 编码器-解码器结构进行处理。这使得模型能够同时分析整个图像上下文,从而在对象密集堆叠或重叠的复杂场景中表现出极高的有效性。

Link to this section优势与不足#

优势:

  • 全局上下文: 注意力机制使模型在复杂、杂乱的环境中表现出色。
  • 无需 NMS: 直接预测对象坐标,简化了部署流水线。
  • 高精度: 在 COCO 数据集上实现了出色的平均精度均值 (mAP)

劣势:

  • 资源密集型: 与 CNN 相比,Transformer 架构在训练过程中通常需要更多的 CUDA 显存,因此在标准硬件上进行微调的成本较高。
  • 推理速度波动: 虽然速度较快,但沉重的注意力计算可能导致在缺乏专用 AI 加速器的边缘设备上出现 FPS 较低的情况。

了解更多关于 RTDETRv2 的信息

Link to this sectionYOLOv10:实时端到端目标检测#

YOLOv10 通过在 CNN 框架内直接解决长期存在的 NMS 瓶颈,代表了 YOLO 目标检测谱系的一次重大变革。

主要特性:

Link to this section架构与训练方法论#

YOLOv10 的核心创新在于其用于无 NMS 训练的一致性双重分配。它在训练期间采用两个检测头:一个是提供丰富监督信号的一对多分配(类似于传统 YOLO),另一个是消除 NMS 需求的一对一分配。在推理过程中,仅使用一对一检测头,从而实现了端到端过程。此外,作者应用了以效率-精度为导向的整体模型设计策略,全面优化了各个组件以减少计算冗余。

Link to this section优势与不足#

优势:

  • 极致速度: 通过移除 NMS 并优化架构,YOLOv10 实现了极低的推理延迟
  • 高效性: 在达到与其他模型相当的精度时,所需参数和 FLOPs 更少,这使其非常适合资源受限的环境。
  • 无需 NMS 部署: 简化了集成到智能监控等边缘应用中的流程。

劣势:

  • 第一代概念: 作为首个实现此特定无 NMS 架构的 YOLO 模型,它奠定了基础,但仍有空间改进后续模型(如 YOLO11 和 YOLO26)中可见的多任务通用性和优化。

了解更多关于 YOLOv10 的信息

Link to this section性能比较#

在评估生产环境模型时,平衡精度与计算成本至关重要。下表重点介绍了各种尺寸的 RTDETRv2 和 YOLOv10 之间的性能权衡。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

虽然 RTDETRv2 提供了可靠的精度,但 YOLOv10 在延迟和参数效率方面表现出显著优势,特别是在其较小的版本(Nano 和 Small)中,使其在边缘计算和 AIoT 应用中极具吸引力。

选择合适的规模

如果你在对批次大小和显存限制较少的服务器级 GPU 上进行部署,大型模型(如 -x-l)可以最大限度地提高精度。对于 Raspberry Pi 或手机等边缘设备,应优先考虑 nano (-n) 或 small (-s) 版本以保持实时帧率。

Link to this section应用场景与建议#

在 RT-DETR 和 YOLOv10 之间进行选择,取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 RT-DETR#

RT-DETR 在以下情况是一个强有力的选择:

  • 基于 Transformer 的检测研究: 探索注意力机制和 Transformer 架构以实现无 NMS 的端到端目标检测的项目。
  • 高精度、延迟要求宽松的场景: 将检测精度置于首位,且可以容忍稍高推理延迟的应用。
  • 大目标检测: 以中大型目标为主的场景,在这种场景下,Transformer 的全局注意力机制具有天然优势。

Link to this section何时选择 YOLOv10#

推荐使用 YOLOv10 的情况:

  • 无需 NMS 的实时检测: 得益于无需非极大值抑制(Non-Maximum Suppression)的端到端检测,能够降低部署复杂性的应用。
  • 平衡的速度与精度权衡: 需要在推理速度和检测精度之间取得良好平衡的各类项目,适用于多种模型规模。
  • 延迟一致的应用:机器人或自动驾驶系统等对可预测推理时间有严格要求的部署场景中。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this sectionUltralytics 的优势:隆重介绍 YOLO26#

虽然 RTDETRv2 和 YOLOv10 都提供了引人注目的学术进展,但在现实场景中部署它们需要一个强大且维护良好的软件生态系统。Ultralytics 平台 提供了无与伦比的开发者体验,结合了易用性、详尽的文档以及强大的数据标注和部署工具。

对于寻求 2026 年绝对前沿技术的开发者,Ultralytics YOLO26 是终极推荐。它融合了这两种架构的最佳理念,同时引入了突破性的改进:

  • 端到端无 NMS 设计: 在 YOLOv10 开创的概念基础上,YOLO26 原生地消除了 NMS 后处理,从而实现更快、更简单的部署逻辑和零延迟波动。
  • DFL 移除: 通过移除分布焦点损失(Distribution Focal Loss),YOLO26 简化了模型导出,并极大地提高了与边缘和低功耗设备的兼容性。
  • MuSGD 优化器: 作为 SGD 和 Muon 的混合体(受 LLM 训练创新的启发),这种新型优化器与传统方法相比,提供了更稳定的训练和显著更快的收敛速度。
  • CPU 推理速度提升高达 43%: 针对没有专用 GPU 的环境进行了精心优化,让高性能视觉 AI 更加平民化。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面产生了显著改进,这对于使用无人机的应用和物联网传感器至关重要。
  • 无与伦比的通用性: 与仅限于边界框的模型不同,YOLO26 支持全套任务,包括实例分割姿态估计图像分类OBB 检测,并辅以针对任务的改进,例如用于姿态估计的残差对数似然估计(RLE)。

了解更多关于 YOLO26 的信息

Link to this section使用 Python 无缝实现#

使用 Ultralytics Python API 训练和部署这些模型旨在实现无摩擦的体验。与 Transformer 密集型架构相比,训练期间的内存需求显著降低,允许你在标准硬件上训练强大的模型。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 model (recommended)
# Alternatively, load a YOLOv10 model using YOLO('yolov10n.pt')
model = YOLO("yolo26n.pt")

# Train the model on your custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Easily export to various formats for edge deployment
model.export(format="onnx", simplify=True)

Whether you are implementing security alarm systems or conducting medical image analysis, choosing a model backed by the active Ultralytics community ensures you have the tools, hyperparameter tuning guides, and continuous updates needed to succeed. While YOLOv10 and RTDETRv2 paved the way for NMS-free architectures, YOLO26 perfects the formula, offering the best balance of performance, versatility, and production readiness.

评论