Meet YOLO26: next-gen vision AI.

Link to this sectionRTDETRv2 与 YOLO26#

实时目标检测领域发展迅速,研究人员不断突破速度、精度和部署效率的极限。目前引领这一潮流的最著名架构是基于 Transformer 的 RTDETRv2 和最先进的卷积神经网络 (CNN),即 Ultralytics YOLO26。本指南深入分析了它们的架构、性能指标和理想用例,以帮助你为下一个 计算机视觉 项目选择合适的模型。

Link to this sectionRTDETRv2:实时检测 Transformer#

RTDETRv2 基于原始的 RT-DETR 架构,旨在将视觉 Transformer 的全局上下文感知能力与实时应用所需的速度结合起来。

主要特性:

  • 作者: Wenyu Lv, Yian Zhao, Qinyao Chang, Kui Huang, Guanzhong Wang 和 Yi Liu
  • 机构: Baidu
  • 日期: 2024-07-24
  • 链接: Arxiv, GitHub, 文档

Link to this section架构与优势#

与传统的基于锚框的检测器不同,RTDETRv2 采用基于 Transformer 的方法,从根本上消除了后处理过程中对 非极大值抑制 (NMS) 的需求。通过利用灵活的注意力机制,该模型在理解复杂场景和重叠目标方面非常有效。其“Bag-of-Freebies”改进显着提高了其在 COCO 数据集 上的准确性,同时在高端 GPU 上保持了可接受的推理速度。

Link to this section局限性#

虽然 RTDETRv2 取得了令人印象深刻的学术成果,但在生产环境中往往面临挑战。与 CNN 相比,Transformer 架构在训练和推理过程中天生需要更高的内存使用率。这使得在资源受限的 边缘 AI 设备上进行部署变得困难。此外,训练 Transformer 通常需要更大的批次大小和更多的 CUDA 内存,这对硬件有限的研究人员来说可能是一个瓶颈。

了解更多关于 RTDETRv2 的信息

Link to this sectionYOLO26:边缘优先视觉 AI 的巅峰之作#

于 2026 年初发布的 Ultralytics YOLO26 重新定义了基于 CNN 的目标检测的可能性。它结合了专为无缝生产部署和极端硬件效率而量身定制的尖端优化。

主要特性:

  • 作者: Glenn Jocher 和 Jing Qiu
  • 机构: Ultralytics
  • 日期: 2026 年 1 月 14 日
  • 链接: GitHub, 文档

Link to this section架构突破#

YOLO26 引入了几项革命性的功能,解决了模型部署中的常见痛点:

  • 端到端无 NMS 设计: 基于 YOLOv10 开创的概念,YOLO26 本质上是端到端的。通过移除 NMS 后处理,它极大地减少了延迟波动,确保了生产环境中高度可预测的推理时间。
  • CPU 推理速度提升高达 43%: 通过战略性的架构改进和移除分布焦点损失 (DFL),YOLO26 实现了前所未有的 CPU 速度,使其成为无需专用 GPU 的 边缘计算 的首选。
  • MuSGD 优化器: 受月之暗面 (Moonshot AI) Kimi K2 等大语言模型 (LLM) 训练技术的启发,YOLO26 使用了 MuSGD 优化器(SGD 和 Muon 的混合体)。这确保了高度稳定的训练运行和极快的收敛速度。
  • ProgLoss + STAL: 这些高级损失函数在小目标识别方面带来了显着的改进,这对于涉及 航拍图像 和无人机监控的应用来说是一次必要的升级。
YOLO26 中的特定任务增强

Beyond standard detection, YOLO26 features specialized improvements: Semantic segmentation loss and multi-scale proto for segmentation tasks, Residual Log-Likelihood Estimation (RLE) for pose estimation, and customized angle loss to resolve boundary issues in Oriented Bounding Box (OBB) detection.

了解更多关于 YOLO26 的信息

Link to this section性能比较#

在评估这些模型时,在准确性 (mAP) 和计算效率之间取得良好的性能平衡至关重要。下表展示了 YOLO26 如何在各种尺寸版本中持续优于 RTDETRv2。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
RTDETRv2-s64048.1-5.032060
RTDETRv2-m64051.9-7.5136100
RTDETRv2-l64053.4-9.7642136
RTDETRv2-x64054.3-15.0376259
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

如上所示,YOLO26x 模型实现了惊人的 57.5 mAP,显着超过了 RTDETRv2-x 模型,同时使用了更少的参数并保持了更快的 TensorRT 推理速度。此外,YOLO26 的内存需求显着降低,使其成为实时边缘部署的最佳选择。

Link to this section生态系统与易用性#

虽然原始性能至关重要,但周边生态系统决定了模型从研究到生产的转移速度。这正是 Ultralytics Platform 提供无与伦比优势的地方。

Link to this section维护良好、统一的生态系统#

RTDETRv2 主要作为一个研究级存储库运行,这可能需要复杂的环境设置和手动脚本来处理自定义任务。相反,Ultralytics YOLO26 得益于成熟且经过严格测试的 Python 包。Ultralytics 生态系统提供了极其精简的用户体验,为训练、验证、预测和导出提供了简单的 API。

通过内置的 Weights & BiasesComet ML 集成,实验跟踪变得无缝。此外,Ultralytics 模型用途广泛;虽然 RTDETRv2 专注于目标检测,但 YOLO26 在同一个框架内原生支持实例分割、姿态估计和图像分类。

Link to this section代码示例:简约之美#

Ultralytics API 允许开发者仅用几行代码即可加载、训练和运行推理。这极大地提高了训练效率并缩短了上市时间。

from ultralytics import RTDETR, YOLO

# Load an RT-DETR model
model_rtdetr = RTDETR("rtdetr-l.pt")

# Load a state-of-the-art YOLO26 model
model_yolo = YOLO("yolo26n.pt")

# Run inference on an image seamlessly
results_rtdetr = model_rtdetr("https://ultralytics.com/images/bus.jpg")
results_yolo = model_yolo("https://ultralytics.com/images/bus.jpg")

# Display the YOLO26 results
results_yolo[0].show()

# Export YOLO26 to ONNX format with one click
model_yolo.export(format="onnx")

Link to this section应用场景与建议#

在 RT-DETR 和 YOLO26 之间进行选择取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 RT-DETR#

RT-DETR 在以下情况是一个强有力的选择:

  • 基于 Transformer 的检测研究: 探索注意力机制和 Transformer 架构以实现无 NMS 的端到端目标检测的项目。
  • 高精度、延迟要求宽松的场景: 将检测精度置于首位,且可以容忍稍高推理延迟的应用。
  • 大目标检测: 以中大型目标为主的场景,在这种场景下,Transformer 的全局注意力机制具有天然优势。

Link to this section何时选择 YOLO26#

建议在以下情况下选择 YOLO26:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section探索其他架构#

虽然 YOLO26 代表了目前性能的巅峰,但开发者也可能会发现探索以前的版本很有价值。非常成功的 YOLO11 仍然是一个稳健、完全支持的模型,适用于各种遗留系统。你可以阅读我们的 RTDETR 与 YOLO11 对比 来深入了解其功能。此外,如果你正在分析旧架构,查看 EfficientDet 与 YOLO26 对比 可以提供关于 目标检测架构 发展历程的极好历史背景。

Link to this section总结#

RTDETRv2 和 YOLO26 都为人工智能领域带来了不可思议的进步。然而,对于优先考虑无缝过渡到生产、最小内存占用和广泛任务通用性的团队,Ultralytics YOLO26 是明确的推荐。其无 NMS 架构、快速的 CPU 速度以及强大的 Ultralytics 生态系统的支持,确保了你的视觉 AI 项目保持可扩展、高效和面向未来。无论是部署在云服务器还是资源受限的 Raspberry Pi 上,YOLO26 都能开箱即用,提供不妥协的性能。

评论