Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO11 与 YOLOX#

过去几年,计算机视觉领域取得了飞速发展,实时目标检测模型也变得日益复杂。在为生产环境或学术研究选择架构时,开发者往往需要权衡经典里程碑与前沿创新之间的得失。这篇详尽的对比文章探讨了 Ultralytics YOLO11 与旷视科技 (Megvii) YOLOX 之间的差异,深入分析了它们的架构、性能指标以及理想的部署场景。

Link to this section架构概览#

这两个模型都代表了目标检测领域的重大飞跃,但它们源自不同的设计理念,且针对的开发者体验也各不相同。

Link to this sectionYOLO11:全能型多任务引擎#

YOLO11 由 Glenn Jocher 和 Jing Qiu 于 2024 年 9 月在 Ultralytics 发布,旨在构建一个兼顾高精度与极致效率的统一框架。

YOLO11 不仅限于标准的边界框检测,还原生支持 实例分割图像分类姿态估计 以及 旋转边界框 (OBB) 检测。其精简的架构优化了特征提取过程,确保在复杂的空间层级中实现更好的特征保持。

了解更多关于 YOLO11 的信息

Link to this sectionYOLOX:无锚框 (Anchor-Free) 先驱#

YOLOX 由旷视科技的研究人员开发,于 2021 年凭借其纯粹的无锚框方法,显著缩小了研究与工业应用之间的鸿沟,从而备受关注。

YOLOX 引入了去耦头 (decoupled head) 和无锚框范式,这在发布时大大减少了设计参数的数量,并提升了学术基准测试的性能。

了解关于 YOLOX 的更多信息

你知道吗?

YOLOX 推广的无锚框设计启发了许多后续架构。Ultralytics 在 YOLOv8 和 YOLO11 等后续版本中整合并深度优化了这些无锚框概念,从而提供更卓越的精度和部署灵活性。

Link to this section性能与指标#

在评估检测模型时,权衡参数量、计算成本 (FLOPs) 和平均精度均值 (mAP) 对于实际的 模型部署 至关重要。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

如表所示,YOLO11x 在绝对精度方面显著优于 YOLOXx (54.7 mAP 对 51.1 mAP),同时参数量仅为其一半左右 (56.9M 对 99.1M)。这种效率意味着在训练和推理过程中对内存的需求更低,这对生产环境来说是一个巨大的优势。

Link to this section生态系统与开发者体验#

Link to this sectionUltralytics 的优势#

YOLO11 与 YOLOX 最深刻的差异之一在于易用性。YOLOX 主要作为研究代码库运行,需要复杂的环境配置、手动编译 C++ 算子以及冗长的命令行参数才能启动 自定义数据集训练

相比之下,YOLO11 完全集成在 Ultralytics Python 软件包中,提供了一种精简的“从零到英雄”工作流。Ultralytics 平台 提供了用于数据标注、实验跟踪和云端训练的丰富工具,将样板代码抽象化,让工程师能够专注于模型性能。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model effortlessly using the Ultralytics API
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX or TensorRT seamlessly
model.export(format="onnx")

此外,将 Ultralytics 模型导出为 TensorRT、CoreML 或 OpenVINO 等格式仅需一条命令,而传统的存储库通常需要复杂的第三方工具或手动进行图结构修改。

Link to this section实际应用场景#

Link to this section何时考虑 YOLOX#

对于那些已经围绕其特定的去耦头张量输出构建了高度定制化 C++ 推理流水线的特殊旧有部署场景,YOLOX 仍然是一个可行的选择。此外,进行 2021 年前沿架构对比研究的研究人员仍会将 YOLOX 作为 基准数据集 的基准。

Link to this sectionYOLO11 的优势所在#

对于几乎所有现代生产场景,YOLO11 都提供了远超以往的体验:

  • 智慧城市与零售: 得益于其卓越的速度与精度比,YOLO11 可以轻松应对拥挤场景,在无需庞大 GPU 集群的情况下,驱动 自动化零售分析 和交通管理系统。
  • Edge Computing: The high memory efficiency and robust export options make YOLO11 perfect for edge AI deployments on devices like Raspberry Pi or NVIDIA Jetson platforms.
  • 复杂流水线: 如果项目需要将目标检测与 姿态关键点(例如体育分析)或精确的实例分割(例如医学影像)相结合,YOLO11 可通过单一统一的 API 原生处理所有任务。

Link to this section应用场景与建议#

在 YOLO11 和 YOLOX 之间做出选择,取决于你的具体项目需求、部署限制以及生态系统偏好。

Link to this section何时选择 YOLO11#

YOLO11 是以下场景的有力选择:

Link to this section何时选择 YOLOX#

推荐 YOLOX 的场景:

  • 无锚点检测研究: 学术研究使用 YOLOX 简洁的无锚点架构作为基准,用于实验新的检测头或损失函数。
  • 超轻量级边缘设备: 部署在微控制器或遗留移动硬件上,此时 YOLOX-Nano 变体极小的体积(0.91M 参数)至关重要。
  • SimOTA 标签分配研究: 探索基于最优传输的标签分配策略及其对训练收敛影响的研究项目。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section展望未来:YOLO26 的力量#

虽然 YOLO11 是一个极佳的选择,但人工智能领域在不断加速。对于那些追求效率和稳定性的巅峰的团队,我们强烈推荐在新的计算机视觉项目中使用 YOLO26(于 2026 年 1 月发布)。

YOLO26 通过实现 端到端无 NMS 设计,代表了巨大的飞跃。通过消除 非极大值抑制 (NMS) 后处理,它彻底消除了延迟波动,极大地简化了部署逻辑——这一概念最初是在 YOLOv10 中开创的。

此外,YOLO26 采用了 DFL 移除(分布焦点损失),优化了架构,使 CPU 推理速度提升高达 43%,使其成为低功耗和边缘设备的不二之选。训练稳定性也通过 MuSGD 优化器得到了极大提升——这是一种受大语言模型启发的 SGD 与 Muon 的混合体,能加速收敛。结合 ProgLoss + STAL 等先进的损失函数,YOLO26 在检测 无人机图像 和 IoT 边缘传感器等挑战性环境中的小目标方面表现出色。

进一步探索

想要扩展你对目标检测架构的了解吗?探索 YOLO-World 的开放词汇能力,或深入研究 Ultralytics 生态系统中记录的基于 Transformer 的 RT-DETR 模型。

总之,虽然 YOLOX 在 2021 年引入了重要的架构概念,但 YOLO11 全面的工具集、内存效率和前沿性能——尤其是 YOLO26 的革命性架构——使得 Ultralytics 生态系统成为当今研究人员和企业开发者的明智选择。

评论