Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX 与 YOLOv5 对比#

选择合适的物体检测模型是决定任何计算机视觉项目成败的关键决策。本指南对人工智能领域中两个关键模型进行了全面的技术对比:Megvii 的 YOLOX 和 Ultralytics YOLOv5。通过分析它们的架构、性能指标和训练生态系统,我们旨在帮助开发者和研究人员针对各自的部署环境做出明智的选择。

Link to this section模型简介#

这两个模型都出现在实时物体检测快速发展的时期,但它们采用了不同的架构理念来实现性能目标。

Link to this sectionYOLOX:一种无锚(Anchor-Free)方案#

YOLOX 由研究人员 Zheng Ge、Songtao Liu、Feng Wang、Zeming Li 和 Jian Sun 于 2021 年 7 月 18 日在 Megvii 发布,它通过摒弃传统的锚框(anchor boxes)带来了重大的转变。正如其 Arxiv 技术报告中所记录的,YOLOX 集成了无锚设计、解耦头(decoupled head)以及 SimOTA 标签分配策略。该设计旨在弥合学术研究与工业应用之间的差距,在标准数据集上提供了强大的性能。

了解关于 YOLOX 的更多信息

Link to this sectionYOLOv5:生产级视觉 AI 的标准#

YOLOv5 由 Glenn Jocher 编写,并由 Ultralytics 于 2020 年 6 月 26 日发布,它迅速成为部署计算机视觉的行业标准。它基于 PyTorch 框架原生构建,通过提供无与伦比的易用性、极快的训练速度以及高度完善的存储库,使最前沿的 AI 技术得以普及。YOLOv5 的架构专注于速度、精度和部署便捷性之间的完美平衡,使其成为从边缘设备到大规模云部署的首选。

了解更多关于 YOLOv5 的信息

Link to this section架构差异#

了解这些网络核心机制上的差异,有助于理清它们在处理各种任务时为何表现各异。

Link to this section无锚(Anchor-Free)与有锚(Anchor-Based)#

最显著的区别是 YOLOX 的无锚机制。YOLOv5 等传统模型依赖预定义的锚框来预测边界框,这需要对训练数据集进行聚类分析以确定最佳的锚框尺寸。YOLOX 消除了这一步,直接在每个空间位置预测边界框坐标。虽然无锚方案减少了设计参数和启发式调整的数量,但 YOLOv5 经过优化的有锚方案,在 auto-anchor 功能的辅助下,确保了开箱即用时极其稳定且可预测的训练收敛。

Link to this section解耦头(Decoupled Head)与耦合头(Coupled Head)#

YOLOX 采用了解耦头,意味着分类和回归任务被分离到不同的神经网络分支中。作者认为这解决了空间特征学习和语义特征学习之间的冲突。相反,YOLOv5(在早期版本中)使用了高度优化的耦合头,最大限度地提高了计算效率并降低了推理延迟,这对实时边缘计算至关重要。

架构演进

尽管 YOLOX 在 2021 年率先采用了耦合头,但 Ultralytics 后来在 YOLOv8 和尖端的 YOLO26 等后续模型中采纳并完善了解耦架构,博采众长。

Link to this section标签分配策略#

YOLOX 使用 SimOTA 进行标签分配,将地面实况物体与预测结果的配对表述为最优传输问题。这种动态分配改善了对拥挤场景的处理。YOLOv5 采用了稳健的基于形状规则的分配,确保高质量的正样本始终被输入到损失函数中,这有助于其实现传奇般的训练稳定性。

Link to this section性能与基准测试#

速度与精度的权衡是检验这些架构的终极标准。下表展示了各种模型尺寸在标准基准测试中的性能。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

虽然 YOLOX 在大型变体中取得了具有竞争力的 mAP 分数,但 YOLOv5 在 TensorRT 推理速度方面始终保持显著优势。例如,YOLOv5s 模型提供了出色的速度与精度比,这使其非常适合对毫秒必争的实时应用。

Link to this sectionUltralytics 的优势:训练与可用性#

当从研究转向生产时,围绕模型的生态系统往往与模型本身同样重要。在这一点上,Ultralytics 生态系统的优势变得尤为明显。

Link to this section精简的用户体验#

YOLOv5 因其“从零到英雄”的开发者体验而受到普遍赞誉。Ultralytics Python API 和 CLI 允许你通过单行代码加载、训练和部署模型。相比之下,从 Megvii GitHub 存储库运行 YOLOX 则需要更多的手动环境变量配置、复杂的 Python 路径设置,以及学术研究代码库中常见的较高学习曲线。

Link to this section训练效率和内存需求#

Ultralytics 模型经过精心设计,可最大限度地减少训练过程中的内存使用。与 RT-DETR 等高参数化 Transformer 模型或未经优化的研究模型相比,YOLOv5 所需的 CUDA 内存显著更少。这使得开发者能够在消费级硬件上训练更大的批次,从而加速迭代开发周期。

Link to this section任务的多功能性#

虽然 YOLOX 严格来说是一个物体检测框架,但 Ultralytics 生态系统已将 YOLOv5 升级为支持多种视觉任务。你可以直接使用完全相同的 API 语法执行图像分类实例分割和物体检测。

持续创新

如果你需要诸如姿态估计旋转边界框 (OBB)检测等更高级的任务,我们强烈建议升级到最新的 Ultralytics YOLO26 架构,它原生支持所有这些任务,并具备最先进的精度。

Link to this section代码对比#

可用性的差异最好通过代码来演示。

使用 YOLOv5 训练:

from ultralytics import YOLO

# Load a pretrained YOLOv5s model
model = YOLO("yolov5su.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")

# Display results
results[0].show()

使用 YOLOX 训练: (需要手动克隆存储库、安装 setup.py 和复杂的 CLI 参数)

# Example YOLOX training command
python tools/train.py -f exps/default/yolox_s.py -d 1 -b 64 --fp16 -o

Ultralytics 的方法消除了摩擦,让你能够专注于数据集和应用程序逻辑,而不是调试配置文件。此外,通过内置的 Weights & BiasesComet ML 集成,跟踪你的实验过程也变得十分顺畅。

Link to this section理想用例与实际应用#

在这些模型之间进行选择,取决于你项目的运行环境。

Link to this sectionYOLOX 的优势场景#

YOLOX 在学术环境中仍然是一个强有力的候选者,研究人员在那里专门研究无锚范式或标签分配策略。它也适用于以拥挤场景检测作为绝对首要指标,而边缘部署速度为次要考虑的场景。

Link to this sectionYOLOv5 的卓越之处#

YOLOv5 是实际部署中无可争议的冠军。

  • 高速制造: 对于流水线缺陷检测,YOLOv5 在边缘 GPU 上的最小化推理延迟可确保在不拖慢生产线的前提下完成产品检验。
  • 无人机和航拍影像: 其高效的内存占用使其能够运行在无人机轻量级的配套计算机上,用于农业监测和野生动物追踪等任务。
  • 智慧零售:自动结账到库存管理,YOLOv5 可以轻松导出为 TensorRTONNX,从而在数千个商店摄像头中进行大规模部署。

Link to this section展望未来:YOLO26 的优势#

虽然 YOLOv5 是一个传奇模型,但 AI 领域发展迅速。如果你今天开启一个新项目,我们强烈建议查看最新一代的 Ultralytics 模型。

于 2026 年发布的 Ultralytics YOLO26 代表了一次巨大的飞跃。它采用了 端到端无 NMS 设计,完全消除了对非极大值抑制(NMS)后处理的需求,这极大地简化了部署逻辑。通过移除分布焦点损失(DFL)并利用尖端的 MuSGD 优化器,YOLO26 在保持更高精度的同时,CPU 推理速度比前几代产品提高了 43%,特别是在利用新的 ProgLoss + STAL 损失函数后,对小物体的检测表现更优。

无论你选择久经考验的 YOLOv5 的可靠性,还是 YOLO26 的前沿性能,Ultralytics 平台都能确保你拥有最好的工具,将你的计算机视觉解决方案无缝地从概念转化为生产。请务必探索全面的 Ultralytics 文档,以充分释放你的 AI 流水的潜力。

评论