Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 与 YOLOv7#

过去几年计算机视觉的飞速发展,产生了越来越多适用于实时应用的高效架构。比较 YOLOv10YOLOv7 可以凸显这一演进过程中的关键过渡期。虽然 YOLOv7 引入了极为有效的训练策略和架构扩展方式,但 YOLOv10 通过消除对非极大值抑制(NMS)的长期依赖,彻底改变了模型部署。

这两个模型在各自发布时都突破了 目标检测 的界限,但现代 Ultralytics 生态系统 以及 YOLO26 等下一代模型的引入,为当今的 AI 从业者提供了远优于以往的工作流程。

Link to this section模型简介与起源#

了解这些模型的起源,可以为理解其架构设计选择以及推动这些研究的学术背景提供有价值的参考。

Link to this sectionYOLOv10 详情#

了解更多关于 YOLOv10 的信息

Link to this sectionYOLOv7 详情#

了解更多关于 YOLOv7 的信息

Link to this section架构创新#

Link to this sectionYOLOv7 的方法#

YOLOv7 发布于 2022 年,重点在于优化梯度路径。它引入了扩展高效层聚合网络(E-ELAN),使模型能够在不破坏原始梯度路径的情况下学习更多样化的特征。此外,作者还实现了一种“可训练的免费包(bag-of-freebies)”方法,在训练期间利用重参数化技术,这些技术可以在推理时融合,从而保持快速的执行速度。尽管进行了这些令人印象深刻的优化,YOLOv7 在后处理阶段仍然严重依赖 NMS,这会导致在密集场景分析中出现不稳定的延迟。

Link to this sectionYOLOv10 的突破#

YOLOv10 直接解决了 NMS 的瓶颈问题。通过在训练过程中引入一致的双重分配,清华大学团队实现了无 NMS 的端到端检测。这种双头方法使用一个具有“一对多”分配的分支在训练过程中提供丰富的监督信号,并使用另一个具有“一对一”分配的分支实现无 NMS 的推理。这一架构转变确保了超低的 推理延迟,非常适合高速视频分析。此外,YOLOv10 采用了一种以效率和准确性为核心的整体模型设计,剔除了早期版本中存在的计算冗余。

后处理的影响

移除 NMS 后处理不仅加快了推理速度,还显著简化了在边缘 AI 硬件上的部署,例如 AI 加速器和 NPU,在这些设备上,自定义 NMS 操作通常难以编译。

Link to this section性能比较#

当比较 MS COCO dataset 上的原始指标时,代际差距显而易见。YOLOv10 在参数量、计算要求和准确性之间实现了更加有利的权衡。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

如上所示,YOLOv10x 提供了 54.4% 的卓越 mAP,而 YOLOv7x 为 53.1%,同时参数量减少了约 20%。此外,轻量级的 YOLOv10 模型(Nano 和 Small)提供了卓越的 TensorRT deployment 速度,使其在移动端部署方面极具吸引力。

Link to this sectionUltralytics 生态系统优势#

虽然研究架构论文很有启发性,但现代计算机视觉开发依赖于强大且维护良好的框架。对于希望快速从原型转入生产的开发者来说,选择一个由 Ultralytics 支持的模型具有巨大的优势。

Link to this section精简的开发流程#

YOLOv10 和 YOLOv7 都可以通过标准的 Ultralytics Python 包进行访问。这提供了无与伦比的 易用性,用简单直观的 API 替换了数千行样板代码。此外,与沉重的 Transformer 架构相比,Ultralytics YOLO 模型在训练期间所需的 CUDA 内存显著更低,从而可以在消费级硬件上使用更大的批次大小。

Link to this section无与伦比的多功能性#

虽然旧的存储库通常仅专注于边界框检测,但集成的 Ultralytics 框架无缝支持多种任务。无论你是在执行 Instance SegmentationPose Estimation 还是 Oriented Bounding Box (OBB) 检测,工作流程都是完全一致的。

Link to this section代码示例:一致的训练工作流程#

以下代码片段展示了无缝的训练过程,它会自动处理 data augmentation 和学习率调度:

from ultralytics import YOLO

# Load the desired model (YOLOv10, YOLOv7, or the recommended YOLO26)
model = YOLO("yolo26n.pt")

# Train the model effortlessly on your dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)

# Export to ONNX format for rapid deployment
model.export(format="onnx")

Link to this section应用场景与建议#

在 YOLOv10 和 YOLOv7 之间进行选择,取决于你的具体项目需求、部署限制和生态系统偏好。

Link to this section何时选择 YOLOv10#

YOLOv10 是以下情况的有力选择:

  • 无需 NMS 的实时检测: 得益于无需非极大值抑制(Non-Maximum Suppression)的端到端检测,能够降低部署复杂性的应用。
  • 平衡的速度与精度权衡: 需要在推理速度和检测精度之间取得良好平衡的各类项目,适用于多种模型规模。
  • 延迟一致的应用:机器人或自动驾驶系统等对可预测推理时间有严格要求的部署场景中。

Link to this section何时选择 YOLOv7#

建议在以下情况选择 YOLOv7:

  • 学术基准测试: 重现 2022 年水平的最先进结果,或研究 E-ELAN 和可训练免费赠品包技术的效果。
  • 重参数化研究: 调研规划重参数化卷积和复合模型缩放策略。
  • 现有自定义流水线: 围绕 YOLOv7 特定架构构建了大量定制流水线,且难以轻松重构的项目。

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section新标准:介绍 YOLO26#

虽然 YOLOv10 在 2024 年实现了巨大的飞跃,但计算机视觉领域发展极快。对于所有新开发项目,我们强烈建议使用最新一代模型:Ultralytics YOLO26。它发布于 2026 年 1 月,代表了实时视觉 AI 的最高水平,在很大程度上取代了 YOLOv7 和 YOLOv10。

了解更多关于 YOLO26 的信息

YOLO26 带来了专门为现代部署环境设计的空前创新:

  • 端到端无 NMS 设计: 在 YOLOv10 的基础上,YOLO26 原生消除了 NMS 后处理,从而实现了更简单的部署管道和一致的高速推理。
  • CPU 推理速度提升高达 43%: 针对边缘计算和缺乏专用 GPU 的设备进行了深度优化,可大幅节省硬件成本。
  • 移除 DFL: 分布焦点损失(Distribution Focal Loss)已被完全移除,这极大地简化了导出逻辑,并显著提高了与低功耗边缘设备和微控制器的兼容性。
  • MuSGD 优化器: 受 Moonshot AI 的 Kimi K2 启发,这种 SGD 和 Muon 的混合体将 Large Language Model (LLM) 的训练创新直接引入到计算机视觉中,从而带来极高稳定性的训练动态和更快的收敛速度。
  • ProgLoss + STAL: 这些先进的损失函数在小目标识别方面带来了显著改进,这在历史上是一个充满挑战的领域,对于无人机、机器人和 smart city monitoring 至关重要。
  • 任务特定的改进: YOLO26 不仅仅是一个检测器。它包括专门的语义分割损失、用于超精确姿态跟踪的残差对数似然估计(RLE)以及用于消除 OBB 边界问题的专门角度损失算法。
管理数据集和训练

若要在管理数据集、训练 YOLO26 以及将模型部署到云端方面获得最佳体验,请探索 Ultralytics Platform。它提供了一个与 Python SDK 完美互补的无代码界面。

Link to this section实际应用场景#

选择正确的架构在很大程度上取决于你的硬件和应用限制。

Link to this section何时使用 YOLOv7#

YOLOv7 仍然是维护已深度集成其特定张量结构的旧系统,或复现 2022 年和 2023 年学术基准时的可靠选择。它在高端服务器 GPU 上表现优异。

Link to this section何时使用 YOLOv10#

YOLOv10 在需要严格且不变延迟的场景中表现突出。因为它无 NMS,非常适合高密度人群计数或 manufacturing defect detection,在这些场景中,目标数量变化很大,但每帧的处理时间必须保持恒定。

Link to this section何时使用 YOLO26#

YOLO26 是任何新项目的最终选择。从在基础的 Raspberry Pi 上部署复杂的 security alarm systems,到运行大规模的云端视频分析,其卓越的 CPU 速度和先进的小目标检测能力使其远优于旧版本。

对于有兴趣探索其他现代架构的开发者,我们还为基于 Transformer 的检测器(如 RT-DETR)以及上一代主流模型(如 Ultralytics YOLO11)提供广泛支持。

评论