Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv10 与 YOLO11#

计算机视觉领域在不断演进,新的架构持续突破实时处理的极限。对于在该领域快速发展的开发者和研究人员来说,了解前沿模型之间的细微差别至关重要。这份详尽的对比分析探讨了 YOLOv10Ultralytics YOLO11 这两款高性能目标检测框架在技术差异、性能取舍及理想使用场景方面的不同。

虽然两款模型在基准数据集上均取得了出色的表现,但它们的设计理念和生态系统集成存在显著差异。通过研究它们的架构,我们可以确定哪种方案最符合你的部署限制和项目目标。

Link to this sectionYOLOv10:开创性的无 NMS 端到端检测#

YOLOv10 发布于 2024 年春季,它通过直接解决后处理相关的延迟开销,为传统目标检测流程带来了一种全新的方法。

YOLOv10 的核心创新在于其一致的双重分配策略,这使得无 NMS 训练成为可能。传统目标检测器严重依赖 非极大值抑制 (NMS) 来过滤多余的边界框预测。通过移除这一步骤,YOLOv10 实现了真正的端到端检测,减少了推理延迟,并简化了在 神经处理单元 (NPU) 等硬件加速器上的部署,因为在这些硬件上,自定义 NMS 操作通常难以优化。

了解更多关于 YOLOv10 的信息

Link to this sectionYOLO11:生态驱动的多功能性与高性能#

YOLO11 于同年晚些时候发布,代表了 Ultralytics 模型系列的持续改进,专注于速度、准确性和开发者体验的最佳平衡。

YOLO11 是专为生产环境设计的。虽然它在标准边界框检测方面表现优异,但其真正的优势在于其多功能性。与主要专注于目标检测的 YOLOv10 不同,YOLO11 使用统一架构原生支持 实例分割姿态估计图像分类旋转边界框 (OBB) 任务。它在训练过程中对内存需求极低,相较于较重的 Transformer 架构,对于使用消费级 GPU 的团队来说非常友好。

了解更多关于 YOLO11 的信息

Link to this section性能与指标对比#

在对比这些模型时,必须观察它们在 COCO 数据集 等标准基准测试中,跨不同规模变体的性能表现。

下表重点介绍了性能差异。YOLO11 在大多数尺寸类别中的 mAP 表现经常略优于 YOLOv10,同时保持了极具竞争力的 TensorRT 推理速度。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
硬件加速

为了在本地重现这些快速的推理速度,请务必将你的模型导出为优化格式,例如用于 Intel CPU 的 OpenVINO 或用于 NVIDIA GPU 的 TensorRT。

Link to this section架构深度解析#

Link to this section训练方法与效率#

YOLOv10 的架构强调减少计算冗余。清华大学的作者通过采用一种整体效率与准确性并重的策略来优化主干网络和颈部设计,从而在相比以往迭代版本的中等规模模型(如 YOLOv10m)中显著降低了参数量。

然而,训练效率是 Ultralytics 模型的主要标志。YOLO11 使用了高度精简的 ultralytics Python 包,它抽象化了复杂的 超参数调优 过程。该框架能够开箱即用地自动处理高级数据增强、学习率调度和多 GPU 分布式训练。YOLO11 的架构还展现出极佳的梯度流动,从而在训练阶段实现更快的收敛和更低的显存占用。

Link to this section易用性与生态优势#

企业采用的一个关键因素是维护良好的生态系统。研究类仓库虽然具有开创性,但在论文发表后往往会处于停滞状态。支持 YOLO11 的 Ultralytics 生态系统提供了无缝的端到端开发者体验。

YOLO11 与 Weights & Biases 等实验跟踪工具和 Roboflow 等数据集管理工具无缝集成,加速了从原型到生产的进程。其易用性体现在精简的 API 中,让开发者只需几行代码即可完成模型的训练和导出。

from ultralytics import YOLO

# Initialize the YOLO11 small model
model = YOLO("yolo11s.pt")

# Train the model efficiently with optimized memory handling
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="0")

# Export to ONNX format for deployment flexibility
model.export(format="onnx")

Link to this section应用场景与建议#

选择 YOLOv10 还是 YOLO11 取决于你的具体项目需求、部署限制和生态偏好。

Link to this section何时选择 YOLOv10#

YOLOv10 是以下情况的有力选择:

  • 无需 NMS 的实时检测: 得益于无需非极大值抑制(Non-Maximum Suppression)的端到端检测,能够降低部署复杂性的应用。
  • 平衡的速度与精度权衡: 需要在推理速度和检测精度之间取得良好平衡的各类项目,适用于多种模型规模。
  • 延迟一致的应用:机器人或自动驾驶系统等对可预测推理时间有严格要求的部署场景中。

Link to this section何时选择 YOLO11#

YOLO11 推荐用于:

Link to this section何时选择 Ultralytics (YOLO26)#

对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:

  • 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
  • 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
  • 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。

Link to this section探索其他架构#

尽管 YOLOv10 和 YOLO11 是极佳的选择,但你的特定用例可能更适合文档中提供的其他架构。对于基于序列的推理,RT-DETR 等 Transformer 模型提供了高准确性,尽管它们通常有更高的内存要求。反之,如果你需要在不重新训练的情况下识别新类别,YOLO-World 提供了一种由自然语言提示驱动的开放词汇方法。

Link to this section下一代:YOLO26#

对于追求极致尖端技术的团队,最近发布的 Ultralytics YOLO26 结合了上述两款模型各自的优势。YOLO26 发布于 2026 年 1 月,是针对现代部署场景的终极推荐方案。

在继承前代产品基础的同时,YOLO26 原生集成了端到端无 NMS 设计,有效消除了 YOLOv10 首次解决的后处理瓶颈,并将其保持在稳健的 Ultralytics 框架内。此外,YOLO26 还具备 DFL 移除(分布焦点损失)功能,这大幅简化了模型导出图并增强了与边缘及低功耗 IoT 设备的兼容性。

随着 MuSGD 优化器的引入,训练稳定性也实现了代际跃升。这是一种受大模型训练方法启发的混合方案,确保了极快的收敛速度。结合 ProgLoss + STAL 等先进损失函数,YOLO26 在小目标识别方面取得了显著改进。对于在标准边缘设备上的部署,这些架构改进带来了高达 43% 的 CPU 推理速度提升,使 YOLO26 成为处理所有计算机视觉任务时无可匹敌的选择。

评论