跳转至内容

YOLO26与YOLOv10:端到端目标检测的进化之路

实时物体检测领域正经历着快速变革。2024年, YOLOv10 凭借开创性的无最大值抑制(NMS)训练方法引发轰动,有效消除了推理管道中的重大瓶颈。时至2026年Ultralytics 在这些理念基础上进行优化与扩展,推出原生端到端架构,不仅速度更快、精度更高,更深度融入Ultralytics 。

本指南对这两种具有重要影响力的模型进行了技术对比,旨在帮助开发者、研究人员和工程师为其计算机视觉应用选择合适的工具。

性能指标比较

在评估现代检测器时,速度与精度的权衡至关重要。YOLOv2针对边缘设备和CPU 进行了重大优化,相较于前代产品,在CPU上实现了高达43%的速度提升。而 YOLOv10 仍是高效能模型,YOLO26却以更轻量级的计算资源突破了技术边界。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

架构创新

Ultralytics :新标准

作者:Glenn Jocher, Jing Qiu
机构:Ultralytics
日期:2026年1月14日

YOLO26是效率与易用性研究的集大成之作。它采用端到NMS,YOLOv10类似,但通过若干关键架构改进增强了鲁棒性和部署灵活性。

  1. DFL移除:通过移除分布式焦点损失(DFL),模型架构得以简化。此项变更对出口兼容性至关重要,使模型更易部署于树莓派或移动设备等受限边缘硬件——在这些平台上,复杂的输出层可能引发延迟问题。
  2. MuSGD优化器:受大型语言模型(LLMs)训练稳定性的启发,YOLO26采用融合SGD MuonSGD 混合优化器。这项源自Moonshot AI Kimi K2的创新技术,确保更快的收敛速度与稳定的训练过程,从而降低计算成本。
  3. 渐进损失(ProgLoss)软目标锚损失(STAL)的引入显著提升了小目标检测性能这使得YOLO26在航空影像分析或制造业缺陷检测等任务中表现尤为出色。

了解更多关于 YOLO26 的信息

YOLOv10:NMS先驱者

作者:王洵等
机构:清华大学
日期:2024年5月23日

YOLOv10 具有里程碑意义的版本,它解决了NMS 的冗余问题。其主要创新在于采用一致双目标分配机制,实现了NMS训练。

  • 双重标注:在训练过程中,模型同时采用一对多和一对一的标签分配方式。这使得模型能够学习丰富的表示,同时确保在推理阶段每个对象仅生成一个预测结果,从而无需NMS(非最大相似度)处理。
  • 整体效率设计:作者引入了轻量级分类头和空间-通道解耦下采样技术以降低计算开销,这体现在其较低的浮点运算次数上。

了解更多关于 YOLOv10

NMS瓶颈

非最大抑制(NMS)是用于过滤重叠边界框的后处理步骤。虽然该方法有效,但会引入延迟波动并增加部署复杂度。YOLOv2和YOLOv10 均YOLOv10 此步骤,使推理时间具有确定性且更快。

集成与生态系统

最显著的差异之一在于周边生态系统。Ultralytics Ultralytics 旗舰模型,确保对所有任务和模式提供即时支持。

Ultralytics 优势

代码对比

两种模型均可通过 ultralytics Python 突显了该库的灵活性。然而,YOLO26受益于最新的实用函数和优化。

from ultralytics import YOLO

# ----------------- YOLO26 -----------------
# Load the latest YOLO26 model (NMS-free, optimized for CPU)
model_26 = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimizer enabled automatically
model_26.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference with simplified output (no NMS overhead)
results_26 = model_26("path/to/image.jpg")


# ----------------- YOLOv10 -----------------
# Load the YOLOv10 model (Historical academic checkpoint)
model_10 = YOLO("yolov10n.pt")

# Train using standard settings
model_10.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference
results_10 = model_10("path/to/image.jpg")

应用场景与建议

选择这些模型取决于您的具体部署限制和项目目标。

YOLO26 的理想应用场景

  • 基于CPU的边缘AI:若您的应用运行在无专用GPU 硬件上GPU 如标准笔记本电脑、低功耗物联网网关),YOLO26凭借其快43%CPU ,无疑是最佳选择。
  • 商业解决方案:针对需要长期可维护性、严格许可透明度(企业许可证)及可靠支持的企业级应用,YOLO26专为生产环境设计。
  • 复杂任务:无论是需要定向边界框的航测项目,还是用于运动分析的姿势估计 ,都能从YOLO26的多任务能力中获益。

YOLOv10 的理想应用场景

  • 学术研究:研究人员若想探索NMS训练或标签分配策略的理论基础YOLOv10 arXiv论文及其架构将提供宝贵的参考价值。
  • 传统基准测试:在与2024年代基准进行对比时YOLOv10 注重效率架构的卓越标杆。

部署灵活性

Ultralytics 在可移植性方面表现卓越。您可轻松将训练好的YOLO26模型导出至 ONNXCoreML 单条命令即可调用TensorRT 或CoreML : yolo export model=yolo26n.pt format=onnx.

结论

这两种架构在推动计算机视觉发展方面都发挥了关键作用。 YOLOv10 成功挑战了NMS必要性,证明端到端检测在实时应用中具有可行性。

Ultralytics 在此突破基础上更臻完善。通过融合NMS、MuSGD优化器的稳定性、边缘设备友好的深度全局优化(DFL)移除方案,Ultralytics 全面支持,YOLO26 为当今开发者提供了最均衡的高性能解决方案。无论是构建智能城市交通系统还是移动文档扫描器,YOLO26 都能提供成功所需的速度与精度。

延伸阅读


评论