跳转至内容

YOLO YOLOv10:实时目标检测技术的演进之路

实时目标检测领域正经历着快速演进,其发展动力源于对更低延迟和更高精度的持续追求。在这段征程中,阿里巴巴集团YOLOYOLOv10。YOLO 先进的神经网络架构搜索(NAS)YOLO 该领域YOLO YOLOv10 YOLO 非最大YOLO (NMS)YOLOv10 将全面对比两者的技术架构与性能指标,并阐释为何YOLO26等Ultralytics 代表着这些技术在NMS巅峰成就。

绩效指标对比

下表提供了关键性能指标的直接对比。请注意推断速度的差异,特别是NMS设计有助于降低延迟的情况。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
DAMO-YOLOt64042.0-2.328.518.1
DAMO-YOLOs64046.0-3.4516.337.8
DAMO-YOLOm64049.2-5.0928.261.8
DAMO-YOLOl64050.8-7.1842.197.3
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

YOLO:架构与方法论

YOLO由阿里巴巴集团的研究人员于2022年11月提出,旨在通过将尖端技术整合到统一的探测器框架中,突破性能极限。

  • 作者: Xianzhe Xu、Yiqi Jiang、Weihua Chen、Yilun Huang、Yuan Zhang 和 Xiuyu Sun
  • 组织: 阿里巴巴集团
  • 日期: 2022-11-23
  • 论文:arXiv:2211.15444
  • GitHub:tinyvision/DAMO-YOLO

主要架构特性

YOLO 其采用神经网络架构搜索(NAS)技术。不同于采用人工设计的骨干网络模型YOLO 方法感知高效NAS(MAE-NAS)在特定约束条件下探索最优网络结构。由此生成的骨干网络能针对特定硬件实现高度优化,显著提升运行效率。

此外,该模型集成了高效的RepGFPN(重参数化广义特征金字塔网络)用于特征融合,并采用名为"ZeroHead"的轻量级头部结构。 其训练策略的关键组件是AlignedOTA——一种动态标签分配机制,可优化分类与回归任务间的对齐效果。然而,要YOLO 达到峰值性能YOLO 需要复杂的知识蒸馏过程,这要求训练阶段使用庞大的教师模型,相较于YOLOv7采用的"bag-of-freebies"方法,会显著增加计算负担。 YOLOv8所采用的"自由样本袋"方法相比,计算负担大幅增加。

训练复杂性

尽管功能强大YOLO 训练流程YOLO 消耗大量资源。其蒸馏阶段通常需要先训练更大的教师模型,这使得开发者在自定义数据集上进行快速迭代时,工作流程变得复杂。

YOLOv10:端到端的突破

由清华大学于2024年5月发布, YOLOv10 通过解决目标检测领域长期存在的瓶颈——非最大抑制(NMS)问题,实现了范式转变。

架构创新

YOLOv10 的核心特征YOLOv10 其端到NMS。传统检测器会生成冗余边界框,必须通过NMS(NMS二乘法)进行过滤——这一后处理步骤会引入延迟并增加部署复杂度。YOLOv10 在训练YOLOv10 一致性双重分配策略——同时运用一对多匹配(实现丰富监督)与一对一匹配(支持端到端推理)。该机制使模型能直接为每个目标预测最佳边界框,彻底消NMS 环节。

此外YOLOv10 整体效率与精度驱动的模型设计。该设计包含轻量级分类头、空间-通道解耦下采样以及秩引导的块设计,由此构建的模型在体积和速度上均优于前代模型,例如 YOLOv9 ,同时保持了具有竞争力的准确率。

了解更多关于 YOLOv10

Ultralytics 优势:为何选择 YOLO26?

YOLO YOLOv10 学术领域YOLOv10 Ultralytics 却架起了前沿研究与实用可靠生产软件之间的桥梁。新发布的YOLO26在YOLOv10 NMS突破的基础上YOLOv10 将其整合为一个稳健的企业级框架YOLOv10

卓越性能与效率

YOLO26是新项目的推荐选择YOLO YOLOv10 ,它具有显著优势:

  • 端到端NMS: YOLOv10类似,YOLOv26天生具备端到端特性。它消NMS ,从而简化了部署流程,并显著降低了延迟波动性。
  • 增强训练稳定性: YOLO26采用MuSGD优化器,该混合算法融合了SGD 大型语言模型(LLM)训练启发的Muon算法。这项创新确保了更快的收敛速度和更高的训练稳定性,相较于transformer架构,可显著降低GPU
  • 边缘优化:通过移除分布式焦点损失(DFL),YOLO26精简了输出层,使 CPU 速度提升高达43%。这对无法GPU 的边缘设备至关重要。

YOLO26 技术飞跃

YOLO26不仅是版本迭代,更是全面升级。

易用性与生态系统

像YOLO 这样的研究存储库面临的主要挑战之一YOLO 设置和维护的复杂性。Ultralytics 通过统一Python Ultralytics 这个问题。无论您使用的是 YOLO11、YOLOv10还是YOLO26,工作流程始终保持一致且简洁。

Ultralytics (原名HUB)通过提供数据集管理工具、自动化标注功能以及一键导出 TensorRT、CoreML格式的支持,进一步加速了开发进程。

了解更多关于 YOLO26 的信息

理想用例

选择合适的模型取决于您的具体限制条件:

  • 选择YOLO 您进行神经网络架构搜索(NAS)研究,或因特殊硬件限制需要专用骨干结构,而标准CSP/ELAN骨干网络无法满足需求YOLO
  • 选择YOLOv10 您需要特定的NMS检测器用于学术基准测试,或因历史原因需要采用清华大学原始论文中提出的特定架构 YOLOv10 。
  • Ultralytics :当您需要一款生产就绪的尖端解决方案时。NMS设计,结合MuSGD训练稳定性与 CPU 使其成为全能之选。尤其在制造、零售分析及自主系统等实时应用场景中表现卓越——这些领域对部署便捷性和长期支持至关重要。

代码示例:运行YOLOv10和YOLO26

Ultralytics 这些架构之间切换Ultralytics 极其简单。Ultralytics YOLOv10 您只需极少修改代码即可同时测试两种模型。

运行YOLOv10

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model
model = YOLO("yolov10n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Show results
results[0].show()

训练YOLO26

要利用YOLO26的最新进展(如MuSGD优化器和ProgLoss),在自定义数据集上进行训练变得非常简单:

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset using the new optimizer settings (auto-configured)
model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Export to ONNX for simplified edge deployment
model.export(format="onnx")

结论

YOLOv10 该领域的发展YOLO 高效的NAS技术YOLOv10 YOLOv10 开创性地移除NMS引领变革。然而对于计划在2026年构建稳健且面向未来的应用程序的开发者Ultralytics 具备决定性优势。 YOLO26融合YOLOv10 NMS架构YOLOv10 卓越的训练动态性YOLOv10 更快的CPU YOLOv10 以及Ultralytics 无可比拟的支持YOLOv10 已成为计算机视觉专业人士的首选方案。

对于有兴趣探索先前稳定版本的人士, YOLO11 仍是完全受支持且功能强大的替代方案。


评论