YOLOv10 YOLOYOLOv10 :实时目标检测架构的演进
在计算机视觉快速发展的领域中,对延迟与准确性之间最佳平衡的追求推动着持续创新。这一进程中的两个重要里程碑是 YOLOv10,以其突破性的NMS而闻名;YOLO该模型通过神经架构搜索(NAS)技术突破了效率极限。本文将比较这两种模型的架构差异、性能指标及其在现代人工智能应用中的适用性。
性能指标分析
下表详细比较了关键性能指标。 YOLOv10 在现代GPU上展现出卓越的参数利用率和推理速度,尤其体现在大型模型变体中。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (毫秒) | 速度 T4 TensorRT10 (毫秒) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
YOLOv10:端到端先驱
由清华大学研究人员于2024年5月发布的 YOLOv10 通过消除非最大抑制(NMS)需求实现了范式转变。该架构解决了传统检测器中后期处理步骤常导致的延迟波动问题。
主要架构特性
- NMS:采用一致的双任务NMS方案,使模型能够直接为每个目标预测单个边界框。这对需要可预测延迟的应用至关重要,例如自动驾驶汽车或工业机器人。
- 整体效率-精度设计:作者王傲等人通过优化包括主干网络和头部在内的多个组件,有效减少了计算冗余。
- 轻量级分类头:降低分类分支的开销,该分支常是无锚检测器的瓶颈。
您可YOLOv10 Ultralytics Python 运行YOLOv10 ,从而受益于标准化接口。
from ultralytics import YOLO
# Load a pre-trained YOLOv10n model
model = YOLO("yolov10n.pt")
# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Run inference on an image
results = model("path/to/image.jpg")
results[0].show()
YOLO:大规模神经网络架构搜索
由阿里巴巴集团研发并于2022年11月发布的YOLO专注于高效架构的自动化发现。通过采用神经网络架构搜索(NAS)技术,该团队致力于在严格的计算预算下,为检测骨干网络寻找最优深度与宽度。
主要架构特性
- MAE-NAS 骨干网络:采用多目标进化搜索算法,寻找兼顾检测精度与推理速度的骨干网络结构。
- 高效RepGFPN:一种重颈设计,可提升特征融合能力,这对检测不同尺度的目标至关重要,例如在航空影像分析中。
- ZeroHead: 一种简化的 detect 头部,可降低最终预测层的复杂性。
YOLO 强劲YOLO 其依赖复杂的NAS流程,使得普通开发者难以针对定制数据集重新训练或修改架构,相比之下,Ultralytics 的用户友好配置则YOLO 。
Ultralytics 优势:YOLO26 登场
YOLOv10 YOLO 重大进步,该领域仍在持续发展。Ultralytics 在继承YOLOv10 NMS基础上YOLOv10 将其整合到更强大、更适合生产环境的生态系统中YOLOv10
为什么选择Ultralytics?
Ultralytics 维护完善的生态系统,确保您的模型不仅能满足当前需求,还能随着硬件和软件库的演进持续运行。与许多学术存储库Ultralytics 持续更新、详尽文档,并能与部署工具(如 TensorRT 和OpenVINO 等部署工具实现无缝集成。
YOLO26 创新
对于追求极致速度与精度的开发者而言,YOLO26相较于其前代产品实现了多项关键性改进:
- NMS: YOLOv10类似,YOLO26天生具备端到端特性。但它通过移除分布式焦点损失(DFL)进一步优化了这一特性,从而简化模型图结构,以实现与边缘设备和低功耗芯片的更佳兼容性。
- MuSGD优化器:受大型语言模型训练领域的创新启发(特别是Moonshot AI的Kimi K2算法),YOLO26采用了MuSGD优化器。这种融合了SGD 混合优化方案为训练过程带来前所未有的稳定性,实现更快的收敛速度并GPU 。
- CPU :YOLO26专为边缘计算进行优化,在CPU上实现最高达43%的推理速度提升。这使其成为无法使用GPU的物联网应用的理想选择。
- 增强型损失函数:引入ProgLoss 和STAL(自教锚点学习)后,在小目标和复杂背景下的性能显著提升。
对比用例
选择合适的模型很大程度上取决于您的具体部署限制和工作流要求。
何时使用 DAMO-YOLO
YOLO 神经架构搜索(NAS)研究场景中的有力候选模型。若您的项目需要探究自动化搜索策略对特征提取的影响,或您深度融入阿里巴巴生态系统,该模型将提供宝贵洞见。其RepGFPN模块亦是特征融合研究的绝佳参考范例。
何时使用YOLOv10
YOLOv10在低延迟方差至关重要的应用场景中YOLOv10 卓越。其NMS确保无论检测到多少目标,推理时间都能保持稳定,这对实时安全系统至关重要。
- 实时监控:在拥挤场景中保持稳定帧率。
- 机器人技术:控制回路的可预测时序。
为何YOLO26是更优选择
对于大多数开发者和商业应用而言Ultralytics 提供了最具吸引力的解决方案。它兼具YOLOv10 NMS的优势YOLOv10 卓越的训练效率和广泛的硬件支持。
- 易用性:通过单一Python 即可实现训练、验证和部署。
- 多功能性:与YOLO不同,YOLO26支持完整任务集,包括实例分割、姿势估计 、分类以及定向边界框旋转框检测。
- 内存效率:与transformer模型相比,YOLO26在训练过程中CUDA 显著减少,从而能够在消费级GPU上进行训练。
- 平台集成:无缝导出至 ONNX、CoreML TFLite 简化从原型到生产的流程Ultralytics
代码示例:YOLO26 工作流
Ultralytics向最新技术过渡变得轻而易举。以下代码片段演示了如何加载先进的YOLO26模型、运行推理并导出模型以供部署。
from ultralytics import YOLO
# Load the YOLO26s model (Small version)
model = YOLO("yolo26s.pt")
# Train on COCO8 dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Export to ONNX for simplified deployment
model.export(format="onnx", opset=13)
结论
YOLOv10 计算机视觉领域YOLO 宝贵的创新贡献。 YOLOv10 证明了NMS的可行性,YOLO展现了NAS的强大能力。然而Ultralytics 这些技术突破融合为一款全面、易用且高性能的工具。凭借卓越的速度、任务通用性及强大的生态系统支持,YOLO26已成为开发者构建新一代AI应用的首选解决方案。
若需进一步探索,建议查阅YOLO11 transformerRT-DETR 模型,了解其他架构方案。