YOLOv10 YOLO11:连接学术创新与实际应用规模
实时目标检测技术的演进历程,以速度、精度和架构效率的快速提升为标志。近期发展史上的两大关键参与者是 YOLOv10 和 YOLO11。尽管两者均突破了计算机视觉技术的边界,但它们源于不同的设计理念,并针对人工智能领域中不同的需求而存在。本比较将深入探讨这两种模型的技术规格、架构差异及实际应用场景,以帮助开发者根据具体需求选择合适的工具。
YOLOv10:端到端检测的学术先驱
由清华大学研究人员于2024年5月发布的 YOLOv10 通过采用NMS策略, YOLO 引发了范式转变。传统YOLO 依赖非最大抑制(NMS)在推理阶段过滤重叠边界框。尽管有效,NMS 在部署延迟中NMS 瓶颈,并使导出至TensorRT等格式的过程复杂化。 TensorRT 或ONNXNX等格式的导出流程。
主要架构创新
YOLOv10 通过训练阶段的双重分配策略YOLOv10 这些难题。它采用一对多头进行学习阶段的丰富监督,同时采用一对一头进行推理,使模型能够直接为每个目标预测单个最佳边界框。这消NMS 的需求,显著降低了边缘设备的延迟。
此外YOLOv10 整体效率-精度驱动的模型设计。该设计包含轻量级分类头、空间-通道解耦下采样以及秩引导的块设计,这些要素共同减少了计算冗余。
技术元数据:
- 作者: Ao Wang, Hui Chen, Lihao Liu, et al.
- 组织:清华大学
- 日期: 2024-05-23
- Arxiv:YOLOv10:实时端到端目标检测
- GitHub:THU-MIG/yolov10
Ultralytics YOLO11:为企业级规模优化
Ultralytics于2024年9月发布, Ultralytics YOLO11 在 YOLOv8 和 YOLOv9的强大框架基础上发展而来。虽然它保留了NMS的方法(与原生端YOLOv10),YOLO11 特征提取效率 和参数优化。它被设计为计算机视觉领域的"瑞士军刀",不仅在检测方面表现出色,而且在实例分割、姿势估计 、分类和 定向边界框旋转框检测等广泛任务中都表现优异。
YOLO11的进展
YOLO11 精炼的骨干架构(C3k2),该架构提升了跨尺度特征融合能力。这使得模型能够比前代方案更有效地捕捉复杂场景中的精细细节——例如航拍图像中的微小物体。此外,Ultralytics 深度集成,确保了NVIDIA 基础CPU等各类硬件平台上训练、验证与部署的无缝支持。
技术元数据:
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2024-09-27
- 文档:YOLO11 文档
- GitHub:ultralytics/ultralytics
性能对比
在比较性能时,关键要超越单纯mAP ,同时考量速度、模型规模(参数数量)与计算成本(浮点运算次数)之间的权衡关系。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (毫秒) | 速度 T4 TensorRT10 (毫秒) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
数据分析
虽然 YOLOv10 在某些配置(如'M'模型)中参数数量较少, YOLO11 却常能获得更高的 mAP 分数,并在T4 GPU上展现出具有竞争力的推理速度甚至更优表现,充分验证了其优化骨干架构的有效性。
理想用例
何时选择 YOLOv10
YOLOv10 面向研究型项目或特定边缘部署场景YOLOv10 绝佳选择,在这些场景中,移除NMS 对降低延迟至关重要。其端到端架构简化了特定嵌入式系统的导出流程,在这些系统中,后处理逻辑难以高效实现。
- 嵌入式系统:具有有限CPU 用于后处理的设备。
- 学术研究:探索NMS架构及双目标分配训练策略。
- 延迟关键型应用:高速机器人领域,其中每次推理延迟的毫秒级差异都至关重要。
何时选择 Ultralytics YOLO11
YOLO11 生产级应用的首选解决方案YOLO11 它兼顾了高精度、多功能性和易用性。Ultralytics ,它提供了从数据标注到模型监控的简化工作流程。
- 企业级解决方案:适用于需要可靠维护代码库和商业许可的大规模部署场景。
- 复杂视觉任务:需要在检测之外同时姿势估计 或分割的项目。
- 云端训练: Ultralytics 无缝集成,用于管理数据集和训练运行。
- 多功能性:面向需要单一框架处理分类、检测和分割任务,并采用统一API的开发者。
Ultralytics 生态系统优势
YOLO111111111111111111111111111111111111111111 YOLO11 的核心优势在于其生态系统。YOLOv10 学术成果令人瞩目YOLOv10 YOLO11 持续更新、详尽文档以及Ultralytics 等工具的深度集成YOLO11 。
- 易用性: Python 仅需几行代码即可完成模型训练。
- 内存效率:与许多Transformer替代方案相比Ultralytics 在训练过程中经过优化,可降低内存使用量,使其能够在消费级GPU上运行。
- 广泛兼容性:将您的YOLO11YOLO11 导出至 CoreML、 OpenVINO、 TensorRT等平台。
from ultralytics import YOLO
# Load a pretrained YOLO11 model
model = YOLO("yolo11n.pt")
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
展望未来:与YOLO26共创未来
尽管YOLOv10 YOLO11 重要的里程碑,但该领域发展迅猛。对于追求绝对前沿技术的开发者而言, YOLO26 (2026年1月发布)实现了两全其美。
YOLO26 采用由YOLOv10 率先提出的NMS 端到端设计 YOLOv10 Ultralytics 专为企业级规模打造的优化方案进行精进。 该方案通过移除分布式焦散损耗(DFL)实现更简洁的模型导出,并采用创新的MuSGD优化器,以实现稳定的、受大型语言模型启发的训练收敛。相较前代产品 CPU 提升高达43%,同时改进ProgLoss + STAL等损失函数,是现代计算机视觉项目的终极推荐方案。
对于关注其他专用架构的用户,文档还涵盖了 RT-DETR 用于transformer检测,以及YOLO用于开放词汇任务。