Link to this sectionYOLO11 与 YOLOv10#
实时计算机视觉领域不断演进,全新的架构正在不断拓展边缘设备和云基础设施所能达到的极限。在这份详尽的技术分析中,我们将探讨该领域两个关键模型之间的细微差别:Ultralytics YOLO11 和 YOLOv10。两者均代表了 目标检测 能力的重大跨越,但它们为了实现各自的性能采用了本质上不同的架构理念。
Link to this section剖析 YOLO11 架构#
YOLO11 详情:
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期:2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- 文档:https://docs.ultralytics.com/models/yolo11/
作为一款多功能的强力模型,YOLO11 建立在多年 计算机视觉和人工智能 基础研究之上。YOLO11 的核心设计理念围绕着特征丰富度和跨多个 计算机视觉任务 的极致通用性展开。
YOLO11 最显著的改进之一是采用了 C3k2 Block。这种改进的瓶颈模块优化了整个网络中的梯度流,在保持高 精度 的同时,大幅提升了参数效率。此外,YOLO11 还采用了增强的空间注意力机制,这对识别细小或部分遮挡的目标至关重要。这使其成为 航空影像应用场景 和详细 医学图像分析 的卓越选择。
YOLO11 利用锚框无关(anchor-free)设计,最大限度地减少了超参数调优的复杂性,从而在各种自定义数据集上实现了稳健的泛化能力。此外,与基于 Transformer 的架构相比,其训练过程中的内存需求显著降低,使研究人员能够在标准消费级硬件上高效训练大型模型。
Link to this section探索 YOLOv10 架构#
YOLOv10 详情:
- 作者:Ao Wang, Hui Chen, Lihao Liu 等。
- 组织:清华大学
- 日期:2024-05-23
- Arxiv: https://arxiv.org/abs/2405.14458
- GitHub: https://github.com/THU-MIG/yolov10
- 文档:https://docs.ultralytics.com/models/yolov10/
YOLOv10 由清华大学的研究人员开发,作为 YOLO 系列中的端到端先驱引起了轰动。YOLOv10 的标志性特征是其 NMS-Free Training(无 NMS 训练)方法。通过在训练阶段采用一致的双重分配,模型能够自然地为每个对象精准预测唯一一个边界框。这一突破彻底消除了推理过程中对 非极大值抑制 (NMS) 的需求,这一后处理步骤在过去曾是部署流水线中产生延迟瓶颈的主要原因。
The architecture also introduces a holistic efficiency-accuracy design strategy. It incorporates spatial-channel decoupled downsampling and rank-guided block designs that selectively reduce redundancy in the network stages. This results in fewer FLOPs and reduced computational overhead without significantly sacrificing the mean Average Precision (mAP). For real-time applications where every millisecond counts, the removal of NMS provides a deterministic inference graph highly suitable for edge AI devices.
Link to this section性能指标与基准#
在评估这两个模型时,我们着眼于精度、参数量和速度之间的平衡。下表展示了它们在 COCO 数据集 上不同规模下的对比情况。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | 参数量 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
正如在 YOLO 性能指标 中所观察到的,YOLO11 在其各个变体中通常能获得略高的 mAP 分数,特别是在较大模型中。YOLOv10 的无 NMS 设计确保了高度稳定的端到端推理时间,但在使用 TensorRT 在 NVIDIA 硬件上进行优化时,YOLO11 依然能够实现卓越的吞吐量。
在为部署准备模型时,导出为优化格式至关重要。YOLO11 和 YOLOv10 均可使用 Ultralytics 框架无缝导出为 ONNX 和 TensorRT 等格式。有关分步说明,请参阅我们的 模型部署选项 指南。
Link to this sectionUltralytics 生态系统优势#
虽然独立的性能指标很重要,但周边的框架决定了机器学习项目的实际成功与否。这正是 YOLO11 作为 Ultralytics 生态系统原生的一员,真正大放异彩之处。
Ultralytics Platform 提供了极其精简的用户体验。借助简单且统一的 Python API,开发者可以处理超越基础边界框的任务。YOLO11 开箱即用地支持原生 实例分割、姿态估计、图像分类 和 旋转边界框 (OBB) 检测。这种巨大的通用性往往是专门的研究存储库所缺乏的。
此外,该生态系统拥有详尽的文档和活跃的社区支持。与用于实验跟踪的 Weights & Biases 以及用于 Intel 硬件优化的 OpenVINO 等工具的集成直接内置于库中。训练模型只需极少的样板代码,并受益于比重型 Transformer 模型(如 RT-DETR)消耗更少 CUDA 显存的高效训练过程。
Link to this section动手代码示例#
使用 Ultralytics 进行训练和运行推理被设计得尽可能直观。相同的 API 可以轻松处理 YOLO11 和 YOLOv10。
from ultralytics import YOLO
# Initialize the model (YOLO11n or YOLOv10n)
model = YOLO("yolo11n.pt")
# Train the model efficiently on a custom dataset
# Ultralytics automatically handles hyperparameters and memory optimization
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Run inference on an image
inference_results = model("https://ultralytics.com/images/bus.jpg")
# Display the detected objects
inference_results[0].show()Link to this section应用场景与建议#
在 YOLO11 和 YOLOv10 之间进行选择,取决于你的具体项目需求、部署限制和生态系统偏好。
Link to this section何时选择 YOLO11#
YOLO11 是以下场景的有力选择:
- 生产边缘部署: 在像 Raspberry Pi 或 NVIDIA Jetson 等设备上的商业应用,这些设备对可靠性和主动维护要求极高。
- 多任务视觉应用: 需要在单个统一框架内进行 detection、segmentation、pose estimation 和 OBB 的项目。
- 快速原型开发与部署: 团队需要使用精简的 Ultralytics Python API 从数据收集快速推进到生产环境。
Link to this section何时选择 YOLOv10#
推荐使用 YOLOv10 的情况:
- 无需 NMS 的实时检测: 得益于无需非极大值抑制(Non-Maximum Suppression)的端到端检测,能够降低部署复杂性的应用。
- 平衡的速度与精度权衡: 需要在推理速度和检测精度之间取得良好平衡的各类项目,适用于多种模型规模。
- 延迟一致的应用: 在机器人或自动驾驶系统等对可预测推理时间有严格要求的部署场景中。
Link to this section何时选择 Ultralytics (YOLO26)#
对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:
- 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
- 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
- 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。
Link to this section下一代:YOLO26#
虽然 YOLOv10 引入了革命性的无 NMS 范式,YOLO11 完善了多任务通用性,但人工智能领域发展迅速。对于今天开始新生产部署的开发者,我们强烈建议探索 Ultralytics YOLO26。
YOLO26 发布于 2026 年 1 月,它融合了两者之长。它原生采用了 YOLOv10 开创的 端到端无 NMS 设计,大幅简化了部署流水线并确保了延迟的一致性。此外,YOLO26 加入了专门的边缘计算优化。通过执行 DFL 移除(移除分布焦点损失),该架构保证了更易于导出,并实现了与传统模型相比 高达 43% 的 CPU 推理速度提升,使其成为低功耗物联网设备和移动应用的首选。
YOLO26 还通过创新的 MuSGD 优化器(一种受尖端 AI 研究启发的混合体)将大语言模型 (LLM) 的训练稳定性引入了计算机视觉。结合 ProgLoss + STAL 损失函数,YOLO26 在小目标上提供了无与伦比的精度,这对于详细的 交通视频检测 和复杂的机器人自动化至关重要。
Link to this section结论#
选择合适的视觉模型取决于你的特定操作约束。YOLOv10 作为学术界的一个重要里程碑,证明了 NMS 可以从检测流水线中有效消除。然而,为了在性能、全面的任务通用性和无缝部署工具之间获得卓越平衡,YOLO11 提供了一个稳健且可投入生产的解决方案。
对于追求极致前沿技术——结合端到端的简洁性与极速边缘性能——的工程师来说,迁移到最新的 YOLO26 是我们的终极推荐。通过利用全面的 Ultralytics Platform,你可以确保你的项目建立在一个维护良好、高效且面向未来的基础之上。