Link to this sectionYOLOv7 与 YOLOv10#
计算机视觉领域在过去几年中见证了显著进步,YOLO (You Only Look Once) 系列模型在实时目标检测方面一直处于领先地位。为你的计算机视觉项目选择合适的架构,需要对现有选项有深刻理解。在这篇全面的技术对比中,我们将探讨两个里程碑式架构的关键差异:YOLOv7 和 YOLOv10。
Link to this section模型简介#
这两个模型都代表了人工智能历史上的重要里程碑,但它们在解决目标检测挑战时采取了根本不同的方法。
Link to this sectionYOLOv7:“免费赠品包”的先驱#
YOLOv7 由 中央研究院信息科学研究所 的研究员 Chien-Yao Wang、Alexey Bochkovskiy 和 Hong-Yuan Mark Liao 于 2022 年 7 月 6 日发布,它引入了神经网络优化方式的范式转变。其原始研究详情见于他们的 学术论文 并托管在他们的 官方 GitHub 仓库 中,重点关注架构重参数化和可训练的“免费赠品集”(bag-of-freebies)。
YOLOv7 利用扩展的高效层聚合网络 (E-ELAN) 来引导网络学习多样化特征,同时不破坏原始梯度路径。这使其成为学术研究基准测试以及严重依赖标准高端 GPU 的系统的稳健选择。
Link to this sectionYOLOv10:实时端到端检测#
YOLOv10 由 清华大学 的 Ao Wang 及其团队开发,于 2024 年 5 月 23 日发布。正如其 arxiv 出版物 和 清华 GitHub 仓库 中所述,该模型消除了目标检测中长期存在的瓶颈:非极大值抑制 (NMS)。
YOLOv10 引入了用于 NMS-free 训练的一致性双重分配,从根本上改变了后处理流水线。通过采用整体效率与精度驱动的模型设计策略,YOLOv10 减少了计算冗余。这带来了一种专门为需要极低延迟的边缘设备量身定制的架构。
Link to this section性能与指标对比#
在分析模型性能时,权衡精度、速度和计算权重至关重要。下表展示了这些模型在不同规模下的表现对比。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (ms) | 速度 T4 TensorRT10 (ms) | 参数量 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
| YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
| YOLOv10n | 640 | 39.5 | - | 1.56 | 2.3 | 6.7 |
| YOLOv10s | 640 | 46.7 | - | 2.66 | 7.2 | 21.6 |
| YOLOv10m | 640 | 51.3 | - | 5.48 | 15.4 | 59.1 |
| YOLOv10b | 640 | 52.7 | - | 6.54 | 24.4 | 92.0 |
| YOLOv10l | 640 | 53.3 | - | 8.33 | 29.5 | 120.3 |
| YOLOv10x | 640 | 54.4 | - | 12.2 | 56.9 | 160.4 |
Link to this section分析权衡#
上述指标揭示了明显的代际差距。虽然 YOLOv7x 提供了 53.1% 的高 mAPval,但它需要 71.3M 参数和 189.9B FLOPs。相比之下,YOLOv10l 在超过该精度的同时(53.3% mAP),所需的参数不到前者的一半(29.5M),且 FLOPs 显著减少(120.3B)。此外,高度优化的 YOLOv10n 提供了 1.56ms 的惊人推理速度,使其成为实时视频分析和移动应用程序的理想选择。
Link to this section实际应用场景#
这些模型之间的架构差异决定了它们的最佳使用场景。
Link to this section何时使用 YOLOv7#
由于其丰富的特征表示,YOLOv7 在高度复杂的环境中表现优异。诸如 监测交通流量(在人口稠密的城市地区)、分析卫星图像或在 制造自动化 中识别缺陷等用例,都受益于其稳健的结构重参数化。它在那些已经深度集成特定 PyTorch 1.12 流水线的遗留环境中也受到高度青睐。
Link to this section何时使用 YOLOv10#
YOLOv10 的 NMS-free 轻量级设计在受限环境中表现出色。它非常推荐用于 边缘计算设备,如 NVIDIA Jetson Nano 或 Raspberry Pi。其低延迟性能使其非常适合快速移动的应用程序,例如 体育分析、自主无人机导航以及传送带上的高速机器人分拣。
Link to this sectionUltralytics 生态系统优势#
虽然这两个模型都有深厚的学术背景,但只有在统一的 Ultralytics Platform 中使用时,它们才能发挥出真正的潜力。从零开始开发计算机视觉模型极其困难,但 Ultralytics 生态系统为机器学习工程师提供了无与伦比的体验。
- 易用性: Ultralytics Python API 提供了一个统一的接口。你只需几行代码即可训练、验证和导出模型,从而避免了典型学术存储库中常见的复杂依赖地狱。
- 维护良好的生态系统: Ultralytics 保证底层代码得到积极开发。用户可以受益于与流行 ML 工具的无缝集成,例如用于记录实验的 Weights & Biases,或用于快速 Web 演示的 Hugging Face。
- 内存需求: 基于 Transformer 的目标检测器在训练期间往往会消耗大量 CUDA 内存。相比之下,Ultralytics YOLO 模型所需的内存少得多,这允许在消费级硬件上使用更大的 batch sizes。
- 通用性: Ultralytics 流水线并不局限于标准的边界框。它无缝支持 姿态估计、实例分割 以及跨模型系列(如 YOLO11 和 YOLOv8)的旋转边界框。
Link to this section精简的训练示例#
使用 Ultralytics 运行训练流水线非常直观。无论你是利用 YOLOv7 的历史稳健性,还是 YOLOv10 的 NMS-free 速度,语法都保持一致:
from ultralytics import YOLO
# Load the preferred model (e.g., YOLOv10 Nano)
model = YOLO("yolov10n.pt")
# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run an inference prediction on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")
# Export to an edge-friendly format like ONNX
model.export(format="onnx")Link to this section应用场景与建议#
在 YOLOv7 和 YOLOv10 之间进行选择,取决于你的具体项目需求、部署限制和生态系统偏好。
Link to this section何时选择 YOLOv7#
YOLOv7 是以下场景的有力选择:
- 学术基准测试: 重现 2022 年水平的最先进结果,或研究 E-ELAN 和可训练免费赠品包技术的效果。
- 重参数化研究: 调研规划重参数化卷积和复合模型缩放策略。
- 现有自定义流水线: 围绕 YOLOv7 特定架构构建了大量定制流水线,且难以轻松重构的项目。
Link to this section何时选择 YOLOv10#
推荐使用 YOLOv10 的情况:
- 无需 NMS 的实时检测: 得益于无需非极大值抑制(Non-Maximum Suppression)的端到端检测,能够降低部署复杂性的应用。
- 平衡的速度与精度权衡: 需要在推理速度和检测精度之间取得良好平衡的各类项目,适用于多种模型规模。
- 延迟一致的应用: 在机器人或自动驾驶系统等对可预测推理时间有严格要求的部署场景中。
Link to this section何时选择 Ultralytics (YOLO26)#
对于大多数新项目,Ultralytics YOLO26 提供了性能和开发者体验的最佳组合:
- 无 NMS 的边缘部署: 需要一致、低延迟推理且无需复杂非极大值抑制后处理的应用。
- 仅 CPU 环境: 没有专用 GPU 加速的设备,YOLO26 带来的高达 43% 的 CPU 推理提速可提供决定性优势。
- 小目标检测: 具有挑战性的场景,如 aerial drone imagery 或 IoT 传感器分析,其中 ProgLoss 和 STAL 可显著提升对极小目标的检测精度。
Link to this section未来展望:引入 YOLO26#
虽然 YOLOv7 和 YOLOv10 是令人印象深刻的里程碑,但 AI 的前沿技术始终在前进。发布于 2026 年 1 月的 Ultralytics YOLO26 是所有边缘和云端部署场景中公认的效率和准确性新标准。
如果你今天正在开始一个新的计算机视觉项目,YOLO26 是推荐的架构。它通过结合多项突破性创新,建立在其前辈的遗产之上:
- 端到端 NMS-free 设计: YOLO26 借鉴了 YOLOv10 的灵感,原生消除了 NMS 后处理,为确定性实时机器人技术确保了超低延迟推理。
- CPU 推理速度提升高达 43%: 通过策略性地移除分布焦点损失 (DFL) 模块,YOLO26 大幅加速了在非 GPU 边缘计算硬件上的执行速度,使其成为 IoT 设备 的强力支撑。
- MuSGD 优化器: 受近期大语言模型训练创新的启发,YOLO26 结合了 SGD 和 Muon 的混合体,稳定了训练路径并保证了更快的收敛速度。
- ProgLoss + STAL: 这些先进的损失函数在小目标识别方面产生了显著改进,克服了旧版 YOLO 代系中的历史弱点。
- 无与伦比的通用性: YOLO26 具有原生的任务特定优化功能,例如用于姿态跟踪的残差对数似然估计 (RLE),以及用于航拍图像中精确 OBB 检测的专用角度损失。
对于寻求速度、精度和部署简单性终极平衡的工程师来说,从传统模型过渡到 YOLO26 可提供直接且可衡量的竞争优势。