跳转至内容

YOLOv6-3.0 与 YOLOv7:工业级速度与精度深度解析

选择最佳物体检测模型是一项关键决策,它取决于推理速度、准确性和计算效率之间的平衡。本技术比较探讨了YOLOv6.0YOLOv6 之间的区别。 YOLOv7之间的区别。通过分析它们的架构、基准和理想用例,开发人员可以确定哪种解决方案最适合他们的特定部署限制。

YOLOv6-3.0:专为工业效率而设计

YOLOv6-3.0 代表了 YOLO 系列的重大演进,专门为工业应用量身定制,在这些应用中,实时速度和硬件效率是不容妥协的。此版本由美团开发,专注于优化延迟和准确性之间的权衡,使其成为边缘计算和高吞吐量环境的强大选择。

作者: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu, and Xiangxiang Chu
机构:美团
日期: 2023-01-13
Arxiv:https://arxiv.org/abs/2301.05586
GitHub:https://github.com/meituan/YOLOv6
文档:https://docs.ultralytics.com/models/yolov6/

架构和主要特性

YOLOv6-3.0 的架构围绕硬件感知设计理念构建。它采用可重参数化主干网络 (EfficientRep),这使得模型能够在训练期间利用复杂结构以更好地学习特征,同时在推理期间折叠成更简单、更快的结构。这项技术显著降低了内存访问成本并改善了推理延迟

主要架构创新包括:

  • 双向拼接 (BiC):该模块通过增强特征传播来提高定位精度。
  • Anchor-Aided Training (AAT): 一种结合了基于 anchor 和无 anchor detect 器优势的策略,旨在稳定训练过程并提升性能。
  • 自蒸馏:YOLOv6-3.0 利用自蒸馏技术,其中学生模型从其自身的教师模型预测中学习,在不需要外部大型模型的情况下提高准确性。

优势与劣势

YOLOv6-3.0 的主要优势在于其推理速度。正如基准测试所示,较小的变体(如 YOLOv6-3.0n)在 GPU 硬件上速度极快,使其成为必须处理高帧率的视频分析流水线的理想选择。此外,该模型对模型量化的支持有助于在资源受限的硬件上进行部署。

然而,YOLOv6的早期版本主要限于目标detect,缺乏更全面框架中开箱即用的对segmentation或姿势估计的原生支持。此外,尽管效率很高,但其生态系统支持不如其他社区驱动的项目广泛。

理想用例

YOLOv6-3.0在以下场景中表现出色:

  • 生产线: 需要对传送带上的产品进行高速缺陷检测的场景。
  • 零售分析:适用于计算资源有限情况下的队列管理和库存跟踪。
  • 嵌入式系统: 部署到NVIDIA Jetson系列等设备上。

了解更多关于YOLOv6的信息。

YOLOv7: 优化可训练的免费赠品包

YOLOv7 采用了一种不同的方法,主要侧重于架构改革,以最大限度地提高准确性,而不会增加推理成本。作者引入了“可训练的免费技巧”——在训练过程中提高模型性能但不改变推理架构或速度的优化方法。

作者:王建尧、Alexey Bochkovskiy、廖鸿源Chien-Yao Wang, Alexey Bochkovskiy, and Hong-Yuan Mark Liao
组织:台湾中央研究院信息科学研究所
日期:2022-07-06
Arxiv:https://arxiv.org/abs/2207.02696
GitHub:https://github.com/WongKinYiu/yolov7
Docs:ultralytics

架构和主要特性

YOLOv7 引入了E-ELAN(扩展高效层聚合网络)。这种架构通过控制最短和最长的梯度路径,使模型能够学习更多样化的特征,从而确保网络有效收敛。

主要功能包括:

  • 模型缩放:与以往仅缩放深度或宽度的方法不同,YOLOv7 提出了一种复合缩放方法,该方法拼接层而不是仅仅调整大小,从而保留了模型的优化特性。
  • 辅助头训练:模型在训练期间使用辅助头来辅助主头。这种深度监督技术改善了中间层的学习,但在推理期间会被移除以保持速度。
  • 计划重参数化卷积:重参数化的一种特殊应用,它避免在某些层中出现恒等连接,以防止性能下降。

优势与劣势

YOLOv7 以其高精度而闻名,在 COCO 数据集上取得了令人印象深刻的平均精度均值(mAP)分数。它有效地弥合了实时性要求与高保真检测需求之间的差距。

不利的一面是,架构的复杂性和辅助头的使用可能使训练过程与更简单的架构相比更加内存密集。虽然在推理过程中效率很高,但训练阶段需要大量的 GPU 内存,特别是对于较大的“E6E”变体。

理想用例

YOLOv7 特别适用于:

  • 详细监控:在复杂的安保录像中识别小物体或细微动作。
  • 自动驾驶:精确性对安全和导航至关重要的场景。
  • 科学研究: 需要高 AP 指标的应用,例如医学影像或生物调查。

了解更多关于YOLOv7的信息。

性能比较:指标与分析

下表对比了 YOLOv6-3.0 和 YOLOv7 变体在 COCO 验证数据集上的性能。它突出了模型大小、计算负载 (FLOPs) 和速度之间的权衡。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9

解读基准测试

尽管 YOLOv7x 实现了最高的准确率(53.1% mAP),但它需要显著更多的参数(71.3M)和 FLOPs(189.9B)。相比之下,YOLOv6-3.0n 针对极致速度进行了优化,在 T4 GPU 上实现了 1.17 ms 的推理速度,使其比最大的 YOLOv7 变体快约 10 倍,尽管准确率较低。

数据揭示了一个明显的区别:YOLOv6-3.0 在低延迟环境中占据主导地位,而当最大检测质量是优先考虑且硬件资源更充足时,YOLOv7 更具优势。

Ultralytics 优势:超越原始指标

尽管 YOLOv6 和 YOLOv7 提供了强大的功能,但计算机视觉领域正在迅速发展。对于寻求面向未来、多功能且用户友好的解决方案的开发者和研究人员,Ultralytics YOLO11YOLOv8 展现出超越原始基准测试的引人注目的优势。

易用性与生态系统

采用先进 AI 模型最显著的障碍之一是实现复杂性。Ultralytics 模型以其简化的用户体验而闻名。借助简单的 python API 和 CLI,用户只需几行代码即可训练、验证和部署模型。这与通常需要复杂环境设置和配置调整的研究型代码库形成对比。

from ultralytics import YOLO

# Load a model (YOLO11n recommended for speed/accuracy balance)
model = YOLO("yolo11n.pt")

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

跨任务多功能性

与早期主要严格用于检测的 YOLO 版本不同,Ultralytics 模型原生支持多模态。单一框架支持:

性能平衡与效率

Ultralytics 模型,例如 YOLO11,旨在提供速度和准确性之间的最佳平衡。它们通常比 YOLOv7 获得更高的 mAP,同时保持与 YOLOv6 等高效架构相关的推理速度。此外,Ultralytics 模型专为训练效率而设计,与基于 Transformer 的模型(如 RT-DETR)相比,需要更低的 GPU 内存使用量,这加快了实验周期并降低了云计算成本。

维护良好的生态系统

选择 Ultralytics 模型意味着融入一个受支持的生态系统。这包括:

  • 频繁更新:架构和权重定期改进。
  • 广泛导出支持:无缝导出到 ONNXTensorRT、CoreML 和 TFLite,可在任何设备上部署。
  • 社区:庞大的开发者社区和详尽的文档确保随时都能获得帮助。

结论

YOLOv6-3.0 和 YOLOv7 都对计算机视觉领域做出了重大贡献。YOLOv6-3.0 是需要超快速推理和量化支持的工业应用的首选。YOLOv7 在 detect 精度至关重要且硬件限制灵活的场景中仍然是一个强有力的竞争者。

然而,对于一个结合了最先进性能、无与伦比的易用性、多功能性和部署灵活性的整体解决方案,Ultralytics YOLO11在现代AI开发中脱颖而出,成为卓越的选择。无论您是部署到边缘设备还是在云端进行扩展,Ultralytics生态系统都提供了成功所需的工具。

如需进一步阅读,请考虑查阅我们关于 YOLOX 的比较,或了解 RT-DETR 在 Transformer-based detect 方面的能力。


评论