跳转至内容

YOLO11 与YOLOv6.0:最新物体检测比较

选择最佳计算机视觉模型是影响人工智能应用效率、准确性和可扩展性的关键决策。本指南提供全面的技术分析,比较 Ultralytics YOLO11和YOLOv6.0 的全面技术分析。我们研究了它们的架构创新、性能基准、训练方法以及对各种实际部署场景的适用性。虽然这两个框架都对该领域做出了重大贡献,但YOLO11 代表了在效率、多功能性和用户体验方面的最新发展。

Ultralytics YOLO11

作者: Glenn Jocher 和 Jing QiuGlenn Jocher 和 Jing Qiu
组织机构Ultralytics
日期:2024-09-27
GitHubultralyticshttps://github.com/ultralytics/ultralytics
文档 :yolo11

YOLO11 是Ultralytics 于 2024 年底推出的YOLO (你只看一次)系列的前沿进化版。在前几代产品(如 YOLOv8等前代产品的成功基础上,推出了一种精巧的架构,旨在最大限度地提高性能,同时最大限度地降低计算成本。YOLO11 可处理各种计算机视觉任务,是汽车和医疗保健等行业的通用解决方案。

架构和主要特性

YOLO11 的架构侧重于提高特征提取和处理效率。它采用了改进的主干和颈部设计,减少了冗余计算,从而提高了边缘设备和云服务器的推理速度。作为一种无锚检测器,YOLO11 无需手动配置锚框,从而简化了训练管道,并提高了对不同物体形状的适应性。

优势

弱点

  • 采用曲线:作为最近发布的机型,第三方教程和外部资源的数量正在快速增长,但目前可能还不及旧版本、传统版本,如 YOLOv5.
  • 小物体挑战:与专门的方法(尽管速度较慢)相比,单级物体检测器对极小物体的检测虽然有了很大改进,但仍然是一项具有挑战性的任务。

理想用例

YOLO11 在要求高通量和高精度的情况下表现出色:

  • 自主系统:用于自动驾驶汽车和无人机的实时目标跟踪。
  • 智能制造:需要同时进行缺陷检测和细分的质量保证任务。
  • 医疗保健:医疗成像分析通常需要在资源有限的情况下进行部署。
  • 零售分析:使用姿势估计 估计和跟踪进行顾客行为分析和库存管理。

了解更多关于 YOLO11 的信息

YOLOv6.0

作者李楚怡、李璐璐、耿一飞、蒋洪亮、程萌、张博、柯在丹、徐晓明、储祥祥
组织美团网
日期:2023-01-13
Arxiv https://arxiv.org/abs/2301.05586
GitHubYOLOv6https://github.com/meituan/YOLOv6
文档ultralytics

YOLOv6.0 是美团针对工业应用开发的对象检测框架。YOLOv6-3.0 于 2023 年初发布,其设计目的是在推理速度和准确性之间进行有竞争力的权衡,以满足物流和自动化领域实时系统的需求。

架构和主要特性

YOLOv6.0 架构引入了 "全面重装 "网络。它采用了高效的可重新参数化骨干网(EfficientRep)和去耦头结构。主要创新包括在训练过程中使用自蒸馏技术,在不增加推理成本的情况下提高准确性,并针对以下方面进行了特定优化 TensorRT部署。

优势

  • 工业聚焦:模型架构专为工业硬件量身定制,特别是优化了NVIDIA ®)图形处理器的延迟
  • 量化就绪:YOLOv6 提供对模型量化的特定支持,便于在计算精度有限的硬件上部署。
  • 移动版本:该框架包括针对移动 CPUS 和DSP架构优化的YOLOv6 版本。

弱点

  • 资源强度:如性能数据所示,YOLOv6.0 通常需要更多的参数和 FLOP 才能达到与YOLO11 等较新模型相当的精度。
  • 任务范围有限:主要侧重于物体检测。它缺乏统一的Ultralytics 框架中的无缝本地多任务支持(分割、姿势估计、分类、旋转框检测)。
  • 生态系统分散:虽然是开源的,但生态系统的集成度不如Ultralytics,可能需要更多的人工来完成数据集管理、跟踪和云培训等任务。

理想用例

YOLOv6.0 适用于:

  • 传统工业系统:专为YOLOv6 架构调整的环境。
  • 专用检测任务:只需要边界框检测,不需要多任务功能的应用。
  • 特定硬件部署:利用美团框架支持的特定量化管道的场景。

了解有关YOLOv6的更多信息

性能指标:速度、准确性和效率

下表列出了YOLO11 和YOLOv6.0 在COCO 数据集上的详细比较。这些指标凸显了YOLO11 架构在效率方面取得的进步。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
YOLOv6.0n64037.5-1.174.711.4
YOLOv6.0s64045.0-2.6618.545.3
YOLOv6.0m64050.0-5.2834.985.8
YOLOv6.0l64052.8-8.9559.6150.7

数据分析

比较显示了一个明显的趋势:YOLO11 始终能达到更高的精度(mAP),同时显著降低计算开销。

  • 参数效率:与YOLOv6.0m 的 50.0 mAP相比,YOLOv6 模型实现了卓越的51.5 mAP,但它只使用了20.1M 的参数,而YOLOv6.0m 则使用了 34.9M 的参数。这意味着模型大小减少了近 42%,从而获得了更好的性能。
  • 计算成本:同样,YOLO11l 需要86.9B FLOPs才能达到 53.4mAP,而YOLOv6.0l 则需要150.7B FLOPs才能达到较低的 52.8mAP。较低的 FLOPs 直接转化为较低的功耗和发热量,而这正是嵌入式系统的关键因素。
  • 推理速度:虽然YOLOv6.0n 的TensorRT 速度略快,但在精度上的巨大差距(2.0mAP)和更大的模型尺寸使 YOLO11n 成为精度至关重要的现代应用中更均衡的选择。

部署优势

YOLO11 减少了参数数量,不仅加快了推理速度,还降低了对内存带宽的要求。这使得YOLO11 在Raspberry PiNVIDIA Jetson 等边缘设备上特别有效,因为内存资源往往是这些设备的瓶颈。

培训和可用性

易用性和生态系统

最重要的区别之一是围绕模型的生态系统。Ultralytics YOLO11 集成到一个综合平台中,简化了整个机器学习运营 (MLOps)生命周期。

  • 简单的 API:开发人员只需几行Python 代码就能使用YOLO11 进行加载、训练和预测。
  • 文档:广泛而积极的文档维护确保用户可以轻松找到从数据注释到模型导出的各种指南。
  • 社区GitHubDiscord上充满活力的社区可提供快速支持和持续改进。

相比之下,虽然YOLOv6 提供了一个坚实的代码库,但它缺乏同等水平的集成工具和社区驱动的资源可用性,这可能会增加新项目的部署时间。

培训效率

YOLO11 的设计旨在提高训练效率。其架构收敛速度更快,这意味着与旧架构相比,用户通常可以在更短的时间内达到目标精度。此外,YOLO11 还优化了训练过程中的内存需求,允许在消费级 GPU 上实现更大的批次规模

下面举例说明开始训练YOLO11 模型有多简单:

from ultralytics import YOLO

# Load a pretrained YOLO11n model
model = YOLO("yolo11n.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")

结论

尽管YOLOv6.0 仍是一个能够胜任特定工业检测任务的型号,但Ultralytics YOLO11已成为绝大多数新计算机视觉项目的最佳选择。

YOLO11 集更高的精度更低的资源消耗无与伦比的多功能性于一身。它能够在一个简单易用的框架内处理检测、分割、姿势估计 和分类,从而简化了开发工作流程。在积极维护的Ultralytics 生态系统和Ultralytics HUB 等工具的支持下,YOLO11 为构建可扩展的高性能人工智能解决方案奠定了面向未来的基础。

对于寻求性能、效率和易用性最佳平衡的开发人员来说,YOLO11 是值得推荐的前进之路。

探索其他模型

如果您对进一步的比较感兴趣,请浏览文档中的相关页面:


评论