跳转至内容

YOLO11 与 PP-YOLOE+:详细技术比较

选择最佳的物体检测架构是一项关键决策,它影响着计算机视觉项目的速度、准确性和部署的可行性。本指南深入比较了 Ultralytics YOLO11与来自百度PaddlePaddle 生态系统的强大检测器 PP-YOLOE+ 进行了深入的技术比较。虽然这两个模型都能提供高性能,但YOLO11 凭借其卓越的计算效率、与PyTorch 的无缝集成以及旨在加快研究人员和工程师开发速度的综合生态系统脱颖而出。

Ultralytics YOLO11:效率与多功能性的Ultralytics 结合

YOLO11 是著名的YOLO (你只看一次)系列的最新进化版,由Ultralytics 发布,旨在推动实时物体检测技术的发展。该模型由 Glenn Jocher 和 Jing Qiu 设计,改进了无锚点架构,在大幅降低计算开销的同时实现了更高的精度。

作者: Glenn Jocher, Jing QiuGlenn Jocher, Jing Qiu
组织机构:Ultralytics
日期:2024-09-27
GitHubultralytics
文档yolo11

架构与核心优势

YOLO11 采用精简的网络设计,优化了特征提取和融合。与依赖预定义框的传统锚点检测器不同,YOLO11 可直接预测物体中心和尺度。这种方法简化了模型头,减少了需要调整的超参数数量。

该模型的架构非常灵活,除了简单的检测任务外,还支持广泛的计算机视觉任务。它可以在一个统一的框架内处理实例分割姿势估计 图像分类定向边界框(旋转框检测)

开发人员体验

YOLO11 最显著的优势之一是将其集成到了 ultralytics Python 软件包。这为训练、验证和部署提供了一致的应用程序接口,允许开发人员在不同任务之间切换,或将模型导出为以下格式 ONNXTensorRT 只需一行代码。

主要优势

  • 卓越的性能平衡: YOLO11 在以下两个方面实现了业界领先的平衡 mAP和推理延迟之间实现了业界领先的平衡,使其适用于边缘设备上的实时应用。
  • 计算效率:与 PP-YOLOE+ 等竞争对手相比,该模型所需的参数和 FLOP(浮点运算)更少,因此执行速度更快,能耗更低。
  • 低内存占用: YOLO11 优化了内存使用效率,因此运行速度更快,可在 VRAM 有限的硬件上运行,有别于资源繁重的transformer 模型。
  • 强大的生态系统:用户可从积极的维护、大量的文档和社区支持中获益,从而确保企业项目的长期可行性。

了解更多关于 YOLO11 的信息

PP-YOLOE+:PaddlePaddle 生态系统中的高精度

PP-YOLOE+ 是百度研究人员开发的YOLO 系列的进化版。它于 2022 年发布,是PaddleDetection工具包的一部分,旨在PaddlePaddle 深度学习框架内高效运行。

作者: PaddlePaddle 作者
组织:百度
日期:2022-04-02
ArXiv:https://arxiv.org/abs/2203.16250
GitHubPaddlePaddle
文档:PaddleDetection 文档

架构与特性

PP-YOLOE+ 采用 CSPRepResNet 主干网和高效任务对齐头(ET-Head)。它通过任务对齐学习(TAL)整合了动态标签分配,并使用变焦损失(Varifocal Loss)来提高对象分类的质量。该模型专门针对PaddlePaddle 推理引擎进行了优化,利用TensorRT 集成进行部署。

优势与局限

虽然 PP-YOLOE+ 在诸如 COCO等基准上提供了具有竞争力的精确度,但由于其对框架的依赖性,它在应用上面临障碍。全球研究界大多依赖 PyTorch,因此在转换到PaddlePaddle 时会产生摩擦。此外,PP-YOLOE+ 模型通常需要更高的参数数才能达到YOLO11 等较新架构的精度,这导致训练和推理过程中的计算成本增加。

了解更多关于 PP-YOLOE+ 的信息

性能分析:效率和速度

对性能指标的直接比较显示,YOLO11 在效率和速度方面始终优于 PP-YOLOE+,同时保持了最先进的精度。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

重要观察

  1. 效率优势: YOLO11 的参数效率非常高。例如,与 PP-YOLOE+x 相比,YOLO11x实现了 54.7mAP ,但参数却只有56.9M而 PP-YOLOE+x 为 98.42M。这意味着 YOLO11x 的体积缩小了约 42%,从而更容易在存储受限的设备上部署。
  2. 推理速度:在实际部署场景中,速度至关重要。YOLO11n 在 T4GPU 上的推理时间仅为1.5 毫秒,大大快于同类 PP-YOLOE+t 的 2.84 毫秒。这一速度优势使得在自动驾驶汽车和机器人等应用中可以进行更高帧速率的处理。
  3. CPU 性能: YOLO11 的CPU 优化基准突出了其灵活性。使用 YOLO11n 在CPU 上达到 56.1 毫秒,即使没有专用GPU 加速,也能实现可行的实时应用,而在竞争对手的框架中往往缺少或较少优化这一指标。

实际应用案例

YOLO11 的建筑优势直接转化为各行各业的利益。

  • 智能城市基础设施: YOLO11 的高吞吐量支持使用更少的服务器对多个摄像机流进行实时交通监控和拥堵分析。
  • 工业制造: YOLO11 以更低的延迟实现更高的精度,在高速装配线的质量控制和缺陷检测方面表现出色。
  • 零售分析:该模型能够高效处理对象计数和热图生成,帮助零售商优化店铺布局和库存管理。
  • 医疗成像:进行分割的多功能性有助于进行精确的医学图像分析,如识别肿瘤或分析细胞结构。

培训与生态系统整合

开发人员可以轻松地训练和部署模型,这是 Ultralytics 的一大与众不同之处。Ultralytics 生态系统就是围绕简化用户体验而建立的。

简化工作流程

在自定义数据集上训练YOLO11 模型只需最少的代码。该框架可自动处理数据增强、超参数演化和GPU GPU 训练等复杂任务。

from ultralytics import YOLO

# Load a pre-trained YOLO11 model
model = YOLO("yolo11n.pt")

# Train the model on a custom dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run inference on an image
results = model("path/to/image.jpg")

相比之下,如果原始数据管道是PyTorch 的,那么使用 PP-YOLOE+ 通常需要浏览复杂的PaddlePaddle 生态系统、配置文件和潜在的转换脚本。

部署灵活性

Ultralytics 提供多种格式的内置导出模式,包括ONNX、OpenVINO、CoreML 和TFLite。这确保了训练一次的模型可以部署到任何地方,NVIDIA Jetson边缘设备到iOS 智能手机或云 API。

结论

在百度生态系统中,PP-YOLOE+ 仍然是一种可行的模式、 Ultralytics YOLO11是更广泛的计算机视觉社区的最佳选择。YOLO11 结合了更少的参数数、更快的推理速度和PyTorch易用性,消除了进入市场的障碍,加快了产品上市速度。

对于寻求兼顾最先进性能和易用性的面向未来的解决方案的开发人员来说,YOLO11 为构建下一代人工智能应用提供了一个强大、通用和高效的平台。

探索其他模型

如果您有兴趣了解Ultralytics 生态系统中的其他架构,请考虑这些比较:


评论