跳转至内容

YOLO26与YYOLO11:视觉人工智能的代际飞跃

在构建尖端计算机视觉系统时,选择合适的模型对于平衡准确性、延迟和资源效率至关重要。在快速发展的人工智能领域中, Ultralytics 持续突破技术边界。本篇详尽的技术对比分析,将深入探讨从广受好评的 YOLO11 到革命性新模型YOLO26的演进历程,为人工智能工程师与研究人员提供制定明智架构决策所需的洞见。

模型谱系与元数据

这两种模型Ultralytics,但在物体检测和多任务视觉模型的发展历程中,它们代表着不同的范式。

YOLO26 详情:

了解更多关于 YOLO26 的信息

YOLO11 :

了解更多关于 YOLO11 的信息

其他体系结构

虽然YOLO26是我们最先进的实时模型,但处理高度专业化硬件或海量内存容量的用户也可探索transformer架构,例如 RT-DETR ,或是突破性的NMSNMS先驱—— YOLOv10

建筑差异与创新

YOLO11 YOLO26YOLO11 飞跃,涉及模型架构与底层训练机制的根本性变革。YOLO11 为目标检测与多任务学习YOLO11 稳健基准,而YOLO26则彻底重构了边缘计算的部署管道。

端到端NMS-Free设计

YOLO26最重大的升级之一在于其原生端到端架构。与依赖非最大抑制(NMS)后处理过滤重叠边界框YOLO11不同,YOLO26彻底消除了这一步骤。该概念最初由 YOLOv10,显著降低了延迟波动性,并简化了在各类边缘设备上的部署逻辑。

DFL移除以提升边缘效率

YOLO11 分布式焦点损失(DFL)来优化边界框估计。然而,DFL依赖复杂的softmax运算,这类运算在低功耗边缘加速器上往往难以高效实现。YOLO26成功去除了DFL机制,同时保持了原有精度。这种架构简化显著提升了嵌入式系统的兼容性,使 CPU 较前代提升高达43%

MuSGD优化器

训练稳定性与速度至关重要。YOLO26引入了MuSGD优化器——这种融合随机梯度下降(SGD)与Muon算法的混合优化器,深受Moonshot AI旗下Kimi K2模型在大型语言模型训练领域的创新启发。该优化器将语言模型训练的稳定性引入计算机视觉领域,相较于笨重的transformer 它能确保更快的收敛速度并降低训练过程中的内存占用。

ProgLoss 与 STAL

对于从事航空影像或无人机应用研究的学者而言,检测微小特征始终是历史性难题。YOLO26引入ProgLoss并结合STAL(尺度目标注意力损失),在小目标识别方面较YOLO11实现了显著提升。

性能与指标对比

在直接对比两种模型时,YOLO26在精度和边缘设备效率方面展现出明显优势,同时保持了Ultralytics 特有的超低内存需求特性。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(毫秒)
速度
T4 TensorRT10
(毫秒)
参数
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

注:YOLO26 nano(YOLO26n)模型CPU 较YOLO11n提升约31%(38.9毫秒 vs 56.1毫秒),彰显其边缘优先的设计理念。

计算机视觉任务中的多功能性

两种模型均受益于高度维护Ultralytics 通过统一Python 提供无与伦比的易用性。它们不仅是目标检测器,更是多任务处理的强大工具。然而,YOLO26在特定任务上实现了多项突破性改进:

  • 实例分割:YOLO26采用改进的语义分割损失函数和多尺度原型生成技术,生成的遮罩边界比YOLO11更为清晰。了解更多分割工作流程
  • 姿势估计 :通过整合残差对数似然估计(RLE),YOLO26在复杂人体姿势中显著提升关键点定位精度。探索姿势估计
  • 定向边界框(旋转框检测):通过专用的角度损失函数解决了历史边界不连续问题,使YOLO26在卫星数据中检测旋转物体时表现出极高的可靠性。了解旋转框检测 详情。
  • 图像分类:两种模型均能高效处理高速分类任务,其中YOLO26在ImageNet集上实现了顶端1准确率的微幅提升。

训练与推理代码示例

Ultralytics 卓越的开发者体验Ultralytics 。训练尖端模型或运行推理脚本仅需几行代码,最大限度减少冗余代码并提升生产效率。此外,训练YOLO CUDA 远低于大型transformer 。

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

理想使用场景与部署策略

选择YOLO26还是YOLO11完全YOLO11 您的生产环境的限制条件。

何时部署YOLO26

YOLO26是现代绿地项目的首选方案。它专为以下场景打造:

  • 边缘计算与物联网:其惊人的CPU 和DFL移除功能,使其成为树莓派、Coral神经处理器和移动处理器等设备的王者。
  • 无人机与空中分析:ProgLoss与STAL的集成使其具备独特能力,能够在广阔地形中追踪微小且快速移动的物体。
  • 延迟关键型应用:在自主机器人或制造质量控制领域,NMS设计确保确定性延迟,避免出现意外的后处理延迟峰值。

何时保留YOLO11

尽管YOLO26性能更优,YOLO11 极其强大的模型。YOLO11 您可能仍会选择继续使用YOLO11 :

  • 遗留管道:您现有的C++部署基础设施与旧架构中特定的锚点式输出和NMS 紧密耦合。
  • 学术基准:您正在发表研究成果,需要一个广受认可的2024年标准来衡量您创新算法的性能。

Ultralytics 系统的强大力量

无论您部署的是YOLO11 YOLO26,使用Ultralytics 都意味着您将获得一个维护完善、持续更新且拥有庞大社区支持的生态系统

对于企业Ultralytics 解决方案,涵盖数据标注、模型训练及无缝云部署。从导出训练好的权重到 CoreMLTensorRT,到配置高级超参数调优,所提供的工具确保您的AI生命周期尽可能高效流畅。


评论