YOLO26与YYOLO11:视觉人工智能的代际飞跃
在构建尖端计算机视觉系统时,选择合适的模型对于平衡准确性、延迟和资源效率至关重要。在快速发展的人工智能领域中, Ultralytics 持续突破技术边界。本篇详尽的技术对比分析,将深入探讨从广受好评的 YOLO11 到革命性新模型YOLO26的演进历程,为人工智能工程师与研究人员提供制定明智架构决策所需的洞见。
模型谱系与元数据
这两种模型Ultralytics,但在物体检测和多任务视觉模型的发展历程中,它们代表着不同的范式。
YOLO26 详情:
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2026-01-14
- GitHub:Ultralytics 仓库
- 文档:YOLO26 官方文档
YOLO11 :
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2024-09-27
- GitHub:Ultralytics 仓库
- 文档:YOLO11 文档
其他体系结构
虽然YOLO26是我们最先进的实时模型,但处理高度专业化硬件或海量内存容量的用户也可探索transformer架构,例如 RT-DETR ,或是突破性的NMSNMS先驱—— YOLOv10。
建筑差异与创新
YOLO11 YOLO26YOLO11 飞跃,涉及模型架构与底层训练机制的根本性变革。YOLO11 为目标检测与多任务学习YOLO11 稳健基准,而YOLO26则彻底重构了边缘计算的部署管道。
端到端NMS-Free设计
YOLO26最重大的升级之一在于其原生端到端架构。与依赖非最大抑制(NMS)后处理过滤重叠边界框YOLO11不同,YOLO26彻底消除了这一步骤。该概念最初由 YOLOv10,显著降低了延迟波动性,并简化了在各类边缘设备上的部署逻辑。
DFL移除以提升边缘效率
YOLO11 分布式焦点损失(DFL)来优化边界框估计。然而,DFL依赖复杂的softmax运算,这类运算在低功耗边缘加速器上往往难以高效实现。YOLO26成功去除了DFL机制,同时保持了原有精度。这种架构简化显著提升了嵌入式系统的兼容性,使 CPU 较前代提升高达43%。
MuSGD优化器
训练稳定性与速度至关重要。YOLO26引入了MuSGD优化器——这种融合随机梯度下降(SGD)与Muon算法的混合优化器,深受Moonshot AI旗下Kimi K2模型在大型语言模型训练领域的创新启发。该优化器将语言模型训练的稳定性引入计算机视觉领域,相较于笨重的transformer 它能确保更快的收敛速度并降低训练过程中的内存占用。
ProgLoss 与 STAL
对于从事航空影像或无人机应用研究的学者而言,检测微小特征始终是历史性难题。YOLO26引入ProgLoss并结合STAL(尺度目标注意力损失),在小目标识别方面较YOLO11实现了显著提升。
性能与指标对比
在直接对比两种模型时,YOLO26在精度和边缘设备效率方面展现出明显优势,同时保持了Ultralytics 特有的超低内存需求特性。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (毫秒) | 速度 T4 TensorRT10 (毫秒) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
注:YOLO26 nano(YOLO26n)模型CPU 较YOLO11n提升约31%(38.9毫秒 vs 56.1毫秒),彰显其边缘优先的设计理念。
计算机视觉任务中的多功能性
两种模型均受益于高度维护Ultralytics 通过统一Python 提供无与伦比的易用性。它们不仅是目标检测器,更是多任务处理的强大工具。然而,YOLO26在特定任务上实现了多项突破性改进:
- 实例分割:YOLO26采用改进的语义分割损失函数和多尺度原型生成技术,生成的遮罩边界比YOLO11更为清晰。了解更多分割工作流程。
- 姿势估计 :通过整合残差对数似然估计(RLE),YOLO26在复杂人体姿势中显著提升关键点定位精度。探索姿势估计 。
- 定向边界框(旋转框检测):通过专用的角度损失函数解决了历史边界不连续问题,使YOLO26在卫星数据中检测旋转物体时表现出极高的可靠性。了解旋转框检测 详情。
- 图像分类:两种模型均能高效处理高速分类任务,其中YOLO26在ImageNet集上实现了顶端1准确率的微幅提升。
训练与推理代码示例
Ultralytics 卓越的开发者体验Ultralytics 。训练尖端模型或运行推理脚本仅需几行代码,最大限度减少冗余代码并提升生产效率。此外,训练YOLO CUDA 远低于大型transformer 。
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()
理想使用场景与部署策略
选择YOLO26还是YOLO11完全YOLO11 您的生产环境的限制条件。
何时部署YOLO26
YOLO26是现代绿地项目的首选方案。它专为以下场景打造:
- 边缘计算与物联网:其惊人的CPU 和DFL移除功能,使其成为树莓派、Coral神经处理器和移动处理器等设备的王者。
- 无人机与空中分析:ProgLoss与STAL的集成使其具备独特能力,能够在广阔地形中追踪微小且快速移动的物体。
- 延迟关键型应用:在自主机器人或制造质量控制领域,NMS设计确保确定性延迟,避免出现意外的后处理延迟峰值。
何时保留YOLO11
尽管YOLO26性能更优,YOLO11 极其强大的模型。YOLO11 您可能仍会选择继续使用YOLO11 :
- 遗留管道:您现有的C++部署基础设施与旧架构中特定的锚点式输出和NMS 紧密耦合。
- 学术基准:您正在发表研究成果,需要一个广受认可的2024年标准来衡量您创新算法的性能。
Ultralytics 系统的强大力量
无论您部署的是YOLO11 YOLO26,使用Ultralytics 都意味着您将获得一个维护完善、持续更新且拥有庞大社区支持的生态系统。
对于企业Ultralytics 解决方案,涵盖数据标注、模型训练及无缝云部署。从导出训练好的权重到 CoreML 或 TensorRT,到配置高级超参数调优,所提供的工具确保您的AI生命周期尽可能高效流畅。