YOLO26 与 YOLO11:视觉 AI 的代际飞跃
在构建最先进的计算机视觉系统时,选择合适的模型对于平衡精度、延迟和资源效率至关重要。在快速发展的人工智能领域,Ultralytics 不断突破可能性的边界。这项详细的技术比较探讨了从非常成功的YOLO11 到革命性的新YOLO26 的演变,为 AI 工程师和研究人员提供了做出明智架构决策所需的见解。
模型沿袭与元数据
两种模型都由Ultralytics开发,但它们在目标检测和多任务视觉模型的演进时间轴中代表了不同的范式。
YOLO26 详情:
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2026-01-14
- GitHub:Ultralytics 仓库
- 文档:YOLO26 官方文档
YOLO11 详情:
- 作者:Glenn Jocher 和 Jing Qiu
- 组织:Ultralytics
- 日期: 2024-09-27
- GitHub:Ultralytics 仓库
- 文档:YOLO11 官方文档
架构差异与创新
从YOLO11到YOLO26的飞跃涉及模型架构和底层训练方案的根本性转变。尽管YOLO11为目标检测和多任务学习建立了坚实的基础,但YOLO26彻底改革了边缘计算的部署流程。
端到端NMS-Free设计
YOLO26 最显著的升级之一是其原生端到端架构。与依赖 非极大值抑制 (NMS) 后处理来过滤重叠边界框的 YOLO11 不同,YOLO26 完全消除了这一步骤。这一概念最初由 YOLOv10 首创,显著降低了延迟可变性,并简化了跨不同边缘设备的部署逻辑。
DFL移除以提升边缘效率
YOLO11 利用分布焦点损失 (DFL) 来优化边界框估计。然而,DFL 依赖于复杂的 softmax 操作,这些操作通常在低功耗边缘加速器上支持不佳。YOLO26 成功移除了 DFL 而不牺牲精度。这种架构简化显著提高了与嵌入式系统的兼容性,并使 YOLO26 相比其前身实现了高达43% 更快的 CPU 推理速度。
MuSGD 优化器
训练稳定性和速度至关重要。YOLO26 引入了 MuSGD 优化器,这是一种随机梯度下降(SGD)和 Muon 的混合优化器,深受面壁智能 Kimi K2 的大型语言模型(LLM)训练创新启发。该优化器将语言模型训练的稳定性带入计算机视觉领域,与笨重的 Transformer 替代方案相比,可确保更快的收敛速度并减少训练期间的内存占用。
ProgLoss 和 STAL
对于从事航空影像或无人机应用的研究人员,检测微小特征一直是一个历史性挑战。YOLO26 引入了 ProgLoss 结合 STAL(尺度目标注意力损失),在小目标识别方面比 YOLO11 有显著改进。
性能与指标比较
在直接对比这些模型时,YOLO26在精度和边缘设备效率方面表现出明显优势,同时保持了Ultralytics生态系统特有的极低内存需求。
| 模型 | 尺寸 (像素) | mAPval 50-95 | 速度 CPU ONNX (毫秒) | 速度 T4 TensorRT10 (毫秒) | 参数 (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
注:YOLO26 nano (YOLO26n) 模型与 YOLO11n 相比,CPU 速度提高了约 31% (38.9ms 对 56.1ms),这突显了其边缘优先的设计理念。
在计算机视觉任务中的多功能性
这两种模型都受益于维护良好的 Ultralytics 生态系统,通过统一的 python API 提供无与伦比的易用性。它们不仅仅是目标检测器;它们是多任务的强大工具。然而,YOLO26 融入了多项针对特定任务的改进:
- 实例 segment: YOLO26 使用了改进的语义 segment 损失和多尺度原型设计,生成比 YOLO11 更清晰的掩码边界。了解更多关于segment 工作流程的信息。
- 姿势估计:通过集成残差对数似然估计 (RLE),YOLO26 显著提高了复杂人体姿势中的关键点精度。了解姿势估计能力。
- 旋转边界框 (旋转框检测):专门的角度损失函数解决了历史上的边界不连续性问题,使YOLO26在卫星图像中检测旋转目标时表现出卓越的可靠性。阅读有关obb任务的信息。
- 图像分类:两种模型都能高效处理高速分类,其中 YOLO26 在 ImageNet 上提供了微小的 top-1 精度改进。
训练与推理代码示例
Ultralytics 以其开发者体验而闻名。训练 SOTA 模型或运行推理脚本只需几行代码,最大限度地减少样板代码并提高生产力。此外,训练 YOLO 模型所需的CUDA 内存远少于大型 Transformer 网络。
from ultralytics import YOLO
# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
data="coco8.yaml",
epochs=100,
imgsz=640,
device="0", # Utilize GPU for accelerated training
)
# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")
# Display the clean, instant predictions
results[0].show()
理想用例和部署策略
在YOLO26和YOLO11之间选择完全取决于您生产环境的限制。
何时部署 YOLO26
YOLO26 是现代全新项目的明确选择。它专为以下目的而构建:
- 边缘计算与物联网:其惊人的CPU性能以及DFL的移除,使其成为树莓派、Coral NPU和移动处理器等设备的王者。
- 无人机与航空分析:ProgLoss + STAL 的集成使其在广阔的区域内追踪微小、快速移动的物体方面具有独特的能力。
- 延迟敏感型应用:在自主机器人或制造质量控制中,免NMS设计确保了确定性延迟,避免了意外的后处理峰值。
何时保留 YOLO11
尽管YOLO26更优越,但YOLO11仍然是一个极其强大的模型。如果您符合以下情况,可以继续使用YOLO11:
- 遗留管道:您现有的 C++ 部署基础设施与旧架构中特定的基于锚点的输出和 NMS 逻辑紧密耦合。
- 学术基线:如果您正在发表研究成果,并需要一个高度认可的2024年标准来衡量您的新颖算法。
Ultralytics 生态系统的强大功能
无论您部署YOLO11还是YOLO26,使用Ultralytics模型都意味着您将受益于一个维护良好的生态系统,该系统提供频繁更新和广泛的社区支持。
对于企业团队而言,Ultralytics Platform为数据标注、模型训练和无缝云部署提供了端到端解决方案。从将训练好的权重导出到CoreML或TensorRT,到配置高级超参数调优,所提供的工具确保您的AI生命周期尽可能地简化。