Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv7 与 YOLOv8#

计算机视觉的快速发展为开发者和研究人员带来了众多强大的工具。在为目标检测流水线确定合适的架构时,比较成熟的模型至关重要。本技术指南深入探讨了两个极具影响力的模型:YOLOv7 和 Ultralytics YOLOv8 的架构、性能指标及理想应用场景。

Link to this section架构简介#

这两个模型都代表了性能上的重大飞跃,但它们在优化深度神经网络挑战方面采用了不同的结构理念。

Link to this sectionYOLOv7:“免费赠品包”的先驱#

YOLOv7 于 2022 年年中推出,重点关注架构梯度路径优化和“可训练的免费赠品 (trainable bag-of-freebies)”概念,旨在突破高端硬件上实时检测的极限。

架构亮点: YOLOv7 主要采用基于锚框的检测头(尽管也尝试过无锚分支),并引入了扩展高效层聚合网络 (E-ELAN)。这种设计在不破坏原始梯度路径的情况下提高了网络的学习能力。它在服务器级 GPU 上表现异常出色,非常适合重型视频分析。

优缺点: 虽然 YOLOv7 在专用硬件上实现了出色的延迟表现,但其生态系统高度分散。训练需要复杂的命令行参数、手动克隆仓库以及在 PyTorch 中进行严格的依赖管理。此外,其训练时的内存需求在消费级硬件上可能会过高。

了解更多关于 YOLOv7 的信息

Link to this sectionUltralytics YOLOv8:多功能标准#

YOLOv8 于 2023 年初发布,它彻底重新定义了开发者体验,不仅专注于最先进的准确性,还致力于提供一个统一的、生产就绪的框架。

架构亮点: YOLOv8 引入了原生的无锚 (anchor-free) 检测头,无需根据 MS COCO 数据集 或自定义数据分布手动配置锚框。它集成了 C2f 模块以改善梯度流,并使用了解耦头结构,将目标性、分类和回归任务分离。这极大地加速了收敛并提高了准确性。

优缺点: YOLOv8 拥有卓越的内存需求效率。与 YOLOv7 和更重的 Transformer 模型相比,它在训练期间显著减少了 CUDA 内存占用,允许开发者使用更大的批次大小。其主要优势在于多功能性,原生支持实例分割图像分类姿态估计旋转边界框 (OBB)。唯一的小缺点是,专为 YOLOv7 张量构建的极其特殊的遗留流水线可能需要一段简短的重构期。

了解更多关于 YOLOv8 的信息

生态系统优势

Ultralytics YOLOv8 受益于一个维护良好的生态系统。凭借直观的 Python API、积极的开发迭代和强大的社区支持,将模型从本地测试转向全球部署所需的时间仅为独立仓库的一小部分。

Link to this section详细性能对比#

下表细分了各关键模型尺寸的性能指标。请注意 YOLOv8 实现的独特的性能平衡,它在优化边缘设备快速推理的同时,保持了世界级的准确性。

模型尺寸
(像素)
mAPval
50-95
速度
CPU ONNX
(ms)
速度
T4 TensorRT10
(ms)
参数量
(M)
FLOPs
(B)
YOLOv7l64051.4-6.8436.9104.7
YOLOv7x64053.1-11.5771.3189.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

注意:YOLOv8x 在此分组中实现了最高的 mAP,而 YOLOv8n 在参数效率和推理速度方面表现卓越,使其成为在边缘 AI 设备上部署计算机视觉无可争议的冠军。

Link to this section易用性与训练效率#

谈到易用性,Ultralytics YOLOv8 处于领先地位。像 YOLOv7 这样的旧架构需要克隆特定仓库并运行冗长的命令行脚本来配置数据集和路径。

Conversely, YOLOv8's ultralytics package offers a highly streamlined developer experience. Training Efficiency is maximized through automatic data downloading, ready-to-use pretrained weights, and seamless exporting capabilities to formats like ONNX and TensorRT.

以下是你如何使用 Ultralytics Python API 轻松加载、训练和运行推理的方法:

from ultralytics import YOLO

# Load a pretrained YOLOv8 nano model
model = YOLO("yolov8n.pt")

# Train the model efficiently on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run fast inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the predictions
predictions[0].show()
实验跟踪

YOLOv8 与 Weights & BiasesClearML 等流行的 MLOps 工具原生集成,让你能够实时监控超参数调优和训练指标。

Link to this section理想使用场景#

在这些架构之间进行选择,通常取决于你部署环境的具体限制。

Link to this section何时选择 YOLOv7#

  • 遗留基准测试: 适合需要固定基准来与 2022 年架构标准进行比较的研究人员。
  • 现有重型基础设施: 深度投资于 NVIDIA V100 或 A100 GPU,且 YOLOv7 的特定张量配置已深度嵌入遗留 C++ 流水线的环境。

Link to this section何时选择 YOLOv8#

  • 跨平台生产: 适合需要跨云端 GPU、移动设备和浏览器进行无缝部署的团队。
  • 多任务需求: 如果你的项目需要超越边界框,并利用丰富的实例分割掩码姿态关键点
  • 资源受限边缘端: YOLOv8 Nano (yolov8n) 为机器人、无人机和物联网传感器提供了令人难以置信的精度与速度比。

Link to this section展望未来:通向 YOLO26 的代际跨越#

虽然 YOLOv8 仍然是一个非常稳健的选择,但计算机视觉领域发展迅速。对于开始全新高性能项目的开发者,Ultralytics 最近推出了 AI 模型的下一次进化。强烈建议探索经过深度优化的 YOLO11 和新发布的 YOLO26

于 2026 年 1 月发布,YOLO26 拓宽了边缘设备上可能性的边界:

  • 端到端免 NMS 设计: YOLO26 原生支持端到端,完全消除了非极大值抑制 (NMS) 后处理。这确保了显著更快、更简单的部署流水线,且没有传统密集预测模型的延迟瓶颈。
  • 移除 DFL: 通过移除分布焦点损失 (Distribution Focal Loss),YOLO26 实现了更简单的模型部署选项和卓越的边缘兼容性。
  • CPU 推理速度提升高达 43%: 针对 Raspberry Pi 和嵌入式系统等受限环境进行了深度优化,在 CPU 吞吐量方面击败了所有前代产品。
  • MuSGD 优化器: 受大语言模型 (LLM) 训练范式启发,YOLO26 结合了 SGD 和 Muon。这带来了前所未有的训练稳定性和极快的收敛速度。
  • ProgLoss + STAL: 这些高级损失函数在小目标识别方面产生了显著改进,这对于航拍图像、自动化农业和机器人技术至关重要。

无论你是通过 YOLOv8 扩展到海量视频分析集群,还是通过尖端的 YOLO26 将推理推向小型边缘设备,Ultralytics 平台都能提供无缝管理整个 AI 生命周期的工具。

评论