Ultralytics YOLO 常见问题解答 (FAQ)

本 FAQ 部分旨在解决用户在使用 Ultralytics YOLO 存储库时可能遇到的常见问题和状况。

常见问题 (FAQ)

Ultralytics 是什么?它提供什么服务?

Ultralytics 是一家专注于 计算机视觉 的 AI 公司,专门研究最先进的目标检测和 图像分割 模型,重点关注 YOLO (You Only Look Once) 系列。其产品包括:

  • YOLO26(最新版本)和 YOLO11(上一代)的开源实现
  • 适用于各种计算机视觉任务的广泛 预训练模型
  • 一个全面的 Python 包,用于将 YOLO 模型无缝集成到项目中
  • 用于模型训练、测试和部署的通用 工具
  • 详尽的文档 和支持性的社区

如何安装 Ultralytics 包?

使用 pip 安装 Ultralytics 包非常简单:

pip install ultralytics

若要安装最新的开发版本,请直接从 GitHub 存储库安装:

pip install git+https://github.com/ultralytics/ultralytics.git

详细的安装说明可在 快速入门指南 中找到。

运行 Ultralytics 模型有哪些系统要求?

最低要求:

  • Python 3.8+
  • PyTorch 1.8+
  • 支持 CUDA 的 GPU(用于 GPU 加速)

推荐配置:

  • Python 3.8+
  • PyTorch 1.10+
  • 配备 CUDA 11.2+ 的 NVIDIA GPU
  • 8GB+ 内存
  • 50GB+ 可用磁盘空间(用于数据集存储和模型训练)

如需排查常见问题,请访问 YOLO 常见问题 页面。

我该如何在自己的数据集上训练自定义 YOLO 模型?

训练自定义 YOLO 模型步骤如下:

  1. YOLO 格式 准备数据集(图像及对应的 txt 标签文件)。

  2. 创建一个描述数据集结构和类别的 YAML 文件(请参阅 数据集 YAML 示例)。

  3. 使用以下 Python 代码开始训练:

    from ultralytics import YOLO
    
    # Load a model
    model = YOLO("yolo26n.yaml")  # build a new model from scratch
    model = YOLO("yolo26n.pt")  # load a pretrained model (recommended for training)
    
    # Train the model
    results = model.train(data="path/to/your/data.yaml", epochs=100, imgsz=640)

如需更深入的指南(包括数据准备和高级训练选项),请参考全面的 训练指南

Ultralytics 提供哪些预训练模型?

Ultralytics 为各种任务提供了多种预训练模型:

  • 目标检测:YOLO26n, YOLO26s, YOLO26m, YOLO26l, YOLO26x
  • 实例分割:YOLO26n-seg, YOLO26s-seg, YOLO26m-seg, YOLO26l-seg, YOLO26x-seg
  • 分类:YOLO26n-cls, YOLO26s-cls, YOLO26m-cls, YOLO26l-cls, YOLO26x-cls
  • 姿态估计:YOLO26n-pose, YOLO26s-pose, YOLO26m-pose, YOLO26l-pose, YOLO26x-pose
  • 旋转目标检测 (OBB):YOLO26n-obb, YOLO26s-obb, YOLO26m-obb, YOLO26l-obb, YOLO26x-obb

这些模型的大小和复杂度各异,在速度和 准确率 之间提供了不同的权衡。请浏览全部 预训练模型,找到最适合你项目的模型。

如何使用训练好的 Ultralytics 模型执行推理?

使用训练好的模型进行推理的方法如下:

from ultralytics import YOLO

# Load a model
model = YOLO("path/to/your/model.pt")

# Perform inference
results = model("path/to/image.jpg")

# Process results
for r in results:
    print(r.boxes)  # print bbox predictions
    print(r.masks)  # print mask predictions
    print(r.probs)  # print class probabilities

如需了解高级推理选项(包括批处理和视频推理),请查阅详细的 预测指南

Ultralytics 模型能否部署在边缘设备或生产环境中?

当然可以!Ultralytics 模型专为在各种平台上灵活部署而设计:

  • 边缘设备:使用 TensorRT、ONNX 或 OpenVINO 优化 NVIDIA Jetson 或 Intel Neural Compute Stick 等设备上的推理。
  • 移动端:通过将模型转换为 TFLite 或 Core ML,部署在 Android 或 iOS 设备上。
  • 云端:利用 TensorFlow Serving 或 PyTorch Serve 等框架进行可扩展的云部署。
  • Web 端:使用 ONNX.js 或 TensorFlow.js 实现浏览器内推理。

Ultralytics 提供了导出功能,可将模型转换为各种格式以进行部署。探索广泛的 部署选项,找到最适合你用例的解决方案。

YOLO11 和 YOLO26 有什么区别?

主要区别包括:

  • 端到端无 NMS 推理:YOLO26 原生支持端到端,无需非极大值抑制 (NMS) 即可直接生成预测,从而降低了延迟并简化了部署。
  • 移除 DFL:YOLO26 移除了 Distribution Focal Loss 模块,简化了导出并提高了在边缘设备和低功耗设备上的兼容性。
  • MuSGD 优化器:SGD 和 Muon(受 Moonshot AI 的 Kimi K2 启发)的混合体,可实现更稳定的训练和更快的收敛。
  • CPU 性能:YOLO26 的 CPU 推理速度提升高达 43%,非常适合没有 GPU 的设备。
  • 任务特定优化:通过语义损失和多尺度原型增强了分割功能,通过 RLE 实现更精确的姿态估计,并通过角度损失改进了 OBB 解码。
  • 任务:这两种模型在统一框架内都支持 目标检测、实例分割、分类、姿态估计和旋转目标检测 (OBB)。

如需深入了解功能和性能指标的对比,请访问 YOLO26 文档页面

我该如何为 Ultralytics 开源项目做出贡献?

为 Ultralytics 做出贡献是改进项目并提升技能的绝佳方式。以下是你可以参与的方式:

  1. 在 GitHub 上 Fork Ultralytics 存储库。
  2. 为你的功能或错误修复创建一个新分支。
  3. 进行修改并确保所有测试通过。
  4. 提交一个包含清晰描述的 pull request。
  5. 参与代码审查过程。

你也可以通过报告错误、建议功能或改进文档来做出贡献。有关详细指南和最佳实践,请参考 贡献指南

如何在 Python 中安装 Ultralytics 包?

在 Python 中安装 Ultralytics 包非常简单。请在终端或命令提示符中使用 pip 运行以下命令:

pip install ultralytics

若要获取前沿开发版本,请直接从 GitHub 存储库安装:

pip install git+https://github.com/ultralytics/ultralytics.git

有关特定环境的安装说明和故障排查技巧,请查阅全面的 快速入门指南

Ultralytics YOLO 的主要功能是什么?

Ultralytics YOLO 拥有一套丰富的功能,适用于高级计算机视觉任务:

  • 实时检测:在实时场景中高效地检测和分类对象。
  • 多任务能力:在一个统一框架内执行目标检测、实例分割、分类和姿态估计。
  • 预训练模型:访问各种 预训练模型,在不同用例中平衡速度和准确率。
  • 自定义训练:使用灵活的 训练流水线 轻松在自定义数据集上微调模型。
  • 广泛的 部署选项:将模型导出为 TensorRT、ONNX 和 CoreML 等多种格式,以便在不同平台上部署。
  • 详尽的文档:受益于全面的 文档 和支持性的社区,以辅助你的计算机视觉工作流。

我该如何提高 YOLO 模型的性能?

你可以通过多种技术来提升 YOLO 模型的性能:

  1. 超参数调优:使用 超参数调优指南 试验不同的超参数,以优化模型性能。
  2. 数据增强:实施翻转、缩放、旋转和颜色调整等技术来增强训练数据集,并提高模型的泛化能力。
  3. 迁移学习:利用预训练模型,并使用 训练指南 在你的特定数据集上对其进行微调。
  4. 导出为高效格式:使用 导出指南 将模型转换为 TensorRT 或 ONNX 等优化格式,以实现更快的推理。
  5. 基准测试:利用 基准测试模式 系统地测量并提高推理速度和准确率。

我可以在移动设备和边缘设备上部署 Ultralytics YOLO 模型吗?

是的,Ultralytics YOLO 模型专为灵活部署而设计,包括移动设备和边缘设备:

  • 移动端:将模型转换为 TFLite 或 CoreML,以便无缝集成到 Android 或 iOS 应用中。请参考 TFLite 集成指南CoreML 集成指南 获取针对特定平台的说明。
  • 边缘设备:使用 TensorRT 或 ONNX 在 NVIDIA Jetson 或其他边缘硬件上优化推理。边缘 TPU 集成指南 提供了详细的边缘部署步骤。

如需全面了解跨平台的部署策略,请查阅 部署选项指南

如何使用训练好的 Ultralytics YOLO 模型执行推理?

使用训练好的 Ultralytics YOLO 模型进行推理非常简单:

  1. 加载模型:

    from ultralytics import YOLO
    
    model = YOLO("path/to/your/model.pt")
  2. 运行推理:

    results = model("path/to/image.jpg")
    
    for r in results:
        print(r.boxes)  # print bounding box predictions
        print(r.masks)  # print mask predictions
        print(r.probs)  # print class probabilities

如需了解高级推理技术(包括批处理、视频推理和自定义预处理),请参考详细的 预测指南

在哪里可以找到使用 Ultralytics 的示例和教程?

Ultralytics 提供了丰富的资源来帮助你入门并掌握其工具:

  • 📚 官方文档:全面的指南、API 参考和最佳实践。
  • 💻 GitHub 存储库:源代码、示例脚本和社区贡献。
  • ✍️ Ultralytics 博客:深度文章、用例和技术洞察。
  • 💬 社区论坛:与其他用户联系、提问并分享你的经验。
  • 🎥 YouTube channel:关于各种 Ultralytics 主题的视频教程、演示和网络研讨会。

这些资源为使用 Ultralytics 模型执行各种任务提供了代码示例、实际应用案例和分步指南。

如果你需要进一步的帮助,请查阅 Ultralytics 文档,或通过 GitHub Issues 或官方 讨论论坛 联系社区。

评论