Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 模型导出至 TFLite 部署指南#

TensorFlow Lite edge deployment framework

在边缘设备或嵌入式设备上部署 计算机视觉 模型,需要一种能够确保无缝性能的格式。

TensorFlow Lite 或 TFLite 导出格式允许你针对边缘设备应用,优化你的 Ultralytics YOLO26 模型,以执行 目标检测图像分类 等任务。在本指南中,我们将介绍将模型转换为 TFLite 格式的步骤,使你的模型更容易在各种边缘设备上表现出色。

Link to this section为什么要导出为 TFLite?#

由 Google 在 2017 年 5 月作为其 TensorFlow 框架的一部分推出,TensorFlow Lite(简称 TFLite)是一个开源深度学习框架,专为设备端推理而设计,也称为 边缘计算。它为开发者提供了必要的工具,使其能够将训练好的模型在移动设备、嵌入式设备、物联网设备以及传统计算机上执行。

TensorFlow Lite 与多种平台兼容,包括嵌入式 Linux、Android、iOS 和微控制器 (MCU)。将模型导出为 TFLite 可以使你的应用程序运行更快、更可靠,并支持离线运行。

Link to this sectionTFLite 模型的主要特性#

TFLite 模型提供了广泛的关键特性,通过帮助开发者在移动、嵌入式和边缘设备上运行模型,从而实现设备端机器学习:

  • 设备端优化:TFLite 针对设备端 ML 进行了优化,通过本地处理数据来减少延迟,通过不传输个人数据来增强隐私,并最小化模型大小以节省空间。

  • 多平台支持:TFLite 提供广泛的平台兼容性,支持 Android、iOS、嵌入式 Linux 和微控制器。

  • 多样化的语言支持:TFLite 与多种编程语言兼容,包括 Java、Swift、Objective-C、C++ 和 Python。

  • 高性能:通过硬件加速和模型优化实现卓越的性能。

Link to this sectionTFLite 中的部署选项#

在查看将 YOLO26 模型导出为 TFLite 格式的代码之前,让我们先了解一下 TFLite 模型通常是如何使用的。

TFLite 为机器学习模型提供了各种设备端部署选项,包括:

  • 在 Android 和 iOS 上部署:搭载 TFLite 的 Android 和 iOS 应用程序可以分析基于边缘的摄像头馈送和传感器,以检测和识别对象。TFLite 还提供由 SwiftObjective-C 编写的原生 iOS 库。下方的架构图展示了使用 TensorFlow Lite 将训练好的模型部署到 Android 和 iOS 平台的过程。

TensorFlow Lite deployment architecture for mobile

  • Implementing with Embedded Linux: If running inferences on a Raspberry Pi using the Ultralytics Guide does not meet the speed requirements for your use case, you can use an exported TFLite model to accelerate inference times. Additionally, it's possible to further improve performance by utilizing a Coral Edge TPU device.

  • 在微控制器上部署:TFLite 模型也可以部署在只有几千字节内存的微控制器和其他设备上。其核心运行时在 Arm Cortex M3 上仅占 16 KB,并可运行许多基础模型。它不需要操作系统支持、任何标准的 C 或 C++ 库,也不需要动态内存分配。

Link to this section导出至 TFLite:转换你的 YOLO26 模型#

你可以通过将模型转换为 TFLite 格式,来提高设备端模型的执行效率并优化性能。

Link to this section安装#

要安装所需的软件包,请运行:

安装
# Install the required package for YOLO26
pip install ultralytics

有关安装过程的详细说明和最佳实践,请查阅我们的 Ultralytics 安装指南。在为 YOLO26 安装所需软件包时,如果遇到任何困难,请参考我们的 常见问题指南 获取解决方案和提示。

Link to this section用法#

所有 Ultralytics YOLO26 模型 都设计为开箱即用支持导出,这使得将它们集成到你首选的部署工作流中变得非常容易。你可以 查看支持的导出格式和配置选项的完整列表,为你的应用选择最佳设置。

TFLite 格式支持 导出预测验证 模式。导出你的模型,然后加载导出的模型以运行推理或验证其准确性。

导出
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite format
model.export(format="tflite")  # creates 'yolo26n_float32.tflite'
预测
from ultralytics import YOLO

# Load the exported TFLite model
model = YOLO("yolo26n_float32.tflite")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
验证
from ultralytics import YOLO

# Load the exported TFLite model
model = YOLO("yolo26n_float32.tflite")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this section导出参数#

参数类型默认值描述
formatstr'tflite'导出模型的目标格式,定义了与各种部署环境的兼容性。
imgszinttuple640模型输入的期望图像尺寸。可以是一个用于正方形图像的整数,或者是一个用于特定尺寸的元组 (height, width)
halfboolFalse启用 FP16(半精度)量化,减小模型尺寸并可能在受支持的硬件上加快推理速度。
int8boolFalse激活 INT8 量化,进一步压缩模型并加速推理,且 accuracy 损失极小,主要用于边缘设备。
nmsboolFalse添加非极大值抑制 (NMS),这是准确高效的检测后处理所必需的。
batchint1指定导出模型的推理批次大小,或导出模型在 predict 模式下并发处理的最大图像数量。
datastr'coco8.yaml'dataset 配置文件的路径(默认:coco8.yaml),这对量化至关重要。
fractionfloat1.0指定用于 INT8 量化校准的数据集比例。允许在完整数据集的一个子集上进行校准,这对实验或资源受限时非常有用。如果启用 INT8 但未指定,将使用完整数据集。
devicestrNone指定导出设备:CPU (device=cpu),Apple 芯片的 MPS (device=mps)。

有关导出过程的更多详细信息,请访问 Ultralytics 导出文档页面

Link to this section部署导出的 YOLO26 TFLite 模型#

在成功将你的 Ultralytics YOLO26 模型导出为 TFLite 格式后,现在就可以部署它们了。运行 TFLite 模型的首选且推荐的第一步是使用 YOLO("model.tflite") 方法,如前文的使用代码片段所示。但是,如需在各种其他设置中部署 TFLite 模型的深入说明,请查看以下资源:

  • Android:一份将 TensorFlow Lite 集成到 Android 应用程序中的快速入门指南,提供了设置和运行 机器学习 模型的简单易懂步骤。

  • iOS:查看这份为开发者准备的详细指南,了解如何在 iOS 应用程序中集成和部署 TensorFlow Lite 模型,其中提供了分步说明和资源。

  • 端到端示例:此页面概述了各种 TensorFlow Lite 示例,展示了旨在帮助开发者在移动设备和边缘设备上实现机器学习项目中的 TensorFlow Lite 的实际应用和教程。

Link to this section总结#

在本指南中,我们重点介绍了如何导出为 TFLite 格式。通过将你的 Ultralytics YOLO26 模型转换为 TFLite 模型格式,你可以提高 YOLO26 模型的效率和速度,使其在边缘计算环境中更加有效且适用。

有关用法的更多详细信息,请访问 TFLite 官方文档

此外,如果你对其他 Ultralytics YOLO26 集成感兴趣,请查看我们的 集成指南页面。你会在那里找到许多有用的信息和见解。

Link to this section常见问题解答#

Link to this section如何将 YOLO26 模型导出为 TFLite 格式?#

要将 YOLO26 模型导出为 TFLite 格式,可以使用 Ultralytics 库。首先,使用以下命令安装所需的软件包:

pip install ultralytics

然后,使用以下代码片段导出你的模型:

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite format
model.export(format="tflite")  # creates 'yolo26n_float32.tflite'

对于 CLI 用户,你可以通过以下命令实现:

yolo export model=yolo26n.pt format=tflite # creates 'yolo26n_float32.tflite'

有关更多详细信息,请访问 Ultralytics 导出指南

Link to this section使用 TensorFlow Lite 进行 YOLO26 模型部署有什么好处?#

TensorFlow Lite (TFLite) 是一个开源 深度学习 框架,专为设备端推理而设计,非常适合在移动、嵌入式和物联网设备上部署 YOLO26 模型。主要好处包括:

  • 设备端优化:通过本地处理数据来最小化延迟并增强隐私。
  • 平台兼容性:支持 Android、iOS、嵌入式 Linux 和 MCU。
  • 性能:利用硬件加速来优化模型速度和效率。

要了解更多信息,请查看 TFLite 指南

Link to this section可以在 Raspberry Pi 上运行 YOLO26 TFLite 模型吗?#

可以,你可以在 Raspberry Pi 上运行 YOLO26 TFLite 模型以提高推理速度。首先,按照上述说明将你的模型导出为 TFLite 格式。然后,使用像 TensorFlow Lite Interpreter 这样的工具在你的 Raspberry Pi 上执行模型。

如需进一步优化,你可以考虑使用 Coral Edge TPU。有关详细步骤,请参阅我们的 Raspberry Pi 部署指南Edge TPU 集成指南

Link to this section我可以在微控制器上使用 TFLite 模型进行 YOLO26 预测吗?#

可以,TFLite 支持在资源受限的微控制器上进行部署。TFLite 的核心运行时在 Arm Cortex M3 上仅需要 16 KB 的内存,并且可以运行基本的 YOLO26 模型。这使得它非常适合部署在计算能力和内存有限的设备上。

要开始使用,请访问 TFLite 微控制器指南

Link to this section哪些平台与 TFLite 导出的 YOLO26 模型兼容?#

TensorFlow Lite 提供广泛的平台兼容性,允许你在各种设备上部署 YOLO26 模型,包括:

  • Android 和 iOS:通过 TFLite Android 和 iOS 库提供原生支持。
  • 嵌入式 Linux:非常适合 Raspberry Pi 等单板计算机。
  • 微控制器:适用于资源受限的 MCU。

有关部署选项的更多信息,请参阅我们详细的 部署指南

Link to this section如何排查 YOLO26 模型导出至 TFLite 期间的常见问题?#

如果你在将 YOLO26 模型导出为 TFLite 时遇到错误,常见的解决方案包括:

  • 检查软件包兼容性:确保你使用的是兼容版本的 Ultralytics 和 TensorFlow。请参考我们的 安装指南
  • 模型支持:通过查看 Ultralytics 导出文档页面,确认特定的 YOLO26 模型是否支持 TFLite 导出。
  • 量化问题:在使用 INT8 量化时,请确保在 data 参数中正确指定了你的数据集路径。

有关其他排查技巧,请访问我们的 常见问题指南

评论