Guía sobre la exportación de modelos YOLO26 a TFLite para su despliegue

TensorFlow Lite edge deployment framework

El despliegue de modelos de visión artificial en dispositivos de borde o integrados requiere un formato que garantice un rendimiento fluido.

El formato de exportación TensorFlow Lite o TFLite te permite optimizar tus modelos Ultralytics YOLO26 para tareas como la detección de objetos y la clasificación de imágenes en aplicaciones basadas en dispositivos de borde. En esta guía, te mostraremos los pasos para convertir tus modelos al formato TFLite, facilitando que funcionen correctamente en diversos dispositivos de borde.

¿Por qué deberías exportar a TFLite?

Introducido por Google en mayo de 2017 como parte de su framework TensorFlow, TensorFlow Lite, o TFLite para abreviar, es un framework de aprendizaje profundo de código abierto diseñado para la inferencia en el dispositivo, también conocido como edge computing. Proporciona a los desarrolladores las herramientas necesarias para ejecutar sus modelos entrenados en dispositivos móviles, integrados e IoT, así como en equipos tradicionales.

TensorFlow Lite es compatible con una amplia gama de plataformas, incluyendo Linux integrado, Android, iOS y microcontroladores (MCU). Exportar tu modelo a TFLite hace que tus aplicaciones sean más rápidas, fiables y capaces de ejecutarse sin conexión.

Características principales de los modelos TFLite

Los modelos TFLite ofrecen una amplia gama de características clave que permiten el aprendizaje automático en el dispositivo al ayudar a los desarrolladores a ejecutar sus modelos en dispositivos móviles, integrados y de borde:

  • Optimización en el dispositivo: TFLite optimiza el ML en el dispositivo, reduciendo la latencia al procesar datos localmente, mejorando la privacidad al no transmitir datos personales y minimizando el tamaño del modelo para ahorrar espacio.

  • Soporte para múltiples plataformas: TFLite ofrece una amplia compatibilidad de plataformas, soportando Android, iOS, Linux integrado y microcontroladores.

  • Soporte para diversos lenguajes: TFLite es compatible con varios lenguajes de programación, incluyendo Java, Swift, Objective-C, C++ y Python.

  • Alto rendimiento: Alcanza un rendimiento superior mediante la aceleración por hardware y la optimización del modelo.

Opciones de despliegue en TFLite

Antes de ver el código para exportar modelos YOLO26 al formato TFLite, entendamos cómo se utilizan normalmente los modelos TFLite.

TFLite ofrece varias opciones de despliegue en el dispositivo para modelos de aprendizaje automático, incluyendo:

  • Despliegue con Android e iOS: Tanto las aplicaciones de Android como las de iOS con TFLite pueden analizar transmisiones de cámaras y sensores de borde para detectar e identificar objetos. TFLite también ofrece bibliotecas nativas de iOS escritas en Swift y Objective-C. El diagrama de arquitectura a continuación muestra el proceso de despliegue de un modelo entrenado en plataformas Android e iOS usando TensorFlow Lite.

TensorFlow Lite deployment architecture for mobile

  • Implementación con Linux integrado: Si la ejecución de inferencias en una Raspberry Pi usando la Guía de Ultralytics no cumple con los requisitos de velocidad para tu caso de uso, puedes utilizar un modelo TFLite exportado para acelerar los tiempos de inferencia. Además, es posible mejorar aún más el rendimiento utilizando un dispositivo Coral Edge TPU.

  • Despliegue con microcontroladores: Los modelos TFLite también pueden desplegarse en microcontroladores y otros dispositivos con solo unos pocos kilobytes de memoria. El núcleo de ejecución (runtime) cabe perfectamente en 16 KB en un Arm Cortex M3 y puede ejecutar muchos modelos básicos. No requiere soporte de sistema operativo, ninguna biblioteca estándar de C o C++ ni asignación dinámica de memoria.

Exportar a TFLite: Convirtiendo tu modelo YOLO26

Puedes mejorar la eficiencia de ejecución del modelo en el dispositivo y optimizar el rendimiento convirtiendo tus modelos al formato TFLite.

Instalación

Para instalar los paquetes necesarios, ejecuta:

Instalación
# Install the required package for YOLO26
pip install ultralytics

Para obtener instrucciones detalladas y mejores prácticas relacionadas con el proceso de instalación, consulta nuestra guía de instalación de Ultralytics. Si encuentras alguna dificultad al instalar los paquetes necesarios para YOLO26, consulta nuestra guía de problemas comunes para obtener soluciones y consejos.

Uso

Todos los modelos Ultralytics YOLO26 están diseñados para soportar la exportación de forma inmediata, facilitando su integración en tu flujo de trabajo de despliegue preferido. Puedes ver la lista completa de formatos de exportación compatibles y opciones de configuración para elegir la mejor configuración para tu aplicación.

Uso
  from ultralytics import YOLO

  # Load the YOLO26 model
  model = YOLO("yolo26n.pt")

  # Export the model to TFLite format
  model.export(format="tflite")  # creates 'yolo26n_float32.tflite'

  # Load the exported TFLite model
  tflite_model = YOLO("yolo26n_float32.tflite")

  # Run inference
  results = tflite_model("https://ultralytics.com/images/bus.jpg")

Argumentos de exportación

ArgumentoTipoPredeterminadoDescripción
formatstr'tflite'Formato de destino para el modelo exportado, que define la compatibilidad con varios entornos de implementación.
imgszint o tuple640Tamaño de imagen deseado para la entrada del modelo. Puede ser un número entero para imágenes cuadradas o una tupla (height, width) para dimensiones específicas.
halfboolFalseActiva la cuantización FP16 (precisión media), reduciendo el tamaño del modelo y acelerando potencialmente la inferencia en hardware compatible.
int8boolFalseActiva la cuantización INT8, comprimiendo aún más el modelo y acelerando la inferencia con una pérdida de precisión mínima, principalmente para dispositivos de borde (edge).
nmsboolFalseAñade la supresión de no máximos (NMS), esencial para un posprocesamiento de detección preciso y eficiente.
batchint1Especifica el tamaño de inferencia por lotes del modelo de exportación o el número máximo de imágenes que el modelo exportado procesará simultáneamente en modo predict.
datastr'coco8.yaml'Ruta al archivo de configuración del dataset (por defecto: coco8.yaml), esencial para la cuantización.
fractionfloat1.0Especifica la fracción del conjunto de datos a usar para la calibración de cuantización INT8. Permite calibrar sobre un subconjunto del conjunto de datos completo, útil para experimentos o cuando los recursos son limitados. Si no se especifica con INT8 activado, se usará el conjunto de datos completo.
devicestrNoneEspecifica el dispositivo para exportar: CPU (device=cpu), MPS para Apple silicon (device=mps).

Para más detalles sobre el proceso de exportación, visita la página de documentación de Ultralytics sobre exportación.

Despliegue de modelos YOLO26 TFLite exportados

Después de exportar con éxito tus modelos Ultralytics YOLO26 al formato TFLite, ya puedes desplegarlos. El primer paso recomendado y principal para ejecutar un modelo TFLite es utilizar el método YOLO("model.tflite"), tal como se describe en el fragmento de código de uso anterior. Sin embargo, para obtener instrucciones detalladas sobre cómo desplegar tus modelos TFLite en otros entornos, echa un vistazo a los siguientes recursos:

  • Android: Una guía de inicio rápido para integrar TensorFlow Lite en aplicaciones de Android, que proporciona pasos fáciles de seguir para configurar y ejecutar modelos de aprendizaje automático.

  • iOS: Consulta esta guía detallada para desarrolladores sobre la integración y el despliegue de modelos de TensorFlow Lite en aplicaciones de iOS, que ofrece instrucciones paso a paso y recursos.

  • Ejemplos integrales: Esta página ofrece una visión general de varios ejemplos de TensorFlow Lite, mostrando aplicaciones prácticas y tutoriales diseñados para ayudar a los desarrolladores a implementar TensorFlow Lite en sus proyectos de aprendizaje automático en dispositivos móviles y de borde.

Resumen

En esta guía, nos hemos centrado en cómo exportar al formato TFLite. Al convertir tus modelos Ultralytics YOLO26 al formato de modelo TFLite, puedes mejorar la eficiencia y la velocidad de los modelos YOLO26, haciéndolos más eficaces y adecuados para entornos de edge computing.

Para obtener más detalles sobre su uso, visita la documentación oficial de TFLite.

Además, si tienes curiosidad por otras integraciones de Ultralytics YOLO26, consulta nuestra página de guías de integración. Encontrarás mucha información útil y perspectivas allí.

Preguntas frecuentes

¿Cómo exporto un modelo YOLO26 al formato TFLite?

Para exportar un modelo YOLO26 al formato TFLite, puedes utilizar la biblioteca de Ultralytics. Primero, instala el paquete necesario usando:

pip install ultralytics

Luego, usa el siguiente fragmento de código para exportar tu modelo:

from ultralytics import YOLO

# Load the YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to TFLite format
model.export(format="tflite")  # creates 'yolo26n_float32.tflite'

Para usuarios de la CLI, puedes lograr esto con:

yolo export model=yolo26n.pt format=tflite # creates 'yolo26n_float32.tflite'

Para más detalles, visita la guía de exportación de Ultralytics.

¿Cuáles son los beneficios de usar TensorFlow Lite para el despliegue de modelos YOLO26?

TensorFlow Lite (TFLite) es un framework de aprendizaje profundo de código abierto diseñado para la inferencia en el dispositivo, lo que lo hace ideal para desplegar modelos YOLO26 en dispositivos móviles, integrados y de IoT. Los beneficios clave incluyen:

  • Optimización en el dispositivo: Minimiza la latencia y mejora la privacidad al procesar datos localmente.
  • Compatibilidad de plataformas: Soporta Android, iOS, Linux integrado y MCU.
  • Rendimiento: Utiliza aceleración por hardware para optimizar la velocidad y la eficiencia del modelo.

Para aprender más, consulta la guía de TFLite.

¿Es posible ejecutar modelos YOLO26 TFLite en Raspberry Pi?

Sí, puedes ejecutar modelos YOLO26 TFLite en Raspberry Pi para mejorar las velocidades de inferencia. Primero, exporta tu modelo al formato TFLite como se explicó anteriormente. Luego, utiliza una herramienta como TensorFlow Lite Interpreter para ejecutar el modelo en tu Raspberry Pi.

Para más optimizaciones, podrías considerar usar Coral Edge TPU. Para pasos detallados, consulta nuestra guía de despliegue en Raspberry Pi y la guía de integración de Edge TPU.

¿Puedo usar modelos TFLite en microcontroladores para predicciones YOLO26?

Sí, TFLite soporta el despliegue en microcontroladores con recursos limitados. El núcleo de ejecución de TFLite requiere solo 16 KB de memoria en un Arm Cortex M3 y puede ejecutar modelos YOLO26 básicos. Esto lo hace adecuado para el despliegue en dispositivos con un poder computacional y memoria mínimos.

Para empezar, visita la guía de TFLite Micro para microcontroladores.

¿Qué plataformas son compatibles con los modelos YOLO26 exportados a TFLite?

TensorFlow Lite proporciona una amplia compatibilidad de plataformas, permitiéndote desplegar modelos YOLO26 en una amplia gama de dispositivos, incluyendo:

  • Android e iOS: Soporte nativo a través de las bibliotecas de TFLite para Android e iOS.
  • Linux integrado: Ideal para computadoras de placa única como Raspberry Pi.
  • Microcontroladores: Adecuado para MCU con recursos restringidos.

Para más información sobre opciones de despliegue, consulta nuestra guía de despliegue detallada.

¿Cómo soluciono problemas comunes durante la exportación de modelos YOLO26 a TFLite?

Si encuentras errores al exportar modelos YOLO26 a TFLite, las soluciones comunes incluyen:

  • Comprobar la compatibilidad de paquetes: Asegúrate de estar utilizando versiones compatibles de Ultralytics y TensorFlow. Consulta nuestra guía de instalación.
  • Soporte del modelo: Verifica que el modelo YOLO26 específico soporte la exportación a TFLite revisando la página de documentación de exportación de Ultralytics.
  • Problemas de cuantización: Al usar cuantización INT8, asegúrate de que la ruta de tu conjunto de datos esté especificada correctamente en el parámetro data.

Para consejos adicionales de resolución de problemas, visita nuestra guía de problemas comunes.

Comentarios