Análisis comparativo de las opciones de despliegue de YOLO26

Introducción

Has recorrido un largo camino en tu viaje con YOLO26. Has recopilado datos diligentemente, los has anotado meticulosamente y has dedicado horas a entrenar y evaluar rigurosamente tu modelo personalizado de YOLO26. Ahora es el momento de poner tu modelo a trabajar para tu aplicación, caso de uso o proyecto específico. Pero te enfrentas a una decisión crítica: cómo exportar y desplegar tu modelo de forma eficaz.



Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀

Esta guía te orienta a través de las opciones de despliegue de YOLO26 y los factores esenciales que debes considerar para elegir la opción adecuada para tu proyecto.

Cómo seleccionar la opción de despliegue adecuada para tu modelo YOLO26

Cuando llega el momento de desplegar tu modelo YOLO26, seleccionar un formato de exportación adecuado es muy importante. Como se detalla en la documentación de modos de Ultralytics YOLO26, la función model.export() te permite convertir tu modelo entrenado a una variedad de formatos adaptados a diversos entornos y requisitos de rendimiento.

El formato ideal depende del contexto operativo previsto para tu modelo, equilibrando la velocidad, las restricciones de hardware y la facilidad de integración. Para un despliegue gestionado sin exportación manual, Ultralytics Platform ofrece endpoints de inferencia listos para usar con escalado automático en 43 regiones globales. En la siguiente sección, analizaremos más de cerca cada opción de exportación, comprendiendo cuándo elegir cada una.

Opciones de despliegue de YOLO26

Revisemos las diferentes opciones de despliegue de YOLO26. Para obtener un recorrido detallado del proceso de exportación, visita la página de documentación de Ultralytics sobre exportación.

PyTorch

PyTorch es una biblioteca de aprendizaje automático de código abierto ampliamente utilizada para aplicaciones en deep learning e inteligencia artificial. Proporciona un alto nivel de flexibilidad y velocidad, lo que la ha convertido en una de las favoritas entre investigadores y desarrolladores.

  • Evaluaciones comparativas de rendimiento: PyTorch es conocido por su facilidad de uso y flexibilidad, lo que puede dar lugar a un ligero compromiso en el rendimiento bruto en comparación con otros marcos de trabajo más especializados y optimizados.
  • Compatibilidad e integración: Ofrece una excelente compatibilidad con diversas bibliotecas de ciencia de datos y aprendizaje automático en Python.
  • Apoyo de la comunidad y ecosistema: Una de las comunidades más vibrantes, con amplios recursos para el aprendizaje y la resolución de problemas.
  • Casos prácticos: Utilizado habitualmente en prototipos de investigación, muchos artículos académicos hacen referencia a modelos desplegados en PyTorch.
  • Mantenimiento y actualizaciones: Actualizaciones periódicas con desarrollo activo y soporte para nuevas funciones.
  • Consideraciones de seguridad: Parches regulares para problemas de seguridad, aunque la seguridad depende en gran medida del entorno general en el que se despliega.
  • Aceleración de hardware: Admite CUDA para la aceleración mediante GPU, esencial para acelerar el entrenamiento del modelo y la inferencia.

TorchScript

TorchScript amplía las capacidades de PyTorch al permitir la exportación de modelos para ejecutarlos en un entorno de tiempo de ejecución de C++. Esto lo hace adecuado para entornos de producción donde Python no está disponible.

  • Evaluaciones comparativas de rendimiento: Puede ofrecer un mejor rendimiento que PyTorch nativo, especialmente en entornos de producción.
  • Compatibilidad e integración: Diseñado para una transición fluida de PyTorch a entornos de producción de C++, aunque algunas funciones avanzadas podrían no traducirse a la perfección.
  • Apoyo de la comunidad y ecosistema: Se beneficia de la gran comunidad de PyTorch, pero tiene un ámbito más reducido de desarrolladores especializados.
  • Casos prácticos: Ampliamente utilizado en entornos industriales donde la sobrecarga de rendimiento de Python es un cuello de botella.
  • Mantenimiento y actualizaciones: Se mantiene junto a PyTorch con actualizaciones constantes.
  • Consideraciones de seguridad: Ofrece una seguridad mejorada al permitir la ejecución de modelos en entornos sin instalaciones completas de Python.
  • Aceleración de hardware: Hereda el soporte CUDA de PyTorch, garantizando una utilización eficiente de la GPU.

ONNX

El intercambio de redes neuronales abiertas (ONNX) es un formato que permite la interoperabilidad de modelos entre diferentes marcos de trabajo, lo cual puede ser crítico al desplegar en diversas plataformas.

  • Evaluaciones comparativas de rendimiento: Los modelos ONNX pueden experimentar un rendimiento variable dependiendo del tiempo de ejecución específico en el que se desplieguen.
  • Compatibilidad e integración: Alta interoperabilidad entre múltiples plataformas y hardware debido a su naturaleza independiente del marco de trabajo.
  • Apoyo de la comunidad y ecosistema: Respaldado por muchas organizaciones, lo que conduce a un ecosistema amplio y una variedad de herramientas para la optimización.
  • Casos prácticos: Utilizado con frecuencia para mover modelos entre diferentes marcos de aprendizaje automático, demostrando su flexibilidad.
  • Mantenimiento y actualizaciones: Como estándar abierto, ONNX se actualiza periódicamente para admitir nuevas operaciones y modelos.
  • Consideraciones de seguridad: Como ocurre con cualquier herramienta multiplataforma, es esencial garantizar prácticas seguras en la canalización de conversión y despliegue.
  • Aceleración de hardware: Con ONNX Runtime, los modelos pueden aprovechar diversas optimizaciones de hardware.

OpenVINO

OpenVINO es un kit de herramientas de Intel diseñado para facilitar el despliegue de modelos de deep learning en hardware Intel, mejorando el rendimiento y la velocidad.

  • Evaluaciones comparativas de rendimiento: Optimizado específicamente para CPUs, GPUs y VPUs de Intel, ofreciendo importantes aumentos de rendimiento en hardware compatible.
  • Compatibilidad e integración: Funciona mejor dentro del ecosistema Intel, pero también es compatible con una gama de otras plataformas.
  • Apoyo de la comunidad y ecosistema: Respaldado por Intel, con una sólida base de usuarios, especialmente en el dominio de la visión artificial.
  • Casos prácticos: Utilizado a menudo en escenarios de IoT y edge computing donde predomina el hardware de Intel.
  • Mantenimiento y actualizaciones: Intel actualiza periódicamente OpenVINO para admitir los modelos de deep learning más recientes y el hardware de Intel.
  • Consideraciones de seguridad: Proporciona características de seguridad robustas adecuadas para el despliegue en aplicaciones sensibles.
  • Aceleración de hardware: Adaptado para la aceleración en hardware de Intel, aprovechando conjuntos de instrucciones y características de hardware dedicados.

Para obtener más detalles sobre el despliegue con OpenVINO, consulta la documentación de integración de Ultralytics: Exportación a Intel OpenVINO.

TensorRT

TensorRT es un optimizador y tiempo de ejecución de inferencia de deep learning de alto rendimiento de NVIDIA, ideal para aplicaciones que necesitan velocidad y eficiencia.

  • Evaluaciones comparativas de rendimiento: Ofrece un rendimiento de primer nivel en GPUs NVIDIA con soporte para inferencia de alta velocidad.
  • Compatibilidad e integración: Más adecuado para hardware NVIDIA, con soporte limitado fuera de este entorno.
  • Apoyo de la comunidad y ecosistema: Fuerte red de soporte a través de los foros de desarrolladores y la documentación de NVIDIA.
  • Casos prácticos: Ampliamente adoptado en sectores que requieren inferencia en tiempo real sobre datos de vídeo e imagen.
  • Mantenimiento y actualizaciones: NVIDIA mantiene TensorRT con actualizaciones frecuentes para mejorar el rendimiento y admitir nuevas arquitecturas de GPU.
  • Consideraciones de seguridad: Al igual que muchos productos de NVIDIA, hace un gran énfasis en la seguridad, pero los detalles específicos dependen del entorno de despliegue.
  • Aceleración de hardware: Diseñado exclusivamente para GPUs NVIDIA, proporcionando una optimización y aceleración profundas.

Para obtener más información sobre el despliegue de TensorRT, echa un vistazo a la guía de integración de TensorRT.

CoreML

CoreML es el marco de aprendizaje automático de Apple, optimizado para el rendimiento en el dispositivo dentro del ecosistema de Apple, incluidos iOS, macOS, watchOS y tvOS.

  • Evaluaciones comparativas de rendimiento: Optimizado para el rendimiento en el dispositivo en hardware de Apple con un consumo mínimo de batería.
  • Compatibilidad e integración: Exclusivo para el ecosistema de Apple, proporcionando un flujo de trabajo optimizado para aplicaciones de iOS y macOS.
  • Apoyo de la comunidad y ecosistema: Fuerte apoyo de Apple y una comunidad de desarrolladores dedicada, con amplia documentación y herramientas.
  • Casos prácticos: Utilizado habitualmente en aplicaciones que requieren capacidades de aprendizaje automático en el dispositivo en productos Apple.
  • Mantenimiento y actualizaciones: Actualizado periódicamente por Apple para admitir los últimos avances en aprendizaje automático y hardware de Apple.
  • Consideraciones de seguridad: Se beneficia del enfoque de Apple en la privacidad del usuario y la seguridad de los datos.
  • Aceleración de hardware: Aprovecha al máximo el motor neuronal y la GPU de Apple para tareas aceleradas de aprendizaje automático.

TF SavedModel

TF SavedModel es el formato de TensorFlow para guardar y servir modelos de aprendizaje automático, particularmente adecuado para entornos de servidor escalables.

  • Evaluaciones comparativas de rendimiento: Ofrece un rendimiento escalable en entornos de servidor, especialmente cuando se utiliza con TensorFlow Serving.
  • Compatibilidad e integración: Amplia compatibilidad en todo el ecosistema de TensorFlow, incluidos los despliegues en la nube y en servidores empresariales.
  • Apoyo de la comunidad y ecosistema: Gran apoyo de la comunidad debido a la popularidad de TensorFlow, con una amplia gama de herramientas para el despliegue y la optimización.
  • Casos prácticos: Utilizado ampliamente en entornos de producción para servir modelos de deep learning a gran escala.
  • Mantenimiento y actualizaciones: Respaldado por Google y la comunidad de TensorFlow, lo que garantiza actualizaciones periódicas y nuevas funciones.
  • Consideraciones de seguridad: El despliegue utilizando TensorFlow Serving incluye características de seguridad robustas para aplicaciones de nivel empresarial.
  • Aceleración de hardware: Admite diversas aceleraciones de hardware a través de los backends de TensorFlow.

TF GraphDef

TF GraphDef es un formato de TensorFlow que representa el modelo como un gráfico, lo cual es beneficioso para entornos donde se requiere un gráfico de cálculo estático.

  • Evaluaciones comparativas de rendimiento: Proporciona un rendimiento estable para gráficos de cálculo estáticos, centrándose en la coherencia y la fiabilidad.
  • Compatibilidad e integración: Se integra fácilmente dentro de la infraestructura de TensorFlow, pero es menos flexible en comparación con SavedModel.
  • Apoyo de la comunidad y ecosistema: Buen soporte del ecosistema de TensorFlow, con muchos recursos disponibles para optimizar gráficos estáticos.
  • Casos prácticos: Útil en escenarios donde es necesario un gráfico estático, como en ciertos sistemas integrados.
  • Mantenimiento y actualizaciones: Actualizaciones periódicas junto con las actualizaciones principales de TensorFlow.
  • Consideraciones de seguridad: Garantiza un despliegue seguro con las prácticas de seguridad establecidas de TensorFlow.
  • Aceleración de hardware: Puede utilizar las opciones de aceleración de hardware de TensorFlow, aunque no es tan flexible como SavedModel.

Obtén más información sobre TF GraphDef en nuestra guía de integración de TF GraphDef.

TF Lite

TF Lite es la solución de TensorFlow para el aprendizaje automático en dispositivos móviles e integrados, proporcionando una biblioteca ligera para la inferencia en el dispositivo.

  • Evaluaciones comparativas de rendimiento: Diseñado para la velocidad y la eficiencia en dispositivos móviles e integrados.
  • Compatibilidad e integración: Se puede utilizar en una amplia gama de dispositivos debido a su naturaleza ligera.
  • Apoyo de la comunidad y ecosistema: Respaldado por Google, cuenta con una comunidad robusta y un número creciente de recursos para desarrolladores.
  • Casos prácticos: Popular en aplicaciones móviles que requieren inferencia en el dispositivo con una huella mínima.
  • Mantenimiento y actualizaciones: Actualizado periódicamente para incluir las últimas funciones y optimizaciones para dispositivos móviles.
  • Consideraciones de seguridad: Proporciona un entorno seguro para ejecutar modelos en dispositivos de usuario final.
  • Aceleración de hardware: Admite una variedad de opciones de aceleración de hardware, incluidas GPU y DSP.

TF Edge TPU

TF Edge TPU está diseñado para una computación eficiente y de alta velocidad en el hardware Edge TPU de Google, perfecto para dispositivos IoT que requieren procesamiento en tiempo real.

  • Evaluaciones comparativas de rendimiento: Optimizado específicamente para una computación eficiente y de alta velocidad en el hardware Edge TPU de Google.
  • Compatibilidad e integración: Funciona exclusivamente con modelos de TensorFlow Lite en dispositivos Edge TPU.
  • Apoyo de la comunidad y ecosistema: Creciente apoyo con recursos proporcionados por Google y desarrolladores externos.
  • Casos prácticos: Utilizado en dispositivos IoT y aplicaciones que requieren procesamiento en tiempo real con baja latencia.
  • Mantenimiento y actualizaciones: Se mejora continuamente para aprovechar las capacidades de los nuevos lanzamientos de hardware de Edge TPU.
  • Consideraciones de seguridad: Se integra con la seguridad robusta de Google para dispositivos IoT y edge.
  • Aceleración de hardware: Diseñado a medida para aprovechar al máximo los dispositivos Google Coral.

TF.js

TensorFlow.js (TF.js) es una biblioteca que lleva las capacidades de aprendizaje automático directamente al navegador, ofreciendo un nuevo reino de posibilidades tanto para los desarrolladores web como para los usuarios. Permite la integración de modelos de aprendizaje automático en aplicaciones web sin necesidad de infraestructura de back-end.

  • Evaluaciones comparativas de rendimiento: Permite el aprendizaje automático directamente en el navegador con un rendimiento razonable, dependiendo del dispositivo del cliente.
  • Compatibilidad e integración: Alta compatibilidad con tecnologías web, lo que permite una fácil integración en aplicaciones web.
  • Apoyo comunitario y ecosistema: Apoyo de una comunidad de desarrolladores web y de Node.js, con una variedad de herramientas para desplegar modelos de ML en navegadores.
  • Casos de estudio: Ideal para aplicaciones web interactivas que se benefician del aprendizaje automático en el lado del cliente sin necesidad de procesamiento en el lado del servidor.
  • Mantenimiento y actualizaciones: Mantenido por el equipo de TensorFlow con contribuciones de la comunidad de código abierto.
  • Consideraciones de seguridad: Se ejecuta dentro del contexto seguro del navegador, utilizando el modelo de seguridad de la plataforma web.
  • Aceleración de hardware: El rendimiento se puede mejorar con APIs basadas en web que acceden a la aceleración de hardware como WebGL.

PaddlePaddle

PaddlePaddle es un framework de aprendizaje profundo de código abierto desarrollado por Baidu. Está diseñado para ser eficiente para los investigadores y fácil de usar para los desarrolladores. Es particularmente popular en China y ofrece soporte especializado para el procesamiento de lenguaje chino.

  • Benchmarks de rendimiento: Ofrece un rendimiento competitivo con un enfoque en la facilidad de uso y la escalabilidad.
  • Compatibilidad e integración: Bien integrado dentro del ecosistema de Baidu y admite una amplia gama de aplicaciones.
  • Apoyo comunitario y ecosistema: Aunque la comunidad es más pequeña a nivel mundial, está creciendo rápidamente, especialmente en China.
  • Casos de estudio: Utilizado comúnmente en mercados chinos y por desarrolladores que buscan alternativas a otros frameworks principales.
  • Mantenimiento y actualizaciones: Actualizado regularmente con un enfoque en servir a aplicaciones y servicios de IA en idioma chino.
  • Consideraciones de seguridad: Enfatiza la privacidad de los datos y la seguridad, atendiendo a los estándares de gobernanza de datos chinos.
  • Aceleración de hardware: Admite varias aceleraciones de hardware, incluidos los propios chips Kunlun de Baidu.

MNN

MNN es un framework de aprendizaje profundo altamente eficiente y ligero. Admite la inferencia y el entrenamiento de modelos de aprendizaje profundo y tiene un rendimiento líder en la industria para la inferencia y el entrenamiento en el dispositivo. Además, MNN también se utiliza en dispositivos integrados, como IoT.

  • Benchmarks de rendimiento: Alto rendimiento para dispositivos móviles con una excelente optimización para sistemas ARM.
  • Compatibilidad e integración: Funciona bien con sistemas móviles e integrados ARM y arquitecturas de CPU X86-64.
  • Apoyo comunitario y ecosistema: Respaldado por la comunidad de aprendizaje automático móvil e integrado.
  • Casos de estudio: Ideal para aplicaciones que requieren un rendimiento eficiente en sistemas móviles.
  • Mantenimiento y actualizaciones: Mantenido regularmente para garantizar un alto rendimiento en dispositivos móviles.
  • Consideraciones de seguridad: Proporciona ventajas de seguridad en el dispositivo manteniendo los datos locales.
  • Aceleración de hardware: Optimizado para CPUs y GPUs ARM para una máxima eficiencia.

NCNN

NCNN es un framework de inferencia de redes neuronales de alto rendimiento optimizado para la plataforma móvil. Destaca por su naturaleza ligera y eficiencia, lo que lo hace particularmente adecuado para dispositivos móviles e integrados donde los recursos son limitados.

  • Benchmarks de rendimiento: Altamente optimizado para plataformas móviles, ofreciendo una inferencia eficiente en dispositivos basados en ARM.
  • Compatibilidad e integración: Adecuado para aplicaciones en teléfonos móviles y sistemas integrados con arquitectura ARM.
  • Apoyo comunitario y ecosistema: Respaldado por una comunidad pequeña pero activa centrada en aplicaciones de ML móviles e integradas.
  • Casos de estudio: Preferido para aplicaciones móviles donde la eficiencia y la velocidad son críticas en Android y otros sistemas basados en ARM.
  • Mantenimiento y actualizaciones: Mejorado continuamente para mantener un alto rendimiento en una gama de dispositivos ARM.
  • Consideraciones de seguridad: Se enfoca en ejecutarse localmente en el dispositivo, aprovechando la seguridad inherente del procesamiento en el dispositivo.
  • Aceleración de hardware: Adaptado para CPUs y GPUs ARM, con optimizaciones específicas para estas arquitecturas.

Análisis comparativo de las opciones de despliegue de YOLO26

La siguiente tabla proporciona una instantánea de las diversas opciones de despliegue disponibles para modelos YOLO26, ayudándote a evaluar cuál puede adaptarse mejor a las necesidades de tu proyecto en función de varios criterios críticos. Para obtener un vistazo detallado del formato de cada opción de despliegue, consulta la página de documentación de Ultralytics sobre formatos de exportación.

Opción de despliegueBenchmarks de rendimientoCompatibilidad e integraciónApoyo comunitario y ecosistemaCasos de estudioMantenimiento y actualizacionesConsideraciones de seguridadAceleración de hardware
PyTorchBuena flexibilidad; puede sacrificar el rendimiento brutoExcelente con librerías de PythonAmplios recursos y comunidadInvestigación y prototiposDesarrollo regular y activoDependiente del entorno de despliegueSoporte CUDA para aceleración de GPU
TorchScriptMejor para producción que PyTorchTransición fluida de PyTorch a C++Especializado pero más limitado que PyTorchIndustria donde Python es un cuello de botellaActualizaciones consistentes con PyTorchSeguridad mejorada sin Python completoHereda el soporte CUDA de PyTorch
ONNXVariable dependiendo del tiempo de ejecuciónAlto a través de diferentes frameworksEcosistema amplio, respaldado por muchas organizacionesFlexibilidad entre frameworks de MLActualizaciones regulares para nuevas operacionesAsegura prácticas seguras de conversión y despliegueVarias optimizaciones de hardware
OpenVINOOptimizado para hardware de IntelMejor dentro del ecosistema IntelSólido en el campo de la visión artificialIoT y edge con hardware IntelActualizaciones regulares para hardware IntelFunciones robustas para aplicaciones sensiblesAdaptado para hardware Intel
TensorRTDe primer nivel en GPUs NVIDIAMejor para hardware NVIDIARed fuerte a través de NVIDIAInferencia de vídeo e imagen en tiempo realActualizaciones frecuentes para nuevas GPUsÉnfasis en la seguridadDiseñado para GPUs NVIDIA
CoreMLOptimizado para hardware Apple en el dispositivoExclusivo del ecosistema AppleSoporte fuerte de Apple y de desarrolladoresML en el dispositivo en productos AppleActualizaciones regulares de AppleEnfoque en privacidad y seguridadMotor neuronal y GPU de Apple
TF SavedModelEscalable en entornos de servidorAmplia compatibilidad en el ecosistema TensorFlowGran soporte debido a la popularidad de TensorFlowServicio de modelos a escalaActualizaciones regulares por Google y la comunidadFunciones robustas para empresasVarias aceleraciones de hardware
TF GraphDefEstable para grafos de computación estáticosSe integra bien con la infraestructura de TensorFlowRecursos para optimizar grafos estáticosEscenarios que requieren grafos estáticosActualizaciones junto con el núcleo de TensorFlowPrácticas de seguridad establecidas de TensorFlowOpciones de aceleración de TensorFlow
TF LiteVelocidad y eficiencia en móviles/integradosAmplia gama de soporte para dispositivosComunidad robusta, respaldada por GoogleAplicaciones móviles con una huella mínimaÚltimas funciones para móvilesEntorno seguro en dispositivos del usuario finalGPU y DSP entre otros
TF Edge TPUOptimizado para el hardware Edge TPU de GoogleExclusivo para dispositivos Edge TPUEn crecimiento con recursos de Google y de tercerosDispositivos IoT que requieren procesamiento en tiempo realMejoras para nuevo hardware Edge TPUSeguridad IoT robusta de GoogleDiseñado a medida para Google Coral
TF.jsRendimiento razonable en el navegadorAlto con tecnologías webSoporte para desarrolladores web y Node.jsAplicaciones web interactivasContribuciones del equipo de TensorFlow y la comunidadModelo de seguridad de la plataforma webMejorado con WebGL y otras API
PaddlePaddleCompetitivo, fácil de usar y escalableEcosistema Baidu, amplio soporte de aplicacionesCrecimiento rápido, especialmente en ChinaMercado chino y procesamiento de lenguajeEnfoque en aplicaciones de IA chinasEnfatiza la privacidad y seguridad de los datosIncluyendo chips Kunlun de Baidu
MNNAlto rendimiento para dispositivos móviles.Sistemas móviles y embebidos ARM y CPU X86-64Comunidad de ML móvil/embebidoEficiencia de sistemas móvilesMantenimiento de alto rendimiento en dispositivos móvilesVentajas de seguridad en el dispositivoOptimizaciones para CPU y GPU ARM
NCNNOptimizado para dispositivos móviles basados en ARMSistemas móviles y embebidos ARMComunidad de ML móvil/embebido de nicho pero activaEficiencia de sistemas Android y ARMMantenimiento de alto rendimiento en ARMVentajas de seguridad en el dispositivoOptimizaciones para CPU y GPU ARM

Este análisis comparativo te ofrece una visión general de alto nivel. Para el despliegue, es esencial considerar los requisitos y limitaciones específicos de tu proyecto, y consultar la documentación detallada y los recursos disponibles para cada opción.

Comunidad y soporte

Cuando comienzas con YOLO26, contar con una comunidad útil y soporte puede marcar una diferencia significativa. Aquí tienes cómo conectar con otros que comparten tus intereses y obtener la asistencia que necesitas.

Interactúa con la comunidad más amplia

  • Debates en GitHub: El repositorio de YOLO26 en GitHub tiene una sección de "Discussions" donde puedes hacer preguntas, informar problemas y sugerir mejoras.
  • Servidor de Discord de Ultralytics: Ultralytics tiene un servidor de Discord donde puedes interactuar con otros usuarios y desarrolladores.

Documentación oficial y recursos

  • Documentación de Ultralytics YOLO26: La documentación oficial proporciona una visión general completa de YOLO26, junto con guías sobre instalación, uso y solución de problemas.

Estos recursos te ayudarán a abordar desafíos y a mantenerte al día sobre las últimas tendencias y mejores prácticas en la comunidad de YOLO26.

Conclusión

En esta guía, hemos explorado las diferentes opciones de despliegue para YOLO26. También hemos tratado los factores importantes a tener en cuenta al tomar tu elección. Estas opciones te permiten personalizar tu modelo para diversos entornos y requisitos de rendimiento, haciéndolo adecuado para aplicaciones del mundo real.

No olvides que la comunidad de YOLO26 y Ultralytics es una fuente valiosa de ayuda. Conecta con otros desarrolladores y expertos para aprender consejos y soluciones únicos que quizás no encuentres en la documentación habitual. Sigue buscando conocimiento, explorando nuevas ideas y compartiendo tus experiencias.

Preguntas frecuentes

¿Qué opciones de despliegue están disponibles para YOLO26 en diferentes plataformas de hardware?

Ultralytics YOLO26 admite varios formatos de despliegue, cada uno diseñado para entornos y plataformas de hardware específicos. Los formatos clave incluyen:

  • PyTorch para investigación y creación de prototipos, con una excelente integración en Python.
  • TorchScript para entornos de producción donde no hay Python disponible.
  • ONNX para compatibilidad multiplataforma y aceleración de hardware.
  • OpenVINO para un rendimiento optimizado en hardware de Intel.
  • TensorRT para inferencia de alta velocidad en GPU de NVIDIA.

Cada formato tiene ventajas únicas. Para un recorrido detallado, consulta nuestra documentación del proceso de exportación.

¿Cómo mejoro la velocidad de inferencia de mi modelo YOLO26 en una CPU Intel?

Para mejorar la velocidad de inferencia en CPU Intel, puedes desplegar tu modelo YOLO26 utilizando el kit de herramientas OpenVINO de Intel. OpenVINO ofrece aumentos significativos de rendimiento al optimizar los modelos para aprovechar el hardware de Intel de manera eficiente.

  1. Convierte tu modelo YOLO26 al formato OpenVINO usando la función model.export().
  2. Sigue la guía de configuración detallada en la documentación de exportación de Intel OpenVINO.

Para más ideas, echa un vistazo a nuestra entrada de blog.

¿Puedo desplegar modelos YOLO26 en dispositivos móviles?

Sí, los modelos YOLO26 se pueden desplegar en dispositivos móviles utilizando TensorFlow Lite (TF Lite) tanto para plataformas Android como iOS. TF Lite está diseñado para dispositivos móviles y embebidos, proporcionando una inferencia eficiente en el dispositivo.

Ejemplo
# Export command for TFLite format
model.export(format="tflite")

Para obtener más detalles sobre el despliegue de modelos en móviles, consulta nuestra guía de integración de TF Lite.

¿Qué factores debo considerar al elegir un formato de despliegue para mi modelo YOLO26?

Al elegir un formato de despliegue para YOLO26, considera los siguientes factores:

  • Rendimiento: Algunos formatos como TensorRT proporcionan velocidades excepcionales en GPU de NVIDIA, mientras que OpenVINO está optimizado para hardware de Intel.
  • Compatibilidad: ONNX ofrece una amplia compatibilidad entre diferentes plataformas.
  • Facilidad de integración: Formatos como CoreML o TF Lite están diseñados para ecosistemas específicos como iOS y Android, respectivamente.
  • Soporte de la comunidad: Formatos como PyTorch y TensorFlow cuentan con amplios recursos y soporte de la comunidad.

Para un análisis comparativo, consulta nuestra documentación de formatos de exportación.

¿Cómo puedo desplegar modelos YOLO26 en una aplicación web?

Para desplegar modelos YOLO26 en una aplicación web, puedes usar TensorFlow.js (TF.js), que permite ejecutar modelos de machine learning directamente en el navegador. Este enfoque elimina la necesidad de una infraestructura de backend y proporciona un rendimiento en tiempo real.

  1. Exporta el modelo YOLO26 al formato TF.js.
  2. Integra el modelo exportado en tu aplicación web.

Para instrucciones paso a paso, consulta nuestra guía sobre integración con TensorFlow.js.

Comentarios