Análisis comparativo de las opciones de despliegue de YOLO26
Introducción
Has recorrido un largo camino en tu viaje con YOLO26. Has recopilado datos diligentemente, los has anotado meticulosamente y has dedicado horas a entrenar y evaluar rigurosamente tu modelo personalizado de YOLO26. Ahora es el momento de poner tu modelo a trabajar para tu aplicación, caso de uso o proyecto específico. Pero te enfrentas a una decisión crítica: cómo exportar y desplegar tu modelo de forma eficaz.
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
Esta guía te orienta a través de las opciones de despliegue de YOLO26 y los factores esenciales que debes considerar para elegir la opción adecuada para tu proyecto.
Cómo seleccionar la opción de despliegue adecuada para tu modelo YOLO26
Cuando llega el momento de desplegar tu modelo YOLO26, seleccionar un formato de exportación adecuado es muy importante. Como se detalla en la documentación de modos de Ultralytics YOLO26, la función model.export() te permite convertir tu modelo entrenado a una variedad de formatos adaptados a diversos entornos y requisitos de rendimiento.
El formato ideal depende del contexto operativo previsto para tu modelo, equilibrando la velocidad, las restricciones de hardware y la facilidad de integración. Para un despliegue gestionado sin exportación manual, Ultralytics Platform ofrece endpoints de inferencia listos para usar con escalado automático en 43 regiones globales. En la siguiente sección, analizaremos más de cerca cada opción de exportación, comprendiendo cuándo elegir cada una.
Opciones de despliegue de YOLO26
Revisemos las diferentes opciones de despliegue de YOLO26. Para obtener un recorrido detallado del proceso de exportación, visita la página de documentación de Ultralytics sobre exportación.
PyTorch
PyTorch es una biblioteca de aprendizaje automático de código abierto ampliamente utilizada para aplicaciones en deep learning e inteligencia artificial. Proporciona un alto nivel de flexibilidad y velocidad, lo que la ha convertido en una de las favoritas entre investigadores y desarrolladores.
- Evaluaciones comparativas de rendimiento: PyTorch es conocido por su facilidad de uso y flexibilidad, lo que puede dar lugar a un ligero compromiso en el rendimiento bruto en comparación con otros marcos de trabajo más especializados y optimizados.
- Compatibilidad e integración: Ofrece una excelente compatibilidad con diversas bibliotecas de ciencia de datos y aprendizaje automático en Python.
- Apoyo de la comunidad y ecosistema: Una de las comunidades más vibrantes, con amplios recursos para el aprendizaje y la resolución de problemas.
- Casos prácticos: Utilizado habitualmente en prototipos de investigación, muchos artículos académicos hacen referencia a modelos desplegados en PyTorch.
- Mantenimiento y actualizaciones: Actualizaciones periódicas con desarrollo activo y soporte para nuevas funciones.
- Consideraciones de seguridad: Parches regulares para problemas de seguridad, aunque la seguridad depende en gran medida del entorno general en el que se despliega.
- Aceleración de hardware: Admite CUDA para la aceleración mediante GPU, esencial para acelerar el entrenamiento del modelo y la inferencia.
TorchScript
TorchScript amplía las capacidades de PyTorch al permitir la exportación de modelos para ejecutarlos en un entorno de tiempo de ejecución de C++. Esto lo hace adecuado para entornos de producción donde Python no está disponible.
- Evaluaciones comparativas de rendimiento: Puede ofrecer un mejor rendimiento que PyTorch nativo, especialmente en entornos de producción.
- Compatibilidad e integración: Diseñado para una transición fluida de PyTorch a entornos de producción de C++, aunque algunas funciones avanzadas podrían no traducirse a la perfección.
- Apoyo de la comunidad y ecosistema: Se beneficia de la gran comunidad de PyTorch, pero tiene un ámbito más reducido de desarrolladores especializados.
- Casos prácticos: Ampliamente utilizado en entornos industriales donde la sobrecarga de rendimiento de Python es un cuello de botella.
- Mantenimiento y actualizaciones: Se mantiene junto a PyTorch con actualizaciones constantes.
- Consideraciones de seguridad: Ofrece una seguridad mejorada al permitir la ejecución de modelos en entornos sin instalaciones completas de Python.
- Aceleración de hardware: Hereda el soporte CUDA de PyTorch, garantizando una utilización eficiente de la GPU.
ONNX
El intercambio de redes neuronales abiertas (ONNX) es un formato que permite la interoperabilidad de modelos entre diferentes marcos de trabajo, lo cual puede ser crítico al desplegar en diversas plataformas.
- Evaluaciones comparativas de rendimiento: Los modelos ONNX pueden experimentar un rendimiento variable dependiendo del tiempo de ejecución específico en el que se desplieguen.
- Compatibilidad e integración: Alta interoperabilidad entre múltiples plataformas y hardware debido a su naturaleza independiente del marco de trabajo.
- Apoyo de la comunidad y ecosistema: Respaldado por muchas organizaciones, lo que conduce a un ecosistema amplio y una variedad de herramientas para la optimización.
- Casos prácticos: Utilizado con frecuencia para mover modelos entre diferentes marcos de aprendizaje automático, demostrando su flexibilidad.
- Mantenimiento y actualizaciones: Como estándar abierto, ONNX se actualiza periódicamente para admitir nuevas operaciones y modelos.
- Consideraciones de seguridad: Como ocurre con cualquier herramienta multiplataforma, es esencial garantizar prácticas seguras en la canalización de conversión y despliegue.
- Aceleración de hardware: Con ONNX Runtime, los modelos pueden aprovechar diversas optimizaciones de hardware.
OpenVINO
OpenVINO es un kit de herramientas de Intel diseñado para facilitar el despliegue de modelos de deep learning en hardware Intel, mejorando el rendimiento y la velocidad.
- Evaluaciones comparativas de rendimiento: Optimizado específicamente para CPUs, GPUs y VPUs de Intel, ofreciendo importantes aumentos de rendimiento en hardware compatible.
- Compatibilidad e integración: Funciona mejor dentro del ecosistema Intel, pero también es compatible con una gama de otras plataformas.
- Apoyo de la comunidad y ecosistema: Respaldado por Intel, con una sólida base de usuarios, especialmente en el dominio de la visión artificial.
- Casos prácticos: Utilizado a menudo en escenarios de IoT y edge computing donde predomina el hardware de Intel.
- Mantenimiento y actualizaciones: Intel actualiza periódicamente OpenVINO para admitir los modelos de deep learning más recientes y el hardware de Intel.
- Consideraciones de seguridad: Proporciona características de seguridad robustas adecuadas para el despliegue en aplicaciones sensibles.
- Aceleración de hardware: Adaptado para la aceleración en hardware de Intel, aprovechando conjuntos de instrucciones y características de hardware dedicados.
Para obtener más detalles sobre el despliegue con OpenVINO, consulta la documentación de integración de Ultralytics: Exportación a Intel OpenVINO.
TensorRT
TensorRT es un optimizador y tiempo de ejecución de inferencia de deep learning de alto rendimiento de NVIDIA, ideal para aplicaciones que necesitan velocidad y eficiencia.
- Evaluaciones comparativas de rendimiento: Ofrece un rendimiento de primer nivel en GPUs NVIDIA con soporte para inferencia de alta velocidad.
- Compatibilidad e integración: Más adecuado para hardware NVIDIA, con soporte limitado fuera de este entorno.
- Apoyo de la comunidad y ecosistema: Fuerte red de soporte a través de los foros de desarrolladores y la documentación de NVIDIA.
- Casos prácticos: Ampliamente adoptado en sectores que requieren inferencia en tiempo real sobre datos de vídeo e imagen.
- Mantenimiento y actualizaciones: NVIDIA mantiene TensorRT con actualizaciones frecuentes para mejorar el rendimiento y admitir nuevas arquitecturas de GPU.
- Consideraciones de seguridad: Al igual que muchos productos de NVIDIA, hace un gran énfasis en la seguridad, pero los detalles específicos dependen del entorno de despliegue.
- Aceleración de hardware: Diseñado exclusivamente para GPUs NVIDIA, proporcionando una optimización y aceleración profundas.
Para obtener más información sobre el despliegue de TensorRT, echa un vistazo a la guía de integración de TensorRT.
CoreML
CoreML es el marco de aprendizaje automático de Apple, optimizado para el rendimiento en el dispositivo dentro del ecosistema de Apple, incluidos iOS, macOS, watchOS y tvOS.
- Evaluaciones comparativas de rendimiento: Optimizado para el rendimiento en el dispositivo en hardware de Apple con un consumo mínimo de batería.
- Compatibilidad e integración: Exclusivo para el ecosistema de Apple, proporcionando un flujo de trabajo optimizado para aplicaciones de iOS y macOS.
- Apoyo de la comunidad y ecosistema: Fuerte apoyo de Apple y una comunidad de desarrolladores dedicada, con amplia documentación y herramientas.
- Casos prácticos: Utilizado habitualmente en aplicaciones que requieren capacidades de aprendizaje automático en el dispositivo en productos Apple.
- Mantenimiento y actualizaciones: Actualizado periódicamente por Apple para admitir los últimos avances en aprendizaje automático y hardware de Apple.
- Consideraciones de seguridad: Se beneficia del enfoque de Apple en la privacidad del usuario y la seguridad de los datos.
- Aceleración de hardware: Aprovecha al máximo el motor neuronal y la GPU de Apple para tareas aceleradas de aprendizaje automático.
TF SavedModel
TF SavedModel es el formato de TensorFlow para guardar y servir modelos de aprendizaje automático, particularmente adecuado para entornos de servidor escalables.
- Evaluaciones comparativas de rendimiento: Ofrece un rendimiento escalable en entornos de servidor, especialmente cuando se utiliza con TensorFlow Serving.
- Compatibilidad e integración: Amplia compatibilidad en todo el ecosistema de TensorFlow, incluidos los despliegues en la nube y en servidores empresariales.
- Apoyo de la comunidad y ecosistema: Gran apoyo de la comunidad debido a la popularidad de TensorFlow, con una amplia gama de herramientas para el despliegue y la optimización.
- Casos prácticos: Utilizado ampliamente en entornos de producción para servir modelos de deep learning a gran escala.
- Mantenimiento y actualizaciones: Respaldado por Google y la comunidad de TensorFlow, lo que garantiza actualizaciones periódicas y nuevas funciones.
- Consideraciones de seguridad: El despliegue utilizando TensorFlow Serving incluye características de seguridad robustas para aplicaciones de nivel empresarial.
- Aceleración de hardware: Admite diversas aceleraciones de hardware a través de los backends de TensorFlow.
TF GraphDef
TF GraphDef es un formato de TensorFlow que representa el modelo como un gráfico, lo cual es beneficioso para entornos donde se requiere un gráfico de cálculo estático.
- Evaluaciones comparativas de rendimiento: Proporciona un rendimiento estable para gráficos de cálculo estáticos, centrándose en la coherencia y la fiabilidad.
- Compatibilidad e integración: Se integra fácilmente dentro de la infraestructura de TensorFlow, pero es menos flexible en comparación con SavedModel.
- Apoyo de la comunidad y ecosistema: Buen soporte del ecosistema de TensorFlow, con muchos recursos disponibles para optimizar gráficos estáticos.
- Casos prácticos: Útil en escenarios donde es necesario un gráfico estático, como en ciertos sistemas integrados.
- Mantenimiento y actualizaciones: Actualizaciones periódicas junto con las actualizaciones principales de TensorFlow.
- Consideraciones de seguridad: Garantiza un despliegue seguro con las prácticas de seguridad establecidas de TensorFlow.
- Aceleración de hardware: Puede utilizar las opciones de aceleración de hardware de TensorFlow, aunque no es tan flexible como SavedModel.
Obtén más información sobre TF GraphDef en nuestra guía de integración de TF GraphDef.
TF Lite
TF Lite es la solución de TensorFlow para el aprendizaje automático en dispositivos móviles e integrados, proporcionando una biblioteca ligera para la inferencia en el dispositivo.
- Evaluaciones comparativas de rendimiento: Diseñado para la velocidad y la eficiencia en dispositivos móviles e integrados.
- Compatibilidad e integración: Se puede utilizar en una amplia gama de dispositivos debido a su naturaleza ligera.
- Apoyo de la comunidad y ecosistema: Respaldado por Google, cuenta con una comunidad robusta y un número creciente de recursos para desarrolladores.
- Casos prácticos: Popular en aplicaciones móviles que requieren inferencia en el dispositivo con una huella mínima.
- Mantenimiento y actualizaciones: Actualizado periódicamente para incluir las últimas funciones y optimizaciones para dispositivos móviles.
- Consideraciones de seguridad: Proporciona un entorno seguro para ejecutar modelos en dispositivos de usuario final.
- Aceleración de hardware: Admite una variedad de opciones de aceleración de hardware, incluidas GPU y DSP.
TF Edge TPU
TF Edge TPU está diseñado para una computación eficiente y de alta velocidad en el hardware Edge TPU de Google, perfecto para dispositivos IoT que requieren procesamiento en tiempo real.
- Evaluaciones comparativas de rendimiento: Optimizado específicamente para una computación eficiente y de alta velocidad en el hardware Edge TPU de Google.
- Compatibilidad e integración: Funciona exclusivamente con modelos de TensorFlow Lite en dispositivos Edge TPU.
- Apoyo de la comunidad y ecosistema: Creciente apoyo con recursos proporcionados por Google y desarrolladores externos.
- Casos prácticos: Utilizado en dispositivos IoT y aplicaciones que requieren procesamiento en tiempo real con baja latencia.
- Mantenimiento y actualizaciones: Se mejora continuamente para aprovechar las capacidades de los nuevos lanzamientos de hardware de Edge TPU.
- Consideraciones de seguridad: Se integra con la seguridad robusta de Google para dispositivos IoT y edge.
- Aceleración de hardware: Diseñado a medida para aprovechar al máximo los dispositivos Google Coral.
TF.js
TensorFlow.js (TF.js) es una biblioteca que lleva las capacidades de aprendizaje automático directamente al navegador, ofreciendo un nuevo reino de posibilidades tanto para los desarrolladores web como para los usuarios. Permite la integración de modelos de aprendizaje automático en aplicaciones web sin necesidad de infraestructura de back-end.
- Evaluaciones comparativas de rendimiento: Permite el aprendizaje automático directamente en el navegador con un rendimiento razonable, dependiendo del dispositivo del cliente.
- Compatibilidad e integración: Alta compatibilidad con tecnologías web, lo que permite una fácil integración en aplicaciones web.
- Apoyo comunitario y ecosistema: Apoyo de una comunidad de desarrolladores web y de Node.js, con una variedad de herramientas para desplegar modelos de ML en navegadores.
- Casos de estudio: Ideal para aplicaciones web interactivas que se benefician del aprendizaje automático en el lado del cliente sin necesidad de procesamiento en el lado del servidor.
- Mantenimiento y actualizaciones: Mantenido por el equipo de TensorFlow con contribuciones de la comunidad de código abierto.
- Consideraciones de seguridad: Se ejecuta dentro del contexto seguro del navegador, utilizando el modelo de seguridad de la plataforma web.
- Aceleración de hardware: El rendimiento se puede mejorar con APIs basadas en web que acceden a la aceleración de hardware como WebGL.
PaddlePaddle
PaddlePaddle es un framework de aprendizaje profundo de código abierto desarrollado por Baidu. Está diseñado para ser eficiente para los investigadores y fácil de usar para los desarrolladores. Es particularmente popular en China y ofrece soporte especializado para el procesamiento de lenguaje chino.
- Benchmarks de rendimiento: Ofrece un rendimiento competitivo con un enfoque en la facilidad de uso y la escalabilidad.
- Compatibilidad e integración: Bien integrado dentro del ecosistema de Baidu y admite una amplia gama de aplicaciones.
- Apoyo comunitario y ecosistema: Aunque la comunidad es más pequeña a nivel mundial, está creciendo rápidamente, especialmente en China.
- Casos de estudio: Utilizado comúnmente en mercados chinos y por desarrolladores que buscan alternativas a otros frameworks principales.
- Mantenimiento y actualizaciones: Actualizado regularmente con un enfoque en servir a aplicaciones y servicios de IA en idioma chino.
- Consideraciones de seguridad: Enfatiza la privacidad de los datos y la seguridad, atendiendo a los estándares de gobernanza de datos chinos.
- Aceleración de hardware: Admite varias aceleraciones de hardware, incluidos los propios chips Kunlun de Baidu.
MNN
MNN es un framework de aprendizaje profundo altamente eficiente y ligero. Admite la inferencia y el entrenamiento de modelos de aprendizaje profundo y tiene un rendimiento líder en la industria para la inferencia y el entrenamiento en el dispositivo. Además, MNN también se utiliza en dispositivos integrados, como IoT.
- Benchmarks de rendimiento: Alto rendimiento para dispositivos móviles con una excelente optimización para sistemas ARM.
- Compatibilidad e integración: Funciona bien con sistemas móviles e integrados ARM y arquitecturas de CPU X86-64.
- Apoyo comunitario y ecosistema: Respaldado por la comunidad de aprendizaje automático móvil e integrado.
- Casos de estudio: Ideal para aplicaciones que requieren un rendimiento eficiente en sistemas móviles.
- Mantenimiento y actualizaciones: Mantenido regularmente para garantizar un alto rendimiento en dispositivos móviles.
- Consideraciones de seguridad: Proporciona ventajas de seguridad en el dispositivo manteniendo los datos locales.
- Aceleración de hardware: Optimizado para CPUs y GPUs ARM para una máxima eficiencia.
NCNN
NCNN es un framework de inferencia de redes neuronales de alto rendimiento optimizado para la plataforma móvil. Destaca por su naturaleza ligera y eficiencia, lo que lo hace particularmente adecuado para dispositivos móviles e integrados donde los recursos son limitados.
- Benchmarks de rendimiento: Altamente optimizado para plataformas móviles, ofreciendo una inferencia eficiente en dispositivos basados en ARM.
- Compatibilidad e integración: Adecuado para aplicaciones en teléfonos móviles y sistemas integrados con arquitectura ARM.
- Apoyo comunitario y ecosistema: Respaldado por una comunidad pequeña pero activa centrada en aplicaciones de ML móviles e integradas.
- Casos de estudio: Preferido para aplicaciones móviles donde la eficiencia y la velocidad son críticas en Android y otros sistemas basados en ARM.
- Mantenimiento y actualizaciones: Mejorado continuamente para mantener un alto rendimiento en una gama de dispositivos ARM.
- Consideraciones de seguridad: Se enfoca en ejecutarse localmente en el dispositivo, aprovechando la seguridad inherente del procesamiento en el dispositivo.
- Aceleración de hardware: Adaptado para CPUs y GPUs ARM, con optimizaciones específicas para estas arquitecturas.
Análisis comparativo de las opciones de despliegue de YOLO26
La siguiente tabla proporciona una instantánea de las diversas opciones de despliegue disponibles para modelos YOLO26, ayudándote a evaluar cuál puede adaptarse mejor a las necesidades de tu proyecto en función de varios criterios críticos. Para obtener un vistazo detallado del formato de cada opción de despliegue, consulta la página de documentación de Ultralytics sobre formatos de exportación.
| Opción de despliegue | Benchmarks de rendimiento | Compatibilidad e integración | Apoyo comunitario y ecosistema | Casos de estudio | Mantenimiento y actualizaciones | Consideraciones de seguridad | Aceleración de hardware |
|---|---|---|---|---|---|---|---|
| PyTorch | Buena flexibilidad; puede sacrificar el rendimiento bruto | Excelente con librerías de Python | Amplios recursos y comunidad | Investigación y prototipos | Desarrollo regular y activo | Dependiente del entorno de despliegue | Soporte CUDA para aceleración de GPU |
| TorchScript | Mejor para producción que PyTorch | Transición fluida de PyTorch a C++ | Especializado pero más limitado que PyTorch | Industria donde Python es un cuello de botella | Actualizaciones consistentes con PyTorch | Seguridad mejorada sin Python completo | Hereda el soporte CUDA de PyTorch |
| ONNX | Variable dependiendo del tiempo de ejecución | Alto a través de diferentes frameworks | Ecosistema amplio, respaldado por muchas organizaciones | Flexibilidad entre frameworks de ML | Actualizaciones regulares para nuevas operaciones | Asegura prácticas seguras de conversión y despliegue | Varias optimizaciones de hardware |
| OpenVINO | Optimizado para hardware de Intel | Mejor dentro del ecosistema Intel | Sólido en el campo de la visión artificial | IoT y edge con hardware Intel | Actualizaciones regulares para hardware Intel | Funciones robustas para aplicaciones sensibles | Adaptado para hardware Intel |
| TensorRT | De primer nivel en GPUs NVIDIA | Mejor para hardware NVIDIA | Red fuerte a través de NVIDIA | Inferencia de vídeo e imagen en tiempo real | Actualizaciones frecuentes para nuevas GPUs | Énfasis en la seguridad | Diseñado para GPUs NVIDIA |
| CoreML | Optimizado para hardware Apple en el dispositivo | Exclusivo del ecosistema Apple | Soporte fuerte de Apple y de desarrolladores | ML en el dispositivo en productos Apple | Actualizaciones regulares de Apple | Enfoque en privacidad y seguridad | Motor neuronal y GPU de Apple |
| TF SavedModel | Escalable en entornos de servidor | Amplia compatibilidad en el ecosistema TensorFlow | Gran soporte debido a la popularidad de TensorFlow | Servicio de modelos a escala | Actualizaciones regulares por Google y la comunidad | Funciones robustas para empresas | Varias aceleraciones de hardware |
| TF GraphDef | Estable para grafos de computación estáticos | Se integra bien con la infraestructura de TensorFlow | Recursos para optimizar grafos estáticos | Escenarios que requieren grafos estáticos | Actualizaciones junto con el núcleo de TensorFlow | Prácticas de seguridad establecidas de TensorFlow | Opciones de aceleración de TensorFlow |
| TF Lite | Velocidad y eficiencia en móviles/integrados | Amplia gama de soporte para dispositivos | Comunidad robusta, respaldada por Google | Aplicaciones móviles con una huella mínima | Últimas funciones para móviles | Entorno seguro en dispositivos del usuario final | GPU y DSP entre otros |
| TF Edge TPU | Optimizado para el hardware Edge TPU de Google | Exclusivo para dispositivos Edge TPU | En crecimiento con recursos de Google y de terceros | Dispositivos IoT que requieren procesamiento en tiempo real | Mejoras para nuevo hardware Edge TPU | Seguridad IoT robusta de Google | Diseñado a medida para Google Coral |
| TF.js | Rendimiento razonable en el navegador | Alto con tecnologías web | Soporte para desarrolladores web y Node.js | Aplicaciones web interactivas | Contribuciones del equipo de TensorFlow y la comunidad | Modelo de seguridad de la plataforma web | Mejorado con WebGL y otras API |
| PaddlePaddle | Competitivo, fácil de usar y escalable | Ecosistema Baidu, amplio soporte de aplicaciones | Crecimiento rápido, especialmente en China | Mercado chino y procesamiento de lenguaje | Enfoque en aplicaciones de IA chinas | Enfatiza la privacidad y seguridad de los datos | Incluyendo chips Kunlun de Baidu |
| MNN | Alto rendimiento para dispositivos móviles. | Sistemas móviles y embebidos ARM y CPU X86-64 | Comunidad de ML móvil/embebido | Eficiencia de sistemas móviles | Mantenimiento de alto rendimiento en dispositivos móviles | Ventajas de seguridad en el dispositivo | Optimizaciones para CPU y GPU ARM |
| NCNN | Optimizado para dispositivos móviles basados en ARM | Sistemas móviles y embebidos ARM | Comunidad de ML móvil/embebido de nicho pero activa | Eficiencia de sistemas Android y ARM | Mantenimiento de alto rendimiento en ARM | Ventajas de seguridad en el dispositivo | Optimizaciones para CPU y GPU ARM |
Este análisis comparativo te ofrece una visión general de alto nivel. Para el despliegue, es esencial considerar los requisitos y limitaciones específicos de tu proyecto, y consultar la documentación detallada y los recursos disponibles para cada opción.
Comunidad y soporte
Cuando comienzas con YOLO26, contar con una comunidad útil y soporte puede marcar una diferencia significativa. Aquí tienes cómo conectar con otros que comparten tus intereses y obtener la asistencia que necesitas.
Interactúa con la comunidad más amplia
- Debates en GitHub: El repositorio de YOLO26 en GitHub tiene una sección de "Discussions" donde puedes hacer preguntas, informar problemas y sugerir mejoras.
- Servidor de Discord de Ultralytics: Ultralytics tiene un servidor de Discord donde puedes interactuar con otros usuarios y desarrolladores.
Documentación oficial y recursos
- Documentación de Ultralytics YOLO26: La documentación oficial proporciona una visión general completa de YOLO26, junto con guías sobre instalación, uso y solución de problemas.
Estos recursos te ayudarán a abordar desafíos y a mantenerte al día sobre las últimas tendencias y mejores prácticas en la comunidad de YOLO26.
Conclusión
En esta guía, hemos explorado las diferentes opciones de despliegue para YOLO26. También hemos tratado los factores importantes a tener en cuenta al tomar tu elección. Estas opciones te permiten personalizar tu modelo para diversos entornos y requisitos de rendimiento, haciéndolo adecuado para aplicaciones del mundo real.
No olvides que la comunidad de YOLO26 y Ultralytics es una fuente valiosa de ayuda. Conecta con otros desarrolladores y expertos para aprender consejos y soluciones únicos que quizás no encuentres en la documentación habitual. Sigue buscando conocimiento, explorando nuevas ideas y compartiendo tus experiencias.
Preguntas frecuentes
¿Qué opciones de despliegue están disponibles para YOLO26 en diferentes plataformas de hardware?
Ultralytics YOLO26 admite varios formatos de despliegue, cada uno diseñado para entornos y plataformas de hardware específicos. Los formatos clave incluyen:
- PyTorch para investigación y creación de prototipos, con una excelente integración en Python.
- TorchScript para entornos de producción donde no hay Python disponible.
- ONNX para compatibilidad multiplataforma y aceleración de hardware.
- OpenVINO para un rendimiento optimizado en hardware de Intel.
- TensorRT para inferencia de alta velocidad en GPU de NVIDIA.
Cada formato tiene ventajas únicas. Para un recorrido detallado, consulta nuestra documentación del proceso de exportación.
¿Cómo mejoro la velocidad de inferencia de mi modelo YOLO26 en una CPU Intel?
Para mejorar la velocidad de inferencia en CPU Intel, puedes desplegar tu modelo YOLO26 utilizando el kit de herramientas OpenVINO de Intel. OpenVINO ofrece aumentos significativos de rendimiento al optimizar los modelos para aprovechar el hardware de Intel de manera eficiente.
- Convierte tu modelo YOLO26 al formato OpenVINO usando la función
model.export(). - Sigue la guía de configuración detallada en la documentación de exportación de Intel OpenVINO.
Para más ideas, echa un vistazo a nuestra entrada de blog.
¿Puedo desplegar modelos YOLO26 en dispositivos móviles?
Sí, los modelos YOLO26 se pueden desplegar en dispositivos móviles utilizando TensorFlow Lite (TF Lite) tanto para plataformas Android como iOS. TF Lite está diseñado para dispositivos móviles y embebidos, proporcionando una inferencia eficiente en el dispositivo.
# Export command for TFLite format
model.export(format="tflite")Para obtener más detalles sobre el despliegue de modelos en móviles, consulta nuestra guía de integración de TF Lite.
¿Qué factores debo considerar al elegir un formato de despliegue para mi modelo YOLO26?
Al elegir un formato de despliegue para YOLO26, considera los siguientes factores:
- Rendimiento: Algunos formatos como TensorRT proporcionan velocidades excepcionales en GPU de NVIDIA, mientras que OpenVINO está optimizado para hardware de Intel.
- Compatibilidad: ONNX ofrece una amplia compatibilidad entre diferentes plataformas.
- Facilidad de integración: Formatos como CoreML o TF Lite están diseñados para ecosistemas específicos como iOS y Android, respectivamente.
- Soporte de la comunidad: Formatos como PyTorch y TensorFlow cuentan con amplios recursos y soporte de la comunidad.
Para un análisis comparativo, consulta nuestra documentación de formatos de exportación.
¿Cómo puedo desplegar modelos YOLO26 en una aplicación web?
Para desplegar modelos YOLO26 en una aplicación web, puedes usar TensorFlow.js (TF.js), que permite ejecutar modelos de machine learning directamente en el navegador. Este enfoque elimina la necesidad de una infraestructura de backend y proporciona un rendimiento en tiempo real.
- Exporta el modelo YOLO26 al formato TF.js.
- Integra el modelo exportado en tu aplicación web.
Para instrucciones paso a paso, consulta nuestra guía sobre integración con TensorFlow.js.