Link to this sectionAnálisis comparativo de las opciones de implementación de YOLO26#
Link to this sectionIntroducción#
Has recorrido un largo camino en tu viaje con YOLO26. Has recopilado datos diligentemente, los has anotado meticulosamente y has dedicado horas a entrenar y evaluar rigurosamente tu modelo personalizado de YOLO26. Ahora, es el momento de poner tu modelo a trabajar para tu aplicación, caso de uso o proyecto específico. Sin embargo, te enfrentas a una decisión crítica: cómo exportar e implementar tu modelo de manera eficaz.
Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀
Esta guía te orienta a través de las opciones de implementación de YOLO26 y los factores esenciales a considerar para elegir la opción correcta para tu proyecto.
Link to this sectionCómo seleccionar la opción de implementación adecuada para tu modelo YOLO26#
Cuando llegue el momento de implementar tu modelo YOLO26, seleccionar un formato de exportación adecuado es muy importante. Como se describe en la documentación de modos de Ultralytics YOLO26, la función model.export() te permite convertir tu modelo entrenado a una variedad de formatos adaptados a diversos entornos y requisitos de rendimiento.
El formato ideal depende del contexto operativo previsto para tu modelo, equilibrando la velocidad, las restricciones de hardware y la facilidad de integración. Para una implementación gestionada sin exportación manual, Ultralytics Platform proporciona endpoints de inferencia listos para usar con escalado automático en 43 regiones globales. En la siguiente sección, analizaremos más de cerca cada opción de exportación, comprendiendo cuándo elegir cada una.
Link to this sectionOpciones de implementación de YOLO26#
Repasemos las diferentes opciones de implementación de YOLO26. Para obtener una guía detallada del proceso de exportación, visita la página de documentación de Ultralytics sobre exportación.
Link to this sectionPyTorch#
PyTorch es una biblioteca de aprendizaje automático de código abierto ampliamente utilizada para aplicaciones en deep learning e inteligencia artificial. Ofrece un alto nivel de flexibilidad y velocidad, lo que la ha convertido en una de las favoritas entre investigadores y desarrolladores.
- Puntos de referencia de rendimiento: PyTorch es conocido por su facilidad de uso y flexibilidad, lo que puede resultar en un ligero compromiso en el rendimiento bruto en comparación con otros marcos que están más especializados y optimizados.
- Compatibilidad e integración: Ofrece una excelente compatibilidad con diversas bibliotecas de ciencia de datos y aprendizaje automático en Python.
- Soporte comunitario y ecosistema: Una de las comunidades más vibrantes, con amplios recursos para el aprendizaje y la resolución de problemas.
- Casos prácticos: Comúnmente utilizado en prototipos de investigación, muchos artículos académicos hacen referencia a modelos implementados en PyTorch.
- Mantenimiento y actualizaciones: Actualizaciones regulares con desarrollo activo y soporte para nuevas funciones.
- Consideraciones de seguridad: Parches regulares para problemas de seguridad, pero la seguridad depende en gran medida del entorno general en el que se implementa.
- Aceleración de hardware: Admite CUDA para la aceleración por GPU, esencial para acelerar el entrenamiento y la inferencia de modelos.
Link to this sectionTorchScript#
TorchScript amplía las capacidades de PyTorch al permitir la exportación de modelos para ejecutarlos en un entorno de tiempo de ejecución de C++. Esto lo hace adecuado para entornos de producción donde Python no está disponible.
- Puntos de referencia de rendimiento: Puede ofrecer un rendimiento mejorado con respecto al PyTorch nativo, especialmente en entornos de producción.
- Compatibilidad e integración: Diseñado para una transición fluida de PyTorch a entornos de producción de C++, aunque es posible que algunas funciones avanzadas no se traduzcan perfectamente.
- Soporte comunitario y ecosistema: Se beneficia de la gran comunidad de PyTorch, pero tiene un alcance más limitado de desarrolladores especializados.
- Casos prácticos: Ampliamente utilizado en entornos industriales donde la sobrecarga de rendimiento de Python es un cuello de botella.
- Mantenimiento y actualizaciones: Se mantiene junto a PyTorch con actualizaciones constantes.
- Consideraciones de seguridad: Ofrece una seguridad mejorada al permitir la ejecución de modelos en entornos sin instalaciones completas de Python.
- Aceleración de hardware: Hereda el soporte CUDA de PyTorch, lo que garantiza una utilización eficiente de la GPU.
Link to this sectionONNX#
El intercambio de redes neuronales abiertas (ONNX) es un formato que permite la interoperabilidad de modelos entre diferentes marcos, lo cual puede ser crítico al realizar implementaciones en varias plataformas.
- Puntos de referencia de rendimiento: Los modelos ONNX pueden experimentar un rendimiento variable según el entorno de ejecución específico en el que se implementen.
- Compatibilidad e integración: Alta interoperabilidad entre múltiples plataformas y hardware debido a su naturaleza independiente del marco de trabajo.
- Soporte comunitario y ecosistema: Respaldado por muchas organizaciones, lo que genera un ecosistema amplio y una variedad de herramientas para la optimización.
- Casos prácticos: Se utiliza con frecuencia para mover modelos entre diferentes marcos de aprendizaje automático, lo que demuestra su flexibilidad.
- Mantenimiento y actualizaciones: Como estándar abierto, ONNX se actualiza periódicamente para admitir nuevas operaciones y modelos.
- Consideraciones de seguridad: Como con cualquier herramienta multiplataforma, es esencial garantizar prácticas seguras en el proceso de conversión e implementación.
- Aceleración de hardware: Con ONNX Runtime, los modelos pueden aprovechar diversas optimizaciones de hardware.
Link to this sectionOpenVINO#
OpenVINO es un kit de herramientas de Intel diseñado para facilitar la implementación de modelos de aprendizaje profundo en el hardware de Intel, mejorando el rendimiento y la velocidad.
- Puntos de referencia de rendimiento: Optimizado específicamente para CPUs, GPUs y VPUs de Intel, ofreciendo importantes aumentos de rendimiento en hardware compatible.
- Compatibilidad e integración: Funciona mejor dentro del ecosistema de Intel, pero también admite una variedad de otras plataformas.
- Soporte comunitario y ecosistema: Respaldado por Intel, con una base de usuarios sólida, especialmente en el dominio de la visión artificial.
- Casos prácticos: A menudo utilizado en escenarios de IoT y computación de borde donde predomina el hardware de Intel.
- Mantenimiento y actualizaciones: Intel actualiza periódicamente OpenVINO para admitir los modelos de aprendizaje profundo y el hardware de Intel más recientes.
- Consideraciones de seguridad: Proporciona funciones de seguridad robustas adecuadas para la implementación en aplicaciones confidenciales.
- Aceleración de hardware: Adaptado para la aceleración en hardware de Intel, aprovechando conjuntos de instrucciones dedicados y funciones de hardware.
Para obtener más detalles sobre la implementación con OpenVINO, consulta la documentación de integración de Ultralytics: Exportación a Intel OpenVINO.
Link to this sectionTensorRT#
TensorRT es un optimizador y entorno de ejecución de inferencia de aprendizaje profundo de alto rendimiento de NVIDIA, ideal para aplicaciones que necesitan velocidad y eficiencia.
- Puntos de referencia de rendimiento: Ofrece un rendimiento de primer nivel en GPUs NVIDIA con soporte para inferencia de alta velocidad.
- Compatibilidad e integración: Se adapta mejor al hardware de NVIDIA, con soporte limitado fuera de este entorno.
- Soporte comunitario y ecosistema: Red de soporte sólida a través de los foros de desarrolladores y la documentación de NVIDIA.
- Casos prácticos: Ampliamente adoptado en industrias que requieren inferencia en tiempo real sobre datos de video e imagen.
- Mantenimiento y actualizaciones: NVIDIA mantiene TensorRT con actualizaciones frecuentes para mejorar el rendimiento y admitir nuevas arquitecturas de GPU.
- Consideraciones de seguridad: Como muchos productos de NVIDIA, tiene un fuerte énfasis en la seguridad, pero los detalles dependen del entorno de implementación.
- Aceleración de hardware: Diseñado exclusivamente para GPUs NVIDIA, proporcionando una optimización y aceleración profundas.
Para obtener más información sobre la implementación de TensorRT, consulta la guía de integración de TensorRT.
Link to this sectionCoreML#
CoreML es el marco de aprendizaje automático de Apple, optimizado para el rendimiento en el dispositivo dentro del ecosistema de Apple, incluidos iOS, macOS, watchOS y tvOS.
- Puntos de referencia de rendimiento: Optimizado para el rendimiento en el dispositivo en hardware de Apple con un uso mínimo de batería.
- Compatibilidad e integración: Exclusivo para el ecosistema de Apple, lo que proporciona un flujo de trabajo optimizado para aplicaciones de iOS y macOS.
- Soporte comunitario y ecosistema: Fuerte respaldo de Apple y una comunidad de desarrolladores dedicada, con amplia documentación y herramientas.
- Casos prácticos: Comúnmente utilizado en aplicaciones que requieren capacidades de aprendizaje automático en el dispositivo en productos de Apple.
- Mantenimiento y actualizaciones: Actualizado periódicamente por Apple para admitir los últimos avances en aprendizaje automático y hardware de Apple.
- Consideraciones de seguridad: Se beneficia del enfoque de Apple en la privacidad del usuario y la seguridad de los datos.
- Aceleración de hardware: Aprovecha al máximo el motor neuronal y la GPU de Apple para tareas de aprendizaje automático aceleradas.
Link to this sectionTF SavedModel#
TF SavedModel es el formato de TensorFlow para guardar y servir modelos de aprendizaje automático, especialmente adecuado para entornos de servidor escalables.
- Puntos de referencia de rendimiento: Ofrece un rendimiento escalable en entornos de servidor, especialmente cuando se utiliza con TensorFlow Serving.
- Compatibilidad e integración: Amplia compatibilidad en todo el ecosistema de TensorFlow, incluidas las implementaciones en la nube y en servidores empresariales.
- Soporte comunitario y ecosistema: Gran soporte de la comunidad debido a la popularidad de TensorFlow, con una amplia gama de herramientas para la implementación y optimización.
- Casos prácticos: Utilizado ampliamente en entornos de producción para servir modelos de aprendizaje profundo a gran escala.
- Mantenimiento y actualizaciones: Respaldado por Google y la comunidad de TensorFlow, lo que garantiza actualizaciones periódicas y nuevas funciones.
- Consideraciones de seguridad: La implementación mediante TensorFlow Serving incluye funciones de seguridad robustas para aplicaciones de nivel empresarial.
- Aceleración de hardware: Admite varias aceleraciones de hardware a través de los backends de TensorFlow.
Link to this sectionTF GraphDef#
TF GraphDef es un formato de TensorFlow que representa el modelo como un grafo, lo cual resulta beneficioso para entornos donde se requiere un grafo de computación estático.
- Puntos de referencia de rendimiento: Proporciona un rendimiento estable para grafos de computación estáticos, con un enfoque en la coherencia y la fiabilidad.
- Compatibilidad e integración: Se integra fácilmente en la infraestructura de TensorFlow, pero es menos flexible en comparación con SavedModel.
- Soporte comunitario y ecosistema: Buen soporte del ecosistema de TensorFlow, con muchos recursos disponibles para optimizar grafos estáticos.
- Casos prácticos: Útil en escenarios donde es necesario un grafo estático, como en ciertos sistemas integrados.
- Mantenimiento y actualizaciones: Actualizaciones periódicas junto con las actualizaciones principales de TensorFlow.
- Consideraciones de seguridad: Garantiza una implementación segura con las prácticas de seguridad establecidas de TensorFlow.
- Aceleración de hardware: Puede utilizar las opciones de aceleración de hardware de TensorFlow, aunque no es tan flexible como SavedModel.
Obtén más información sobre TF GraphDef en nuestra guía de integración de TF GraphDef.
Link to this sectionTF Lite#
TF Lite es la solución de TensorFlow para el aprendizaje automático en dispositivos móviles e integrados, proporcionando una biblioteca ligera para la inferencia en el dispositivo.
- Puntos de referencia de rendimiento: Diseñado para la velocidad y la eficiencia en dispositivos móviles e integrados.
- Compatibilidad e integración: Puede utilizarse en una amplia gama de dispositivos debido a su naturaleza ligera.
- Soporte comunitario y ecosistema: Respaldado por Google, cuenta con una comunidad sólida y un número creciente de recursos para desarrolladores.
- Casos prácticos: Popular en aplicaciones móviles que requieren inferencia en el dispositivo con una huella mínima.
- Mantenimiento y actualizaciones: Actualizado periódicamente para incluir las últimas funciones y optimizaciones para dispositivos móviles.
- Consideraciones de seguridad: Proporciona un entorno seguro para ejecutar modelos en los dispositivos del usuario final.
- Aceleración de hardware: Admite una variedad de opciones de aceleración de hardware, incluidas GPU y DSP.
Link to this sectionTF Edge TPU#
TF Edge TPU está diseñado para una computación eficiente y de alta velocidad en el hardware Edge TPU de Google, perfecto para dispositivos IoT que requieren procesamiento en tiempo real.
- Puntos de referencia de rendimiento: Optimizado específicamente para una computación eficiente y de alta velocidad en el hardware Edge TPU de Google.
- Compatibilidad e integración: Funciona exclusivamente con modelos de TensorFlow Lite en dispositivos Edge TPU.
- Soporte comunitario y ecosistema: Soporte creciente con recursos proporcionados por Google y desarrolladores externos.
- Casos prácticos: Utilizado en dispositivos IoT y aplicaciones que requieren procesamiento en tiempo real con baja latencia.
- Mantenimiento y actualizaciones: Mejorado continuamente para aprovechar las capacidades de los nuevos lanzamientos de hardware de Edge TPU.
- Consideraciones de seguridad: Se integra con la seguridad robusta de Google para dispositivos IoT y de borde.
- Aceleración de hardware: Diseñado a medida para aprovechar al máximo los dispositivos Google Coral.
Link to this sectionHailo HEF#
Hailo HEF es un formato ejecutable compilado para aceleradores de IA Hailo, incluidos los dispositivos Hailo-8, Hailo-8L y Hailo-15. Los modelos de detección YOLO de Ultralytics se exportan primero a ONNX y, posteriormente, se compilan a HEF con el compilador externo Hailo Dataflow Compiler. HEF no es un destino de exportación directo de Ultralytics; para flujos de trabajo de aceleración de borde compatibles, compara primero Axelera AI y DeepX.
- Puntos de referencia de rendimiento: Depende del hardware de Hailo, la versión del SDK de Hailo, el script del modelo, la configuración de NMS y los datos de calibración.
- Compatibilidad e integración: Solo para sistemas integrados, puertas de enlace industriales y despliegues del Raspberry Pi AI Kit impulsados por Hailo.
- Soporte de la comunidad y ecosistema: Con el respaldo de Hailo Developer Zone, HailoRT, TAPPAS y Hailo Model Zoo.
- Casos prácticos: Útil para la detección de objetos en tiempo real en cámaras, robótica, control de acceso, ciudades inteligentes y dispositivos de inspección industrial.
- Mantenimiento y actualizaciones: Depende de las actualizaciones del Hailo SDK, el firmware y el Model Zoo para los nuevos objetivos de aceleración.
- Consideraciones de seguridad: Admite inferencia local en el propio dispositivo, donde los datos permanecen en el borde.
- Aceleración de hardware: Utiliza la ejecución en NPU de Hailo mediante artefactos HEF compilados.
Para un flujo de trabajo paso a paso, consulta la guía de integración de Hailo.
Link to this sectionTF.js#
TensorFlow.js (TF.js) es una biblioteca que lleva las capacidades de aprendizaje automático directamente al navegador, ofreciendo un nuevo mundo de posibilidades tanto para desarrolladores web como para usuarios. Permite la integración de modelos de aprendizaje automático en aplicaciones web sin necesidad de infraestructura de back-end.
- Benchmarks de rendimiento: Permite el aprendizaje automático directamente en el navegador con un rendimiento razonable, dependiendo del dispositivo del cliente.
- Compatibilidad e integración: Alta compatibilidad con tecnologías web, lo que facilita su integración en aplicaciones web.
- Soporte de la comunidad y ecosistema: Soporte de una comunidad de desarrolladores web y de Node.js, con una variedad de herramientas para desplegar modelos de ML en navegadores.
- Casos prácticos: Ideal para aplicaciones web interactivas que se benefician del aprendizaje automático del lado del cliente sin necesidad de procesamiento del lado del servidor.
- Mantenimiento y actualizaciones: Mantenido por el equipo de TensorFlow con contribuciones de la comunidad de código abierto.
- Consideraciones de seguridad: Se ejecuta dentro del contexto seguro del navegador, utilizando el modelo de seguridad de la plataforma web.
- Aceleración de hardware: El rendimiento se puede mejorar con API basadas en web que acceden a la aceleración de hardware como WebGL.
Link to this sectionPaddlePaddle#
PaddlePaddle es un framework de aprendizaje profundo de código abierto desarrollado por Baidu. Está diseñado para ser eficiente para los investigadores y fácil de usar para los desarrolladores. Es especialmente popular en China y ofrece soporte especializado para el procesamiento del idioma chino.
- Benchmarks de rendimiento: Ofrece un rendimiento competitivo con un enfoque en la facilidad de uso y la escalabilidad.
- Compatibilidad e integración: Bien integrado en el ecosistema de Baidu y es compatible con una amplia gama de aplicaciones.
- Soporte de la comunidad y ecosistema: Aunque la comunidad es más pequeña a nivel mundial, está creciendo rápidamente, especialmente en China.
- Casos prácticos: Utilizado habitualmente en los mercados chinos y por desarrolladores que buscan alternativas a otros marcos de trabajo importantes.
- Mantenimiento y actualizaciones: Se actualiza regularmente con el objetivo de servir a aplicaciones y servicios de IA en idioma chino.
- Consideraciones de seguridad: Pone énfasis en la privacidad de datos y la seguridad, atendiendo a los estándares de gobernanza de datos chinos.
- Aceleración de hardware: Admite varias aceleraciones de hardware, incluidos los propios chips Kunlun de Baidu.
Link to this sectionMNN#
MNN es un framework de aprendizaje profundo altamente eficiente y ligero. Admite la inferencia y el entrenamiento de modelos de aprendizaje profundo y cuenta con un rendimiento líder en el sector para la inferencia y el entrenamiento en el dispositivo. Además, MNN también se utiliza en dispositivos integrados, como IoT.
- Benchmarks de rendimiento: Alto rendimiento para dispositivos móviles con una excelente optimización para sistemas ARM.
- Compatibilidad e integración: Funciona bien con sistemas móviles y ARM integrados y arquitecturas de CPU X86-64.
- Soporte de la comunidad y ecosistema: Con el respaldo de la comunidad de aprendizaje automático móvil e integrado.
- Casos prácticos: Ideal para aplicaciones que requieren un rendimiento eficiente en sistemas móviles.
- Mantenimiento y actualizaciones: Mantenido regularmente para garantizar un alto rendimiento en dispositivos móviles.
- Consideraciones de seguridad: Proporciona ventajas de seguridad en el dispositivo manteniendo los datos locales.
- Aceleración de hardware: Optimizado para CPU y GPU ARM para una máxima eficiencia.
Link to this sectionNCNN#
NCNN es un framework de inferencia de redes neuronales de alto rendimiento optimizado para la plataforma móvil. Destaca por su naturaleza ligera y eficiente, lo que lo hace especialmente adecuado para dispositivos móviles e integrados donde los recursos son limitados.
- Benchmarks de rendimiento: Altamente optimizado para plataformas móviles, ofreciendo una inferencia eficiente en dispositivos basados en ARM.
- Compatibilidad e integración: Adecuado para aplicaciones en teléfonos móviles y sistemas integrados con arquitectura ARM.
- Soporte de la comunidad y ecosistema: Respaldado por una comunidad pequeña pero activa centrada en aplicaciones de ML móviles e integradas.
- Casos prácticos: Preferido para aplicaciones móviles donde la eficiencia y la velocidad son fundamentales en Android y otros sistemas basados en ARM.
- Mantenimiento y actualizaciones: Se mejora continuamente para mantener un alto rendimiento en una gama de dispositivos ARM.
- Consideraciones de seguridad: Se centra en la ejecución local en el dispositivo, aprovechando la seguridad inherente del procesamiento en el propio dispositivo.
- Aceleración de hardware: Adaptado para CPU y GPU ARM, con optimizaciones específicas para estas arquitecturas.
Link to this sectionAnálisis comparativo de las opciones de implementación de YOLO26#
La siguiente tabla ofrece una instantánea de las diversas opciones de despliegue disponibles para modelos YOLO26, ayudándote a evaluar cuál puede adaptarse mejor a las necesidades de tu proyecto basándote en varios criterios críticos. Para obtener una visión detallada del formato de cada opción de despliegue, consulta la página de documentación de Ultralytics sobre formatos de exportación.
| Opción de despliegue | Benchmarks de rendimiento | Compatibilidad e integración | Soporte de la comunidad y ecosistema | Casos prácticos | Mantenimiento y actualizaciones | Consideraciones de seguridad | Aceleración de hardware |
|---|---|---|---|---|---|---|---|
| PyTorch | Buena flexibilidad; puede comprometer el rendimiento bruto | Excelente con bibliotecas de Python | Amplios recursos y comunidad | Investigación y prototipos | Desarrollo regular y activo | Dependiente del entorno de despliegue | Soporte CUDA para aceleración por GPU |
| TorchScript | Mejor para producción que PyTorch | Transición fluida de PyTorch a C++ | Especializado pero más reducido que PyTorch | Industria donde Python es un cuello de botella | Actualizaciones constantes con PyTorch | Seguridad mejorada sin Python completo | Hereda el soporte CUDA de PyTorch |
| ONNX | Variable según el tiempo de ejecución | Alto en diferentes marcos de trabajo | Ecosistema amplio, respaldado por muchas organizaciones | Flexibilidad entre marcos de ML | Actualizaciones regulares para nuevas operaciones | Garantiza prácticas de conversión y despliegue seguras | Varias optimizaciones de hardware |
| OpenVINO | Optimizado para hardware Intel | Mejor dentro del ecosistema Intel | Sólido en el campo de la visión artificial | IoT y edge con hardware Intel | Actualizaciones regulares para hardware Intel | Funciones robustas para aplicaciones sensibles | Adaptado para hardware Intel |
| TensorRT | De primer nivel en GPU NVIDIA | Mejor para hardware NVIDIA | Red sólida a través de NVIDIA | Inferencia de vídeo e imagen en tiempo real | Actualizaciones frecuentes para nuevas GPU | Énfasis en la seguridad | Diseñado para GPU NVIDIA |
| CoreML | Optimizado para hardware Apple en el dispositivo | Exclusivo para el ecosistema Apple | Fuerte apoyo de Apple y de la comunidad de desarrolladores | ML en el dispositivo en productos Apple | Actualizaciones regulares de Apple | Enfoque en la privacidad y la seguridad | Apple neural engine y GPU |
| TF SavedModel | Escalable en entornos de servidor | Amplia compatibilidad en el ecosistema TensorFlow | Gran soporte debido a la popularidad de TensorFlow | Servicio de modelos a escala | Actualizaciones regulares de Google y la comunidad | Funciones robustas para empresas | Varias aceleraciones de hardware |
| TF GraphDef | Estable para grafos de computación estáticos | Se integra bien con la infraestructura de TensorFlow | Recursos para optimizar grafos estáticos | Escenarios que requieren grafos estáticos | Actualizaciones junto al núcleo de TensorFlow | Prácticas de seguridad de TensorFlow establecidas | Opciones de aceleración de TensorFlow |
| TF Lite | Velocidad y eficiencia en dispositivos móviles/integrados | Amplia gama de compatibilidad con dispositivos | Comunidad sólida, respaldada por Google | Aplicaciones móviles con una huella mínima | Últimas funciones para móviles | Entorno seguro en dispositivos del usuario final | GPU y DSP, entre otros |
| TF Edge TPU | Optimizado para el hardware Edge TPU de Google | Exclusivo para dispositivos Edge TPU | En crecimiento con recursos de Google y terceros | Dispositivos IoT que requieren procesamiento en tiempo real | Mejoras para el nuevo hardware Edge TPU | Seguridad IoT robusta de Google | Diseñado a medida para Google Coral |
| Hailo HEF | Específico para hardware y compilado externamente | Dispositivos Hailo y Raspberry Pi AI Kit | Hailo Developer Zone y Model Zoo | Despliegues de Hailo existentes | Actualizaciones de Hailo SDK y firmware | La inferencia en el dispositivo mantiene los datos locales | Hailo NPU mediante artefactos HEF |
| TF.js | Rendimiento razonable en el navegador | Alto con tecnologías web | Soporte para desarrolladores web y Node.js | Aplicaciones web interactivas | Contribuciones del equipo y la comunidad de TensorFlow | Modelo de seguridad de la plataforma web | Mejorado con WebGL y otras API |
| PaddlePaddle | Competitivo, fácil de usar y escalable | Ecosistema Baidu, amplio soporte de aplicaciones | Crecimiento rápido, especialmente en China | Mercado chino y procesamiento de idiomas | Enfoque en aplicaciones de IA chinas | Enfatiza la privacidad y seguridad de los datos | Incluyendo los chips Kunlun de Baidu |
| MNN | Alto rendimiento para dispositivos móviles. | Sistemas ARM móviles e integrados y CPU X86-64 | Comunidad de ML móvil/integrado | Eficiencia de sistemas móviles | Mantenimiento de alto rendimiento en dispositivos móviles | Ventajas de seguridad en el dispositivo | Optimizaciones para CPU y GPU ARM |
| NCNN | Optimizado para dispositivos móviles basados en ARM | Sistemas ARM móviles e integrados | Comunidad de ML móvil/integrado pequeña pero activa | Eficiencia en sistemas Android y ARM | Mantenimiento de alto rendimiento en ARM | Ventajas de seguridad en el dispositivo | Optimizaciones para CPU y GPU ARM |
Este análisis comparativo te ofrece una visión general de alto nivel. Para el despliegue, es esencial considerar los requisitos y limitaciones específicos de tu proyecto, y consultar la documentación detallada y los recursos disponibles para cada opción.
Link to this sectionComunidad y soporte#
Cuando empiezas con YOLO26, contar con una comunidad útil y soporte puede tener un impacto significativo. Aquí te mostramos cómo conectar con otros que comparten tus intereses y obtener la asistencia que necesitas.
Link to this sectionParticipa en la comunidad en general#
- GitHub Discussions: El repositorio de YOLO26 en GitHub tiene una sección de "Discussions" donde puedes hacer preguntas, informar de problemas y sugerir mejoras.
- Servidor de Discord de Ultralytics: Ultralytics tiene un servidor de Discord donde puedes interactuar con otros usuarios y desarrolladores.
Link to this sectionDocumentación y recursos oficiales#
- Documentación de Ultralytics YOLO26: La documentación oficial ofrece una visión general completa de YOLO26, junto con guías sobre instalación, uso y resolución de problemas.
Estos recursos te ayudarán a superar desafíos y a mantenerte al día sobre las últimas tendencias y mejores prácticas en la comunidad de YOLO26.
Link to this sectionConclusión#
En esta guía, hemos explorado las diferentes opciones de despliegue para YOLO26. También hemos hablado de los factores importantes a tener en cuenta al tomar tu decisión. Estas opciones te permiten personalizar tu modelo para diversos entornos y requisitos de rendimiento, haciéndolo adecuado para aplicaciones del mundo real.
No olvides que la comunidad de Ultralytics y de YOLO26 es una fuente valiosa de ayuda. Conecta con otros desarrolladores y expertos para aprender consejos y soluciones únicos que quizás no encuentres en la documentación habitual. Sigue buscando conocimiento, explorando nuevas ideas y compartiendo tus experiencias.
Link to this sectionFAQ#
Link to this section¿Qué opciones de despliegue hay disponibles para YOLO26 en diferentes plataformas de hardware?#
Ultralytics YOLO26 admite varios formatos de despliegue, cada uno diseñado para entornos y plataformas de hardware específicos. Los formatos clave incluyen:
- PyTorch para investigación y creación de prototipos, con una excelente integración con Python.
- TorchScript para entornos de producción donde Python no está disponible.
- ONNX para compatibilidad multiplataforma y aceleración de hardware.
- OpenVINO para un rendimiento optimizado en hardware Intel.
- TensorRT para inferencia de alta velocidad en GPU NVIDIA.
Cada formato tiene ventajas únicas. Para un recorrido detallado, consulta nuestra documentación del proceso de exportación.
Link to this section¿Cómo puedo mejorar la velocidad de inferencia de mi modelo YOLO26 en una CPU Intel?#
Para mejorar la velocidad de inferencia en CPU Intel, puedes desplegar tu modelo YOLO26 usando el kit de herramientas OpenVINO de Intel. OpenVINO ofrece mejoras de rendimiento significativas al optimizar los modelos para aprovechar el hardware de Intel de manera eficiente.
- Convierte tu modelo YOLO26 al formato OpenVINO usando la función
model.export(). - Sigue la guía de configuración detallada en la documentación de exportación de Intel OpenVINO.
Para más información, echa un vistazo a nuestra entrada de blog.
Link to this section¿Puedo desplegar modelos YOLO26 en dispositivos móviles?#
Sí, los modelos YOLO26 pueden desplegarse en dispositivos móviles usando TensorFlow Lite (TF Lite) tanto para plataformas Android como iOS. TF Lite está diseñado para dispositivos móviles e integrados, proporcionando una inferencia eficiente en el dispositivo.
# Export command for TFLite format
model.export(format="tflite")Para más detalles sobre cómo desplegar modelos en móviles, consulta nuestra guía de integración de TF Lite.
Link to this section¿Qué factores debo considerar al elegir un formato de despliegue para mi modelo YOLO26?#
Al elegir un formato de despliegue para YOLO26, ten en cuenta los siguientes factores:
- Rendimiento: Algunos formatos como TensorRT ofrecen velocidades excepcionales en GPU NVIDIA, mientras que OpenVINO está optimizado para hardware Intel.
- Compatibilidad: ONNX ofrece una amplia compatibilidad en diferentes plataformas.
- Facilidad de integración: Formatos como CoreML o TF Lite están adaptados a ecosistemas específicos como iOS y Android, respectivamente.
- Apoyo de la comunidad: Formatos como PyTorch y TensorFlow cuentan con amplios recursos y apoyo de la comunidad.
Para un análisis comparativo, consulta nuestra documentación sobre formatos de exportación.
Link to this section¿Cómo puedo desplegar modelos YOLO26 en una aplicación web?#
Para desplegar modelos YOLO26 en una aplicación web, puedes usar TensorFlow.js (TF.js), que permite ejecutar modelos de aprendizaje automático directamente en el navegador. Este enfoque elimina la necesidad de una infraestructura backend y proporciona rendimiento en tiempo real.
- Exporta el modelo YOLO26 al formato TF.js.
- Integra el modelo exportado en tu aplicación web.
Para obtener instrucciones paso a paso, consulta nuestra guía sobre integración con TensorFlow.js.