Link to this sectionExportación a Intel OpenVINO#
En esta guía, explicamos cómo exportar modelos YOLO26 al formato OpenVINO, el cual puede ofrecer una aceleración de hasta 3x en CPU, además de acelerar la inferencia de YOLO en hardware GPU y NPU de Intel.
OpenVINO, abreviatura de kit de herramientas de optimización de inferencia visual y redes neuronales (Open Visual Inference & Neural Network Optimization), es un kit integral para optimizar y desplegar modelos de inferencia de IA. Aunque el nombre contenga "Visual", OpenVINO también admite diversas tareas adicionales, como lenguaje, audio, series temporales, etc.
Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀
Link to this sectionEjemplos de uso#
El formato OpenVINO es compatible con los modos Export, Predict y Validate. Exporta tu modelo, luego cárgalo para ejecutar inferencias o validar su precisión en una CPU, GPU integrada/dedicada o NPU de Intel.
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export the model to OpenVINO format
model.export(format="openvino") # creates 'yolo26n_openvino_model/'from ultralytics import YOLO
# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")from ultralytics import YOLO
# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")
# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")Link to this sectionArgumentos de exportación#
| Argumento | Tipo | Predeterminado | Descripción |
|---|---|---|---|
format | str | 'openvino' | Formato destino para el modelo exportado, que define la compatibilidad con diversos entornos de despliegue. |
imgsz | int o tuple | 640 | Tamaño de imagen deseado para la entrada del modelo. Puede ser un número entero para imágenes cuadradas o una tupla (height, width) para dimensiones específicas. |
half | bool | False | Habilita la cuantización FP16 (precisión media), lo que reduce el tamaño del modelo y potencialmente acelera la inferencia en hardware compatible. |
int8 | bool | False | Activa la cuantización INT8, lo que comprime aún más el modelo y acelera la inferencia con una pérdida mínima de precisión, principalmente para dispositivos periféricos. |
dynamic | bool | False | Permite tamaños de entrada dinámicos, mejorando la flexibilidad al manejar diferentes dimensiones de imagen. |
nms | bool | False | Añade la supresión de no máximos (NMS), esencial para el posprocesamiento de detecciones preciso y eficiente. |
batch | int | 1 | Especifica el tamaño de inferencia por lotes del modelo de exportación o el número máximo de imágenes que el modelo exportado procesará simultáneamente en modo predict. |
data | str | 'coco8.yaml' | Ruta al archivo de configuración del dataset (predeterminado: coco8.yaml), esencial para la cuantización. |
fraction | float | 1.0 | Especifica la fracción del dataset que se utilizará para la calibración de cuantización INT8. Permite calibrar sobre un subconjunto del dataset completo, lo cual es útil para experimentos o cuando los recursos son limitados. Si no se especifica y la opción INT8 está activada, se utilizará el dataset completo. |
Para obtener más detalles sobre el proceso de exportación, visita la página de documentación de Ultralytics sobre exportación.
OpenVINO™ es compatible con la mayoría de procesadores Intel®, pero para garantizar un rendimiento óptimo:
-
Verifica la compatibilidad con OpenVINO™ Comprueba si tu chip Intel® es oficialmente compatible con OpenVINO™ usando la lista de compatibilidad de Intel.
-
Identifica tu acelerador Determina si tu procesador incluye una NPU (unidad de procesamiento neuronal) o GPU (GPU integrada) consultando la guía de hardware de Intel.
-
Instala los controladores más recientes Si tu chip admite una NPU o GPU pero OpenVINO™ no la detecta, es posible que necesites instalar o actualizar los controladores asociados. Sigue las instrucciones de instalación de controladores para habilitar la aceleración completa.
Al seguir estos tres pasos, podrás asegurarte de que OpenVINO™ funcione de manera óptima en tu hardware Intel®.
Link to this sectionBeneficios de OpenVINO#
- Rendimiento: OpenVINO ofrece una inferencia de alto rendimiento al utilizar la potencia de las CPUs, GPUs integradas y dedicadas, y FPGAs de Intel.
- Soporte para ejecución heterogénea: OpenVINO proporciona una API para escribir el código una vez y desplegarlo en cualquier hardware Intel compatible (CPU, GPU, FPGA, VPU, etc.).
- Optimizador de modelos: OpenVINO incluye un optimizador de modelos que importa, convierte y optimiza modelos desde marcos populares de deep learning como PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle y Caffe.
- Facilidad de uso: El kit de herramientas viene con una gran colección de cuadernos de tutoriales (incluida la optimización de YOLO26) que enseñan diferentes aspectos de la herramienta.
Link to this sectionEstructura de exportación de OpenVINO#
Cuando exportas un modelo al formato OpenVINO, se genera un directorio que contiene lo siguiente:
- Archivo XML: Describe la topología de la red.
- Archivo BIN: Contiene los datos binarios de los pesos y sesgos.
- Archivo de asignación (Mapping): Contiene la asignación de los tensores de salida del modelo original a los nombres de los tensores de OpenVINO.
Puedes usar estos archivos para ejecutar inferencias con el motor de inferencia de OpenVINO (Inference Engine).
Link to this sectionUso de la exportación a OpenVINO en el despliegue#
Una vez que tu modelo se haya exportado correctamente al formato OpenVINO, tienes dos opciones principales para ejecutar la inferencia:
-
Usa el paquete
ultralytics, que proporciona una API de alto nivel y envuelve el entorno de ejecución (Runtime) de OpenVINO. -
Usa el paquete nativo
openvinopara un control más avanzado o personalizado sobre el comportamiento de la inferencia.
Link to this sectionInferencia con Ultralytics#
El paquete ultralytics te permite ejecutar inferencias fácilmente usando el modelo OpenVINO exportado a través del método predict. También puedes especificar el dispositivo de destino (p. ej., intel:gpu, intel:npu, intel:cpu) utilizando el argumento device.
from ultralytics import YOLO
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/") # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu") # specify the device you want to run inference onEste enfoque es ideal para prototipado rápido o despliegue cuando no necesitas un control total sobre la canalización (pipeline) de inferencia.
Link to this sectionInferencia con el entorno de ejecución de OpenVINO (OpenVINO Runtime)#
El entorno de ejecución de OpenVINO proporciona una API unificada para la inferencia en todo el hardware Intel compatible. También ofrece capacidades avanzadas como el equilibrio de carga entre hardware Intel y la ejecución asíncrona. Para obtener más información sobre cómo ejecutar inferencias, consulta los cuadernos de YOLO26.
Recuerda que necesitarás los archivos XML y BIN, así como cualquier configuración específica de la aplicación, como el tamaño de entrada, el factor de escala para la normalización, etc., para configurar y usar correctamente el modelo con el entorno de ejecución.
En tu aplicación de despliegue, normalmente seguirías estos pasos:
- Inicializa OpenVINO creando
core = Core(). - Carga el modelo usando el método
core.read_model(). - Compila el modelo usando la función
core.compile_model(). - Prepara la entrada (imagen, texto, audio, etc.).
- Ejecuta la inferencia usando
compiled_model(input_data).
Para ver pasos más detallados y fragmentos de código, consulta la documentación de OpenVINO o el tutorial de la API.
Link to this sectionPuntos de referencia (benchmarks) de OpenVINO YOLO26#
El equipo de Ultralytics evaluó YOLO26 en varios formatos de modelo y precisión, analizando la velocidad y exactitud en diferentes dispositivos Intel compatibles con OpenVINO.
-
Los resultados de las pruebas a continuación son de referencia y pueden variar según la configuración exacta de hardware y software del sistema, así como de la carga de trabajo actual del sistema en el momento en que se ejecutan las pruebas.
-
Todas las pruebas se ejecutaron con la versión del paquete de Python
openvino2026.2.0.dev20260501. Actualizaremos las pruebas con una compilación estable una vez que se publique la versión 2026.2.0. -
Los modelos YOLO26 en NPU solo son compatibles con sistemas Intel® Core™ Ultra™ de la serie 2xxV y serie 3xx y superiores.
Link to this sectionIntel® Core™ Ultra#
La serie Intel® Core™ Ultra™ representa un nuevo estándar en informática de alto rendimiento, diseñado para satisfacer las demandas cambiantes de los usuarios modernos, desde jugadores y creadores hasta profesionales que aprovechan la IA. Esta línea de próxima generación es más que una serie de CPUs tradicional; combina potentes núcleos de CPU, capacidades de GPU integrada de alto rendimiento y una unidad de procesamiento neuronal (NPU) dedicada en un único chip, ofreciendo una solución unificada para cargas de trabajo informáticas diversas e intensivas.
En el corazón de la arquitectura Intel® Core Ultra™ hay un diseño híbrido que permite un rendimiento excepcional en tareas de procesamiento tradicionales, cargas de trabajo aceleradas por GPU y operaciones impulsadas por IA. La inclusión de la NPU mejora la inferencia de IA en el dispositivo, lo que permite un aprendizaje automático y un procesamiento de datos más rápidos y eficientes en una amplia gama de aplicaciones.
La familia Core Ultra™ incluye varios modelos adaptados a diferentes necesidades de rendimiento, con opciones que van desde diseños energéticamente eficientes hasta variantes de alta potencia marcadas con la designación "H", ideales para portátiles y formatos compactos que requieren una potencia informática considerable. En toda la línea, los usuarios se benefician de la sinergia de la integración de CPU, GPU y NPU, ofreciendo una eficiencia, capacidad de respuesta y capacidades multitarea notables.
Como parte de la innovación continua de Intel, la serie Core Ultra™ establece un nuevo estándar para la informática preparada para el futuro. Con múltiples modelos disponibles y más en el horizonte, esta serie subraya el compromiso de Intel de ofrecer soluciones de vanguardia para la próxima generación de dispositivos inteligentes mejorados con IA.
Las pruebas a continuación se ejecutan en Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V e Intel® Core™ Ultra™ 7 155H a precisión FP32, FP16 e INT8.
Link to this sectionIntel® Core™ Ultra™ X7 358H#
Resultados detallados de las pruebas
| Modelo | Formato | Precisión | Estado | Tamaño (MB) | metrics/mAP50-95(B) | Tiempo de inferencia (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 25.18 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4763 | 2.67 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4763 | 2.64 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4625 | 2.73 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 50.09 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5615 | 3.57 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5615 | 3.55 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.547 | 3.09 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 135.1 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6168 | 5.64 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6168 | 5.85 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.5994 | 4.14 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6215 | 169.75 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.6206 | 8.14 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6206 | 8.18 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.5999 | 4.67 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 407.56 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6569 | 13.11 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6569 | 13.15 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6374 | 9.24 |
Link to this sectionIntel® Core™ Ultra™ 7 258V#
Resultados detallados de las pruebas
| Modelo | Formato | Precisión | Estado | Tamaño (MB) | metrics/mAP50-95(B) | Tiempo de inferencia (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 31.43 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4762 | 3.57 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4762 | 3.53 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4625 | 3.65 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 60.4 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5616 | 5.02 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5616 | 5.01 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.547 | 4.31 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 173.31 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6191 | 9.48 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6168 | 9.6 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.5994 | 6.03 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6173 | 224.52 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.3725 | 11.88 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6201 | 12.0 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.5999 | 8.47 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 595.72 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6567 | 20.26 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6454 | 20.25 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6374 | 14.77 |
Link to this sectionIntel® Core™ Ultra™ 7 155H#
Resultados detallados de las pruebas
| Modelo | Formato | Precisión | Estado | Tamaño (MB) | metrics/mAP50-95(B) | Tiempo de inferencia (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 38.77 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4774 | 9.87 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4774 | 9.84 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4705 | 5.86 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 69.54 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5616 | 17.29 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5616 | 17.06 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.5452 | 10.33 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 192.22 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6187 | 34.64 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6187 | 34.75 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.6073 | 15.99 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6215 | 245.62 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.6202 | 43.7 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6202 | 44.65 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.6048 | 20.31 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 513.06 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6544 | 80.19 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6544 | 79.83 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6393 | 35.16 |
Link to this sectionReproduce nuestros resultados#
Para reproducir los benchmarks de Ultralytics anteriores en todos los formatos de exportación, ejecuta este código:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")Ten en cuenta que los resultados de los benchmarks pueden variar según la configuración exacta del hardware y el software del sistema, así como de la carga de trabajo actual del sistema en el momento en que se ejecutan. Para obtener los resultados más fiables, utiliza un conjunto de datos con un gran número de imágenes, por ejemplo data='coco.yaml' (5000 imágenes de validación).
Link to this sectionConclusión#
Los resultados de los benchmarks demuestran claramente las ventajas de exportar el modelo YOLO26 al formato OpenVINO. En diferentes modelos y plataformas de hardware, el formato OpenVINO supera consistentemente a otros formatos en términos de velocidad de inferencia mientras mantiene una precisión comparable.
Los benchmarks subrayan la eficacia de OpenVINO como herramienta para desplegar modelos de deep learning. Al convertir los modelos al formato OpenVINO, los desarrolladores pueden lograr mejoras de rendimiento significativas, lo que facilita el despliegue de estos modelos en aplicaciones del mundo real.
Para obtener información más detallada e instrucciones sobre cómo usar OpenVINO, consulta la documentación oficial de OpenVINO.
Link to this sectionPreguntas frecuentes#
Link to this section¿Cómo exporto modelos YOLO26 al formato OpenVINO?#
Exportar modelos YOLO26 al formato OpenVINO puede mejorar significativamente la velocidad de la CPU y permitir aceleraciones de GPU y NPU en hardware Intel. Para exportar, puedes usar Python o la CLI como se muestra a continuación:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model
model.export(format="openvino") # creates 'yolo26n_openvino_model/'Para obtener más información, consulta la documentación de formatos de exportación.
Link to this section¿Cuáles son las ventajas de utilizar OpenVINO con modelos YOLO26?#
Usar el kit de herramientas OpenVINO de Intel con modelos YOLO26 ofrece varias ventajas:
- Rendimiento: Logra una aceleración de hasta 3 veces en la inferencia de CPU y aprovecha las GPU y NPU de Intel para la aceleración.
- Optimizador de modelos: Convierte, optimiza y ejecuta modelos desde frameworks populares como PyTorch, TensorFlow y ONNX.
- Facilidad de uso: Hay disponible una gran colección de cuadernos de tutoriales para ayudar a los usuarios a empezar, incluidos los de YOLO26.
- Ejecución heterogénea: Despliega modelos en varios hardware de Intel con una API unificada.
Para comparaciones de rendimiento detalladas, visita nuestra sección de benchmarks.
Link to this section¿Cómo puedo ejecutar la inferencia usando un modelo YOLO26 exportado a OpenVINO?#
Después de exportar un modelo YOLO26n al formato OpenVINO, puedes ejecutar la inferencia usando Python o la CLI:
from ultralytics import YOLO
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")
# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")Consulta nuestra documentación del modo de predicción para más detalles.
Link to this section¿Por qué debería elegir Ultralytics YOLO26 frente a otros modelos para la exportación a OpenVINO?#
Ultralytics YOLO26 está optimizado para la detección de objetos en tiempo real con alta precisión y velocidad. Específicamente, cuando se combina con OpenVINO, YOLO26 proporciona:
- Hasta 3 veces más velocidad en CPU Intel
- Despliegue fluido en GPU y NPU de Intel
- Precisión consistente y comparable en varios formatos de exportación
Para un análisis de rendimiento en profundidad, consulta nuestros benchmarks de YOLO26 detallados en diferentes hardware.
Link to this section¿Puedo comparar modelos YOLO26 en diferentes formatos como PyTorch, ONNX y OpenVINO?#
Sí, puedes comparar modelos YOLO26 en varios formatos, incluidos PyTorch, TorchScript, ONNX y OpenVINO. Utiliza el siguiente fragmento de código para ejecutar benchmarks en el conjunto de datos que elijas:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")Para obtener resultados detallados de los benchmarks, consulta nuestra sección de benchmarks y la documentación de formatos de exportación.