Meet YOLO26: next-gen vision AI.

Link to this sectionExportación a Intel OpenVINO#

OpenVINO Intel AI inference toolkit

En esta guía, tratamos la exportación de modelos YOLO26 al formato OpenVINO, el cual puede proporcionar hasta 3x de aceleración en CPU, además de acelerar la inferencia de YOLO en hardware GPU y NPU de Intel.

OpenVINO, abreviatura de Open Visual Inference & Neural Network Optimization toolkit, es un kit de herramientas integral para optimizar e implementar modelos de inferencia de IA. Aunque el nombre contenga Visual, OpenVINO también admite diversas tareas adicionales, incluyendo lenguaje, audio, series temporales, etc.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Link to this sectionEjemplos de uso#

El formato OpenVINO admite los modos Export, Predict y Validate. Exporta tu modelo y, a continuación, cárgalo para ejecutar la inferencia o validar su precisión en una CPU, GPU integrada/discreta o NPU de Intel.

Exportar
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to OpenVINO format
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'
Predecir
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")
Validar
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionArgumentos de exportación#

ArgumentoTipoPredeterminadoDescripción
formatstr'openvino'Formato de destino para el modelo exportado, definiendo la compatibilidad con diversos entornos de despliegue.
imgszint o tuple640Tamaño de imagen deseado para la entrada del modelo. Puede ser un número entero para imágenes cuadradas o una tupla (height, width) para dimensiones específicas.
quantizeint o strNonePrecisión de cuantización: 16 (FP16) o 8 (INT8/PTQ; requiere data/fraction de calibración); 32 o no establecer valor equivale a FP32. Sustituye a los flags obsoletos half/int8.
dynamicboolFalsePermite tamaños de entrada dinámicos, mejorando la flexibilidad al manejar diferentes dimensiones de imagen.
nmsboolFalseAñade la supresión de no máximos (NMS), esencial para el posprocesamiento preciso y eficiente de detecciones.
batchint1Especifica el tamaño de inferencia por lote del modelo exportado o el número máximo de imágenes que el modelo procesará simultáneamente en el modo predict.
datastr'coco8.yaml'Ruta al archivo de configuración del dataset (predeterminado: coco8.yaml), esencial para la cuantización.
fractionfloat1.0Especifica la fracción del conjunto de datos a utilizar para la calibración de cuantización INT8. Permite calibrar en un subconjunto del conjunto de datos completo, útil para experimentos o cuando los recursos son limitados. Si no se especifica con INT8 habilitado, se utilizará el conjunto de datos completo.

Para obtener más detalles sobre el proceso de exportación, visita la página de documentación de Ultralytics sobre la exportación.

Advertencia

OpenVINO™ es compatible con la mayoría de los procesadores Intel®, pero para garantizar un rendimiento óptimo:

  1. Verifica la compatibilidad con OpenVINO™ Comprueba si tu chip Intel® es oficialmente compatible con OpenVINO™ utilizando la lista de compatibilidad de Intel.

  2. Identifica tu acelerador Determina si tu procesador incluye una NPU (Neural Processing Unit) o GPU (GPU integrada) consultando la guía de hardware de Intel.

  3. Instala los controladores más recientes Si tu chip admite una NPU o GPU pero OpenVINO™ no la detecta, es posible que debas instalar o actualizar los controladores asociados. Sigue las instrucciones de instalación de controladores para permitir una aceleración total.

Siguiendo estos tres pasos, puedes asegurarte de que OpenVINO™ funcione de forma óptima en tu hardware Intel®.

Link to this sectionVentajas de OpenVINO#

  1. Rendimiento: OpenVINO ofrece una inferencia de alto rendimiento utilizando la potencia de las CPU de Intel, las GPU integradas y discretas, y las FPGA.
  2. Compatibilidad con ejecución heterogénea: OpenVINO proporciona una API para programar una vez e implementar en cualquier hardware Intel compatible (CPU, GPU, FPGA, VPU, etc.).
  3. Optimizador de modelos: OpenVINO proporciona un optimizador de modelos que importa, convierte y optimiza modelos de frameworks populares de deep learning como PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle y Caffe.
  4. Facilidad de uso: El kit de herramientas incluye una amplia colección de tutoriales en formato notebook (incluyendo optimización de YOLO26) que enseñan diferentes aspectos del mismo.

Link to this sectionEstructura de la exportación a OpenVINO#

Cuando exportas un modelo al formato OpenVINO, el resultado es un directorio que contiene lo siguiente:

  1. Archivo XML: Describe la topología de la red.
  2. Archivo BIN: Contiene los datos binarios de los pesos y sesgos.
  3. Archivo de mapeo: Contiene el mapeo de los tensores de salida del modelo original a los nombres de los tensores de OpenVINO.

Puedes usar estos archivos para ejecutar la inferencia con el motor de inferencia de OpenVINO.

Link to this sectionUso de la exportación a OpenVINO en la implementación#

Una vez que tu modelo se haya exportado correctamente al formato OpenVINO, tienes dos opciones principales para ejecutar la inferencia:

  1. Usa el paquete ultralytics, que proporciona una API de alto nivel y envuelve el entorno de ejecución (Runtime) de OpenVINO.

  2. Usa el paquete nativo openvino para un control más avanzado o personalizado sobre el comportamiento de la inferencia.

Link to this sectionInferencia con Ultralytics#

El paquete ultralytics te permite ejecutar fácilmente la inferencia utilizando el modelo OpenVINO exportado a través del método predict. También puedes especificar el dispositivo de destino (p. ej., intel:gpu, intel:npu, intel:cpu) usando el argumento device.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

Este enfoque es ideal para la creación rápida de prototipos o la implementación cuando no necesitas un control total sobre el pipeline de inferencia.

Link to this sectionInferencia con OpenVINO Runtime#

El entorno de ejecución OpenVINO Runtime proporciona una API unificada para la inferencia en todo el hardware Intel compatible. También ofrece capacidades avanzadas como el equilibrio de carga entre hardware Intel y la ejecución asíncrona. Para obtener más información sobre cómo ejecutar la inferencia, consulta los notebooks de YOLO26.

Recuerda que necesitarás los archivos XML y BIN, así como cualquier configuración específica de la aplicación, como el tamaño de entrada, el factor de escala para la normalización, etc., para configurar y utilizar correctamente el modelo con el entorno de ejecución.

En tu aplicación de implementación, normalmente seguirías estos pasos:

  1. Inicializa OpenVINO creando core = Core().
  2. Carga el modelo usando el método core.read_model().
  3. Compila el modelo usando la función core.compile_model().
  4. Prepara la entrada (imagen, texto, audio, etc.).
  5. Ejecuta la inferencia usando compiled_model(input_data).

Para obtener pasos más detallados y fragmentos de código, consulta la documentación de OpenVINO o el tutorial de la API.

Link to this sectionBenchmarks de YOLO26 en OpenVINO#

El equipo de Ultralytics ha evaluado YOLO26 en varios formatos de modelo y precision, evaluando la velocidad y la precisión en diferentes dispositivos Intel compatibles con OpenVINO.

Nota
  • Los resultados de los benchmarks a continuación son de referencia y pueden variar según la configuración exacta del hardware y software de un sistema, así como de la carga de trabajo actual del sistema en el momento en que se ejecutan los benchmarks.

  • All benchmarks were run with openvino Python package version 2026.2.0.

  • Los modelos YOLO26 en NPU solo son compatibles con sistemas Intel® Core™ Ultra™ de la serie 2xxV y serie 3xx y superiores.

Link to this sectionIntel® Core™ Ultra#

La serie Intel® Core™ Ultra™ representa un nuevo estándar en la informática de alto rendimiento, diseñada para satisfacer las demandas cambiantes de los usuarios modernos, desde jugadores y creadores hasta profesionales que aprovechan la IA. Esta línea de nueva generación es más que una serie de CPU tradicional; combina potentes núcleos de CPU, capacidades de GPU integrada de alto rendimiento y una NPU (Neural Processing Unit) dedicada en un solo chip, ofreciendo una solución unificada para cargas de trabajo informáticas diversas e intensivas.

En el corazón de la arquitectura Intel® Core Ultra™ se encuentra un diseño híbrido que permite un rendimiento excepcional en tareas de procesamiento tradicionales, cargas de trabajo aceleradas por GPU y operaciones impulsadas por IA. La inclusión de la NPU mejora la inferencia de IA en el dispositivo, permitiendo un aprendizaje automático y un procesamiento de datos más rápidos y eficientes en una amplia gama de aplicaciones.

La familia Core Ultra™ incluye varios modelos adaptados a diferentes necesidades de rendimiento, con opciones que van desde diseños energéticamente eficientes hasta variantes de alta potencia marcadas con la designación "H", ideales para portátiles y formatos compactos que requieren una potencia de cálculo seria. En toda la gama, los usuarios se benefician de la sinergia de la integración de CPU, GPU y NPU, lo que proporciona una eficiencia, capacidad de respuesta y capacidades multitarea notables.

Como parte de la innovación continua de Intel, la serie Core Ultra™ establece un nuevo estándar para la informática preparada para el futuro. Con múltiples modelos disponibles y más en el horizonte, esta serie subraya el compromiso de Intel de ofrecer soluciones de vanguardia para la próxima generación de dispositivos inteligentes mejorados con IA.

Los benchmarks que se muestran a continuación se ejecutan en Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V e Intel® Core™ Ultra™ 7 155H a una precisión de FP32, FP16 e INT8.

Link to this sectionIntel® Core™ Ultra™ X7 358H#

Benchmarks
Intel Core Ultra GPU benchmarks
Resultados detallados de los benchmarks
ModeloFormatoPrecisiónEstadoTamaño (MB)métricas/mAP50-95(B)Tiempo de inferencia (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Link to this sectionIntel® Core™ Ultra™ 7 258V#

Benchmarks
Intel Core Ultra GPU benchmarks
Resultados detallados de los benchmarks
ModeloFormatoPrecisiónEstadoTamaño (MB)métricas/mAP50-95(B)Tiempo de inferencia (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Link to this sectionIntel® Core™ Ultra™ 7 155H#

Benchmarks
Intel Core Ultra GPU benchmarks
Resultados detallados de los benchmarks
ModeloFormatoPrecisiónEstadoTamaño (MB)métricas/mAP50-95(B)Tiempo de inferencia (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538,77
YOLO26nOpenVINOFP329.60,47749.87
YOLO26nOpenVINOFP165.10,47749,84
YOLO26nOpenVINOINT83.20,47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369,54
YOLO26sOpenVINOFP3236.70.561617,29
YOLO26sOpenVINOFP1618.60.561617,06
YOLO26sOpenVINOINT810.00,545210,33
YOLO26mPyTorch (CPU)FP3242.20.6196192,22
YOLO26mOpenVINOFP3278.30,618734,64
YOLO26mOpenVINOFP1639.50,618734,75
YOLO26mOpenVINOINT820.50,607315,99
YOLO26lPyTorch (CPU)FP3250.70.6215245,62
YOLO26lOpenVINOFP3295.30,620243.7
YOLO26lOpenVINOFP1648.10,620244,65
YOLO26lOpenVINOINT825.20,604820,31
YOLO26xPyTorch (CPU)FP32113.20.6512513,06
YOLO26xOpenVINOFP32213.20,654480,19
YOLO26xOpenVINOFP16107.10,654479,83
YOLO26xOpenVINOINT854.80,639335,16

Link to this sectionReproduce nuestros resultados#

Para reproducir los benchmarks de Ultralytics anteriores en todos los formatos de exportación, ejecuta este código:

Ejemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

Ten en cuenta que los resultados de los benchmarks pueden variar según la configuración exacta de hardware y software de un sistema, así como de la carga de trabajo actual del sistema en el momento en que se ejecutan. Para obtener los resultados más fiables, utiliza un dataset con un gran número de imágenes, por ejemplo data='coco.yaml' (5000 imágenes de validación).

Link to this sectionConclusión#

Los resultados de los benchmarks demuestran claramente las ventajas de exportar el modelo YOLO26 al formato OpenVINO. En diferentes modelos y plataformas de hardware, el formato OpenVINO supera constantemente a otros formatos en términos de velocidad de inferencia mientras mantiene una precisión comparable.

Los benchmarks subrayan la eficacia de OpenVINO como herramienta para implementar modelos de aprendizaje profundo. Al convertir los modelos al formato OpenVINO, los desarrolladores pueden conseguir mejoras de rendimiento significativas, lo que facilita la implementación de estos modelos en aplicaciones del mundo real.

Para obtener información más detallada e instrucciones sobre el uso de OpenVINO, consulta la documentación oficial de OpenVINO.

Link to this sectionFAQ#

Link to this section¿Cómo puedo exportar modelos YOLO26 al formato OpenVINO?#

Exportar modelos YOLO26 al formato OpenVINO puede mejorar significativamente la velocidad de la CPU y permitir aceleraciones de GPU y NPU en hardware Intel. Para exportar, puedes usar Python o la CLI como se muestra a continuación:

Ejemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

Para obtener más información, consulta la documentación de formatos de exportación.

Link to this section¿Cuáles son las ventajas de usar OpenVINO con modelos YOLO26?#

Usar el kit de herramientas OpenVINO de Intel con modelos YOLO26 ofrece varias ventajas:

  1. Rendimiento: logra una aceleración de hasta 3x en la inferencia de la CPU y aprovecha las GPU y NPU de Intel para la aceleración.
  2. Optimizador de modelos: convierte, optimiza y ejecuta modelos de frameworks populares como PyTorch, TensorFlow y ONNX.
  3. Facilidad de uso: hay disponible una gran colección de cuadernos de tutoriales para ayudar a los usuarios a empezar, incluidos algunos para YOLO26.
  4. Ejecución heterogénea: implementa modelos en varios hardwares de Intel con una API unificada.

Para ver comparaciones de rendimiento detalladas, visita nuestra sección de benchmarks.

Link to this section¿Cómo puedo ejecutar la inferencia usando un modelo YOLO26 exportado a OpenVINO?#

Después de exportar un modelo YOLO26n al formato OpenVINO, puedes ejecutar la inferencia usando Python o la CLI:

Ejemplo
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

Consulta nuestra documentación del modo de predicción para obtener más detalles.

Link to this section¿Por qué debería elegir Ultralytics YOLO26 sobre otros modelos para la exportación a OpenVINO?#

Ultralytics YOLO26 está optimizado para la detección de objetos en tiempo real con alta precisión y velocidad. Específicamente, cuando se combina con OpenVINO, YOLO26 proporciona:

  • Hasta 3x de aceleración en CPUs Intel
  • Implementación fluida en GPUs y NPUs Intel
  • Precisión consistente y comparable en varios formatos de exportación

Para un análisis de rendimiento en profundidad, consulta nuestros benchmarks de YOLO26 detallados en diferentes hardwares.

Link to this section¿Puedo hacer benchmarks de modelos YOLO26 en diferentes formatos como PyTorch, ONNX y OpenVINO?#

Sí, puedes hacer benchmarks de modelos YOLO26 en varios formatos, incluyendo PyTorch, TorchScript, ONNX y OpenVINO. Utiliza el siguiente fragmento de código para ejecutar benchmarks en el dataset que elijas:

Ejemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

Para obtener resultados detallados de los benchmarks, consulta nuestra sección de benchmarks y la documentación de formatos de exportación.

Comentarios