Exportação para Intel OpenVINO
Neste guia, abordamos a exportação de modelos YOLO26 para o formato OpenVINO, que pode fornecer um ganho de velocidade de até 3x em CPU, além de acelerar a inferência YOLO em hardware GPU e NPU da Intel.
OpenVINO, sigla para Open Visual Inference & Neural Network Optimization toolkit, é um kit de ferramentas abrangente para otimizar e implantar modelos de inferência de IA. Embora o nome contenha Visual, o OpenVINO também suporta várias tarefas adicionais, incluindo linguagem, áudio, séries temporais, etc.
Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀
Exemplos de uso
Exporte um modelo YOLO26n para o formato OpenVINO e execute a inferência com o modelo exportado.
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model
model.export(format="openvino") # creates 'yolo26n_openvino_model/'
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")
# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")
# Run inference with specified device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = ov_model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")Argumentos de exportação
| Argumento | Tipo | Padrão | Descrição |
|---|---|---|---|
format | str | 'openvino' | Formato de destino para o modelo exportado, definindo a compatibilidade com vários ambientes de implantação. |
imgsz | int ou tuple | 640 | Desired image size for the model input. Can be an integer for square images or a tuple (height, width) for specific dimensions. |
half | bool | False | Ativa a quantização FP16 (precisão metade), reduzindo o tamanho do modelo e potencialmente acelerando a inferência em hardware compatível. |
int8 | bool | False | Ativa a quantização INT8, comprimindo ainda mais o modelo e acelerando a inferência com perda mínima de precisão, principalmente para dispositivos de borda. |
dynamic | bool | False | Permite tamanhos de entrada dinâmicos, aumentando a flexibilidade ao lidar com dimensões de imagem variáveis. |
nms | bool | False | Adiciona Non-Maximum Suppression (NMS), essencial para o pós-processamento de detecção preciso e eficiente. |
batch | int | 1 | Especifica o tamanho da inferência em lote do modelo de exportação ou o número máximo de imagens que o modelo exportado processará simultaneamente no modo predict. |
data | str | 'coco8.yaml' | Caminho para o arquivo de configuração do dataset (padrão: coco8.yaml), essencial para a quantização. |
fraction | float | 1.0 | Especifica a fração do conjunto de dados a ser usada para a calibração da quantização INT8. Permite calibrar em um subconjunto do conjunto de dados completo, útil para experimentos ou quando os recursos são limitados. Se não for especificado com INT8 ativado, o conjunto de dados completo será usado. |
Para mais detalhes sobre o processo de exportação, visite a página de documentação da Ultralytics sobre exportação.
O OpenVINO™ é compatível com a maioria dos processadores Intel®, mas para garantir o desempenho ideal:
-
Verifique o suporte ao OpenVINO™ Verifique se o seu chip Intel® é oficialmente suportado pelo OpenVINO™ usando a lista de compatibilidade da Intel.
-
Identifique seu acelerador Determine se o seu processador inclui uma NPU (Neural Processing Unit) integrada ou GPU (GPU integrada) consultando o guia de hardware da Intel.
-
Instale os drivers mais recentes Se o seu chip suporta uma NPU ou GPU, mas o OpenVINO™ não a detecta, talvez seja necessário instalar ou atualizar os drivers associados. Siga as instruções de instalação de drivers para ativar a aceleração total.
Ao seguir estes três passos, você pode garantir que o OpenVINO™ funcione de forma otimizada no seu hardware Intel®.
Benefícios do OpenVINO
- Desempenho: O OpenVINO oferece inferência de alto desempenho utilizando o poder de CPUs Intel, GPUs integradas e discretas, e FPGAs.
- Suporte para Execução Heterogênea: O OpenVINO fornece uma API para escrever uma vez e implantar em qualquer hardware Intel suportado (CPU, GPU, FPGA, VPU, etc.).
- Otimizador de Modelo: O OpenVINO fornece um Otimizador de Modelo que importa, converte e otimiza modelos de estruturas populares de deep learning, como PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle e Caffe.
- Facilidade de uso: O kit de ferramentas vem com mais de 80 notebooks de tutorial (incluindo otimização YOLO26) ensinando diferentes aspectos do kit de ferramentas.
Estrutura de Exportação do OpenVINO
Ao exportar um modelo para o formato OpenVINO, o resultado é um diretório contendo o seguinte:
- Arquivo XML: Descreve a topologia da rede.
- Arquivo BIN: Contém os dados binários de pesos e vieses.
- Arquivo de mapeamento: Mantém o mapeamento dos tensores de saída do modelo original para os nomes dos tensores OpenVINO.
Você pode usar esses arquivos para executar a inferência com o mecanismo de inferência OpenVINO (Inference Engine).
Usando a exportação OpenVINO na implantação
Uma vez que seu modelo seja exportado com sucesso para o formato OpenVINO, você tem duas opções principais para executar a inferência:
-
Use o pacote
ultralytics, que fornece uma API de alto nível e envolve o Runtime OpenVINO. -
Use o pacote
openvinonativo para um controle mais avançado ou personalizado sobre o comportamento da inferência.
Inferência com Ultralytics
O pacote ultralytics permite que você execute facilmente a inferência usando o modelo OpenVINO exportado através do método predict. Você também pode especificar o dispositivo de destino (por exemplo, intel:gpu, intel:npu, intel:cpu) usando o argumento device.
from ultralytics import YOLO
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/") # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu") # specify the device you want to run inference onEssa abordagem é ideal para prototipagem rápida ou implantação quando você não precisa de controle total sobre o pipeline de inferência.
Inferência com o Runtime OpenVINO
O Runtime OpenVINO fornece uma API unificada para inferência em todo o hardware Intel suportado. Ele também oferece recursos avançados como balanceamento de carga entre hardwares Intel e execução assíncrona. Para obter mais informações sobre como executar a inferência, consulte os notebooks YOLO26.
Lembre-se, você precisará dos arquivos XML e BIN, bem como de quaisquer configurações específicas do aplicativo, como tamanho da entrada, fator de escala para normalização, etc., para configurar e usar corretamente o modelo com o Runtime.
No seu aplicativo de implantação, você normalmente seguiria estes passos:
- Inicialize o OpenVINO criando
core = Core(). - Carregue o modelo usando o método
core.read_model(). - Compile o modelo usando a função
core.compile_model(). - Prepare a entrada (imagem, texto, áudio, etc.).
- Execute a inferência usando
compiled_model(input_data).
Para etapas mais detalhadas e trechos de código, consulte a documentação do OpenVINO ou o tutorial da API.
Benchmarks YOLO26 no OpenVINO
A equipe da Ultralytics realizou o benchmarking do YOLO26 em vários formatos de modelo e precisão, avaliando velocidade e precisão em diferentes dispositivos Intel compatíveis com OpenVINO.
-
Os resultados de benchmarking abaixo são para referência e podem variar com base na configuração exata de hardware e software de um sistema, bem como na carga de trabalho atual do sistema no momento em que os benchmarks são executados.
-
All benchmarks were run with
openvinoPython package version 2026.2.0.dev20260501. We will update benchmarks with stable build once version 2026.2.0 is released. -
Modelos YOLO26 em NPU são suportados apenas em sistemas Intel® Core™ Ultra™ com série 2xxV e série 3xx e superiores.
Intel® Core™ Ultra
A série Intel® Core™ Ultra™ representa um novo benchmark em computação de alto desempenho, projetada para atender às demandas crescentes dos usuários modernos — de gamers e criadores a profissionais que aproveitam a IA. Esta linha de próxima geração é mais do que uma série de CPU tradicional; ela combina núcleos de CPU poderosos, recursos integrados de GPU de alto desempenho e uma NPU (Neural Processing Unit) dedicada dentro de um único chip, oferecendo uma solução unificada para cargas de trabalho computacionais diversas e intensivas.
No coração da arquitetura Intel® Core Ultra™ está um design híbrido que permite um desempenho excepcional em tarefas de processamento tradicionais, cargas de trabalho aceleradas por GPU e operações impulsionadas por IA. A inclusão da NPU aprimora a inferência de IA no dispositivo, permitindo um aprendizado de máquina e um processamento de dados mais rápidos e eficientes em uma ampla gama de aplicações.
A família Core Ultra™ inclui vários modelos adaptados para diferentes necessidades de desempenho, com opções que variam de designs com eficiência energética a variantes de alta potência marcadas pela designação "H" — ideais para laptops e fatores de forma compactos que exigem sério poder de computação. Em toda a linha, os usuários se beneficiam da sinergia da integração de CPU, GPU e NPU, proporcionando eficiência, capacidade de resposta e recursos de multitarefa notáveis.
Como parte da inovação contínua da Intel, a série Core Ultra™ define um novo padrão para a computação preparada para o futuro. Com vários modelos disponíveis e mais no horizonte, esta série ressalta o compromisso da Intel em fornecer soluções de ponta para a próxima geração de dispositivos inteligentes e aprimorados por IA.
Os benchmarks abaixo foram executados em Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V e Intel® Core™ Ultra™ 7 155H nas precisões FP32, FP16 e INT8.
Intel® Core™ Ultra™ X7 358H
Resultados detalhados dos benchmarks
| Modelo | Formato | Precisão | Status | Tamanho (MB) | metrics/mAP50-95(B) | Tempo de inferência (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 25.18 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4763 | 2.67 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4763 | 2.64 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4625 | 2.73 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 50.09 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5615 | 3.57 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5615 | 3.55 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.547 | 3.09 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 135.1 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6168 | 5.64 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6168 | 5.85 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.5994 | 4.14 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6215 | 169.75 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.6206 | 8.14 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6206 | 8.18 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.5999 | 4.67 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 407.56 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6569 | 13.11 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6569 | 13.15 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6374 | 9.24 |
Intel® Core™ Ultra™ 7 258V
Resultados detalhados dos benchmarks
| Modelo | Formato | Precisão | Status | Tamanho (MB) | metrics/mAP50-95(B) | Tempo de inferência (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 31.43 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4762 | 3.57 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4762 | 3.53 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4625 | 3.65 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 60.4 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5616 | 5.02 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5616 | 5.01 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.547 | 4.31 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 173.31 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6191 | 9.48 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6168 | 9.6 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.5994 | 6.03 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6173 | 224.52 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.3725 | 11.88 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6201 | 12.0 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.5999 | 8.47 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 595.72 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6567 | 20.26 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6454 | 20.25 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6374 | 14.77 |
Intel® Core™ Ultra™ 7 155H
Resultados detalhados dos benchmarks
| Modelo | Formato | Precisão | Status | Tamanho (MB) | metrics/mAP50-95(B) | Tempo de inferência (ms/im) |
|---|---|---|---|---|---|---|
| YOLO26n | PyTorch (CPU) | FP32 | ✅ | 5.3 | 0.4765 | 38.77 |
| YOLO26n | OpenVINO | FP32 | ✅ | 9.6 | 0.4774 | 9.87 |
| YOLO26n | OpenVINO | FP16 | ✅ | 5.1 | 0.4774 | 9.84 |
| YOLO26n | OpenVINO | INT8 | ✅ | 3.2 | 0.4705 | 5.86 |
| YOLO26s | PyTorch (CPU) | FP32 | ✅ | 19.5 | 0.5703 | 69.54 |
| YOLO26s | OpenVINO | FP32 | ✅ | 36.7 | 0.5616 | 17.29 |
| YOLO26s | OpenVINO | FP16 | ✅ | 18.6 | 0.5616 | 17.06 |
| YOLO26s | OpenVINO | INT8 | ✅ | 10.0 | 0.5452 | 10.33 |
| YOLO26m | PyTorch (CPU) | FP32 | ✅ | 42.2 | 0.6196 | 192.22 |
| YOLO26m | OpenVINO | FP32 | ✅ | 78.3 | 0.6187 | 34.64 |
| YOLO26m | OpenVINO | FP16 | ✅ | 39.5 | 0.6187 | 34.75 |
| YOLO26m | OpenVINO | INT8 | ✅ | 20.5 | 0.6073 | 15.99 |
| YOLO26l | PyTorch (CPU) | FP32 | ✅ | 50.7 | 0.6215 | 245.62 |
| YOLO26l | OpenVINO | FP32 | ✅ | 95.3 | 0.6202 | 43.7 |
| YOLO26l | OpenVINO | FP16 | ✅ | 48.1 | 0.6202 | 44.65 |
| YOLO26l | OpenVINO | INT8 | ✅ | 25.2 | 0.6048 | 20.31 |
| YOLO26x | PyTorch (CPU) | FP32 | ✅ | 113.2 | 0.6512 | 513.06 |
| YOLO26x | OpenVINO | FP32 | ✅ | 213.2 | 0.6544 | 80.19 |
| YOLO26x | OpenVINO | FP16 | ✅ | 107.1 | 0.6544 | 79.83 |
| YOLO26x | OpenVINO | INT8 | ✅ | 54.8 | 0.6393 | 35.16 |
Reproduzir nossos resultados
Para reproduzir os benchmarks da Ultralytics acima em todos os formatos de exportação, execute este código:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")Tenha em mente que os resultados de benchmarking podem variar com base na configuração exata de hardware e software de um sistema, bem como na carga de trabalho atual do sistema no momento em que os benchmarks são executados. Para obter os resultados mais confiáveis, use um conjunto de dados com um grande número de imagens, ou seja, data='coco.yaml' (5000 imagens de validação).
Conclusão
Os resultados de benchmarking demonstram claramente os benefícios de exportar o modelo YOLO26 para o formato OpenVINO. Em diferentes modelos e plataformas de hardware, o formato OpenVINO supera consistentemente outros formatos em termos de velocidade de inferência, mantendo uma precisão comparável.
Os benchmarks destacam a eficácia do OpenVINO como uma ferramenta para implantar modelos de aprendizado profundo. Ao converter modelos para o formato OpenVINO, os desenvolvedores podem obter melhorias significativas de desempenho, facilitando a implantação desses modelos em aplicações do mundo real.
Para obter informações e instruções mais detalhadas sobre como usar o OpenVINO, consulte a documentação oficial do OpenVINO.
FAQ
Como exporto modelos YOLO26 para o formato OpenVINO?
Exportar modelos YOLO26 para o formato OpenVINO pode aumentar significativamente a velocidade da CPU e permitir acelerações de GPU e NPU em hardware Intel. Para exportar, você pode usar Python ou CLI, conforme mostrado abaixo:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model
model.export(format="openvino") # creates 'yolo26n_openvino_model/'Para obter mais informações, consulte a documentação de formatos de exportação.
Quais são os benefícios de usar o OpenVINO com modelos YOLO26?
Usar o kit de ferramentas OpenVINO da Intel com modelos YOLO26 oferece vários benefícios:
- Desempenho: Obtenha um aumento de velocidade de até 3x na inferência de CPU e aproveite as GPUs e NPUs da Intel para aceleração.
- Otimizador de Modelo: Converta, otimize e execute modelos de estruturas populares como PyTorch, TensorFlow e ONNX.
- Facilidade de uso: Mais de 80 notebooks de tutorial estão disponíveis para ajudar os usuários a começar, incluindo alguns para o YOLO26.
- Execução Heterogênea: Implante modelos em vários hardwares Intel com uma API unificada.
Para comparações de desempenho detalhadas, visite nossa seção de benchmarks.
Como posso executar a inferência usando um modelo YOLO26 exportado para o OpenVINO?
Após exportar um modelo YOLO26n para o formato OpenVINO, você pode executar a inferência usando Python ou CLI:
from ultralytics import YOLO
# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")
# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")Consulte nossa documentação do modo de predição para obter mais detalhes.
Por que devo escolher o Ultralytics YOLO26 em vez de outros modelos para exportação OpenVINO?
O Ultralytics YOLO26 é otimizado para detecção de objetos em tempo real com alta precisão e velocidade. Especificamente, quando combinado com o OpenVINO, o YOLO26 oferece:
- Até 3x de aumento de velocidade em CPUs Intel
- Implantação perfeita em GPUs e NPUs Intel
- Precisão consistente e comparável em vários formatos de exportação
Para uma análise de desempenho detalhada, confira nossos benchmarks do YOLO26 em diferentes hardwares.
Posso avaliar modelos YOLO26 em diferentes formatos, como PyTorch, ONNX e OpenVINO?
Sim, você pode avaliar modelos YOLO26 em vários formatos, incluindo PyTorch, TorchScript, ONNX e OpenVINO. Use o seguinte trecho de código para executar benchmarks em seu conjunto de dados escolhido:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")Para resultados detalhados de benchmark, consulte nossa seção de benchmarks e a documentação de formatos de exportação.