Meet YOLO26: next-gen vision AI.

Link to this sectionExportação para Intel OpenVINO#

OpenVINO Intel AI inference toolkit

Neste guia, abordamos a exportação de modelos YOLO26 para o formato OpenVINO, que pode proporcionar até 3x de aceleração em CPU, além de acelerar a inferência YOLO em hardware de GPU e NPU da Intel.

OpenVINO, abreviação de Open Visual Inference & Neural Network Optimization toolkit, é um kit de ferramentas abrangente para otimizar e implantar modelos de inferência de IA. Embora o nome contenha Visual, o OpenVINO também suporta várias tarefas adicionais, incluindo linguagem, áudio, séries temporais, etc.



Watch: How to Export Ultralytics YOLO26 to Intel OpenVINO Format for Faster Inference 🚀

Link to this sectionExemplos de Uso#

O formato OpenVINO suporta os modos Export, Predict e Validate. Exporte seu modelo e, em seguida, carregue o modelo exportado para executar a inferência ou validar sua precisão em CPU, GPU integrada/discreta ou NPU da Intel.

Exportar
from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export the model to OpenVINO format
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'
Prever
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Run inference on a specific device, available devices: ["intel:gpu", "intel:npu", "intel:cpu"]
results = model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")
Validar
from ultralytics import YOLO

# Load the exported OpenVINO model
model = YOLO("yolo26n_openvino_model/")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionArgumentos de Exportação#

ArgumentoTipoPadrãoDescrição
formatstr'openvino'Formato de destino para o modelo exportado, definindo a compatibilidade com vários ambientes de implantação.
imgszint ou tuple640Tamanho de imagem desejado para a entrada do modelo. Pode ser um número inteiro para imagens quadradas ou uma tupla (height, width) para dimensões específicas.
halfboolFalseAtiva a quantização FP16 (precisão metade), reduzindo o tamanho do modelo e potencialmente acelerando a inferência em hardware compatível.
int8boolFalseAtiva a quantização INT8, comprimindo ainda mais o modelo e acelerando a inferência com perda mínima de accuracy, principalmente para dispositivos de borda.
dynamicboolFalsePermite tamanhos de entrada dinâmicos, aumentando a flexibilidade ao lidar com dimensões de imagem variáveis.
nmsboolFalseAdiciona Non-Maximum Suppression (NMS), essencial para um pós-processamento de detecção preciso e eficiente.
batchint1Especifica o tamanho da inferência em lote do modelo de exportação ou o número máximo de imagens que o modelo exportado processará simultaneamente no modo predict.
datastr'coco8.yaml'Caminho para o arquivo de configuração do dataset (padrão: coco8.yaml), essencial para a quantização.
fractionfloat1.0Especifica a fração do dataset a ser usada para a calibração da quantização INT8. Permite a calibração em um subconjunto do dataset completo, útil para experimentos ou quando os recursos são limitados. Se não for especificado com INT8 ativado, o dataset completo será usado.

Para mais detalhes sobre o processo de exportação, visite a página de documentação da Ultralytics sobre exportação.

Aviso

O OpenVINO™ é compatível com a maioria dos processadores Intel®, mas para garantir o desempenho ideal:

  1. Verifique o suporte ao OpenVINO™ Verifique se o seu chip Intel® é oficialmente suportado pelo OpenVINO™ usando a lista de compatibilidade da Intel.

  2. Identifique seu acelerador Determine se o seu processador inclui uma NPU (Neural Processing Unit) integrada ou GPU (GPU integrada) consultando o guia de hardware da Intel.

  3. Instale os drivers mais recentes Se o seu chip suporta uma NPU ou GPU, mas o OpenVINO™ não a está detectando, você pode precisar instalar ou atualizar os drivers associados. Siga as instruções de instalação de drivers para ativar a aceleração total.

Seguindo esses três passos, você pode garantir que o OpenVINO™ funcione de forma otimizada em seu hardware Intel®.

Link to this sectionBenefícios do OpenVINO#

  1. Desempenho: O OpenVINO oferece inferência de alto desempenho utilizando a potência de CPUs Intel, GPUs integradas e discretas, e FPGAs.
  2. Suporte para Execução Heterogênea: O OpenVINO fornece uma API para escrever uma vez e implantar em qualquer hardware Intel suportado (CPU, GPU, FPGA, VPU, etc.).
  3. Otimizador de Modelo: O OpenVINO fornece um Otimizador de Modelo que importa, converte e otimiza modelos de estruturas populares de deep learning como PyTorch, TensorFlow, TensorFlow Lite, Keras, ONNX, PaddlePaddle e Caffe.
  4. Facilidade de Uso: O kit de ferramentas vem com uma grande coleção de notebooks de tutoriais (incluindo otimização YOLO26) ensinando diferentes aspectos do kit de ferramentas.

Link to this sectionEstrutura de Exportação OpenVINO#

Ao exportar um modelo para o formato OpenVINO, o resultado é um diretório contendo o seguinte:

  1. Arquivo XML: Descreve a topologia da rede.
  2. Arquivo BIN: Contém os dados binários de pesos e vieses.
  3. Arquivo de mapeamento: Contém o mapeamento dos tensores de saída do modelo original para os nomes dos tensores do OpenVINO.

Você pode usar esses arquivos para executar a inferência com o OpenVINO Inference Engine.

Link to this sectionUsando a Exportação OpenVINO na Implantação#

Uma vez que seu modelo é exportado com sucesso para o formato OpenVINO, você tem duas opções principais para executar a inferência:

  1. Use o pacote ultralytics, que fornece uma API de alto nível e encapsula o OpenVINO Runtime.

  2. Use o pacote nativo openvino para um controle mais avançado ou personalizado sobre o comportamento da inferência.

Link to this sectionInferência com Ultralytics#

O pacote ultralytics permite que você execute facilmente a inferência usando o modelo OpenVINO exportado através do método predict. Você também pode especificar o dispositivo de destino (por exemplo, intel:gpu, intel:npu, intel:cpu) usando o argumento device.

from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")  # the path of your exported OpenVINO model
# Run inference with the exported model
ov_model.predict(device="intel:gpu")  # specify the device you want to run inference on

Essa abordagem é ideal para prototipagem rápida ou implantação quando você não precisa de controle total sobre o pipeline de inferência.

Link to this sectionInferência com OpenVINO Runtime#

O OpenVINO Runtime fornece uma API unificada para inferência em todo o hardware Intel suportado. Ele também oferece recursos avançados como balanceamento de carga em hardware Intel e execução assíncrona. Para obter mais informações sobre como executar a inferência, consulte os notebooks do YOLO26.

Lembre-se de que você precisará dos arquivos XML e BIN, bem como de quaisquer configurações específicas da aplicação, como tamanho de entrada, fator de escala para normalização, etc., para configurar e usar corretamente o modelo com o Runtime.

Em sua aplicação de implantação, você normalmente seguiria estes passos:

  1. Inicialize o OpenVINO criando core = Core().
  2. Carregue o modelo usando o método core.read_model().
  3. Compile o modelo usando a função core.compile_model().
  4. Prepare a entrada (imagem, texto, áudio, etc.).
  5. Execute a inferência usando compiled_model(input_data).

Para passos mais detalhados e trechos de código, consulte a documentação do OpenVINO ou o tutorial da API.

Link to this sectionBenchmarks do YOLO26 com OpenVINO#

A equipe da Ultralytics avaliou o YOLO26 em vários formatos de modelo e precision, avaliando velocidade e precisão em diferentes dispositivos Intel compatíveis com o OpenVINO.

Nota
  • Os resultados do benchmarking abaixo são para referência e podem variar com base na configuração exata de hardware e software de um sistema, bem como na carga de trabalho atual do sistema no momento em que os benchmarks são executados.

  • Todos os benchmarks foram executados com a versão do pacote Python openvino 2026.2.0.dev20260501. Atualizaremos os benchmarks com a versão estável assim que a versão 2026.2.0 for lançada.

  • Os modelos YOLO26 na NPU são suportados apenas em sistemas Intel® Core™ Ultra™ com a série 2xxV e série 3xx e superiores.

Link to this sectionIntel® Core™ Ultra#

A série Intel® Core™ Ultra™ representa um novo benchmark em computação de alto desempenho, projetada para atender às demandas crescentes dos usuários modernos — desde jogadores e criadores até profissionais que utilizam IA. Esta linha de próxima geração é mais do que uma série de CPUs tradicionais; ela combina núcleos de CPU poderosos, recursos de GPU integrada de alto desempenho e uma Unidade de Processamento Neural (NPU) dedicada dentro de um único chip, oferecendo uma solução unificada para diversas e intensas cargas de trabalho computacionais.

No coração da arquitetura Intel® Core Ultra™ está um design híbrido que permite um desempenho excepcional em tarefas de processamento tradicionais, cargas de trabalho aceleradas por GPU e operações orientadas por IA. A inclusão da NPU aprimora a inferência de IA no dispositivo, permitindo um aprendizado de máquina e processamento de dados mais rápidos e eficientes em uma ampla gama de aplicações.

A família Core Ultra™ inclui vários modelos adaptados para diferentes necessidades de desempenho, com opções que variam de designs energeticamente eficientes a variantes de alta potência marcadas pela designação "H" — ideal para laptops e fatores de forma compactos que exigem sério poder computacional. Em toda a linha, os usuários se beneficiam da sinergia da integração de CPU, GPU e NPU, proporcionando notável eficiência, capacidade de resposta e recursos multitarefa.

Como parte da inovação contínua da Intel, a série Core Ultra™ estabelece um novo padrão para a computação preparada para o futuro. Com vários modelos disponíveis e mais por vir, esta série ressalta o compromisso da Intel em oferecer soluções de ponta para a próxima geração de dispositivos inteligentes aprimorados por IA.

Os benchmarks abaixo foram executados no Intel® Core™ Ultra™ X7 358H, Intel® Core™ Ultra™ 7 258V e Intel® Core™ Ultra™ 7 155H nas precisões FP32, FP16 e INT8.

Link to this sectionIntel® Core™ Ultra™ X7 358H#

Benchmarks
Intel Core Ultra GPU benchmarks
Resultados Detalhados do Benchmark
ModeloFormatoPrecisãoStatusTamanho (MB)metrics/mAP50-95(B)Tempo de inferência (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476525.18
YOLO26nOpenVINOFP329.60.47632.67
YOLO26nOpenVINOFP165.10.47632.64
YOLO26nOpenVINOINT83.20.46252.73
YOLO26sPyTorch (CPU)FP3219.50.570350.09
YOLO26sOpenVINOFP3236.70.56153.57
YOLO26sOpenVINOFP1618.60.56153.55
YOLO26sOpenVINOINT810.00.5473.09
YOLO26mPyTorch (CPU)FP3242.20.6196135.1
YOLO26mOpenVINOFP3278.30.61685.64
YOLO26mOpenVINOFP1639.50.61685.85
YOLO26mOpenVINOINT820.50.59944.14
YOLO26lPyTorch (CPU)FP3250.70.6215169.75
YOLO26lOpenVINOFP3295.30.62068.14
YOLO26lOpenVINOFP1648.10.62068.18
YOLO26lOpenVINOINT825.20.59994.67
YOLO26xPyTorch (CPU)FP32113.20.6512407.56
YOLO26xOpenVINOFP32213.20.656913.11
YOLO26xOpenVINOFP16107.10.656913.15
YOLO26xOpenVINOINT854.80.63749.24

Link to this sectionIntel® Core™ Ultra™ 7 258V#

Benchmarks
Intel Core Ultra GPU benchmarks
Resultados Detalhados do Benchmark
ModeloFormatoPrecisãoStatusTamanho (MB)metrics/mAP50-95(B)Tempo de inferência (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476531.43
YOLO26nOpenVINOFP329.60.47623.57
YOLO26nOpenVINOFP165.10.47623.53
YOLO26nOpenVINOINT83.20.46253.65
YOLO26sPyTorch (CPU)FP3219.50.570360.4
YOLO26sOpenVINOFP3236.70.56165.02
YOLO26sOpenVINOFP1618.60.56165.01
YOLO26sOpenVINOINT810.00.5474.31
YOLO26mPyTorch (CPU)FP3242.20.6196173.31
YOLO26mOpenVINOFP3278.30.61919.48
YOLO26mOpenVINOFP1639.50.61689.6
YOLO26mOpenVINOINT820.50.59946.03
YOLO26lPyTorch (CPU)FP3250.70.6173224.52
YOLO26lOpenVINOFP3295.30.372511.88
YOLO26lOpenVINOFP1648.10.620112.0
YOLO26lOpenVINOINT825.20.59998.47
YOLO26xPyTorch (CPU)FP32113.20.6512595.72
YOLO26xOpenVINOFP32213.20.656720.26
YOLO26xOpenVINOFP16107.10.645420.25
YOLO26xOpenVINOINT854.80.637414.77

Link to this sectionIntel® Core™ Ultra™ 7 155H#

Benchmarks
Intel Core Ultra GPU benchmarks
Resultados Detalhados do Benchmark
ModeloFormatoPrecisãoStatusTamanho (MB)metrics/mAP50-95(B)Tempo de inferência (ms/im)
YOLO26nPyTorch (CPU)FP325.30.476538.77
YOLO26nOpenVINOFP329.60.47749.87
YOLO26nOpenVINOFP165.10.47749.84
YOLO26nOpenVINOINT83.20.47055.86
YOLO26sPyTorch (CPU)FP3219.50.570369.54
YOLO26sOpenVINOFP3236.70.561617.29
YOLO26sOpenVINOFP1618.60.561617.06
YOLO26sOpenVINOINT810.00.545210.33
YOLO26mPyTorch (CPU)FP3242.20.6196192.22
YOLO26mOpenVINOFP3278.30.618734.64
YOLO26mOpenVINOFP1639.50.618734.75
YOLO26mOpenVINOINT820.50.607315.99
YOLO26lPyTorch (CPU)FP3250.70.6215245.62
YOLO26lOpenVINOFP3295.30.620243.7
YOLO26lOpenVINOFP1648.10.620244.65
YOLO26lOpenVINOINT825.20.604820.31
YOLO26xPyTorch (CPU)FP32113.20.6512513.06
YOLO26xOpenVINOFP32213.20.654480.19
YOLO26xOpenVINOFP16107.10.654479.83
YOLO26xOpenVINOINT854.80.639335.16

Link to this sectionReproduz os nossos resultados#

Para reproduzir os benchmarks da Ultralytics acima em todos os formatos de exportação, executa este código:

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml")

Nota que os resultados do benchmarking podem variar com base na configuração exata de hardware e software de um sistema, bem como na carga de trabalho atual do sistema no momento em que os benchmarks são executados. Para obteres os resultados mais fiáveis, utiliza um conjunto de dados com um grande número de imagens, i.e. data='coco.yaml' (5000 imagens de validação).

Link to this sectionConclusão#

Os resultados do benchmarking demonstram claramente os benefícios de exportar o modelo YOLO26 para o formato OpenVINO. Em diferentes modelos e plataformas de hardware, o formato OpenVINO supera consistentemente outros formatos em termos de velocidade de inferência, mantendo uma precisão comparável.

Os benchmarks sublinham a eficácia do OpenVINO como uma ferramenta para implementar modelos de aprendizagem profunda. Ao converter modelos para o formato OpenVINO, os programadores podem obter melhorias de desempenho significativas, tornando mais fácil implementar estes modelos em aplicações do mundo real.

Para informações mais detalhadas e instruções sobre como usar o OpenVINO, consulta a documentação oficial do OpenVINO.

Link to this sectionFAQ#

Link to this sectionComo posso exportar modelos YOLO26 para o formato OpenVINO?#

Exportar modelos YOLO26 para o formato OpenVINO pode melhorar significativamente a velocidade do CPU e permitir acelerações de GPU e NPU em hardware da Intel. Para exportar, podes usar Python ou CLI como mostrado abaixo:

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model
model.export(format="openvino")  # creates 'yolo26n_openvino_model/'

Para mais informações, consulta a documentação de formatos de exportação.

Link to this sectionQuais são os benefícios de usar o OpenVINO com modelos YOLO26?#

Usar o kit de ferramentas OpenVINO da Intel com modelos YOLO26 oferece vários benefícios:

  1. Desempenho: Atinge até 3x de aceleração na inferência por CPU e aproveita GPUs e NPUs da Intel para aceleração.
  2. Model Optimizer: Converte, otimiza e executa modelos de estruturas populares como PyTorch, TensorFlow e ONNX.
  3. Facilidade de uso: Está disponível uma grande coleção de blocos de notas de tutoriais para ajudar os utilizadores a começar, incluindo alguns para YOLO26.
  4. Execução Heterogénea: Implementa modelos em vários hardwares da Intel com uma API unificada.

Para comparações detalhadas de desempenho, visita a nossa secção de benchmarks.

Link to this sectionComo posso executar a inferência usando um modelo YOLO26 exportado para o OpenVINO?#

Após exportares um modelo YOLO26n para o formato OpenVINO, podes executar a inferência usando Python ou CLI:

Exemplo
from ultralytics import YOLO

# Load the exported OpenVINO model
ov_model = YOLO("yolo26n_openvino_model/")

# Run inference
results = ov_model("https://ultralytics.com/images/bus.jpg")

Consulta a nossa documentação de modo de previsão para mais detalhes.

Link to this sectionPor que devo escolher o Ultralytics YOLO26 em vez de outros modelos para a exportação OpenVINO?#

O Ultralytics YOLO26 está otimizado para deteção de objetos em tempo real com alta precisão e velocidade. Especificamente, quando combinado com o OpenVINO, o YOLO26 oferece:

  • Até 3x de aceleração em CPUs Intel
  • Implementação perfeita em GPUs e NPUs Intel
  • Precisão consistente e comparável em vários formatos de exportação

Para uma análise de desempenho aprofundada, verifica os nossos benchmarks do YOLO26 detalhados em diferentes hardwares.

Link to this sectionPosso fazer o benchmarking de modelos YOLO26 em diferentes formatos como PyTorch, ONNX e OpenVINO?#

Sim, podes fazer o benchmarking de modelos YOLO26 em vários formatos, incluindo PyTorch, TorchScript, ONNX e OpenVINO. Usa o seguinte fragmento de código para executar benchmarks no conjunto de dados escolhido:

Exemplo
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and [accuracy](https://www.ultralytics.com/glossary/accuracy) on the COCO8 dataset for all export formats
results = model.benchmark(data="coco8.yaml")

Para resultados detalhados de benchmarks, consulta a nossa secção de benchmarks e a documentação de formatos de exportação.

Comentários