Link to this sectionOtimizando inferências do YOLO26 com o motor DeepSparse da Neural Magic#

Ao implementar modelos de detecção de objetos como o Ultralytics YOLO26 em diversos hardwares, podes encontrar problemas únicos como a otimização. É aqui que a integração do YOLO26 com o motor DeepSparse da Neural Magic entra em ação. Ele transforma a forma como os modelos YOLO26 são executados e permite um desempenho de nível de GPU diretamente em CPUs.

Este guia mostra-te como implementar o YOLO26 usando o DeepSparse da Neural Magic, como executar inferências e também como realizar benchmarks de desempenho para garantir que ele esteja otimizado.

Fim da vida útil do SparseML

A Neural Magic foi adquirida pela Red Hat em janeiro de 2025 e está descontinuando as versões comunitárias das suas bibliotecas deepsparse, sparseml, sparsezoo e sparsify. Para mais informações, consulta o aviso publicado no Readme do repositório GitHub sparsify.

Link to this sectionDeepSparse da Neural Magic#

Neural Magic's DeepSparse Overview

O DeepSparse da Neural Magic é um tempo de execução de inferência projetado para otimizar a execução de redes neurais em CPUs. Ele aplica técnicas avançadas como esparsidade, poda (pruning) e quantização para reduzir drasticamente as exigências computacionais, mantendo a precisão. O DeepSparse oferece uma solução ágil para a execução eficiente e escalável de redes neurais em diversos dispositivos.

Link to this sectionBenefícios de integrar o DeepSparse da Neural Magic com o YOLO26#

Antes de mergulhar em como implementar o YOLO26 usando o DeepSparse, vamos entender os benefícios de usar o DeepSparse. Algumas vantagens principais incluem:

Velocidade de inferência aprimorada: Alcança até 525 FPS (no YOLO11n), acelerando significativamente as capacidades de inferência do YOLO em comparação com métodos tradicionais.

Neural Magic DeepSparse inference acceleration

Eficiência do modelo otimizada: Usa poda e quantização para melhorar a eficiência do YOLO26, reduzindo o tamanho do modelo e os requisitos computacionais enquanto mantém a precisão.

Neural Magic model optimization and pruning

Alto desempenho em CPUs padrão: Oferece um desempenho semelhante ao de uma GPU em CPUs, proporcionando uma opção mais acessível e econômica para diversas aplicações.
Integração e implementação simplificadas: Oferece ferramentas fáceis de usar para uma integração simples do YOLO26 em aplicações, incluindo recursos de anotação de imagem e vídeo.
Suporte para diversos tipos de modelos: Compatível com modelos YOLO26 padrão e otimizados por esparsidade, adicionando flexibilidade à implementação.
Solução econômica e escalável: Reduz despesas operacionais e oferece uma implementação escalável de modelos avançados de detecção de objetos.

Link to this sectionComo funciona a tecnologia DeepSparse da Neural Magic?#

A tecnologia DeepSparse da Neural Magic é inspirada na eficiência do cérebro humano na computação de redes neurais. Ela adota dois princípios fundamentais do cérebro conforme abaixo:

Esparsidade: O processo de sparsification envolve a poda de informações redundantes de redes de deep learning, resultando em modelos menores e mais rápidos sem comprometer a precisão. Esta técnica reduz significativamente o tamanho da rede e as necessidades computacionais.
Localidade de referência: O DeepSparse utiliza um método de execução único, dividindo a rede em Colunas de Tensores (Tensor Columns). Estas colunas são executadas em profundidade, cabendo inteiramente dentro do cache da CPU. Esta abordagem imita a eficiência do cérebro, minimizando o movimento de dados e maximizando o uso do cache da CPU.

How Neural Magic's DeepSparse Technology Works

Link to this sectionCriando uma versão esparsa do YOLO26 treinada em um conjunto de dados personalizado#

SparseZoo, um repositório de modelos de código aberto da Neural Magic, oferece uma coleção de checkpoints de modelos YOLO26 pré-esparsificados. Com o SparseML, perfeitamente integrado com o Ultralytics, os utilizadores podem ajustar sem esforço estes checkpoints esparsos nos seus conjuntos de dados específicos usando uma interface de linha de comando direta.

Consulta a documentação do SparseML YOLO26 da Neural Magic para mais detalhes.

Link to this sectionUso: Implementando o YOLO26 usando o DeepSparse#

Implementar o YOLO26 com o DeepSparse da Neural Magic envolve alguns passos simples. Antes de mergulhar nas instruções de uso, certifica-te de verificar a gama de modelos YOLO26 oferecidos pela Ultralytics. Isto ajudar-te-á a escolher o modelo mais apropriado para os requisitos do teu projeto. Eis como podes começar.

Link to this sectionPasso 1: Instalação#

Para instalar os pacotes necessários, execute:

Instalação

# Install the required packages
pip install deepsparse[yolov8]

Link to this sectionPasso 2: Exportando o YOLO26 para o formato ONNX#

O motor DeepSparse requer modelos YOLO26 no formato ONNX. Exportar o teu modelo para este formato é essencial para a compatibilidade com o DeepSparse. Usa o seguinte comando para exportar modelos YOLO26:

Exportação de modelo

# Export YOLO26 model to ONNX format
yolo task=detect mode=export model=yolo26n.pt format=onnx opset=13

Este comando salvará o modelo yolo26n.onnx no teu disco.

Link to this sectionPasso 3: Implementando e executando inferências#

Com o teu modelo YOLO26 no formato ONNX, podes implementar e executar inferências usando o DeepSparse. Isto pode ser feito facilmente com a sua API Python intuitiva:

Implementando e executando inferências

from deepsparse import Pipeline

# Specify the path to your YOLO26 ONNX model
model_path = "path/to/yolo26n.onnx"

# Set up the DeepSparse Pipeline
yolo_pipeline = Pipeline.create(task="yolov8", model_path=model_path)

# Run the model on your images
images = ["path/to/image.jpg"]
pipeline_outputs = yolo_pipeline(images=images)

Link to this sectionPasso 4: Benchmarking de desempenho#

É importante verificar se o teu modelo YOLO26 está a ter um desempenho ideal no DeepSparse. Podes fazer um benchmark do desempenho do teu modelo para analisar a taxa de transferência e a latência:

Benchmarking

# Benchmark performance
deepsparse.benchmark model_path="path/to/yolo26n.onnx" --scenario=sync --input_shapes="[1,3,640,640]"

Link to this sectionPasso 5: Recursos adicionais#

O DeepSparse fornece recursos adicionais para a integração prática do YOLO26 em aplicações, como anotação de imagem e avaliação de conjuntos de dados.

Recursos adicionais

# For image annotation
deepsparse.yolov8.annotate --source "path/to/image.jpg" --model_filepath "path/to/yolo26n.onnx"

# For evaluating model performance on a dataset
deepsparse.yolov8.eval --model_path "path/to/yolo26n.onnx"

Executar o comando annotate processa a imagem especificada, detectando objetos e salvando a imagem anotada com caixas delimitadoras e classificações. A imagem anotada será armazenada numa pasta annotation-results. Isto ajuda a fornecer uma representação visual das capacidades de detecção do modelo.

Neural Magic annotation feature interface

Após executar o comando eval, receberás métricas de saída detalhadas como precisão, recall e mAP (média da Precisão Média). Isto fornece uma visão abrangente do desempenho do teu modelo no conjunto de dados e é particularmente útil para ajustar e otimizar os teus modelos YOLO26 para casos de uso específicos, garantindo alta precisão e eficiência.

Link to this sectionResumo#

Este guia explorou a integração do YOLO26 da Ultralytics com o motor DeepSparse da Neural Magic. Destacou como esta integração melhora o desempenho do YOLO26 em plataformas de CPU, oferecendo eficiência de nível de GPU e técnicas avançadas de esparsidade de redes neurais.

Para informações mais detalhadas e uso avançado, visita a documentação do DeepSparse da Neural Magic. Podes também explorar o guia de integração do YOLO26 e assistir a uma sessão passo a passo no YouTube.

Além disso, para uma compreensão mais ampla das diversas integrações do YOLO26, visita a página do guia de integração da Ultralytics, onde podes descobrir uma gama de outras possibilidades de integração interessantes.

Link to this sectionFAQ#

Link to this sectionO que é o motor DeepSparse da Neural Magic e como ele otimiza o desempenho do YOLO26?#

O motor DeepSparse da Neural Magic é um tempo de execução de inferência projetado para otimizar a execução de redes neurais em CPUs através de técnicas avançadas como esparsidade, poda e quantização. Ao integrar o DeepSparse com o YOLO26, podes alcançar um desempenho semelhante ao de uma GPU em CPUs padrão, aumentando significativamente a velocidade de inferência, a eficiência do modelo e o desempenho geral enquanto manténs a precisão. Para mais detalhes, confere a seção DeepSparse da Neural Magic.

Link to this sectionComo posso instalar os pacotes necessários para implementar o YOLO26 usando o DeepSparse da Neural Magic?#

Instalar os pacotes necessários para implementar o YOLO26 com o DeepSparse da Neural Magic é simples. Podes instalá-los facilmente usando a CLI. Eis o comando que precisas de executar:

pip install deepsparse[yolov8]

Uma vez instalado, segue os passos fornecidos na seção de Instalação para configurar o teu ambiente e começar a usar o DeepSparse com o YOLO26.

Link to this sectionComo converto modelos YOLO26 para o formato ONNX para uso com o DeepSparse?#

Para converter modelos YOLO26 para o formato ONNX, que é necessário para a compatibilidade com o DeepSparse, podes usar o seguinte comando CLI:

yolo task=detect mode=export model=yolo26n.pt format=onnx opset=13

Este comando exportará o teu modelo YOLO26 (yolo26n.pt) para um formato (yolo26n.onnx) que pode ser utilizado pelo motor DeepSparse. Mais informações sobre a exportação de modelos podem ser encontradas na seção de Exportação de Modelos.

Link to this sectionComo faço o benchmark do desempenho do YOLO26 no motor DeepSparse?#

Fazer o benchmark do desempenho do YOLO26 no DeepSparse ajuda-te a analisar a taxa de transferência e a latência para garantir que o teu modelo esteja otimizado. Podes usar o seguinte comando CLI para executar um benchmark:

deepsparse.benchmark model_path="path/to/yolo26n.onnx" --scenario=sync --input_shapes="[1,3,640,640]"

Este comando fornecer-te-á métricas de desempenho vitais. Para mais detalhes, vê a seção de Benchmarking de Desempenho.

Link to this sectionPor que devo usar o DeepSparse da Neural Magic com o YOLO26 para tarefas de detecção de objetos?#

Integrar o DeepSparse da Neural Magic com o YOLO26 oferece diversos benefícios:

Velocidade de inferência aprimorada: Alcança até 525 FPS (no YOLO11n), demonstrando as capacidades de otimização do DeepSparse.
Eficiência do modelo otimizada: Usa técnicas de esparsidade, poda e quantização para reduzir o tamanho do modelo e as necessidades computacionais, mantendo a precisão.
Alto desempenho em CPUs padrão: Oferece desempenho semelhante ao de uma GPU em hardware de CPU econômico.
Integração simplificada: Ferramentas fáceis de usar para implementação e integração simples.
Flexibilidade: Suporta modelos YOLO26 padrão e otimizados por esparsidade.
Econômico: Reduz despesas operacionais através do uso eficiente de recursos.

Para um mergulho mais profundo nestas vantagens, visita a seção de Benefícios de Integrar o DeepSparse da Neural Magic com o YOLO26.

Contribuidores

GLglenn-jocher¹⁷ RIRizwanMunawar² BUBurhan-Q¹ MAMatthewNoyce¹ ABabirami-vina¹

Criado 30 de dez. de 2023Atualizado há 3 semanas