Link to this sectionOtimizando inferências do YOLO26 com o motor DeepSparse da Neural Magic#
Ao implementar modelos de detecção de objetos como o Ultralytics YOLO26 em diversos hardwares, podes encontrar problemas únicos como a otimização. É aqui que a integração do YOLO26 com o motor DeepSparse da Neural Magic entra em ação. Ele transforma a forma como os modelos YOLO26 são executados e permite um desempenho de nível de GPU diretamente em CPUs.
Este guia mostra-te como implementar o YOLO26 usando o DeepSparse da Neural Magic, como executar inferências e também como realizar benchmarks de desempenho para garantir que ele esteja otimizado.
A Neural Magic foi adquirida pela Red Hat em janeiro de 2025 e está descontinuando as versões comunitárias das suas bibliotecas deepsparse, sparseml, sparsezoo e sparsify. Para mais informações, consulta o aviso publicado no Readme do repositório GitHub sparsify.
Link to this sectionDeepSparse da Neural Magic#
O DeepSparse da Neural Magic é um tempo de execução de inferência projetado para otimizar a execução de redes neurais em CPUs. Ele aplica técnicas avançadas como esparsidade, poda (pruning) e quantização para reduzir drasticamente as exigências computacionais, mantendo a precisão. O DeepSparse oferece uma solução ágil para a execução eficiente e escalável de redes neurais em diversos dispositivos.
Link to this sectionBenefícios de integrar o DeepSparse da Neural Magic com o YOLO26#
Antes de mergulhar em como implementar o YOLO26 usando o DeepSparse, vamos entender os benefícios de usar o DeepSparse. Algumas vantagens principais incluem:
- Velocidade de inferência aprimorada: Alcança até 525 FPS (no YOLO11n), acelerando significativamente as capacidades de inferência do YOLO em comparação com métodos tradicionais.
- Eficiência do modelo otimizada: Usa poda e quantização para melhorar a eficiência do YOLO26, reduzindo o tamanho do modelo e os requisitos computacionais enquanto mantém a precisão.
-
Alto desempenho em CPUs padrão: Oferece um desempenho semelhante ao de uma GPU em CPUs, proporcionando uma opção mais acessível e econômica para diversas aplicações.
-
Integração e implementação simplificadas: Oferece ferramentas fáceis de usar para uma integração simples do YOLO26 em aplicações, incluindo recursos de anotação de imagem e vídeo.
-
Suporte para diversos tipos de modelos: Compatível com modelos YOLO26 padrão e otimizados por esparsidade, adicionando flexibilidade à implementação.
-
Solução econômica e escalável: Reduz despesas operacionais e oferece uma implementação escalável de modelos avançados de detecção de objetos.
Link to this sectionComo funciona a tecnologia DeepSparse da Neural Magic?#
A tecnologia DeepSparse da Neural Magic é inspirada na eficiência do cérebro humano na computação de redes neurais. Ela adota dois princípios fundamentais do cérebro conforme abaixo:
-
Esparsidade: O processo de sparsification envolve a poda de informações redundantes de redes de deep learning, resultando em modelos menores e mais rápidos sem comprometer a precisão. Esta técnica reduz significativamente o tamanho da rede e as necessidades computacionais.
-
Localidade de referência: O DeepSparse utiliza um método de execução único, dividindo a rede em Colunas de Tensores (Tensor Columns). Estas colunas são executadas em profundidade, cabendo inteiramente dentro do cache da CPU. Esta abordagem imita a eficiência do cérebro, minimizando o movimento de dados e maximizando o uso do cache da CPU.
Link to this sectionCriando uma versão esparsa do YOLO26 treinada em um conjunto de dados personalizado#
SparseZoo, um repositório de modelos de código aberto da Neural Magic, oferece uma coleção de checkpoints de modelos YOLO26 pré-esparsificados. Com o SparseML, perfeitamente integrado com o Ultralytics, os utilizadores podem ajustar sem esforço estes checkpoints esparsos nos seus conjuntos de dados específicos usando uma interface de linha de comando direta.
Consulta a documentação do SparseML YOLO26 da Neural Magic para mais detalhes.
Link to this sectionUso: Implementando o YOLO26 usando o DeepSparse#
Implementar o YOLO26 com o DeepSparse da Neural Magic envolve alguns passos simples. Antes de mergulhar nas instruções de uso, certifica-te de verificar a gama de modelos YOLO26 oferecidos pela Ultralytics. Isto ajudar-te-á a escolher o modelo mais apropriado para os requisitos do teu projeto. Eis como podes começar.
Link to this sectionPasso 1: Instalação#
Para instalar os pacotes necessários, execute:
# Install the required packages
pip install deepsparse[yolov8]Link to this sectionPasso 2: Exportando o YOLO26 para o formato ONNX#
O motor DeepSparse requer modelos YOLO26 no formato ONNX. Exportar o teu modelo para este formato é essencial para a compatibilidade com o DeepSparse. Usa o seguinte comando para exportar modelos YOLO26:
# Export YOLO26 model to ONNX format
yolo task=detect mode=export model=yolo26n.pt format=onnx opset=13Este comando salvará o modelo yolo26n.onnx no teu disco.
Link to this sectionPasso 3: Implementando e executando inferências#
Com o teu modelo YOLO26 no formato ONNX, podes implementar e executar inferências usando o DeepSparse. Isto pode ser feito facilmente com a sua API Python intuitiva:
from deepsparse import Pipeline
# Specify the path to your YOLO26 ONNX model
model_path = "path/to/yolo26n.onnx"
# Set up the DeepSparse Pipeline
yolo_pipeline = Pipeline.create(task="yolov8", model_path=model_path)
# Run the model on your images
images = ["path/to/image.jpg"]
pipeline_outputs = yolo_pipeline(images=images)Link to this sectionPasso 4: Benchmarking de desempenho#
É importante verificar se o teu modelo YOLO26 está a ter um desempenho ideal no DeepSparse. Podes fazer um benchmark do desempenho do teu modelo para analisar a taxa de transferência e a latência:
# Benchmark performance
deepsparse.benchmark model_path="path/to/yolo26n.onnx" --scenario=sync --input_shapes="[1,3,640,640]"Link to this sectionPasso 5: Recursos adicionais#
O DeepSparse fornece recursos adicionais para a integração prática do YOLO26 em aplicações, como anotação de imagem e avaliação de conjuntos de dados.
# For image annotation
deepsparse.yolov8.annotate --source "path/to/image.jpg" --model_filepath "path/to/yolo26n.onnx"
# For evaluating model performance on a dataset
deepsparse.yolov8.eval --model_path "path/to/yolo26n.onnx"Executar o comando annotate processa a imagem especificada, detectando objetos e salvando a imagem anotada com caixas delimitadoras e classificações. A imagem anotada será armazenada numa pasta annotation-results. Isto ajuda a fornecer uma representação visual das capacidades de detecção do modelo.
Após executar o comando eval, receberás métricas de saída detalhadas como precisão, recall e mAP (média da Precisão Média). Isto fornece uma visão abrangente do desempenho do teu modelo no conjunto de dados e é particularmente útil para ajustar e otimizar os teus modelos YOLO26 para casos de uso específicos, garantindo alta precisão e eficiência.
Link to this sectionResumo#
Este guia explorou a integração do YOLO26 da Ultralytics com o motor DeepSparse da Neural Magic. Destacou como esta integração melhora o desempenho do YOLO26 em plataformas de CPU, oferecendo eficiência de nível de GPU e técnicas avançadas de esparsidade de redes neurais.
Para informações mais detalhadas e uso avançado, visita a documentação do DeepSparse da Neural Magic. Podes também explorar o guia de integração do YOLO26 e assistir a uma sessão passo a passo no YouTube.
Além disso, para uma compreensão mais ampla das diversas integrações do YOLO26, visita a página do guia de integração da Ultralytics, onde podes descobrir uma gama de outras possibilidades de integração interessantes.
Link to this sectionFAQ#
Link to this sectionO que é o motor DeepSparse da Neural Magic e como ele otimiza o desempenho do YOLO26?#
O motor DeepSparse da Neural Magic é um tempo de execução de inferência projetado para otimizar a execução de redes neurais em CPUs através de técnicas avançadas como esparsidade, poda e quantização. Ao integrar o DeepSparse com o YOLO26, podes alcançar um desempenho semelhante ao de uma GPU em CPUs padrão, aumentando significativamente a velocidade de inferência, a eficiência do modelo e o desempenho geral enquanto manténs a precisão. Para mais detalhes, confere a seção DeepSparse da Neural Magic.
Link to this sectionComo posso instalar os pacotes necessários para implementar o YOLO26 usando o DeepSparse da Neural Magic?#
Instalar os pacotes necessários para implementar o YOLO26 com o DeepSparse da Neural Magic é simples. Podes instalá-los facilmente usando a CLI. Eis o comando que precisas de executar:
pip install deepsparse[yolov8]Uma vez instalado, segue os passos fornecidos na seção de Instalação para configurar o teu ambiente e começar a usar o DeepSparse com o YOLO26.
Link to this sectionComo converto modelos YOLO26 para o formato ONNX para uso com o DeepSparse?#
Para converter modelos YOLO26 para o formato ONNX, que é necessário para a compatibilidade com o DeepSparse, podes usar o seguinte comando CLI:
yolo task=detect mode=export model=yolo26n.pt format=onnx opset=13Este comando exportará o teu modelo YOLO26 (yolo26n.pt) para um formato (yolo26n.onnx) que pode ser utilizado pelo motor DeepSparse. Mais informações sobre a exportação de modelos podem ser encontradas na seção de Exportação de Modelos.
Link to this sectionComo faço o benchmark do desempenho do YOLO26 no motor DeepSparse?#
Fazer o benchmark do desempenho do YOLO26 no DeepSparse ajuda-te a analisar a taxa de transferência e a latência para garantir que o teu modelo esteja otimizado. Podes usar o seguinte comando CLI para executar um benchmark:
deepsparse.benchmark model_path="path/to/yolo26n.onnx" --scenario=sync --input_shapes="[1,3,640,640]"Este comando fornecer-te-á métricas de desempenho vitais. Para mais detalhes, vê a seção de Benchmarking de Desempenho.
Link to this sectionPor que devo usar o DeepSparse da Neural Magic com o YOLO26 para tarefas de detecção de objetos?#
Integrar o DeepSparse da Neural Magic com o YOLO26 oferece diversos benefícios:
- Velocidade de inferência aprimorada: Alcança até 525 FPS (no YOLO11n), demonstrando as capacidades de otimização do DeepSparse.
- Eficiência do modelo otimizada: Usa técnicas de esparsidade, poda e quantização para reduzir o tamanho do modelo e as necessidades computacionais, mantendo a precisão.
- Alto desempenho em CPUs padrão: Oferece desempenho semelhante ao de uma GPU em hardware de CPU econômico.
- Integração simplificada: Ferramentas fáceis de usar para implementação e integração simples.
- Flexibilidade: Suporta modelos YOLO26 padrão e otimizados por esparsidade.
- Econômico: Reduz despesas operacionais através do uso eficiente de recursos.
Para um mergulho mais profundo nestas vantagens, visita a seção de Benefícios de Integrar o DeepSparse da Neural Magic com o YOLO26.