Exportação e Implementação Axelera AI

Q: How does INT8 quantization affect accuracy?

O Voyager SDK da Axelera quantiza automaticamente os modelos para a arquitetura AIPU de precisão mista. Para a maioria das tarefas de detecção de objetos, os ganhos de desempenho (maior FPS, menor consumo de energia) superam significativamente o impacto mínimo no mAP. A quantização leva de segundos a várias horas, dependendo do tamanho do modelo. Execute yolo val após a exportação para verificar a precisão.

Lançamento Experimental

Esta é uma integração experimental que demonstra a implementação no hardware Axelera Metis. A integração completa é prevista para fevereiro de 2026 com exportação de modelo sem a necessidade de hardware Axelera e instalação pip padrão.

A Ultralytics faz parceria com a Axelera AI para permitir inferência de alto desempenho e energeticamente eficiente em dispositivos de Edge AI. Exporte e implemente modelos Ultralytics YOLO diretamente para a Metis® AIPU usando o Voyager SDK.

Ecossistema de implementação de IA de ponta da Axelera para YOLO

A Axelera AI oferece aceleração de hardware dedicada para visão computacional na borda, usando uma arquitetura de fluxo de dados proprietária e computação em memória para entregar até 856 TOPS com baixo consumo de energia.

Selecionando o Hardware Certo

A Axelera AI oferece vários formatos para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para sua implantação Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portfólio de Hardware

A linha de hardware Axelera é otimizada para executar Ultralytics YOLO26 e versões legadas com alta eficiência de FPS por watt.

Placas Aceleradoras

Essas placas permitem a aceleração de IA em dispositivos host existentes, facilitando implantações brownfield.

Produto	Formato	Computação	Desempenho (INT8)	Aplicação Alvo
Metis PCIe x4	PCIe Gen3 x16	4x Metis AIPUs	856 TOPS	Análise de vídeo de alta densidade, cidades inteligentes
Metis PCIe x1	PCIe Gen3 x1	1x Metis AIPU	214 TOPS	PCs industriais, gestão de filas no varejo
Metis M.2	M.2 2280 M-Key	1x Metis AIPU	214 TOPS	Drones, robótica, dispositivos médicos portáteis
Metis M.2 MAX	M.2 2280	1x Metis AIPU	214 TOPS	Ambientes que exigem gerenciamento térmico avançado

Sistemas Integrados

Para soluções completas, a Axelera faz parceria com fabricantes para fornecer sistemas pré-validados para o Metis AIPU.

Placa de Computação Metis: Um dispositivo edge autónomo que emparelha o Metis AIPU com uma CPU ARM Rockchip RK3588.
Workstations: Torres corporativas da Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
PCs Industriais: Sistemas robustecidos da Advantech e Aetina projetados para automação de manufatura.

Tarefas Suportadas

Atualmente, modelos de Detecção de Objetos podem ser exportados para o formato Axelera. Tarefas adicionais estão sendo integradas:

Tarefa	Status
Detecção de Objetos	✅ Suportado
Estimativa de Pose	Em breve
Segmentação	Em breve
Caixas Delimitadoras Orientadas	Em breve

Instalação

Requisitos da Plataforma

A exportação para o formato Axelera requer:

Sistema Operacional: Apenas Linux (Ubuntu 22.04/24.04 recomendado)
Hardware: Acelerador de IA Axelera (dispositivos Metis)
Python: Versão 3.10 (3.11 e 3.12 em breve)

Instalação da Ultralytics

pip install ultralytics

Para instruções detalhadas, consulte nosso guia de Instalação Ultralytics. Se encontrar dificuldades, consulte nosso guia de Problemas Comuns.

Instalação do Driver Axelera

Adicione a chave do repositório Axelera:

sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"

Adicione o repositório ao apt:

sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"

Instale o SDK e carregue o driver:

sudo apt update
sudo apt install -y axelera-voyager-sdk-base
sudo modprobe metis
yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER

Exportando Modelos YOLO para Axelera

Exporte seus modelos YOLO treinados usando o comando de exportação padrão da Ultralytics.

Exportar para o Formato Axelera

PythonCLI

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory

yolo export model=yolo26n.pt format=axelera

Argumentos de Exportação

Argumento	Tipo	Padrão	Descrição
`format`	`str`	`'axelera'`	Formato alvo para hardware Axelera Metis AIPU
`imgsz`	`int` ou `tuple`	`640`	Tamanho da imagem para entrada do modelo
`int8`	`bool`	`True`	Habilitar quantização INT8 para AIPU
`data`	`str`	`'coco128.yaml'`	Configuração do dataset para calibração de quantização
`fraction`	`float`	`1.0`	Fração do dataset para calibração (100-400 imagens recomendadas)
`device`	`str`	`None`	Dispositivo de exportação: GPU (`device=0`) ou CPU (`device=cpu`)

Para todas as opções de exportação, consulte a documentação do Modo de Exportação.

Estrutura de Saída

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Executando a Inferência

Carregue o modelo exportado com a API Ultralytics e execute a inferência, semelhante ao carregamento de modelos ONNX.

Inferência com Modelo Axelera

PythonCLI

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Problema Conhecido

A primeira execução de inferência pode gerar um ImportError. Execuções subsequentes funcionarão corretamente. Isso será abordado em uma versão futura.

Desempenho da Inference

A Metis AIPU maximiza o throughput enquanto minimiza o consumo de energia.

Métrica	Metis PCIe x4	Metis M.2	Nota
Throughput Máximo	856 TOPS	214 TOPS	Precisão INT8
YOLOv5m FPS	~1539 FPS	~326 FPS	Entrada 640x640
YOLOv5s FPS	N/A	~827 FPS	Entrada 640x640
Eficiência	Alto	Muito Alto	Ideal para energia da bateria

Benchmarks baseados em dados da Axelera AI. O FPS real depende do tamanho do modelo, do batching e da resolução de entrada.

Aplicações no Mundo Real

O YOLO da Ultralytics no hardware da Axelera permite soluções avançadas de computação de ponta:

Varejo Inteligente: Contagem de objetos em tempo real e análise de mapas de calor para otimização da loja.
Segurança Industrial: Detecção de EPI de baixa latência em ambientes de fabricação.
Análise com Drones: detect de objetos de alta velocidade em UAVs para agricultura e busca e salvamento.
Sistemas de Tráfego: Reconhecimento de matrículas e estimativa de velocidade baseados na borda.

Fluxo de Trabalho Recomendado

Treine seu modelo usando o Modo de Treinamento da Ultralytics
Exportar para o formato Axelera usando model.export(format="axelera")
Validar precisão com yolo val para verificar a perda mínima de quantização
Prever usando yolo predict para validação qualitativa

Verificação de Integridade do Dispositivo

Verifique se o seu dispositivo Axelera está funcionando corretamente:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Para diagnósticos detalhados, consulte a documentação do AxDevice.

Desempenho Máximo

Esta integração utiliza uma configuração de núcleo único para compatibilidade. Para produção que exige throughput máximo, o Axelera Voyager SDK oferece:

Utilização multi-core (AIPU Metis quad-core)
Pipelines de inferência em streaming
Inferência em mosaico para câmeras de maior resolução

Consulte o model-zoo para benchmarks de FPS ou entre em contato com a Axelera para suporte de produção.

Problemas Conhecidos

Limitações Conhecidas

Compatibilidade com PyTorch 2.9: A primeira yolo export format=axelera comando pode falhar devido ao downgrade automático do PyTorch para 2.8. Execute o comando uma segunda vez para ter sucesso.
Limitações de energia M.2: Modelos grandes ou extragrandes podem encontrar erros de tempo de execução em aceleradores M.2 devido a restrições de fornecimento de energia.
ImportError na primeira inferência: A primeira execução de inferência pode lançar um ImportError. As execuções subsequentes funcionam corretamente.

Para suporte, visite a Comunidade Axelera.

FAQ

Quais versões do YOLO são suportadas no Axelera?

O SDK Voyager suporta a exportação de modelos YOLOv8 e YOLO26.

Posso implantar modelos treinados personalizados?

Sim. Qualquer modelo treinado usando o Modo de Treinamento Ultralytics pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.

Como a quantização INT8 afeta a precisão?

O Voyager SDK da Axelera quantiza automaticamente modelos para a arquitetura AIPU de precisão mista. Para a maioria das detecção de objetos tarefas, os ganhos de desempenho (FPS mais alto, menor consumo de energia) superam significativamente o impacto mínimo na mAP. A quantização leva de segundos a várias horas, dependendo do tamanho do modelo. Execute yolo val após a exportação para verificar a precisão.

Quantas imagens de calibração devo usar?

Recomendamos de 100 a 400 imagens. Mais de 400 não oferece benefício adicional e aumenta o tempo de quantização. Experimente com 100, 200 e 400 imagens para encontrar o equilíbrio ideal.

Onde posso encontrar o SDK do Voyager?

O SDK, os drivers e as ferramentas de compilação estão disponíveis através do Portal do Desenvolvedor da Axelera.

📅 Criado há 2 meses ✏️ Atualizado há 18 dias