Exportação e Implementação Axelera AI
Lançamento Experimental
Esta é uma integração experimental que demonstra a implementação no hardware Axelera Metis. A integração completa é prevista para fevereiro de 2026 com exportação de modelo sem a necessidade de hardware Axelera e instalação pip padrão.
A Ultralytics faz parceria com a Axelera AI para permitir inferência de alto desempenho e energeticamente eficiente em dispositivos de Edge AI. Exporte e implemente modelos Ultralytics YOLO diretamente para a Metis® AIPU usando o Voyager SDK.
A Axelera AI oferece aceleração de hardware dedicada para visão computacional na borda, usando uma arquitetura de fluxo de dados proprietária e computação em memória para entregar até 856 TOPS com baixo consumo de energia.
Selecionando o Hardware Certo
A Axelera AI oferece vários formatos para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para sua implantação Ultralytics YOLO.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portfólio de Hardware
A linha de hardware Axelera é otimizada para executar Ultralytics YOLO26 e versões legadas com alta eficiência de FPS por watt.
Placas Aceleradoras
Essas placas permitem a aceleração de IA em dispositivos host existentes, facilitando implantações brownfield.
| Produto | Formato | Computação | Desempenho (INT8) | Aplicação Alvo |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Análise de vídeo de alta densidade, cidades inteligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PCs industriais, gestão de filas no varejo |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robótica, dispositivos médicos portáteis |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Ambientes que exigem gerenciamento térmico avançado |
Sistemas Integrados
Para soluções completas, a Axelera faz parceria com fabricantes para fornecer sistemas pré-validados para o Metis AIPU.
- Placa de Computação Metis: Um dispositivo edge autónomo que emparelha o Metis AIPU com uma CPU ARM Rockchip RK3588.
- Workstations: Torres corporativas da Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
- PCs Industriais: Sistemas robustecidos da Advantech e Aetina projetados para automação de manufatura.
Tarefas Suportadas
Atualmente, modelos de Detecção de Objetos podem ser exportados para o formato Axelera. Tarefas adicionais estão sendo integradas:
| Tarefa | Status |
|---|---|
| Detecção de Objetos | ✅ Suportado |
| Estimativa de Pose | Em breve |
| Segmentação | Em breve |
| Caixas Delimitadoras Orientadas | Em breve |
Instalação
Requisitos da Plataforma
A exportação para o formato Axelera requer:
- Sistema Operacional: Apenas Linux (Ubuntu 22.04/24.04 recomendado)
- Hardware: Acelerador de IA Axelera (dispositivos Metis)
- Python: Versão 3.10 (3.11 e 3.12 em breve)
Instalação da Ultralytics
pip install ultralytics
Para instruções detalhadas, consulte nosso guia de Instalação Ultralytics. Se encontrar dificuldades, consulte nosso guia de Problemas Comuns.
Instalação do Driver Axelera
Adicione a chave do repositório Axelera:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"Adicione o repositório ao apt:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"Instale o SDK e carregue o driver:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
Exportando Modelos YOLO para Axelera
Exporte seus modelos YOLO treinados usando o comando de exportação padrão da Ultralytics.
Exportar para o Formato Axelera
from ultralytics import YOLO
# Load a YOLO26 model
model = YOLO("yolo26n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera
Argumentos de Exportação
| Argumento | Tipo | Padrão | Descrição |
|---|---|---|---|
format | str | 'axelera' | Formato alvo para hardware Axelera Metis AIPU |
imgsz | int ou tuple | 640 | Tamanho da imagem para entrada do modelo |
int8 | bool | True | Habilitar quantização INT8 para AIPU |
data | str | 'coco128.yaml' | Configuração do dataset para calibração de quantização |
fraction | float | 1.0 | Fração do dataset para calibração (100-400 imagens recomendadas) |
device | str | None | Dispositivo de exportação: GPU (device=0) ou CPU (device=cpu) |
Para todas as opções de exportação, consulte a documentação do Modo de Exportação.
Estrutura de Saída
yolo26n_axelera_model/
├── yolo26n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
Executando a Inferência
Carregue o modelo exportado com a API Ultralytics e execute a inferência, semelhante ao carregamento de modelos ONNX.
Inferência com Modelo Axelera
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
Problema Conhecido
A primeira execução de inferência pode gerar um ImportError. Execuções subsequentes funcionarão corretamente. Isso será abordado em uma versão futura.
Desempenho da Inference
A Metis AIPU maximiza o throughput enquanto minimiza o consumo de energia.
| Métrica | Metis PCIe x4 | Metis M.2 | Nota |
|---|---|---|---|
| Throughput Máximo | 856 TOPS | 214 TOPS | Precisão INT8 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | Entrada 640x640 |
| YOLOv5s FPS | N/A | ~827 FPS | Entrada 640x640 |
| Eficiência | Alto | Muito Alto | Ideal para energia da bateria |
Benchmarks baseados em dados da Axelera AI. O FPS real depende do tamanho do modelo, do batching e da resolução de entrada.
Aplicações no Mundo Real
O YOLO da Ultralytics no hardware da Axelera permite soluções avançadas de computação de ponta:
- Varejo Inteligente: Contagem de objetos em tempo real e análise de mapas de calor para otimização da loja.
- Segurança Industrial: Detecção de EPI de baixa latência em ambientes de fabricação.
- Análise com Drones: detect de objetos de alta velocidade em UAVs para agricultura e busca e salvamento.
- Sistemas de Tráfego: Reconhecimento de matrículas e estimativa de velocidade baseados na borda.
Fluxo de Trabalho Recomendado
- Treine seu modelo usando o Modo de Treinamento da Ultralytics
- Exportar para o formato Axelera usando
model.export(format="axelera") - Validar precisão com
yolo valpara verificar a perda mínima de quantização - Prever usando
yolo predictpara validação qualitativa
Verificação de Integridade do Dispositivo
Verifique se o seu dispositivo Axelera está funcionando corretamente:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
Para diagnósticos detalhados, consulte a documentação do AxDevice.
Desempenho Máximo
Esta integração utiliza uma configuração de núcleo único para compatibilidade. Para produção que exige throughput máximo, o Axelera Voyager SDK oferece:
- Utilização multi-core (AIPU Metis quad-core)
- Pipelines de inferência em streaming
- Inferência em mosaico para câmeras de maior resolução
Consulte o model-zoo para benchmarks de FPS ou entre em contato com a Axelera para suporte de produção.
Problemas Conhecidos
Limitações Conhecidas
Compatibilidade com PyTorch 2.9: A primeira
yolo export format=axeleracomando pode falhar devido ao downgrade automático do PyTorch para 2.8. Execute o comando uma segunda vez para ter sucesso.Limitações de energia M.2: Modelos grandes ou extragrandes podem encontrar erros de tempo de execução em aceleradores M.2 devido a restrições de fornecimento de energia.
ImportError na primeira inferência: A primeira execução de inferência pode lançar um
ImportError. As execuções subsequentes funcionam corretamente.
Para suporte, visite a Comunidade Axelera.
FAQ
Quais versões do YOLO são suportadas no Axelera?
O SDK Voyager suporta a exportação de modelos YOLOv8 e YOLO26.
Posso implantar modelos treinados personalizados?
Sim. Qualquer modelo treinado usando o Modo de Treinamento Ultralytics pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.
Como a quantização INT8 afeta a precisão?
O Voyager SDK da Axelera quantiza automaticamente modelos para a arquitetura AIPU de precisão mista. Para a maioria das detecção de objetos tarefas, os ganhos de desempenho (FPS mais alto, menor consumo de energia) superam significativamente o impacto mínimo na mAP. A quantização leva de segundos a várias horas, dependendo do tamanho do modelo. Execute yolo val após a exportação para verificar a precisão.
Quantas imagens de calibração devo usar?
Recomendamos de 100 a 400 imagens. Mais de 400 não oferece benefício adicional e aumenta o tempo de quantização. Experimente com 100, 200 e 400 imagens para encontrar o equilíbrio ideal.
Onde posso encontrar o SDK do Voyager?
O SDK, os drivers e as ferramentas de compilação estão disponíveis através do Portal do Desenvolvedor da Axelera.