Exportação e implementação da Axelera AI
Lançamento experimental
Esta é uma integração experimental que demonstra a implementação no hardware Axelera Metis. A integração completa está prevista para fevereiro de 2026, com exportação de modelos sem a necessidade do hardware Axelera e instalação padrão do pip.
Ultralytics com a Axelera AI para permitir inferências de alto desempenho e eficiência energética em dispositivos Edge AI. Exporte e implemente YOLO Ultralytics YOLO diretamente para o Metis® AIPU usando o Voyager SDK.
A Axelera AI fornece aceleração de hardware dedicada para visão computacional na periferia, utilizando uma arquitetura de fluxo de dados proprietária e computação em memória para fornecer até 856 TOPS com baixo consumo de energia.
Selecionando o Hardware Certo
A Axelera AI oferece vários formatos para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para sua implantação Ultralytics YOLO.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portfólio de Hardware
A linha de hardware Axelera é otimizada para executar Ultralytics YOLO11 e versões legadas com alta eficiência de FPS por watt.
Placas Aceleradoras
Essas placas permitem a aceleração de IA em dispositivos host existentes, facilitando implantações brownfield.
| Produto | Formato | Computação | Desempenho (INT8) | Aplicação Alvo |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Análise de vídeo de alta densidade, cidades inteligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PCs industriais, gestão de filas no varejo |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robótica, dispositivos médicos portáteis |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Ambientes que exigem gerenciamento térmico avançado |
Sistemas Integrados
Para soluções completas, a Axelera faz parceria com fabricantes para fornecer sistemas pré-validados para o Metis AIPU.
- Placa de Computação Metis: Um dispositivo edge autónomo que emparelha o Metis AIPU com uma CPU ARM Rockchip RK3588.
- Workstations: Torres corporativas da Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
- PCs Industriais: Sistemas robustecidos da Advantech e Aetina projetados para automação de manufatura.
Tarefas Suportadas
Atualmente, os modelos de detecção de objetos podem ser exportados para o formato Axelera. Tarefas adicionais estão a ser integradas:
| Tarefa | Status |
|---|---|
| Detecção de Objetos | ✅ Suportado |
| Estimativa de Pose | Em breve |
| Segmentação | Em breve |
| Caixas delimitadoras orientadas | Em breve |
Instalação
Requisitos da plataforma
A exportação para o formato Axelera requer:
- Sistema operativo: apenas Linux (recomenda-se Ubuntu 22.04/24.04)
- Hardware: Acelerador Axelera AI (dispositivos Metis)
- Python: Versão 3.10 (3.11 e 3.12 em breve)
Instalação da Ultralytics
pip install ultralytics
Para obter instruções detalhadas, consulte o nosso guiaUltralytics . Se tiver dificuldades, consulte o nosso guia de problemas comuns.
Instalação do driver Axelera
Adicione a chave do repositório Axelera:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"Adicione o repositório ao apt:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"Instale o SDK e carregue o driver:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
Exportando Modelos YOLO para Axelera
Exporte YOLO seus YOLO treinados usando o comando Ultralytics padrão Ultralytics .
Exportar para o Formato Axelera
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera
Argumentos de Exportação
| Argumento | Tipo | Padrão | Descrição |
|---|---|---|---|
format | str | 'axelera' | Formato de destino para hardware Axelera Metis AIPU |
imgsz | int ou tuple | 640 | Tamanho da imagem para entrada do modelo |
int8 | bool | True | Ativar quantização INT8 para AIPU |
data | str | 'coco128.yaml' | Configuração do conjunto de dados para calibração de quantização |
fraction | float | 1.0 | Fração do conjunto de dados para calibração (recomenda-se 100-400 imagens) |
device | str | None | Dispositivo de exportação: GPUdevice=0) ou CPUdevice=cpu) |
Para todas as opções de exportação, consulte a documentação do Modo de Exportação.
Estrutura de Saída
yolo11n_axelera_model/
├── yolo11n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
Executando a Inferência
Carregue o modelo exportado com a Ultralytics e execute a inferência, semelhante ao carregamento ONNX .
Inferência com o modelo Axelera
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
Problema conhecido
A primeira execução da inferência pode lançar uma ImportError. As execuções subsequentes funcionarão corretamente. Isso será corrigido numa versão futura.
Desempenho da Inference
O Metis AIPU maximiza o rendimento enquanto minimiza o consumo de energia.
| Métrica | Metis PCIe x4 | Metis M.2 | Nota |
|---|---|---|---|
| Throughput Máximo | 856 TOPS | 214 TOPS | Precisão INT8 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | Entrada 640x640 |
| YOLOv5s FPS | N/A | ~827 FPS | Entrada 640x640 |
| Eficiência | Alto | Muito Alto | Ideal para energia da bateria |
Referências baseadas nos dados da Axelera AI. O FPS real depende do tamanho do modelo, do processamento em lote e da resolução de entrada.
Aplicações no Mundo Real
O YOLO da Ultralytics no hardware da Axelera permite soluções avançadas de computação de ponta:
- Varejo Inteligente: Contagem de objetos em tempo real e análise de mapas de calor para otimização da loja.
- Segurança Industrial: Detecção de EPI de baixa latência em ambientes de fabricação.
- Análise com Drones: detect de objetos de alta velocidade em UAVs para agricultura e busca e salvamento.
- Sistemas de Tráfego: Reconhecimento de matrículas e estimativa de velocidade baseados na borda.
Fluxo de trabalho recomendado
- Treine o seu modelo usandoo Modo de Treinamento Ultralytics
- Exportar para o formato Axelera usando
model.export(format="axelera") - Validar precisão com
yolo valpara verificar a perda mínima de quantização - Prever usando
yolo predictpara validação qualitativa
Verificação do estado do dispositivo
Verifique se o seu dispositivo Axelera está a funcionar corretamente:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
Para obter diagnósticos detalhados, consulte a documentação do AxDevice.
Desempenho máximo
Esta integração utiliza configuração single-core para compatibilidade. Para produção que requer rendimento máximo, o Axelera Voyager SDK oferece:
- Utilização multi-core (quad-core Metis AIPU)
- Pipelines de inferência de streaming
- Inferência em mosaico para câmaras de alta resolução
Consulte o modelo-zoo para obter referências de FPS ou contacte a Axelera para obter suporte à produção.
Problemas conhecidos
Limitações conhecidas
Compatibilidade com PyTorch .9: O primeiro
yolo export format=axeleraO comando pode falhar devido ao PyTorch automático PyTorch para a versão 2.8. Execute o comando uma segunda vez para que seja bem-sucedido.Limitações de energia M.2: Modelos grandes ou extragrandes podem apresentar erros de tempo de execução em aceleradores M.2 devido a restrições de fornecimento de energia.
Primeira inferência ImportError: A primeira execução de inferência pode lançar uma
ImportError. As execuções subsequentes funcionam corretamente.
Para obter suporte, visite a Comunidade Axelera.
FAQ
Quais versões do YOLO são suportadas no Axelera?
O Voyager SDK suporta a exportação de YOLOv8 e YOLO11 .
Posso implementar modelos treinados personalizados?
Sim. Qualquer modelo treinado usando o Modo de Treinamento Ultralytics pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.
Como a quantização INT8 afeta a precisão?
O Voyager SDK da Axelera quantiza automaticamente modelos para a arquitetura AIPU de precisão mista. Para a maioria detecção de objetos tarefas, os ganhos de desempenho (FPS mais alto, menor consumo de energia) superam significativamente o impacto mínimo sobre mAP. A quantização leva de segundos a várias horas, dependendo do tamanho do modelo. Executar yolo val após a exportação para verificar a precisão.
Quantas imagens de calibração devo usar?
Recomendamos entre 100 e 400 imagens. Mais de 400 não oferece nenhum benefício adicional e aumenta o tempo de quantização. Experimente com 100, 200 e 400 imagens para encontrar o equilíbrio ideal.
Onde posso encontrar o SDK do Voyager?
O SDK, os drivers e as ferramentas de compilação estão disponíveis através do Portal do Desenvolvedor da Axelera.