Ir para o conteúdo

Exportação e implementação da Axelera AI

Lançamento experimental

Esta é uma integração experimental que demonstra a implementação no hardware Axelera Metis. A integração completa está prevista para fevereiro de 2026, com exportação de modelos sem a necessidade do hardware Axelera e instalação padrão do pip.

Ultralytics com a Axelera AI para permitir inferências de alto desempenho e eficiência energética em dispositivos Edge AI. Exporte e implemente YOLO Ultralytics YOLO diretamente para o Metis® AIPU usando o Voyager SDK.

Ecossistema de IA Axelera

A Axelera AI fornece aceleração de hardware dedicada para visão computacional na periferia, utilizando uma arquitetura de fluxo de dados proprietária e computação em memória para fornecer até 856 TOPS com baixo consumo de energia.

Selecionando o Hardware Certo

A Axelera AI oferece vários formatos para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para sua implantação Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portfólio de Hardware

A linha de hardware Axelera é otimizada para executar Ultralytics YOLO11 e versões legadas com alta eficiência de FPS por watt.

Placas Aceleradoras

Essas placas permitem a aceleração de IA em dispositivos host existentes, facilitando implantações brownfield.

ProdutoFormatoComputaçãoDesempenho (INT8)Aplicação Alvo
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSAnálise de vídeo de alta densidade, cidades inteligentes
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSPCs industriais, gestão de filas no varejo
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, robótica, dispositivos médicos portáteis
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSAmbientes que exigem gerenciamento térmico avançado

Sistemas Integrados

Para soluções completas, a Axelera faz parceria com fabricantes para fornecer sistemas pré-validados para o Metis AIPU.

  • Placa de Computação Metis: Um dispositivo edge autónomo que emparelha o Metis AIPU com uma CPU ARM Rockchip RK3588.
  • Workstations: Torres corporativas da Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
  • PCs Industriais: Sistemas robustecidos da Advantech e Aetina projetados para automação de manufatura.

Tarefas Suportadas

Atualmente, os modelos de detecção de objetos podem ser exportados para o formato Axelera. Tarefas adicionais estão a ser integradas:

TarefaStatus
Detecção de Objetos✅ Suportado
Estimativa de PoseEm breve
SegmentaçãoEm breve
Caixas delimitadoras orientadasEm breve

Instalação

Requisitos da plataforma

A exportação para o formato Axelera requer:

  • Sistema operativo: apenas Linux (recomenda-se Ubuntu 22.04/24.04)
  • Hardware: Acelerador Axelera AI (dispositivos Metis)
  • Python: Versão 3.10 (3.11 e 3.12 em breve)

Instalação da Ultralytics

pip install ultralytics

Para obter instruções detalhadas, consulte o nosso guiaUltralytics . Se tiver dificuldades, consulte o nosso guia de problemas comuns.

Instalação do driver Axelera

  1. Adicione a chave do repositório Axelera:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. Adicione o repositório ao apt:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. Instale o SDK e carregue o driver:

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

Exportando Modelos YOLO para Axelera

Exporte YOLO seus YOLO treinados usando o comando Ultralytics padrão Ultralytics .

Exportar para o Formato Axelera

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera

Argumentos de Exportação

ArgumentoTipoPadrãoDescrição
formatstr'axelera'Formato de destino para hardware Axelera Metis AIPU
imgszint ou tuple640Tamanho da imagem para entrada do modelo
int8boolTrueAtivar quantização INT8 para AIPU
datastr'coco128.yaml'Configuração do conjunto de dados para calibração de quantização
fractionfloat1.0Fração do conjunto de dados para calibração (recomenda-se 100-400 imagens)
devicestrNoneDispositivo de exportação: GPUdevice=0) ou CPUdevice=cpu)

Para todas as opções de exportação, consulte a documentação do Modo de Exportação.

Estrutura de Saída

yolo11n_axelera_model/
├── yolo11n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Executando a Inferência

Carregue o modelo exportado com a Ultralytics e execute a inferência, semelhante ao carregamento ONNX .

Inferência com o modelo Axelera

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Problema conhecido

A primeira execução da inferência pode lançar uma ImportError. As execuções subsequentes funcionarão corretamente. Isso será corrigido numa versão futura.

Desempenho da Inference

O Metis AIPU maximiza o rendimento enquanto minimiza o consumo de energia.

MétricaMetis PCIe x4Metis M.2Nota
Throughput Máximo856 TOPS214 TOPSPrecisão INT8
YOLOv5m FPS~1539 FPS~326 FPSEntrada 640x640
YOLOv5s FPSN/A~827 FPSEntrada 640x640
EficiênciaAltoMuito AltoIdeal para energia da bateria

Referências baseadas nos dados da Axelera AI. O FPS real depende do tamanho do modelo, do processamento em lote e da resolução de entrada.

Aplicações no Mundo Real

O YOLO da Ultralytics no hardware da Axelera permite soluções avançadas de computação de ponta:

  1. Treine o seu modelo usandoo Modo de Treinamento Ultralytics
  2. Exportar para o formato Axelera usando model.export(format="axelera")
  3. Validar precisão com yolo val para verificar a perda mínima de quantização
  4. Prever usando yolo predict para validação qualitativa

Verificação do estado do dispositivo

Verifique se o seu dispositivo Axelera está a funcionar corretamente:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Para obter diagnósticos detalhados, consulte a documentação do AxDevice.

Desempenho máximo

Esta integração utiliza configuração single-core para compatibilidade. Para produção que requer rendimento máximo, o Axelera Voyager SDK oferece:

  • Utilização multi-core (quad-core Metis AIPU)
  • Pipelines de inferência de streaming
  • Inferência em mosaico para câmaras de alta resolução

Consulte o modelo-zoo para obter referências de FPS ou contacte a Axelera para obter suporte à produção.

Problemas conhecidos

Limitações conhecidas

  • Compatibilidade com PyTorch .9: O primeiro yolo export format=axelera O comando pode falhar devido ao PyTorch automático PyTorch para a versão 2.8. Execute o comando uma segunda vez para que seja bem-sucedido.

  • Limitações de energia M.2: Modelos grandes ou extragrandes podem apresentar erros de tempo de execução em aceleradores M.2 devido a restrições de fornecimento de energia.

  • Primeira inferência ImportError: A primeira execução de inferência pode lançar uma ImportError. As execuções subsequentes funcionam corretamente.

Para obter suporte, visite a Comunidade Axelera.

FAQ

Quais versões do YOLO são suportadas no Axelera?

O Voyager SDK suporta a exportação de YOLOv8 e YOLO11 .

Posso implementar modelos treinados personalizados?

Sim. Qualquer modelo treinado usando o Modo de Treinamento Ultralytics pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.

Como a quantização INT8 afeta a precisão?

O Voyager SDK da Axelera quantiza automaticamente modelos para a arquitetura AIPU de precisão mista. Para a maioria detecção de objetos tarefas, os ganhos de desempenho (FPS mais alto, menor consumo de energia) superam significativamente o impacto mínimo sobre mAP. A quantização leva de segundos a várias horas, dependendo do tamanho do modelo. Executar yolo val após a exportação para verificar a precisão.

Quantas imagens de calibração devo usar?

Recomendamos entre 100 e 400 imagens. Mais de 400 não oferece nenhum benefício adicional e aumenta o tempo de quantização. Experimente com 100, 200 e 400 imagens para encontrar o equilíbrio ideal.

Onde posso encontrar o SDK do Voyager?

O SDK, os drivers e as ferramentas de compilação estão disponíveis através do Portal do Desenvolvedor da Axelera.



📅 Criado há 18 dias ✏️ Atualizado há 1 dia
glenn-jocherpderrengerambitious-octopusonuralpszr

Comentários