Ir para o conteúdo

Exportação e Implementação Axelera AI

Lançamento Experimental

Esta é uma integração experimental que demonstra a implementação no hardware Axelera Metis. A integração completa é prevista para fevereiro de 2026 com exportação de modelo sem a necessidade de hardware Axelera e instalação pip padrão.

A Ultralytics faz parceria com a Axelera AI para permitir inferência de alto desempenho e energeticamente eficiente em dispositivos de Edge AI. Exporte e implemente modelos Ultralytics YOLO diretamente para a Metis® AIPU usando o Voyager SDK.

Ecossistema de implementação de IA de ponta da Axelera para YOLO

A Axelera AI oferece aceleração de hardware dedicada para visão computacional na borda, usando uma arquitetura de fluxo de dados proprietária e computação em memória para entregar até 856 TOPS com baixo consumo de energia.

Selecionando o Hardware Certo

A Axelera AI oferece vários formatos para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para sua implantação Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portfólio de Hardware

A linha de hardware Axelera é otimizada para executar Ultralytics YOLO26 e versões legadas com alta eficiência de FPS por watt.

Placas Aceleradoras

Essas placas permitem a aceleração de IA em dispositivos host existentes, facilitando implantações brownfield.

ProdutoFormatoComputaçãoDesempenho (INT8)Aplicação Alvo
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSAnálise de vídeo de alta densidade, cidades inteligentes
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSPCs industriais, gestão de filas no varejo
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, robótica, dispositivos médicos portáteis
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSAmbientes que exigem gerenciamento térmico avançado

Sistemas Integrados

Para soluções completas, a Axelera faz parceria com fabricantes para fornecer sistemas pré-validados para o Metis AIPU.

  • Placa de Computação Metis: Um dispositivo edge autónomo que emparelha o Metis AIPU com uma CPU ARM Rockchip RK3588.
  • Workstations: Torres corporativas da Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
  • PCs Industriais: Sistemas robustecidos da Advantech e Aetina projetados para automação de manufatura.

Tarefas Suportadas

Atualmente, modelos de Detecção de Objetos podem ser exportados para o formato Axelera. Tarefas adicionais estão sendo integradas:

TarefaStatus
Detecção de Objetos✅ Suportado
Estimativa de PoseEm breve
SegmentaçãoEm breve
Caixas Delimitadoras OrientadasEm breve

Instalação

Requisitos da Plataforma

A exportação para o formato Axelera requer:

  • Sistema Operacional: Apenas Linux (Ubuntu 22.04/24.04 recomendado)
  • Hardware: Acelerador de IA Axelera (dispositivos Metis)
  • Python: Versão 3.10 (3.11 e 3.12 em breve)

Instalação da Ultralytics

pip install ultralytics

Para instruções detalhadas, consulte nosso guia de Instalação Ultralytics. Se encontrar dificuldades, consulte nosso guia de Problemas Comuns.

Instalação do Driver Axelera

  1. Adicione a chave do repositório Axelera:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. Adicione o repositório ao apt:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. Instale o SDK e carregue o driver:

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

Exportando Modelos YOLO para Axelera

Exporte seus modelos YOLO treinados usando o comando de exportação padrão da Ultralytics.

Exportar para o Formato Axelera

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera

Argumentos de Exportação

ArgumentoTipoPadrãoDescrição
formatstr'axelera'Formato alvo para hardware Axelera Metis AIPU
imgszint ou tuple640Tamanho da imagem para entrada do modelo
int8boolTrueHabilitar quantização INT8 para AIPU
datastr'coco128.yaml'Configuração do dataset para calibração de quantização
fractionfloat1.0Fração do dataset para calibração (100-400 imagens recomendadas)
devicestrNoneDispositivo de exportação: GPU (device=0) ou CPU (device=cpu)

Para todas as opções de exportação, consulte a documentação do Modo de Exportação.

Estrutura de Saída

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Executando a Inferência

Carregue o modelo exportado com a API Ultralytics e execute a inferência, semelhante ao carregamento de modelos ONNX.

Inferência com Modelo Axelera

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Problema Conhecido

A primeira execução de inferência pode gerar um ImportError. Execuções subsequentes funcionarão corretamente. Isso será abordado em uma versão futura.

Desempenho da Inference

A Metis AIPU maximiza o throughput enquanto minimiza o consumo de energia.

MétricaMetis PCIe x4Metis M.2Nota
Throughput Máximo856 TOPS214 TOPSPrecisão INT8
YOLOv5m FPS~1539 FPS~326 FPSEntrada 640x640
YOLOv5s FPSN/A~827 FPSEntrada 640x640
EficiênciaAltoMuito AltoIdeal para energia da bateria

Benchmarks baseados em dados da Axelera AI. O FPS real depende do tamanho do modelo, do batching e da resolução de entrada.

Aplicações no Mundo Real

O YOLO da Ultralytics no hardware da Axelera permite soluções avançadas de computação de ponta:

  1. Treine seu modelo usando o Modo de Treinamento da Ultralytics
  2. Exportar para o formato Axelera usando model.export(format="axelera")
  3. Validar precisão com yolo val para verificar a perda mínima de quantização
  4. Prever usando yolo predict para validação qualitativa

Verificação de Integridade do Dispositivo

Verifique se o seu dispositivo Axelera está funcionando corretamente:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Para diagnósticos detalhados, consulte a documentação do AxDevice.

Desempenho Máximo

Esta integração utiliza uma configuração de núcleo único para compatibilidade. Para produção que exige throughput máximo, o Axelera Voyager SDK oferece:

  • Utilização multi-core (AIPU Metis quad-core)
  • Pipelines de inferência em streaming
  • Inferência em mosaico para câmeras de maior resolução

Consulte o model-zoo para benchmarks de FPS ou entre em contato com a Axelera para suporte de produção.

Problemas Conhecidos

Limitações Conhecidas

  • Compatibilidade com PyTorch 2.9: A primeira yolo export format=axelera comando pode falhar devido ao downgrade automático do PyTorch para 2.8. Execute o comando uma segunda vez para ter sucesso.

  • Limitações de energia M.2: Modelos grandes ou extragrandes podem encontrar erros de tempo de execução em aceleradores M.2 devido a restrições de fornecimento de energia.

  • ImportError na primeira inferência: A primeira execução de inferência pode lançar um ImportError. As execuções subsequentes funcionam corretamente.

Para suporte, visite a Comunidade Axelera.

FAQ

Quais versões do YOLO são suportadas no Axelera?

O SDK Voyager suporta a exportação de modelos YOLOv8 e YOLO26.

Posso implantar modelos treinados personalizados?

Sim. Qualquer modelo treinado usando o Modo de Treinamento Ultralytics pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.

Como a quantização INT8 afeta a precisão?

O Voyager SDK da Axelera quantiza automaticamente modelos para a arquitetura AIPU de precisão mista. Para a maioria das detecção de objetos tarefas, os ganhos de desempenho (FPS mais alto, menor consumo de energia) superam significativamente o impacto mínimo na mAP. A quantização leva de segundos a várias horas, dependendo do tamanho do modelo. Execute yolo val após a exportação para verificar a precisão.

Quantas imagens de calibração devo usar?

Recomendamos de 100 a 400 imagens. Mais de 400 não oferece benefício adicional e aumenta o tempo de quantização. Experimente com 100, 200 e 400 imagens para encontrar o equilíbrio ideal.

Onde posso encontrar o SDK do Voyager?

O SDK, os drivers e as ferramentas de compilação estão disponíveis através do Portal do Desenvolvedor da Axelera.



📅 Criado há 1 mês ✏️ Atualizado há 4 dias
glenn-jocherpderrengerambitious-octopusonuralpszr

Comentários