Ir para o conteúdo

Aceleração da IA da Axelera

Brevemente - 1º trimestre de 2026

Apoio da Axelera em ultralytics é em curso. Os exemplos aqui apresentados mostram a UI/UX planeada e serão executáveis assim que o pacote de tempo de execução Axelera for lançado.

Ultralytics faz parceria com a Axelera AI para simplificar a inferência de alto desempenho e com eficiência energética em dispositivos Edge AI. Esta integração permite aos utilizadores exportar e implementar modelosUltralytics YOLO diretamente para as plataformas Metis® AIPU e Europa® utilizando o SDK Voyager.

Ecossistema de IA da Axelera

A Axelera AI fornece aceleração de hardware dedicada para visão computacional e IA generativa na periferia. A sua tecnologia utiliza uma arquitetura proprietária de fluxo de dados e computação na memória para proporcionar um elevado rendimento (até 856 TOPS) com um baixo consumo de energia.

Para os utilizadores Ultralytics , isto oferece um caminho escalável para implementar a deteção de objectos, a estimativa de pose e outras tarefas YOLO em dispositivos que vão desde drones incorporados a servidores de ponta.

Selecionar o hardware certo

A Axelera AI oferece vários fatores de forma para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para a implantação do Ultralytics YOLO .

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portfólio de hardware

A linha de hardware da Axelera é optimizada para executar Ultralytics YOLO11 e versões antigas com alta eficiência de FPS por watt.

Cartões aceleradores

Estas placas permitem a aceleração da IA em dispositivos anfitriões existentes, facilitando as implantações de raiz.

ProdutoFator de formaCalcularDesempenho (INT8)Aplicação de destino
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSAnálise de vídeo de alta densidade, cidades inteligentes
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSPCs industriais, gestão de filas de espera no retalho
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, robótica, dispositivos médicos portáteis
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSAmbientes que exigem uma gestão térmica avançada

Sistemas integrados

Para soluções chave na mão, a Axelera estabelece parcerias com fabricantes para fornecer sistemas pré-validados para a Metis AIPU.

  • Placa de computação Metis: Um dispositivo periférico autónomo que emparelha a Metis AIPU com uma CPU ARM Rockchip RK3588.
  • Estações de trabalho: Torres empresariais da Dell (Precision 3460XE) e da Lenovo (ThinkStation P360 Ultra).
  • PCs industriais: Sistemas robustos da Advantech e da Aetina concebidos para a automatização do fabrico.

Integração do SDK do Voyager

O SDK Voyager serve de ponte entre os modelos Ultralytics e o hardware Axelera. Ele lida com a compilação, quantização e execução em tempo de execução de redes neurais.

Principais caraterísticas para os utilizadores Ultralytics :

  1. Exportação sem problemas: O compilador do SDK optimiza os modelos YOLO para a arquitetura de fluxo de dados Metis.
  2. Motor de quantização: Converte automaticamente modelos FP32 para precisão INT8 com perda mínima de precisão.
  3. Pipeline Builder: Uma estrutura baseada em YAML para encadear vários modelos (por exemplo, deteção + estimativa de pose) sem escrever código C++ complexo.

Instalação e configuração

Para utilizar a aceleração Axelera, é necessário o ficheiro ultralytics instalado. Observe que o SDK do Voyager é uma instalação separada no nível do sistema necessária para fazer a interface com o hardware. As rodas de tempo de execução são esperadas em Q1 2026os comandos abaixo reflectem o fluxo de configuração pretendido.

# Install Ultralytics
pip install ultralytics

# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.

Exportação de modelos YOLO para a Axelera

Quando o pacote de tempo de execução Axelera for enviado (meta Q1 2026), exportará os seus modelos YOLO treinados para o formato Axelera utilizando o comando de exportação Ultralytics padrão. Esse processo gera os artefatos exigidos pelo compilador Voyager.

SDK do Voyager necessário

O format='axelera' A exportação requer que as bibliotecas Axelera estejam disponíveis no seu ambiente. Como alternativa, é possível exportar para ONNX e compilar manualmente utilizando a cadeia de ferramentas Voyager.

Exemplos de Exportação

Converter um modelo YOLO11 para a implantação do Metis.

Exportar para o formato Axelera

Exemplo futuro - funcionará quando o tempo de execução for lançado

Este bloco de código demonstra o fluxo planeado. Exigirá o próximo pacote de tempo de execução Axelera (ETA Q1 2026) para ser executado com êxito.

from ultralytics import YOLO

# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640

Para conhecer os argumentos disponíveis, consulte a documentação do Modo de Exportação.

Executando a Inferência

Uma vez exportado, será possível carregar o modelo compilado pela Axelera diretamente com o comando ultralytics API (semelhante ao carregamento de ONNX modelos). O exemplo abaixo mostra o padrão de utilização esperado para executar a inferência e guardar os resultados após o envio do pacote de tempo de execução.

Inferência com o formato Axelera

Exemplo futuro - funcionará quando o tempo de execução for lançado

Este bloco de código demonstra o fluxo planeado. Exigirá o próximo pacote de tempo de execução Axelera (ETA Q1 2026) para ser executado com êxito.

from ultralytics import YOLO

# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel")  # will work once Axelera runtime is released

# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)

# Iterate over result objects to inspect or render detections
for r in results:
    boxes = r.boxes  # bounding boxes tensor + metadata
    print(f"Detected {len(boxes)} objects")

    # Save visuals per result (files saved alongside inputs)
    r.save()  # saves annotated image(s) to disk
    # Or display interactively (desktop environments)
    # r.show()

Desempenho da inferência

A Metis AIPU foi concebida para maximizar o rendimento e minimizar o consumo de energia. Os benchmarks abaixo ilustram o desempenho que pode ser alcançado com os modelos Ultralytics padrão.

MétricaMetis PCIe x4Metis M.2Nota
Pico de produtividade856 TOPS214 TOPSPrecisão INT8
YOLOv5m FPS~1539 FPS~326 FPSEntrada 640x640
YOLOv5s FPSN/A~827 FPSEntrada 640x640
EficiênciaElevadoMuito elevadoIdeal para alimentação por bateria

Benchmarks baseados em dados da Axelera AI (setembro de 2025). O FPS real depende do tamanho do modelo, dos lotes e da resolução de entrada.

Aplicações no Mundo Real

Ultralytics YOLO no hardware Axelera permite soluções avançadas de computação periférica:

FAQ

Que versões YOLO são suportadas pela Axelera?

O SDK do Voyager e a integração Ultralytics suportam a exportação do YOLOv8 e YOLO11 modelos.

Posso implementar modelos treinados personalizados?

Sim. Qualquer modelo treinado com o Ultralytics Train Mode pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.

Como é que a quantização da INT8 afecta a precisão?

O motor de quantização da Axelera utiliza técnicas de calibração avançadas para minimizar a queda de precisão. Para a maioria das tarefas de deteção, o ganho de desempenho supera significativamente o impacto insignificante no mAP.

Onde posso encontrar o SDK do Voyager?

O SDK, os controladores e as ferramentas de compilação estão disponíveis através do Portal do Programador Axelera.



📅C riado há 0 dias ✏️ Atualizado há 0 dias
glenn-jocher

Comentários