Aceleração da IA da Axelera
Brevemente - 1º trimestre de 2026
Apoio da Axelera em ultralytics é em curso. Os exemplos aqui apresentados mostram a UI/UX planeada e serão executáveis assim que o pacote de tempo de execução Axelera for lançado.
Ultralytics faz parceria com a Axelera AI para simplificar a inferência de alto desempenho e com eficiência energética em dispositivos Edge AI. Esta integração permite aos utilizadores exportar e implementar modelosUltralytics YOLO diretamente para as plataformas Metis® AIPU e Europa® utilizando o SDK Voyager.
A Axelera AI fornece aceleração de hardware dedicada para visão computacional e IA generativa na periferia. A sua tecnologia utiliza uma arquitetura proprietária de fluxo de dados e computação na memória para proporcionar um elevado rendimento (até 856 TOPS) com um baixo consumo de energia.
Para os utilizadores Ultralytics , isto oferece um caminho escalável para implementar a deteção de objectos, a estimativa de pose e outras tarefas YOLO em dispositivos que vão desde drones incorporados a servidores de ponta.
Selecionar o hardware certo
A Axelera AI oferece vários fatores de forma para atender a diferentes restrições de implantação. O gráfico abaixo ajuda a identificar o hardware ideal para a implantação do Ultralytics YOLO .
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portfólio de hardware
A linha de hardware da Axelera é optimizada para executar Ultralytics YOLO11 e versões antigas com alta eficiência de FPS por watt.
Cartões aceleradores
Estas placas permitem a aceleração da IA em dispositivos anfitriões existentes, facilitando as implantações de raiz.
| Produto | Fator de forma | Calcular | Desempenho (INT8) | Aplicação de destino |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Análise de vídeo de alta densidade, cidades inteligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PCs industriais, gestão de filas de espera no retalho |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robótica, dispositivos médicos portáteis |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Ambientes que exigem uma gestão térmica avançada |
Sistemas integrados
Para soluções chave na mão, a Axelera estabelece parcerias com fabricantes para fornecer sistemas pré-validados para a Metis AIPU.
- Placa de computação Metis: Um dispositivo periférico autónomo que emparelha a Metis AIPU com uma CPU ARM Rockchip RK3588.
- Estações de trabalho: Torres empresariais da Dell (Precision 3460XE) e da Lenovo (ThinkStation P360 Ultra).
- PCs industriais: Sistemas robustos da Advantech e da Aetina concebidos para a automatização do fabrico.
Integração do SDK do Voyager
O SDK Voyager serve de ponte entre os modelos Ultralytics e o hardware Axelera. Ele lida com a compilação, quantização e execução em tempo de execução de redes neurais.
Principais caraterísticas para os utilizadores Ultralytics :
- Exportação sem problemas: O compilador do SDK optimiza os modelos YOLO para a arquitetura de fluxo de dados Metis.
- Motor de quantização: Converte automaticamente modelos FP32 para precisão INT8 com perda mínima de precisão.
- Pipeline Builder: Uma estrutura baseada em YAML para encadear vários modelos (por exemplo, deteção + estimativa de pose) sem escrever código C++ complexo.
Instalação e configuração
Para utilizar a aceleração Axelera, é necessário o ficheiro ultralytics instalado. Observe que o SDK do Voyager é uma instalação separada no nível do sistema necessária para fazer a interface com o hardware. As rodas de tempo de execução são esperadas em Q1 2026os comandos abaixo reflectem o fluxo de configuração pretendido.
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
Exportação de modelos YOLO para a Axelera
Quando o pacote de tempo de execução Axelera for enviado (meta Q1 2026), exportará os seus modelos YOLO treinados para o formato Axelera utilizando o comando de exportação Ultralytics padrão. Esse processo gera os artefatos exigidos pelo compilador Voyager.
SDK do Voyager necessário
O format='axelera' A exportação requer que as bibliotecas Axelera estejam disponíveis no seu ambiente. Como alternativa, é possível exportar para ONNX e compilar manualmente utilizando a cadeia de ferramentas Voyager.
Exemplos de Exportação
Converter um modelo YOLO11 para a implantação do Metis.
Exportar para o formato Axelera
Exemplo futuro - funcionará quando o tempo de execução for lançado
Este bloco de código demonstra o fluxo planeado. Exigirá o próximo pacote de tempo de execução Axelera (ETA Q1 2026) para ser executado com êxito.
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
Para conhecer os argumentos disponíveis, consulte a documentação do Modo de Exportação.
Executando a Inferência
Uma vez exportado, será possível carregar o modelo compilado pela Axelera diretamente com o comando ultralytics API (semelhante ao carregamento de ONNX modelos). O exemplo abaixo mostra o padrão de utilização esperado para executar a inferência e guardar os resultados após o envio do pacote de tempo de execução.
Inferência com o formato Axelera
Exemplo futuro - funcionará quando o tempo de execução for lançado
Este bloco de código demonstra o fluxo planeado. Exigirá o próximo pacote de tempo de execução Axelera (ETA Q1 2026) para ser executado com êxito.
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
Desempenho da inferência
A Metis AIPU foi concebida para maximizar o rendimento e minimizar o consumo de energia. Os benchmarks abaixo ilustram o desempenho que pode ser alcançado com os modelos Ultralytics padrão.
| Métrica | Metis PCIe x4 | Metis M.2 | Nota |
|---|---|---|---|
| Pico de produtividade | 856 TOPS | 214 TOPS | Precisão INT8 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | Entrada 640x640 |
| YOLOv5s FPS | N/A | ~827 FPS | Entrada 640x640 |
| Eficiência | Elevado | Muito elevado | Ideal para alimentação por bateria |
Benchmarks baseados em dados da Axelera AI (setembro de 2025). O FPS real depende do tamanho do modelo, dos lotes e da resolução de entrada.
Aplicações no Mundo Real
Ultralytics YOLO no hardware Axelera permite soluções avançadas de computação periférica:
- Retalho inteligente: Contagem de objectos em tempo real e análise de mapas de calor para otimização de lojas.
- Segurança industrial: Deteção de EPI de baixa latência em ambientes de fabrico.
- Drone Analytics: Deteção de objectos a alta velocidade em UAVs para agricultura e busca e salvamento.
- Sistemas de tráfego: Reconhecimento de mat rículas e estimativa de velocidade com base na borda.
FAQ
Que versões YOLO são suportadas pela Axelera?
O SDK do Voyager e a integração Ultralytics suportam a exportação do YOLOv8 e YOLO11 modelos.
Posso implementar modelos treinados personalizados?
Sim. Qualquer modelo treinado com o Ultralytics Train Mode pode ser exportado para o formato Axelera, desde que utilize camadas e operações suportadas.
Como é que a quantização da INT8 afecta a precisão?
O motor de quantização da Axelera utiliza técnicas de calibração avançadas para minimizar a queda de precisão. Para a maioria das tarefas de deteção, o ganho de desempenho supera significativamente o impacto insignificante no mAP.
Onde posso encontrar o SDK do Voyager?
O SDK, os controladores e as ferramentas de compilação estão disponíveis através do Portal do Programador Axelera.