Accelerazione AI di Axelera
In arrivo - 1° trimestre 2026
Supporto Axelera in ultralytics è in corso. Gli esempi qui riportati mostrano l'UI/UX prevista e saranno eseguibili una volta rilasciato il pacchetto runtime Axelera.
Ultralytics collabora con Axelera AI per ottimizzare l'inferenza ad alte prestazioni ed efficienza energetica sui dispositivi Edge AI. Questa integrazione consente agli utenti di esportare e distribuire i modelliUltralytics YOLO direttamente sulle piattaforme Metis® AIPU ed Europa® utilizzando il Voyager SDK.
Axelera AI fornisce un'accelerazione hardware dedicata per la computer vision e l'intelligenza artificiale generativa in ambito edge. La sua tecnologia sfrutta un'architettura dataflow proprietaria e l'elaborazione in-memory per offrire un throughput elevato (fino a 856 TOPS) con un basso consumo energetico.
Per gli utenti di Ultralytics , questo offre un percorso scalabile per implementare il rilevamento degli oggetti, la stima della posa e altre attività YOLO su dispositivi che vanno dai droni incorporati ai server edge.
Selezione dell'hardware giusto
Axelera AI offre diversi fattori di forma per soddisfare i diversi vincoli di implementazione. Il grafico seguente aiuta a identificare l'hardware ottimale per l'implementazione di Ultralytics YOLO .
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portafoglio hardware
La linea di hardware Axelera è ottimizzata per l'esecuzione di Ultralytics YOLO11 e le versioni precedenti con un'elevata efficienza FPS per watt.
Schede acceleratore
Queste schede consentono l'accelerazione dell'intelligenza artificiale nei dispositivi host esistenti, facilitando le implementazioni brownfield.
| Prodotto | Fattore di forma | Calcolo | Prestazioni (INT8) | Applicazione target |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPU | 856 TOPS | Analisi video ad alta densità, città intelligenti |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PC industriali, gestione delle code di vendita al dettaglio |
| Metis M.2 | M.2 2280 Chiave M | 1x Metis AIPU | 214 TOPS | Droni, robotica, dispositivi medici portatili |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Ambienti che richiedono una gestione termica avanzata |
Sistemi integrati
Per le soluzioni chiavi in mano, Axelera collabora con i produttori per fornire sistemi pre-convalidati per l'AIPU Metis.
- Metis Compute Board: Un dispositivo edge indipendente che abbina l'AIPU Metis a una CPU ARM Rockchip RK3588.
- Postazioni di lavoro: Torri aziendali di Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
- PC industriali: Sistemi robusti di Advantech e Aetina progettati per l'automazione della produzione.
Integrazione dell'SDK Voyager
L'SDK Voyager funge da ponte tra i modelli Ultralytics e l'hardware Axelera. Gestisce la compilazione, la quantizzazione e l'esecuzione runtime delle reti neurali.
Caratteristiche principali per gli utenti di Ultralytics :
- Esportazione senza problemi: Il compilatore dell'SDK ottimizza i modelli YOLO per l'architettura Metis dataflow.
- Motore di quantizzazione: Converte automaticamente i modelli FP32 in precisione INT8 con una perdita minima di precisione.
- Pipeline Builder: Un framework basato su YAML per concatenare più modelli (ad esempio, rilevamento + stima della posa) senza scrivere codice C++ complesso.
Installazione e configurazione
Per utilizzare l'accelerazione di Axelera, è necessario disporre dell'opzione ultralytics installato. Si noti che il Voyager SDK è un'installazione separata a livello di sistema, necessaria per interfacciarsi con l'hardware. Le ruote di runtime sono attese in Q1 2026I comandi riportati di seguito riflettono il flusso di configurazione previsto.
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
Esportare i modelli YOLO in Axelera
Quando il pacchetto runtime Axelera verrà distribuito (target Q1 2026), esporterete i vostri modelli YOLO addestrati nel formato Axelera utilizzando il comando di esportazione standard di Ultralytics . Questo processo genera gli artefatti richiesti dal compilatore Voyager.
Richiesto l'SDK Voyager
Il format='axelera' L'esportazione richiede che le librerie Axelera siano disponibili nel vostro ambiente. In alternativa, è possibile esportare in ONNX e compilare manualmente usando la catena di strumenti Voyager.
Esempi di Export
Convertire un modello YOLO11 per la distribuzione di Metis.
Esportazione in formato Axelera
Esempio futuro - funzionerà quando il runtime sarà rilasciato
Questo blocco di codice dimostra il flusso previsto. Per l'esecuzione è necessario il pacchetto runtime Axelera di prossima uscita (ETA Q1 2026).
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
Per gli argomenti disponibili, consultare la documentazione sulla modalità di esportazione.
Esecuzione dell'Inferenza
Una volta esportato, sarà possibile caricare il modello compilato da Axelera direttamente con il comando ultralytics API (simile al caricamento di ONNX modelli). L'esempio seguente mostra il modello di utilizzo previsto per l'esecuzione dell'inferenza e il salvataggio dei risultati dopo la spedizione del pacchetto runtime.
Inferenza con il formato Axelera
Esempio futuro - funzionerà quando il runtime sarà rilasciato
Questo blocco di codice dimostra il flusso previsto. Per l'esecuzione è necessario il pacchetto runtime Axelera di prossima uscita (ETA Q1 2026).
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
Prestazioni di inferenza
L'AIPU Metis è stata progettata per massimizzare il throughput riducendo al minimo il consumo energetico. I benchmark riportati di seguito illustrano le prestazioni ottenibili con i modelli Ultralytics standard.
| Metrica | Metis PCIe x4 | Metis M.2 | Nota |
|---|---|---|---|
| Portata di picco | 856 TOPS | 214 TOPS | Precisione INT8 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 Ingresso |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 Ingresso |
| Efficienza | Alto | Molto alto | Ideale per l'alimentazione a batteria |
Benchmark basati sui dati Axelera AI (settembre 2025). Gli FPS effettivi dipendono dalle dimensioni del modello, dal batching e dalla risoluzione di input.
Applicazioni nel mondo reale
Ultralytics YOLO su hardware Axelera consente soluzioni avanzate di edge computing:
- Smart Retail: Conteggio degli oggetti in tempo reale e analisi delle mappe di calore per l'ottimizzazione dei punti vendita.
- Sicurezza industriale: Rilevamento dei DPI a bassa latenza negli ambienti di produzione.
- Drone Analytics: Rilevamento di oggetti ad alta velocità su UAV per l'agricoltura e la ricerca e il soccorso.
- Sistemi di traffico: Riconoscimento delle targhe e stima della velocità basati sui bordi.
FAQ
Quali versioni di YOLO sono supportate da Axelera?
L'SDK di Voyager e l'integrazione con Ultralytics supportano l'esportazione di YOLOv8 e YOLO11 modelli.
Posso distribuire modelli addestrati in modo personalizzato?
Sì. Qualsiasi modello addestrato con Ultralytics Train Mode può essere esportato nel formato Axelera, purché utilizzi i livelli e le operazioni supportate.
In che modo la quantizzazione INT8 influisce sulla precisione?
Il motore di quantizzazione di Axelera utilizza tecniche di calibrazione avanzate per ridurre al minimo la caduta di precisione. Per la maggior parte dei compiti di rilevamento, il guadagno di prestazioni supera significativamente l'impatto trascurabile su mAP.
Dove posso trovare l'SDK di Voyager?
L'SDK, i driver e gli strumenti di compilazione sono disponibili tramite il portale per sviluppatori di Axelera.