Esportazione e Distribuzione Axelera AI

Q: How does INT8 quantization affect accuracy?

Il Voyager SDK di Axelera quantizza automaticamente i modelli per l'architettura AIPU a precisione mista. Per la maggior parte dei task di rilevamento oggetti, i guadagni prestazionali (FPS più elevati, minor consumo energetico) superano significativamente l'impatto minimo sul mAP. La quantizzazione richiede da pochi secondi a diverse ore a seconda della dimensione del modello. Esegui yolo val dopo l'esportazione per verificare l'accuratezza.

Rilascio Sperimentale

Questa è un'integrazione sperimentale che dimostra la distribuzione sull'hardware Axelera Metis. L'integrazione completa è prevista entro febbraio 2026 con l'esportazione del modello senza richiedere hardware Axelera e installazione pip standard.

Ultralytics collabora con Axelera AI per abilitare inferenze ad alte prestazioni ed efficienti dal punto di vista energetico su dispositivi Edge AI. Esporta e distribuisci i modelli Ultralytics YOLO direttamente sulla Metis® AIPU utilizzando il Voyager SDK.

Ecosistema di implementazione edge Axelera AI per YOLO

Axelera AI fornisce accelerazione hardware dedicata per la visione artificiale all'edge, utilizzando un'architettura di dataflow proprietaria e il calcolo in-memory per fornire fino a 856 TOPS con basso consumo energetico.

Selezione dell'Hardware Giusto

Axelera AI offre vari fattori di forma per adattarsi a diverse limitazioni di implementazione. Il grafico sottostante aiuta a identificare l'hardware ottimale per la tua implementazione YOLO di Ultralytics.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portfolio hardware

La gamma hardware di Axelera è ottimizzata per eseguire Ultralytics YOLO26 e le versioni precedenti con un'elevata efficienza FPS-per-watt.

Schede Acceleratrici

Queste schede consentono l'accelerazione dell'IA nei dispositivi host esistenti, facilitando i brownfield deployments.

Prodotto	Fattore di forma	Calcolo	Prestazioni (INT8)	Applicazione di destinazione
Metis PCIe x4	PCIe Gen3 x16	4x AIPU Metis	856 TOPS	Video analisi ad alta densità, smart cities
Metis PCIe x1	PCIe Gen3 x1	1x Metis AIPU	214 TOPS	PC industriali, gestione delle code al dettaglio
Metis M.2	M.2 2280 M-Key	1x Metis AIPU	214 TOPS	Droni, robotica, dispositivi medici portatili
Metis M.2 MAX	M.2 2280	1x Metis AIPU	214 TOPS	Ambienti che richiedono una gestione termica avanzata

Sistemi integrati

Per soluzioni chiavi in mano, Axelera collabora con i produttori per fornire sistemi pre-validati per la Metis AIPU.

Metis Compute Board: Un dispositivo edge standalone che abbina il Metis AIPU a una CPU ARM Rockchip RK3588.
Workstation: Torri enterprise di Dell (Precision 3460XE) e Lenovo (ThinkStation P360 Ultra).
PC industriali: Sistemi rinforzati di Advantech e Aetina progettati per l'automazione della produzione.

Attività supportate

Attualmente, i modelli di Object Detection possono essere esportati nel formato Axelera. Ulteriori task sono in fase di integrazione:

Task	Stato
Rilevamento di oggetti	✅ Supportato
Stima della posa	Prossimamente
Segmentazione	Prossimamente
Bounding Box Orientate	Prossimamente

Installazione

Requisiti di Piattaforma

L'esportazione nel formato Axelera richiede:

Sistema Operativo: Solo Linux (Ubuntu 22.04/24.04 raccomandato)
Hardware: acceleratore AI Axelera (dispositivi Metis)
Python: Versione 3.10 (3.11 e 3.12 in arrivo)

Installazione di Ultralytics

pip install ultralytics

Per istruzioni dettagliate, consultare la nostra guida all'installazione di Ultralytics. In caso di difficoltà, consultare la nostra guida ai problemi comuni.

Installazione Driver Axelera

Aggiungere la chiave del repository Axelera:

sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"

Aggiungere il repository ad apt:

sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"

Installare l'SDK e caricare il driver:

sudo apt update
sudo apt install -y axelera-voyager-sdk-base
sudo modprobe metis
yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER

Esportazione di modelli YOLO in Axelera

Esportare i modelli YOLO addestrati utilizzando il comando di esportazione standard di Ultralytics.

Esporta in formato Axelera

PythonCLI

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory

yolo export model=yolo26n.pt format=axelera

Argomenti di esportazione

Argomento	Tipo	Predefinito	Descrizione
`format`	`str`	`'axelera'`	Formato di destinazione per l'hardware AIPU Axelera Metis
`imgsz`	`int` oppure `tuple`	`640`	Dimensione dell'immagine per l'input del modello
`int8`	`bool`	`True`	Abilitare la quantizzazione INT8 per AIPU
`data`	`str`	`'coco128.yaml'`	Configurazione del dataset per la calibrazione della quantizzazione
`fraction`	`float`	`1.0`	Frazione del dataset per la calibrazione (si raccomandano 100-400 immagini)
`device`	`str`	`None`	Dispositivo di esportazione: GPU (`device=0`) o CPU (`device=cpu`)

Per tutte le opzioni di esportazione, consultare la documentazione della modalità di esportazione.

Struttura dell'output

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Esecuzione dell'Inferenza

Caricare il modello esportato con l'API Ultralytics ed eseguire l'inferenza, in modo simile al caricamento dei modelli ONNX.

Inferenza con modello Axelera

PythonCLI

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Problema noto

La prima esecuzione dell'inferenza potrebbe generare un ImportError. Le esecuzioni successive funzioneranno correttamente. Questo problema verrà risolto in una futura release.

Prestazioni di Inference

L'AIPU Metis massimizza il throughput riducendo al minimo il consumo energetico.

Metrica	Metis PCIe x4	Metis M.2	Nota
Throughput massimo	856 TOPS	214 TOPS	Precisione INT8
FPS di YOLOv5m	~1539 FPS	~326 FPS	Input 640x640
FPS di YOLOv5s	N/A	~827 FPS	Input 640x640
Efficienza	Alta	Molto alta	Ideale per l'alimentazione a batteria

Benchmark basati sui dati di Axelera AI. Gli FPS effettivi dipendono dalla dimensione del modello, dal batching e dalla risoluzione dell'input.

Applicazioni nel mondo reale

Ultralytics YOLO su hardware Axelera consente soluzioni avanzate di edge computing:

Smart Retail: Conteggio degli oggetti in tempo reale e analisi heatmap per l'ottimizzazione del negozio.
Sicurezza industriale: Detect di DPI a bassa latenza in ambienti di produzione.
Analisi con droni: Rilevamento di oggetti ad alta velocità su UAV per l'agricoltura e la ricerca e il salvataggio.
Sistemi di Traffico: Riconoscimento delle targhe e stima della velocità basati su edge.

Flusso di Lavoro Raccomandato

Addestrare il modello utilizzando la Modalità di addestramento di Ultralytics
Esportazione al formato Axelera utilizzando model.export(format="axelera")
Convalida precisione con yolo val per verificare la perdita minima di quantizzazione
Predizione utilizzando yolo predict per la validazione qualitativa

Controllo dello Stato del Dispositivo

Verificare il corretto funzionamento del dispositivo Axelera:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Per una diagnostica dettagliata, consultare la documentazione di AxDevice.

Massime Prestazioni

Questa integrazione utilizza una configurazione single-core per compatibilità. Per la produzione che richiede il massimo throughput, l' Axelera Voyager SDK offre:

Utilizzo multi-core (Metis AIPU quad-core)
Pipeline di inferenza in streaming
Inferenza a tasselli per telecamere ad alta risoluzione

Consultare il model-zoo per i benchmark FPS o contattare Axelera per il supporto alla produzione.

Problemi Noti

Limitazioni Note

Compatibilità con PyTorch 2.9: Il primo yolo export format=axelera comando potrebbe fallire a causa del downgrade automatico di PyTorch alla versione 2.8. Eseguire il comando una seconda volta per avere successo.
Limitazioni di alimentazione M.2: Modelli grandi o extra-grandi potrebbero riscontrare errori di runtime sugli acceleratori M.2 a causa di vincoli di alimentazione.
ImportError alla prima inferenza: La prima esecuzione dell'inferenza potrebbe generare un ImportError. Le esecuzioni successive funzionano correttamente.

Per supporto, visitare la Axelera Community.

FAQ

Quali versioni di YOLO sono supportate su Axelera?

Il Voyager SDK supporta l'esportazione dei modelli YOLOv8 e YOLO26.

È possibile distribuire modelli addestrati su misura?

Sì. Qualsiasi modello addestrato utilizzando la Modalità di addestramento Ultralytics può essere esportato nel formato Axelera, a condizione che utilizzi livelli e operazioni supportati.

In che modo la quantizzazione INT8 influisce sull'accuratezza?

L'Axelera Voyager SDK quantizza automaticamente i modelli per l'architettura AIPU a precisione mista. Per la maggior parte dei il rilevamento di oggetti compiti, i guadagni in termini di prestazioni (FPS più elevati, minor consumo energetico) superano significativamente l'impatto minimo su mAP. La quantizzazione richiede da pochi secondi a diverse ore a seconda delle dimensioni del modello. Eseguire yolo val dopo l'esportazione per verificarne l'accuratezza.

Quante immagini di calibrazione dovrei usare?

Raccomandiamo da 100 a 400 immagini. Più di 400 non offrono alcun beneficio aggiuntivo e aumentano il tempo di quantizzazione. Sperimenta con 100, 200 e 400 immagini per trovare l'equilibrio ottimale.

Dove posso trovare l'SDK Voyager?

L'SDK, i driver e gli strumenti del compilatore sono disponibili tramite l'Axelera Developer Portal.

📅 Creato 2 mesi fa ✏️ Aggiornato 18 giorni fa