Exportation et déploiement Axelera AI

Version expérimentale

Il s'agit d'une intégration expérimentale démontrant le déploiement sur le matériel Axelera Metis. Une intégration complète est prévue d'ici février 2026 avec l'exportation de modèles sans nécessiter de matériel Axelera et une installation pip standard.

Ultralytics s'associe à Axelera AI pour permettre une inférence haute performance et économe en énergie sur les appareils Edge AI. Exportez et déployez les modèles Ultralytics YOLO directement sur l'AIPU Metis® à l'aide du Voyager SDK.

Écosystème de déploiement de l'IA Axelera pour YOLO

Axelera AI offre une accélération matérielle dédiée pour la vision par ordinateur en périphérie, en utilisant une architecture de flux de données propriétaire et le calcul in-memory pour fournir jusqu'à 856 TOPS avec une faible consommation d'énergie.

Choisir le bon matériel

Axelera AI propose différents formats pour s'adapter aux différentes contraintes de déploiement. Le tableau ci-dessous vous aide à identifier le matériel optimal pour votre déploiement Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portefeuille matériel

La gamme de matériel Axelera est optimisée pour exécuter Ultralytics YOLO26 et les versions antérieures avec une efficacité élevée en termes de FPS par watt.

Cartes d'accélérateur

Ces cartes permettent l'accélération de l'IA dans les appareils hôtes existants, facilitant ainsi les déploiements brownfield.

Produit	Facteur de forme	Calcul	Performance (INT8)	Application cible
Metis PCIe x4	PCIe Gen3 x16	4x Metis AIPUs	856 TOPS	Analyse vidéo haute densité, villes intelligentes
Metis PCIe x1	PCIe Gen3 x1	1x Metis AIPU	214 TOPS	PC industriels, gestion des files d'attente dans le commerce de détail
Metis M.2	M.2 2280 M-Key	1x Metis AIPU	214 TOPS	Drones, robotique, appareils médicaux portables
Metis M.2 MAX	M.2 2280	1x Metis AIPU	214 TOPS	Environnements nécessitant une gestion thermique avancée

Systèmes intégrés

Pour les solutions clés en main, Axelera s'associe à des fabricants pour fournir des systèmes pré-validés pour le Metis AIPU.

Carte de calcul Metis : Un appareil périphérique autonome associant l'AIPU Metis à un CPU ARM Rockchip RK3588.
Stations de travail : Tours d’entreprise de Dell (Precision 3460XE) et Lenovo (ThinkStation P360 Ultra).
PC Industriels : Systèmes durcis d'Advantech et d'Aetina conçus pour l'automatisation de la fabrication.

Tâches prises en charge

Actuellement, les modèles de détection d'objets peuvent être exportés au format Axelera. Des tâches supplémentaires sont en cours d'intégration :

Tâche	Statut
Détection d'objets	✅ Pris en charge
Estimation de pose	Prochainement
Segmentation	Prochainement
Boîtes englobantes orientées	Prochainement

Installation

Exigences de la plateforme

L'exportation au format Axelera nécessite :

Système d'exploitation : Linux uniquement (Ubuntu 22.04/24.04 recommandé)
Matériel : Accélérateur Axelera AI (appareils Metis)
Python : Version 3.10 (3.11 et 3.12 prochainement)

Installation Ultralytics

pip install ultralytics

Pour des instructions détaillées, consultez notre guide d'installation Ultralytics. Si vous rencontrez des difficultés, consultez notre guide des problèmes courants.

Installation du pilote Axelera

Ajoutez la clé du dépôt Axelera :

sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"

Ajoutez le dépôt à apt :

sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"

Installez le SDK et chargez le pilote :

sudo apt update
sudo apt install -y axelera-voyager-sdk-base
sudo modprobe metis
yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER

Exporter les modèles YOLO vers Axelera

Exportez vos modèles YOLO entraînés à l'aide de la commande d'exportation standard d'Ultralytics.

Exporter au format Axelera

PythonCLI

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory

yolo export model=yolo26n.pt format=axelera

Arguments d'exportation

Argument	Type	Par défaut	Description
`format`	`str`	`'axelera'`	Format cible pour le matériel AIPU Axelera Metis
`imgsz`	`int` ou `tuple`	`640`	Taille d'image pour l'entrée du modèle
`int8`	`bool`	`True`	Activez la quantification INT8 pour l'AIPU
`data`	`str`	`'coco128.yaml'`	Configuration du jeu de données pour la calibration de la quantification
`fraction`	`float`	`1.0`	Fraction du jeu de données pour la calibration (100-400 images recommandées)
`device`	`str`	`None`	Périphérique d'exportation : GPU (`device=0`) ou CPU (`device=cpu`)

Pour toutes les options d'exportation, consultez la documentation du mode d'exportation.

Structure de sortie

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Exécution de l'inférence

Chargez le modèle exporté avec l'API Ultralytics et exécutez l'inférence, de manière similaire au chargement des modèles ONNX.

Inférence avec le modèle Axelera

PythonCLI

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Problème connu

La première exécution d'inférence peut générer une ImportError. Les exécutions ultérieures fonctionneront correctement. Ce problème sera résolu dans une prochaine version.

Performance de l'Inference

L'AIPU Metis maximise le débit tout en minimisant la consommation d'énergie.

Métrique	Metis PCIe x4	Metis M.2	Remarque
Débit de pointe	856 TOPS	214 TOPS	Précision INT8
YOLOv5m FPS	~1539 FPS	~326 FPS	Entrée 640x640
YOLOv5s FPS	N/A	~827 FPS	Entrée 640x640
Efficacité	Élevée	Très élevé	Idéal pour l'alimentation par batterie

Benchmarks basés sur les données d'Axelera AI. Le FPS réel dépend de la taille du modèle, du traitement par lots (batching) et de la résolution d'entrée.

Applications concrètes

Ultralytics YOLO sur le matériel Axelera permet des solutions avancées d'edge computing :

Vente au détail intelligente : Comptage d'objets en temps réel et analyse des cartes thermiques pour l'optimisation des magasins.
Sécurité Industrielle : Détection des EPI à faible latence dans les environnements de fabrication.
Analyse par drone : Détection d’objets à haute vitesse sur les drones pour l’agriculture et la recherche et le sauvetage.
Systèmes de circulation : Reconnaissance des plaques d’immatriculation et estimation de la vitesse en périphérie.

Flux de travail recommandé

Entraînez votre modèle en utilisant le mode d'entraînement Ultralytics
Exporter au format Axelera en utilisant model.export(format="axelera")
Valider précision avec yolo val pour vérifier une perte de quantification minimale
Prédire en utilisant les yolo predict pour une validation qualitative

Vérification de l'état du périphérique

Vérifiez que votre appareil Axelera fonctionne correctement :

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Pour des diagnostics détaillés, consultez la documentation AxDevice.

Performances maximales

Cette intégration utilise une configuration monocœur pour la compatibilité. Pour une production nécessitant un débit maximal, le SDK Axelera Voyager offre :

Utilisation multicœur (AIPU Metis quad-core)
Pipelines d'inférence en streaming
Inférence par tuiles pour les caméras à plus haute résolution

Consultez le model-zoo pour les benchmarks FPS ou contactez Axelera pour le support de production.

Problèmes connus

Limitations connues

Compatibilité PyTorch 2.9: La première yolo export format=axelera commande peut échouer en raison d'une rétrogradation automatique de PyTorch à la version 2.8. Exécutez la commande une seconde fois pour réussir.
Limitations de puissance M.2 : Les modèles de grande taille ou de très grande taille peuvent rencontrer des erreurs d'exécution sur les accélérateurs M.2 en raison de contraintes d'alimentation.
ImportError lors de la première inférence: La première exécution d'inférence peut générer une ImportError. Les exécutions ultérieures fonctionnent correctement.

Pour obtenir de l'aide, visitez la communauté Axelera.

FAQ

Quelles versions de YOLO sont prises en charge sur Axelera ?

Le SDK Voyager prend en charge l'exportation des modèles YOLOv8 et YOLO26.

Puis-je déployer des modèles entraînés sur mesure ?

Oui. Tout modèle entraîné à l'aide du Mode d'entraînement Ultralytics peut être exporté au format Axelera, à condition qu'il utilise des couches et des opérations prises en charge.

Quel est l'impact de la quantification INT8 sur la précision ?

Le SDK Voyager d'Axelera quantifie automatiquement les modèles pour l'architecture AIPU à précision mixte. Pour la plupart des détection d'objets tâches, les gains de performance (FPS plus élevés, consommation d'énergie réduite) l'emportent largement sur l'impact minimal sur mAP. La quantification prend de quelques secondes à plusieurs heures selon la taille du modèle. Exécutez yolo val après l'exportation pour vérifier la précision.

Combien d'images de calibration dois-je utiliser ?

Nous recommandons 100 à 400 images. Plus de 400 images n'apportent aucun avantage supplémentaire et augmentent le temps de quantification. Expérimentez avec 100, 200 et 400 images pour trouver l'équilibre optimal.

Où puis-je trouver le SDK Voyager ?

Le SDK, les pilotes et les outils de compilation sont disponibles via le portail des développeurs d'Axelera.

📅 Créé il y a 2 mois ✏️ Mis à jour il y a 17 jours