Exportation et déploiement d'Axelera AI
Version expérimentale
Il s'agit d'une intégration expérimentale démontrant le déploiement sur le matériel Axelera Metis. L'intégration complète est prévue pour février 2026, avec exportation du modèle sans nécessiter de matériel Axelera ni installation standard de pip.
Ultralytics à Axelera AI pour permettre une inférence haute performance et économe en énergie sur les appareils Edge AI. Exportez et déployez YOLO Ultralytics YOLO directement sur le Metis® AIPU à l'aide du SDK Voyager.
Axelera AI fournit une accélération matérielle dédiée pour la vision par ordinateur à la périphérie, en utilisant une architecture de flux de données propriétaire et un calcul en mémoire pour fournir jusqu'à 856 TOPS avec une faible consommation d'énergie.
Choisir le bon matériel
Axelera AI propose différents formats pour s'adapter aux différentes contraintes de déploiement. Le tableau ci-dessous vous aide à identifier le matériel optimal pour votre déploiement Ultralytics YOLO.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portefeuille matériel
La gamme de matériel Axelera est optimisée pour exécuter Ultralytics YOLO11 et les versions héritées avec une efficacité FPS par watt élevée.
Cartes d'accélérateur
Ces cartes permettent l'accélération de l'IA dans les appareils hôtes existants, facilitant ainsi les déploiements brownfield.
| Produit | Facteur de forme | Calcul | Performance (INT8) | Application cible |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Analyse vidéo haute densité, villes intelligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PC industriels, gestion des files d'attente dans le commerce de détail |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robotique, appareils médicaux portables |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Environnements nécessitant une gestion thermique avancée |
Systèmes intégrés
Pour les solutions clés en main, Axelera s'associe à des fabricants pour fournir des systèmes pré-validés pour le Metis AIPU.
- Carte de calcul Metis : Un appareil périphérique autonome associant l'AIPU Metis à un CPU ARM Rockchip RK3588.
- Stations de travail : Tours d’entreprise de Dell (Precision 3460XE) et Lenovo (ThinkStation P360 Ultra).
- PC Industriels : Systèmes durcis d'Advantech et d'Aetina conçus pour l'automatisation de la fabrication.
Tâches prises en charge
Actuellement, les modèles de détection d'objets peuvent être exportés au format Axelera. D'autres tâches sont en cours d'intégration :
| Tâche | Statut |
|---|---|
| Détection d'objets | ✅ Pris en charge |
| Estimation de pose | À venir prochainement |
| Segmentation | À venir prochainement |
| Boîtes englobantes orientées | À venir prochainement |
Installation
Configuration requise pour la plateforme
L'exportation au format Axelera nécessite :
- Système d'exploitation: Linux uniquement (Ubuntu 22.04/24.04 recommandé)
- Matériel: accélérateur Axelera AI (appareils Metis)
- Python: version 3.10 (3.11 et 3.12 bientôt disponibles)
Installation Ultralytics
pip install ultralytics
Pour obtenir des instructions détaillées, consultez notre guideUltralytics . Si vous rencontrez des difficultés, consultez notre guide des problèmes courants.
Installation du pilote Axelera
Ajoutez la clé du référentiel Axelera :
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"Ajoutez le référentiel à apt :
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"Installez le SDK et chargez le pilote :
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
Exporter les modèles YOLO vers Axelera
Exportez vos YOLO entraînés à l'aide de la commande Ultralytics standard Ultralytics .
Exporter au format Axelera
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera
Arguments d'exportation
| Argument | Type | Par défaut | Description |
|---|---|---|---|
format | str | 'axelera' | Format cible pour le matériel Axelera Metis AIPU |
imgsz | int ou tuple | 640 | Taille de l'image pour l'entrée du modèle |
int8 | bool | True | Activer la quantification INT8 pour AIPU |
data | str | 'coco128.yaml' | Configuration de l'ensemble de données pour l'étalonnage de la quantification |
fraction | float | 1.0 | Fraction de l'ensemble de données pour l'étalonnage (100 à 400 images recommandées) |
device | str | None | Périphérique d'exportation : GPUdevice=0) ou CPUdevice=cpu) |
Pour toutes les options d'exportation, consultez la documentation sur le mode d'exportation.
Structure de sortie
yolo11n_axelera_model/
├── yolo11n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
Exécution de l'inférence
Chargez le modèle exporté avec Ultralytics et lancez l'inférence, comme pour le chargement ONNX .
Inférence avec le modèle Axelera
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
Problème connu
La première exécution de l'inférence peut générer une exception ImportError. Les exécutions suivantes fonctionneront correctement. Ce problème sera résolu dans une prochaine version.
Performance de l'Inference
Le Metis AIPU optimise le débit tout en minimisant la consommation d'énergie.
| Métrique | Metis PCIe x4 | Metis M.2 | Remarque |
|---|---|---|---|
| Débit de pointe | 856 TOPS | 214 TOPS | Précision INT8 |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | Entrée 640x640 |
| YOLOv5s FPS | N/A | ~827 FPS | Entrée 640x640 |
| Efficacité | Élevée | Très élevé | Idéal pour l'alimentation par batterie |
Références basées sur les données Axelera AI. Le nombre réel d'images par seconde dépend de la taille du modèle, du traitement par lots et de la résolution d'entrée.
Applications concrètes
Ultralytics YOLO sur le matériel Axelera permet des solutions avancées d'edge computing :
- Vente au détail intelligente : Comptage d'objets en temps réel et analyse des cartes thermiques pour l'optimisation des magasins.
- Sécurité Industrielle : Détection des EPI à faible latence dans les environnements de fabrication.
- Analyse par drone : Détection d’objets à haute vitesse sur les drones pour l’agriculture et la recherche et le sauvetage.
- Systèmes de circulation : Reconnaissance des plaques d’immatriculation et estimation de la vitesse en périphérie.
Flux de travail recommandé
- Entraînez votre modèle à l'aide dumode Entraînement Ultralytics
- Exporter au format Axelera à l'aide de
model.export(format="axelera") - Valider précision avec
yolo valpour vérifier la perte minimale due à la quantification - Prédire en utilisant les
yolo predictpour la validation qualitative
Vérification de l'état du dispositif
Vérifiez que votre appareil Axelera fonctionne correctement :
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
Pour obtenir des diagnostics détaillés, consultez la documentation AxDevice.
Performance maximale
Cette intégration utilise une configuration monocœur pour des raisons de compatibilité. Pour les productions nécessitant un débit maximal, le SDK Axelera Voyager offre :
- Utilisation multicœur (AIPU Metis quadricœur)
- Pipelines d'inférence en continu
- Inférence mosaïque pour caméras à haute résolution
Consultez le modèle-zoo pour les benchmarks FPS ou contactez Axelera pour obtenir une assistance à la production.
Problèmes connus
Limitations connues
Compatibilité avec PyTorch .9: Le premier
yolo export format=axeleraLa commande peut échouer en raison de PyTorch automatique PyTorch vers la version 2.8. Exécutez la commande une deuxième fois pour qu'elle aboutisse.Limitations d'alimentation M.2: les modèles de grande ou très grande taille peuvent rencontrer des erreurs d'exécution sur les accélérateurs M.2 en raison de contraintes d'alimentation électrique.
Première inférence ImportError: La première exécution de l'inférence peut générer une exception.
ImportErrorLes exécutions suivantes fonctionnent correctement.
Pour obtenir de l'aide, rendez-vous sur la communauté Axelera.
FAQ
Quelles versions de YOLO sont prises en charge sur Axelera ?
Le SDK Voyager prend en charge l'exportation de YOLOv8 et YOLO11 .
Puis-je déployer des modèles personnalisés ?
Oui. Tout modèle entraîné à l'aide du Mode d'entraînement Ultralytics peut être exporté au format Axelera, à condition qu'il utilise des couches et des opérations prises en charge.
Quel est l'impact de la quantification INT8 sur la précision ?
Le SDK Voyager d'Axelera quantifie automatiquement les modèles pour l'architecture AIPU à précision mixte. Pour la plupart détection d'objets tâches, les gains de performances (FPS plus élevés, consommation électrique réduite) compensent largement l'impact minimal sur mAPLa quantification prend de quelques secondes à plusieurs heures selon la taille du modèle. Exécutez yolo val après l'exportation pour vérifier l'exactitude.
Combien d'images d'étalonnage dois-je utiliser ?
Nous recommandons entre 100 et 400 images. Au-delà de 400, cela n'apporte aucun avantage supplémentaire et augmente le temps de quantification. Faites des essais avec 100, 200 et 400 images pour trouver le juste équilibre.
Où puis-je trouver le SDK Voyager ?
Le SDK, les pilotes et les outils de compilation sont disponibles sur le portail des développeurs d'Axelera.