Accélération de l'IA d'Axelera
Prochainement - T1 2026
Soutien d'Axelera en ultralytics est en cours. Les exemples présentés ici montrent l'interface utilisateur prévue et deviendront exécutables une fois que le logiciel d'exécution Axelera sera disponible.
Ultralytics s'associe à Axelera AI pour rationaliser l'inférence haute performance et économe en énergie sur les dispositifs Edge AI. Cette intégration permet aux utilisateurs d'exporter et de déployer les modèlesYOLO d 'Ultralytics directement sur les plateformes Metis® AIPU et Europa® à l'aide du Voyager SDK.
Axelera AI fournit une accélération matérielle dédiée à la vision par ordinateur et à l'IA générative à la périphérie. Sa technologie s'appuie sur une architecture propriétaire de flux de données et de calcul en mémoire pour offrir un débit élevé (jusqu'à 856 TOPS) dans une enveloppe de faible consommation.
Pour les utilisateurs d'Ultralytics , cela offre une voie évolutive pour déployer la détection d'objets, l'estimation de la pose et d'autres tâches YOLO sur des appareils allant des drones embarqués aux serveurs de périphérie.
Choisir le bon matériel
Axelera AI propose différents facteurs de forme pour répondre aux différentes contraintes de déploiement. Le tableau ci-dessous permet d'identifier le matériel optimal pour votre déploiement Ultralytics YOLO .
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portefeuille de matériel
La gamme de matériel d'Axelera est optimisée pour exécuter les applications suivantes Ultralytics YOLO11 et les versions antérieures avec une efficacité élevée en termes de FPS par watt.
Cartes d'accélération
Ces cartes permettent d'accélérer l'IA dans les dispositifs hôtes existants, ce qui facilite les déploiements sur site.
| Produit | Facteur de forme | Calculer | Performance (INT8) | Application cible |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Analyse vidéo à haute densité, villes intelligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PC industriels, gestion des files d'attente dans le commerce de détail |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robotique, dispositifs médicaux portables |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Environnements nécessitant une gestion thermique avancée |
Systèmes intégrés
Pour les solutions clés en main, Axelera s'associe à des fabricants pour fournir des systèmes pré-validés pour l'AIPU de Metis.
- Metis Compute Board: Un dispositif périphérique autonome associant l'AIPU Metis à un CPU ARM Rockchip RK3588.
- Stations de travail: Tours d'entreprise de Dell (Precision 3460XE) et Lenovo (ThinkStation P360 Ultra).
- PC industriels: Systèmes robustes d'Advantech et d'Aetina conçus pour l'automatisation de la production.
Intégration du SDK Voyager
Le Voyager SDK sert de pont entre les modèles Ultralytics et le matériel Axelera. Il gère la compilation, la quantification et l'exécution des réseaux neuronaux.
Caractéristiques principales pour les utilisateurs d'Ultralytics :
- Exportation transparente: Le compilateur du SDK optimise les modèles YOLO pour l'architecture de flux de données Metis.
- Moteur de quantification: Convertit automatiquement les modèles FP32 en INT8 avec une perte de précision minimale.
- Pipeline Builder: Un cadre basé sur YAML pour enchaîner plusieurs modèles (par exemple, détection + estimation de la pose) sans écrire de code C++ complexe.
Installation et mise en place
Pour utiliser l'accélération Axelera, vous avez besoin de l'option ultralytics installé. Notez que le SDK Voyager est une installation séparée au niveau du système, nécessaire pour interfacer avec le matériel. Les roues d'exécution sont attendues dans Q1 2026; les commandes ci-dessous reflètent le flux d'installation prévu.
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
Exporter des modèles YOLO vers Axelera
Lorsque le runtime package Axelera sera livré (objectif Q1 2026), vous exporterez vos modèles YOLO entraînés au format Axelera en utilisant la commande d'exportation standard d'Ultralytics . Ce processus génère les artefacts requis par le compilateur Voyager.
Voyager SDK requis
L'argument format='axelera' nécessite que les bibliothèques Axelera soient disponibles dans votre environnement. Vous pouvez également exporter vers ONNX et compiler manuellement à l'aide de la chaîne d'outils Voyager.
Exemples d’exportation
Convertir un modèle YOLO11 pour le déploiement de Metis.
Exportation vers le format Axelera
Exemple futur - fonctionnera lorsque le runtime sera disponible
Ce bloc de code démontre le flux prévu. Il nécessitera le prochain runtime package Axelera (ETA Q1 2026) pour être exécuté avec succès.
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
Pour connaître les arguments disponibles, reportez-vous à la documentation sur le mode d'exportation.
Exécution de l'inférence
Une fois exporté, vous pourrez charger le modèle compilé par Axelera directement avec la commande ultralytics (similaire au chargement de ONNX modèles). L'exemple ci-dessous montre le schéma d'utilisation prévu pour l'exécution de l'inférence et l'enregistrement des résultats après la livraison du paquetage d'exécution.
Inférence avec le format Axelera
Exemple futur - fonctionnera lorsque le runtime sera disponible
Ce bloc de code démontre le flux prévu. Il nécessitera le prochain runtime package Axelera (ETA Q1 2026) pour être exécuté avec succès.
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
Performance en matière d'inférence
L'AIPU de Metis est conçue pour maximiser le débit tout en minimisant la consommation d'énergie. Les benchmarks ci-dessous illustrent les performances réalisables avec les modèles Ultralytics standard.
| Métrique | Metis PCIe x4 | Metis M.2 | Remarque |
|---|---|---|---|
| Débit de pointe | 856 TOPS | 214 TOPS | INT8 Précision |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 Entrée |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 Entrée |
| Efficacité | Haut | Très élevé | Idéal pour l'alimentation par batterie |
Benchmarks basés sur les données d'Axelera AI (septembre 2025). Le nombre réel de FPS dépend de la taille du modèle, de la mise en lot et de la résolution d'entrée.
Applications concrètes
Ultralytics YOLO sur le matériel d'Axelera permet des solutions avancées d'informatique de pointe :
- Commerce de détail intelligent: Comptage d'objets en temps réel et analyse des cartes thermiques pour l'optimisation des magasins.
- Sécurité industrielle: Détection des EPI à faible latence dans les environnements de production.
- Drone Analytics: Détection d'objets à grande vitesse sur des drones pour l'agriculture et la recherche et le sauvetage.
- Systèmes de circulation: Reconnaissance des plaques d'immatriculation et estimation de la vitesse basées sur les contours.
FAQ
Quelles sont les versions de YOLO supportées par Axelera ?
Le SDK Voyager et l'intégration Ultralytics prennent en charge l'exportation des données de YOLOv8 et de YOLO11 .
Puis-je déployer des modèles formés sur mesure ?
Oui. Tout modèle formé à l'aide d'Ultralytics Train Mode peut être exporté au format Axelera, à condition qu'il utilise les couches et les opérations prises en charge.
Comment la quantification de l'INT8 affecte-t-elle la précision ?
Le moteur de quantification d'Axelera utilise des techniques de calibration avancées pour minimiser la perte de précision. Pour la plupart des tâches de détection, le gain de performance l'emporte largement sur l'impact négligeable sur la mAP.
Où puis-je trouver le SDK Voyager ?
Le SDK, les pilotes et les outils de compilation sont disponibles sur le portail des développeurs d'Axelera.