Passer au contenu

Accélération de l'IA d'Axelera

Prochainement - T1 2026

Soutien d'Axelera en ultralytics est en cours. Les exemples présentés ici montrent l'interface utilisateur prévue et deviendront exécutables une fois que le logiciel d'exécution Axelera sera disponible.

Ultralytics s'associe à Axelera AI pour rationaliser l'inférence haute performance et économe en énergie sur les dispositifs Edge AI. Cette intégration permet aux utilisateurs d'exporter et de déployer les modèlesYOLO d 'Ultralytics directement sur les plateformes Metis® AIPU et Europa® à l'aide du Voyager SDK.

L'écosystème d'intelligence artificielle d'Axelera

Axelera AI fournit une accélération matérielle dédiée à la vision par ordinateur et à l'IA générative à la périphérie. Sa technologie s'appuie sur une architecture propriétaire de flux de données et de calcul en mémoire pour offrir un débit élevé (jusqu'à 856 TOPS) dans une enveloppe de faible consommation.

Pour les utilisateurs d'Ultralytics , cela offre une voie évolutive pour déployer la détection d'objets, l'estimation de la pose et d'autres tâches YOLO sur des appareils allant des drones embarqués aux serveurs de périphérie.

Choisir le bon matériel

Axelera AI propose différents facteurs de forme pour répondre aux différentes contraintes de déploiement. Le tableau ci-dessous permet d'identifier le matériel optimal pour votre déploiement Ultralytics YOLO .

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portefeuille de matériel

La gamme de matériel d'Axelera est optimisée pour exécuter les applications suivantes Ultralytics YOLO11 et les versions antérieures avec une efficacité élevée en termes de FPS par watt.

Cartes d'accélération

Ces cartes permettent d'accélérer l'IA dans les dispositifs hôtes existants, ce qui facilite les déploiements sur site.

ProduitFacteur de formeCalculerPerformance (INT8)Application cible
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSAnalyse vidéo à haute densité, villes intelligentes
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSPC industriels, gestion des files d'attente dans le commerce de détail
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, robotique, dispositifs médicaux portables
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSEnvironnements nécessitant une gestion thermique avancée

Systèmes intégrés

Pour les solutions clés en main, Axelera s'associe à des fabricants pour fournir des systèmes pré-validés pour l'AIPU de Metis.

  • Metis Compute Board: Un dispositif périphérique autonome associant l'AIPU Metis à un CPU ARM Rockchip RK3588.
  • Stations de travail: Tours d'entreprise de Dell (Precision 3460XE) et Lenovo (ThinkStation P360 Ultra).
  • PC industriels: Systèmes robustes d'Advantech et d'Aetina conçus pour l'automatisation de la production.

Intégration du SDK Voyager

Le Voyager SDK sert de pont entre les modèles Ultralytics et le matériel Axelera. Il gère la compilation, la quantification et l'exécution des réseaux neuronaux.

Caractéristiques principales pour les utilisateurs d'Ultralytics :

  1. Exportation transparente: Le compilateur du SDK optimise les modèles YOLO pour l'architecture de flux de données Metis.
  2. Moteur de quantification: Convertit automatiquement les modèles FP32 en INT8 avec une perte de précision minimale.
  3. Pipeline Builder: Un cadre basé sur YAML pour enchaîner plusieurs modèles (par exemple, détection + estimation de la pose) sans écrire de code C++ complexe.

Installation et mise en place

Pour utiliser l'accélération Axelera, vous avez besoin de l'option ultralytics installé. Notez que le SDK Voyager est une installation séparée au niveau du système, nécessaire pour interfacer avec le matériel. Les roues d'exécution sont attendues dans Q1 2026; les commandes ci-dessous reflètent le flux d'installation prévu.

# Install Ultralytics
pip install ultralytics

# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.

Exporter des modèles YOLO vers Axelera

Lorsque le runtime package Axelera sera livré (objectif Q1 2026), vous exporterez vos modèles YOLO entraînés au format Axelera en utilisant la commande d'exportation standard d'Ultralytics . Ce processus génère les artefacts requis par le compilateur Voyager.

Voyager SDK requis

L'argument format='axelera' nécessite que les bibliothèques Axelera soient disponibles dans votre environnement. Vous pouvez également exporter vers ONNX et compiler manuellement à l'aide de la chaîne d'outils Voyager.

Exemples d’exportation

Convertir un modèle YOLO11 pour le déploiement de Metis.

Exportation vers le format Axelera

Exemple futur - fonctionnera lorsque le runtime sera disponible

Ce bloc de code démontre le flux prévu. Il nécessitera le prochain runtime package Axelera (ETA Q1 2026) pour être exécuté avec succès.

from ultralytics import YOLO

# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640

Pour connaître les arguments disponibles, reportez-vous à la documentation sur le mode d'exportation.

Exécution de l'inférence

Une fois exporté, vous pourrez charger le modèle compilé par Axelera directement avec la commande ultralytics (similaire au chargement de ONNX modèles). L'exemple ci-dessous montre le schéma d'utilisation prévu pour l'exécution de l'inférence et l'enregistrement des résultats après la livraison du paquetage d'exécution.

Inférence avec le format Axelera

Exemple futur - fonctionnera lorsque le runtime sera disponible

Ce bloc de code démontre le flux prévu. Il nécessitera le prochain runtime package Axelera (ETA Q1 2026) pour être exécuté avec succès.

from ultralytics import YOLO

# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel")  # will work once Axelera runtime is released

# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)

# Iterate over result objects to inspect or render detections
for r in results:
    boxes = r.boxes  # bounding boxes tensor + metadata
    print(f"Detected {len(boxes)} objects")

    # Save visuals per result (files saved alongside inputs)
    r.save()  # saves annotated image(s) to disk
    # Or display interactively (desktop environments)
    # r.show()

Performance en matière d'inférence

L'AIPU de Metis est conçue pour maximiser le débit tout en minimisant la consommation d'énergie. Les benchmarks ci-dessous illustrent les performances réalisables avec les modèles Ultralytics standard.

MétriqueMetis PCIe x4Metis M.2Remarque
Débit de pointe856 TOPS214 TOPSINT8 Précision
YOLOv5m FPS~1539 FPS~326 FPS640x640 Entrée
YOLOv5s FPSN/A~827 FPS640x640 Entrée
EfficacitéHautTrès élevéIdéal pour l'alimentation par batterie

Benchmarks basés sur les données d'Axelera AI (septembre 2025). Le nombre réel de FPS dépend de la taille du modèle, de la mise en lot et de la résolution d'entrée.

Applications concrètes

Ultralytics YOLO sur le matériel d'Axelera permet des solutions avancées d'informatique de pointe :

FAQ

Quelles sont les versions de YOLO supportées par Axelera ?

Le SDK Voyager et l'intégration Ultralytics prennent en charge l'exportation des données de YOLOv8 et de YOLO11 .

Puis-je déployer des modèles formés sur mesure ?

Oui. Tout modèle formé à l'aide d'Ultralytics Train Mode peut être exporté au format Axelera, à condition qu'il utilise les couches et les opérations prises en charge.

Comment la quantification de l'INT8 affecte-t-elle la précision ?

Le moteur de quantification d'Axelera utilise des techniques de calibration avancées pour minimiser la perte de précision. Pour la plupart des tâches de détection, le gain de performance l'emporte largement sur l'impact négligeable sur la mAP.

Où puis-je trouver le SDK Voyager ?

Le SDK, les pilotes et les outils de compilation sont disponibles sur le portail des développeurs d'Axelera.



📅C réé il y a 0 jours ✏️ Mis à jour il y a 0 jour
glenn-jocher

Commentaires