Zum Inhalt springen

Axelera KI-Export und Bereitstellung

Experimentelle Veröffentlichung

Dies ist eine experimentelle Integration, die die Bereitstellung auf Axelera Metis Hardware demonstriert. Eine vollständige Integration wird bis Februar 2026 erwartet, mit Modellausgabe ohne Axelera Hardware und Standard-Pip-Installation.

Ultralytics kooperiert mit Axelera AI, um eine hochleistungsfähige, energieeffiziente Inferenz auf Edge AI-Geräten zu ermöglichen. Exportieren und deployen Sie Ultralytics YOLO Modelle direkt auf die Metis® AIPU mithilfe des Voyager SDK.

Axelera KI-Ökosystem

Axelera AI bietet dedizierte Hardware-Beschleunigung für Computer Vision am Edge, unter Verwendung einer proprietären Datenflussarchitektur und In-Memory-Computing, um bis zu 856 TOPS bei geringem Stromverbrauch zu liefern.

Auswahl der richtigen Hardware

Axelera AI bietet verschiedene Formfaktoren, um unterschiedlichen Bereitstellungsanforderungen gerecht zu werden. Die folgende Tabelle hilft bei der Identifizierung der optimalen Hardware für Ihre Ultralytics YOLO-Bereitstellung.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Hardware-Portfolio

Die Axelera-Hardware-Produktlinie ist optimiert, um Ultralytics YOLO11 und ältere Versionen mit hoher FPS-pro-Watt-Effizienz auszuführen.

Beschleunigerkarten

Diese Karten ermöglichen die KI-Beschleunigung in bestehenden Host-Geräten, was Brownfield-Bereitstellungen erleichtert.

ProduktFormfaktorBerechnungLeistung (INT8)Zielanwendung
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSHochdichte Videoanalyse, Smart Cities
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSIndustrie-PCs, Warteschlangenmanagement im Einzelhandel
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, Robotik, tragbare medizinische Geräte
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSUmgebungen, die ein fortschrittliches Wärmemanagement erfordern

Integrierte Systeme

Für schlüsselfertige Lösungen arbeitet Axelera mit Herstellern zusammen, um Systeme bereitzustellen, die für die Metis AIPU vorvalidiert sind.

  • Metis Compute Board: Ein eigenständiges Edge-Gerät, das die Metis AIPU mit einer Rockchip RK3588 ARM CPU kombiniert.
  • Workstations: Enterprise-Tower von Dell (Precision 3460XE) und Lenovo (ThinkStation P360 Ultra).
  • Industrie-PCs: Robuste Systeme von Advantech und Aetina, entwickelt für die Fertigungsautomatisierung.

Unterstützte Aufgaben

Derzeit können Objekterkennungsmodelle in das Axelera-Format exportiert werden. Zusätzliche Aufgaben werden integriert:

AufgabeStatus
Objekterkennung✅ Unterstützt
Pose-SchätzungDemnächst verfügbar
SegmentationDemnächst verfügbar
Orientierte Bounding BoxesDemnächst verfügbar

Installation

Plattformanforderungen

Der Export ins Axelera-Format erfordert:

  • Betriebssystem: Nur Linux (Ubuntu 22.04/24.04 empfohlen)
  • Hardware: Axelera KI-Beschleuniger (Metis-Geräte)
  • Python: Version 3.10 (3.11 und 3.12 demnächst verfügbar)

Ultralytics Installation

pip install ultralytics

Detaillierte Anweisungen finden Sie in unserem Ultralytics Installationsleitfaden. Bei Schwierigkeiten konsultieren Sie bitte unseren Leitfaden für häufige Probleme.

Axelera Treiberinstallation

  1. Fügen Sie den Axelera-Repository-Schlüssel hinzu:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. Fügen Sie das Repository zu apt hinzu:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. Installieren Sie das SDK und laden Sie den Treiber:

    sudo apt update
    sudo apt install -y axelera-voyager-sdk-base
    sudo modprobe metis
    yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
    

Export von YOLO-Modellen nach Axelera

Exportieren Sie Ihre trainierten YOLO-Modelle mit dem Standard-Exportbefehl von Ultralytics.

Export ins Axelera-Format

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera

Export-Argumente

ArgumentTypStandardBeschreibung
formatstr'axelera'Zielformat für Axelera Metis AIPU Hardware
imgszint oder tuple640Bildgröße für Modelleingabe
int8boolTrueAktiviert die INT8-Quantisierung für AIPU
datastr'coco128.yaml'Dataset-Konfiguration für die Quantisierungskalibrierung
fractionfloat1.0Anteil des Datensatzes für die Kalibrierung (100-400 Bilder empfohlen)
devicestrNoneExportgerät: GPU (device=0) oder CPU (device=cpu)

Für alle Exportoptionen siehe die Dokumentation zum Exportmodus.

Ausgabestruktur

yolo11n_axelera_model/
├── yolo11n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Inferenz ausführen

Laden Sie das exportierte Modell mit der Ultralytics API und führen Sie die Inferenz aus, ähnlich dem Laden von ONNX-Modellen.

Inferenz mit Axelera-Modell

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Bekanntes Problem

Der erste Inferenzlauf kann einen Fehler auslösen ImportError. Nachfolgende Ausführungen werden korrekt funktionieren. Dies wird in einer zukünftigen Version behoben.

Inferenzleistung

Die Metis AIPU maximiert den Durchsatz und minimiert gleichzeitig den Energieverbrauch.

MetrikMetis PCIe x4Metis M.2Hinweis
Spitzendurchsatz856 TOPS214 TOPSINT8-Präzision
YOLOv5m FPS~1539 FPS~326 FPS640x640 Eingabe
YOLOv5s FPSN/A~827 FPS640x640 Eingabe
EffizienzHochSehr hochIdeal für Akkubetrieb

Benchmarks basierend auf Axelera AI Daten. Die tatsächliche FPS hängt von der Modellgröße, dem Batching und der Eingangsauflösung ab.

Anwendungen in der realen Welt

Ultralytics YOLO auf Axelera-Hardware ermöglicht fortschrittliche Edge-Computing-Lösungen:

  1. Trainieren Sie Ihr Modell mit dem Ultralytics Trainingsmodus
  2. Export in das Axelera-Format mittels model.export(format="axelera")
  3. Validieren Genauigkeit mit yolo val um minimale Quantisierungsverluste zu überprüfen
  4. Vorhersagen mit yolo predict für die qualitative Validierung

Geräte-Integritätsprüfung

Überprüfen Sie, ob Ihr Axelera-Gerät ordnungsgemäß funktioniert:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Für detaillierte Diagnosen siehe die AxDevice-Dokumentation.

Maximale Leistung

Diese Integration verwendet eine Single-Core-Konfiguration zur Kompatibilität. Für die Produktion, die maximalen Durchsatz erfordert, bietet das Axelera Voyager SDK:

  • Mehrkernnutzung (Quad-Core Metis AIPU)
  • Streaming-Inferenz-Pipelines
  • Kachelbasiertes Inferencing für hochauflösende Kameras

Siehe den model-zoo für FPS-Benchmarks oder kontaktieren Sie Axelera für Produktionsunterstützung.

Bekannte Probleme

Bekannte Einschränkungen

  • PyTorch 2.9-Kompatibilität: Der erste yolo export format=axelera Befehl kann aufgrund eines automatischen PyTorch-Downgrades auf 2.8 fehlschlagen. Führen Sie den Befehl ein zweites Mal aus, um erfolgreich zu sein.

  • M.2-Leistungsbeschränkungen: Große oder extragroße Modelle können auf M.2-Beschleunigern aufgrund von Stromversorgungsbeschränkungen Laufzeitfehler aufweisen.

  • Erster Inferenz-Importfehler: Der erste Inferenzlauf kann einen ImportError. Nachfolgende Ausführungen funktionieren korrekt.

Für Unterstützung besuchen Sie die Axelera Community.

FAQ

Welche YOLO-Versionen werden auf Axelera unterstützt?

Das Voyager SDK unterstützt den Export von YOLOv8- und YOLO11-Modellen.

Kann ich benutzerdefiniert trainierte Modelle bereitstellen?

Ja. Jedes Modell, das mit dem Ultralytics Train Mode trainiert wurde, kann in das Axelera-Format exportiert werden, sofern es unterstützte Schichten und Operationen verwendet.

Wie beeinflusst die INT8-Quantisierung die Genauigkeit?

Axeleras Voyager SDK quantisiert Modelle für die Mixed-Precision AIPU-Architektur automatisch. Für die meisten Objekterkennung durchzuführen Aufgaben, überwiegen die Leistungssteigerungen (höhere FPS, geringerer Stromverbrauch) den minimalen Einfluss auf mAP. Die Quantisierung dauert Sekunden bis mehrere Stunden, abhängig von der Modellgröße. Führen Sie aus yolo val nach dem Export zur Überprüfung der Genauigkeit.

Wie viele Kalibrierungsbilder sollte ich verwenden?

Wir empfehlen 100 bis 400 Bilder. Mehr als 400 Bilder bieten keinen zusätzlichen Nutzen und erhöhen die Quantisierungszeit. Experimentieren Sie mit 100, 200 und 400 Bildern, um die optimale Balance zu finden.

Wo finde ich das Voyager SDK?

Das SDK, die Treiber und die Compiler-Tools sind über das Axelera Developer Portal verfügbar.



📅 Erstellt vor 20 Tagen ✏️ Vor 3 Tagen aktualisiert
glenn-jocherpderrengerambitious-octopusonuralpszr

Kommentare