Zum Inhalt springen

Axelera KI-Export und Bereitstellung

Ultralytics kooperiert mit Axelera AI, um eine hochleistungsfähige, energieeffiziente Inferenz auf Edge AI-Geräten zu ermöglichen. Exportieren und deployen Sie Ultralytics YOLO Modelle direkt auf die Metis® AIPU mithilfe des Voyager SDK.

Axelera KI-Edge-Bereitstellungsökosystem für YOLO

Axelera AI bietet dedizierte Hardware-Beschleunigung für Computer Vision am Edge, unter Verwendung einer proprietären Datenflussarchitektur und In-Memory-Computing, um bis zu 856 TOPS bei geringem Stromverbrauch zu liefern.

Auswahl der richtigen Hardware

Axelera AI bietet verschiedene Formfaktoren, um unterschiedlichen Bereitstellungsanforderungen gerecht zu werden. Die folgende Tabelle hilft bei der Identifizierung der optimalen Hardware für Ihre Ultralytics YOLO-Bereitstellung.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Hardware-Portfolio

Die Axelera-Hardware-Produktreihe ist optimiert, um Ultralytics YOLO26 und ältere Versionen mit hoher FPS-pro-Watt-Effizienz auszuführen.

Beschleunigerkarten

Diese Karten ermöglichen die KI-Beschleunigung in bestehenden Host-Geräten, was Brownfield-Bereitstellungen erleichtert.

ProduktFormfaktorBerechnungLeistung (INT8)Zielanwendung
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSHochdichte Videoanalyse, Smart Cities
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSIndustrie-PCs, Warteschlangenmanagement im Einzelhandel
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, Robotik, tragbare medizinische Geräte
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSUmgebungen, die ein fortschrittliches Wärmemanagement erfordern

Integrierte Systeme

Für schlüsselfertige Lösungen arbeitet Axelera mit Herstellern zusammen, um Systeme bereitzustellen, die für die Metis AIPU vorvalidiert sind.

  • Metis Compute Board: Ein eigenständiges Edge-Gerät, das die Metis AIPU mit einer Rockchip RK3588 ARM CPU kombiniert.
  • Workstations: Enterprise-Tower von Dell (Precision 3460XE) und Lenovo (ThinkStation P360 Ultra).
  • Industrie-PCs: Robuste Systeme von Advantech und Aetina, entwickelt für die Fertigungsautomatisierung.

Unterstützte Aufgaben

Die folgenden Aufgaben werden von den Modellen YOLOv8, YOLO11 und YOLO26 unterstützt.

AufgabeYOLOv8YOLO11YOLO26
Objekterkennung
Pose-Schätzung
Segmentation⚠️ Nur Voyager SDK
Orientierte Bounding Boxes
Klassifizierung

Hinweis

Die YOLO26-Segmentierung wird von Ultralytics noch nicht unterstützt export Befehl. Benutzer, die YOLO26-seg benötigen, können es über den Voyager SDK mit deploy.py, das eine Umgehungslösung im Benutzerbereich bietet. Eine native Compiler-Unterstützung wird in einer zukünftigen Version hinzugefügt.

Installation

Plattformanforderungen

Der Export ins Axelera-Format erfordert:

  • Betriebssystem: Nur Linux (Ubuntu 22.04/24.04 empfohlen)
  • Hardware: Axelera KI-Beschleuniger (Metis-Geräte)
  • Python: Versionen 3.10, 3.11 und 3.12
  • Systemabhängigkeit: sudo apt install libgl1 (von OpenCV benötigt, nicht enthalten über pip)

Ultralytics Installation

pip install ultralytics

Detaillierte Anweisungen finden Sie in unserem Ultralytics Installationsleitfaden. Bei Schwierigkeiten konsultieren Sie bitte unseren Leitfaden für häufige Probleme.

Axelera Treiberinstallation

  1. Fügen Sie den Axelera-Repository-Schlüssel hinzu:

    sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"
    
  2. Fügen Sie das Repository zu apt hinzu:

    sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"
    
  3. Installieren Sie das SDK und laden Sie den Treiber:

    sudo apt update
    sudo apt install -y metis-dkms=1.4.16
    sudo modprobe metis
    

Export von YOLO-Modellen nach Axelera

Exportieren Sie Ihre trainierten YOLO-Modelle mit dem Standard-Exportbefehl von Ultralytics.

Export ins Axelera-Format

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory
yolo export model=yolo26n.pt format=axelera

Der erste Export kann nach einer Aktualisierung der Abhängigkeiten fehlschlagen

Der Axelera-Compiler benötigt numpy<2. Wenn Ihre Umgebung über numpy>=2, der erste yolo export Das System führt automatisch ein Downgrade durch, doch der Export schlägt aufgrund des veralteten Modulstatus fehl. Führen Sie einfach denselben Exportbefehl erneut aus – beim zweiten Versuch wird er erfolgreich sein.

Export-Argumente

ArgumentTypStandardBeschreibung
formatstr'axelera'Zielformat für Axelera Metis AIPU Hardware
imgszint oder tuple640Bildgröße für Modelleingabe
int8boolTrueAktiviert die INT8-Quantisierung für AIPU
datastr'coco128.yaml'Dataset-Konfiguration für die Quantisierungskalibrierung
fractionfloat1.0Anteil des Datensatzes für die Kalibrierung (100-400 Bilder empfohlen)
devicestrNoneExportgerät: GPU (device=0) oder CPU (device=cpu)

Für alle Exportoptionen siehe die Dokumentation zum Exportmodus.

Ausgabestruktur

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Inferenz ausführen

Laden Sie das exportierte Modell mit der Ultralytics API und führen Sie die Inferenz aus, ähnlich dem Laden von ONNX-Modellen.

Inferenz mit Axelera-Modell

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results
yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Axelera-KI-Benchmarks

Die Metis AIPU maximiert den Durchsatz und minimiert gleichzeitig den Energieverbrauch.

ModellMetis PCIe FPS (Bilder pro Sekunde)Metis M.2 FPS (Bilder pro Sekunde)
YOLOv8n847771
YOLO11n746574
YOLO26n648.6484.9

Benchmarks basierend auf Axelera AI Daten. Die tatsächliche FPS hängt von der Modellgröße, dem Batching und der Eingangsauflösung ab.

Anwendungen in der realen Welt

Ultralytics YOLO auf Axelera-Hardware ermöglicht fortschrittliche Edge-Computing-Lösungen:

  1. Trainieren Sie Ihr Modell mit dem Ultralytics Trainingsmodus
  2. Export in das Axelera-Format mittels model.export(format="axelera")
  3. Validieren Genauigkeit mit yolo val um minimale Quantisierungsverluste zu überprüfen
  4. Vorhersagen mit yolo predict für die qualitative Validierung
  5. Bereitstellung zu einer leistungsstarken End-to-End-Pipeline ohne PyTorch – siehe die Beispiele für YOLO dem Voyager SDK für zusammensetzbare Python unter Verwendung von axelera-rt

Geräte-Integritätsprüfung

Überprüfen Sie, ob Ihr Axelera-Gerät ordnungsgemäß funktioniert:

# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice

Für detaillierte Diagnosen siehe die AxDevice-Dokumentation.

Maximale Leistung

Diese Integration verwendet eine Single-Core-Konfiguration zur Kompatibilität. Für die Produktion, die maximalen Durchsatz erfordert, bietet das Axelera Voyager SDK:

  • Mehrkernnutzung (Quad-Core Metis AIPU)
  • Streaming-Inferenz-Pipelines
  • Kachelbasiertes Inferencing für hochauflösende Kameras

Siehe den model-zoo für FPS-Benchmarks oder kontaktieren Sie Axelera für Produktionsunterstützung.

Bekannte Probleme

Bekannte Einschränkungen

  • M.2-Leistungsbeschränkungen: Große oder extragroße Modelle können auf M.2-Beschleunigern aufgrund von Stromversorgungsbeschränkungen Laufzeitfehler aufweisen.

Für Unterstützung besuchen Sie die Axelera Community.

FAQ

Welche YOLO-Versionen werden auf Axelera unterstützt?

Das Voyager SDK unterstützt den Export von YOLOv8, YOLO11und YOLO26 -Modelle. Informationen zur Verfügbarkeit der Aufgaben für die einzelnen Modelle finden Sie unter „Unterstützte Aufgaben “.

Kann ich benutzerdefiniert trainierte Modelle bereitstellen?

Ja. Jedes Modell, das mit dem Ultralytics Train Mode trainiert wurde, kann in das Axelera-Format exportiert werden, sofern es unterstützte Schichten und Operationen verwendet.

Wie beeinflusst die INT8-Quantisierung die Genauigkeit?

Axeleras Voyager SDK quantisiert Modelle für die Mixed-Precision AIPU-Architektur automatisch. Für die meisten Objekterkennung durchzuführen Aufgaben, überwiegen die Leistungssteigerungen (höhere FPS, geringerer Stromverbrauch) den minimalen Einfluss auf mAP. Die Quantisierung dauert Sekunden bis mehrere Stunden, abhängig von der Modellgröße. Führen Sie aus yolo val nach dem Export zur Überprüfung der Genauigkeit.

Wie viele Kalibrierungsbilder sollte ich verwenden?

Wir empfehlen 100 bis 400 Bilder. Mehr als 400 Bilder bieten keinen zusätzlichen Nutzen und erhöhen die Quantisierungszeit. Experimentieren Sie mit 100, 200 und 400 Bildern, um die optimale Balance zu finden.

Wo finde ich das Voyager SDK?

Das SDK, die Treiber und die Compiler-Tools sind über das Axelera Developer Portal verfügbar.



📅 Erstellt vor 4 Monaten ✏️ Aktualisiert vor 3 Tagen
glenn-jocherlakshanthadpderrengerambitious-octopusonuralpszr

Kommentare