Axelera KI-Export und Bereitstellung

Experimentelle Veröffentlichung

Dies ist eine experimentelle Integration, die die Bereitstellung auf Axelera Metis Hardware demonstriert. Eine vollständige Integration wird bis Februar 2026 erwartet, mit Modellausgabe ohne Axelera Hardware und Standard-Pip-Installation.

Ultralytics kooperiert mit Axelera AI, um eine hochleistungsfähige, energieeffiziente Inferenz auf Edge AI-Geräten zu ermöglichen. Exportieren und deployen Sie Ultralytics YOLO Modelle direkt auf die Metis® AIPU mithilfe des Voyager SDK.

Axelera KI-Ökosystem

Axelera AI bietet dedizierte Hardware-Beschleunigung für Computer Vision am Edge, unter Verwendung einer proprietären Datenflussarchitektur und In-Memory-Computing, um bis zu 856 TOPS bei geringem Stromverbrauch zu liefern.

Auswahl der richtigen Hardware

Axelera AI bietet verschiedene Formfaktoren, um unterschiedlichen Bereitstellungsanforderungen gerecht zu werden. Die folgende Tabelle hilft bei der Identifizierung der optimalen Hardware für Ihre Ultralytics YOLO-Bereitstellung.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Hardware-Portfolio

Die Axelera-Hardware-Produktlinie ist optimiert, um Ultralytics YOLO11 und ältere Versionen mit hoher FPS-pro-Watt-Effizienz auszuführen.

Beschleunigerkarten

Diese Karten ermöglichen die KI-Beschleunigung in bestehenden Host-Geräten, was Brownfield-Bereitstellungen erleichtert.

Produkt	Formfaktor	Berechnung	Leistung (INT8)	Zielanwendung
Metis PCIe x4	PCIe Gen3 x16	4x Metis AIPUs	856 TOPS	Hochdichte Videoanalyse, Smart Cities
Metis PCIe x1	PCIe Gen3 x1	1x Metis AIPU	214 TOPS	Industrie-PCs, Warteschlangenmanagement im Einzelhandel
Metis M.2	M.2 2280 M-Key	1x Metis AIPU	214 TOPS	Drones, Robotik, tragbare medizinische Geräte
Metis M.2 MAX	M.2 2280	1x Metis AIPU	214 TOPS	Umgebungen, die ein fortschrittliches Wärmemanagement erfordern

Integrierte Systeme

Für schlüsselfertige Lösungen arbeitet Axelera mit Herstellern zusammen, um Systeme bereitzustellen, die für die Metis AIPU vorvalidiert sind.

Metis Compute Board: Ein eigenständiges Edge-Gerät, das die Metis AIPU mit einer Rockchip RK3588 ARM CPU kombiniert.
Workstations: Enterprise-Tower von Dell (Precision 3460XE) und Lenovo (ThinkStation P360 Ultra).
Industrie-PCs: Robuste Systeme von Advantech und Aetina, entwickelt für die Fertigungsautomatisierung.

Unterstützte Aufgaben

Derzeit können Objekterkennungsmodelle in das Axelera-Format exportiert werden. Zusätzliche Aufgaben werden integriert:

Aufgabe	Status
Objekterkennung	✅ Unterstützt
Pose-Schätzung	Demnächst verfügbar
Segmentation	Demnächst verfügbar
Orientierte Bounding Boxes	Demnächst verfügbar

Installation

Plattformanforderungen

Der Export ins Axelera-Format erfordert:

Betriebssystem: Nur Linux (Ubuntu 22.04/24.04 empfohlen)
Hardware: Axelera KI-Beschleuniger (Metis-Geräte)
Python: Version 3.10 (3.11 und 3.12 demnächst verfügbar)

Ultralytics Installation

pip install ultralytics

Detaillierte Anweisungen finden Sie in unserem Ultralytics Installationsleitfaden. Bei Schwierigkeiten konsultieren Sie bitte unseren Leitfaden für häufige Probleme.

Axelera Treiberinstallation

Fügen Sie den Axelera-Repository-Schlüssel hinzu:

sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"

Fügen Sie das Repository zu apt hinzu:

sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"

Installieren Sie das SDK und laden Sie den Treiber:

sudo apt update
sudo apt install -y axelera-voyager-sdk-base
sudo modprobe metis
yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER

Export von YOLO-Modellen nach Axelera

Exportieren Sie Ihre trainierten YOLO-Modelle mit dem Standard-Exportbefehl von Ultralytics.

Export ins Axelera-Format

PythonCLI

from ultralytics import YOLO

# Load a YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo11n_axelera_model' directory

yolo export model=yolo11n.pt format=axelera

Export-Argumente

Argument	Typ	Standard	Beschreibung
`format`	`str`	`'axelera'`	Zielformat für Axelera Metis AIPU Hardware
`imgsz`	`int` oder `tuple`	`640`	Bildgröße für Modelleingabe
`int8`	`bool`	`True`	Aktiviert die INT8-Quantisierung für AIPU
`data`	`str`	`'coco128.yaml'`	Dataset-Konfiguration für die Quantisierungskalibrierung
`fraction`	`float`	`1.0`	Anteil des Datensatzes für die Kalibrierung (100-400 Bilder empfohlen)
`device`	`str`	`None`	Exportgerät: GPU (`device=0`) oder CPU (`device=cpu`)

Für alle Exportoptionen siehe die Dokumentation zum Exportmodus.

Ausgabestruktur

yolo11n_axelera_model/
├── yolo11n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Inferenz ausführen

Laden Sie das exportierte Modell mit der Ultralytics API und führen Sie die Inferenz aus, ähnlich dem Laden von ONNX-Modellen.

Inferenz mit Axelera-Modell

PythonCLI

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Bekanntes Problem

Der erste Inferenzlauf kann einen Fehler auslösen ImportError. Nachfolgende Ausführungen werden korrekt funktionieren. Dies wird in einer zukünftigen Version behoben.

Inferenzleistung

Die Metis AIPU maximiert den Durchsatz und minimiert gleichzeitig den Energieverbrauch.

Metrik	Metis PCIe x4	Metis M.2	Hinweis
Spitzendurchsatz	856 TOPS	214 TOPS	INT8-Präzision
YOLOv5m FPS	~1539 FPS	~326 FPS	640x640 Eingabe
YOLOv5s FPS	N/A	~827 FPS	640x640 Eingabe
Effizienz	Hoch	Sehr hoch	Ideal für Akkubetrieb

Benchmarks basierend auf Axelera AI Daten. Die tatsächliche FPS hängt von der Modellgröße, dem Batching und der Eingangsauflösung ab.

Anwendungen in der realen Welt

Ultralytics YOLO auf Axelera-Hardware ermöglicht fortschrittliche Edge-Computing-Lösungen:

Smart Retail: Echtzeit-Objektzählung und Heatmap-Analysen zur Ladenoptimierung.
Arbeitssicherheit: Low-Latency PSA-Erkennung in Fertigungsumgebungen.
Drohnen-Analysen: Hochgeschwindigkeits- Objekterkennung auf UAVs für die Landwirtschaft und Such- und Rettungseinsätze.
Verkehrssysteme: Edge-basierte Kennzeichenerkennung und Geschwindigkeitsmessung.

Empfohlener Workflow

Trainieren Sie Ihr Modell mit dem Ultralytics Trainingsmodus
Export in das Axelera-Format mittels model.export(format="axelera")
Validieren Genauigkeit mit yolo val um minimale Quantisierungsverluste zu überprüfen
Vorhersagen mit yolo predict für die qualitative Validierung

Geräte-Integritätsprüfung

Überprüfen Sie, ob Ihr Axelera-Gerät ordnungsgemäß funktioniert:

. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice

Für detaillierte Diagnosen siehe die AxDevice-Dokumentation.

Maximale Leistung

Diese Integration verwendet eine Single-Core-Konfiguration zur Kompatibilität. Für die Produktion, die maximalen Durchsatz erfordert, bietet das Axelera Voyager SDK:

Mehrkernnutzung (Quad-Core Metis AIPU)
Streaming-Inferenz-Pipelines
Kachelbasiertes Inferencing für hochauflösende Kameras

Siehe den model-zoo für FPS-Benchmarks oder kontaktieren Sie Axelera für Produktionsunterstützung.

Bekannte Probleme

Bekannte Einschränkungen

PyTorch 2.9-Kompatibilität: Der erste yolo export format=axelera Befehl kann aufgrund eines automatischen PyTorch-Downgrades auf 2.8 fehlschlagen. Führen Sie den Befehl ein zweites Mal aus, um erfolgreich zu sein.
M.2-Leistungsbeschränkungen: Große oder extragroße Modelle können auf M.2-Beschleunigern aufgrund von Stromversorgungsbeschränkungen Laufzeitfehler aufweisen.
Erster Inferenz-Importfehler: Der erste Inferenzlauf kann einen ImportError. Nachfolgende Ausführungen funktionieren korrekt.

Für Unterstützung besuchen Sie die Axelera Community.

FAQ

Welche YOLO-Versionen werden auf Axelera unterstützt?

Das Voyager SDK unterstützt den Export von YOLOv8- und YOLO11-Modellen.

Kann ich benutzerdefiniert trainierte Modelle bereitstellen?

Ja. Jedes Modell, das mit dem Ultralytics Train Mode trainiert wurde, kann in das Axelera-Format exportiert werden, sofern es unterstützte Schichten und Operationen verwendet.

Wie beeinflusst die INT8-Quantisierung die Genauigkeit?

Axeleras Voyager SDK quantisiert Modelle für die Mixed-Precision AIPU-Architektur automatisch. Für die meisten Objekterkennung durchzuführen Aufgaben, überwiegen die Leistungssteigerungen (höhere FPS, geringerer Stromverbrauch) den minimalen Einfluss auf mAP. Die Quantisierung dauert Sekunden bis mehrere Stunden, abhängig von der Modellgröße. Führen Sie aus yolo val nach dem Export zur Überprüfung der Genauigkeit.

Wie viele Kalibrierungsbilder sollte ich verwenden?

Wir empfehlen 100 bis 400 Bilder. Mehr als 400 Bilder bieten keinen zusätzlichen Nutzen und erhöhen die Quantisierungszeit. Experimentieren Sie mit 100, 200 und 400 Bildern, um die optimale Balance zu finden.

Wo finde ich das Voyager SDK?

Das SDK, die Treiber und die Compiler-Tools sind über das Axelera Developer Portal verfügbar.

📅 Erstellt vor 1 Monat ✏️ Aktualisiert vor 23 Tagen