Axelera KI-Export und Bereitstellung
Experimentelle Veröffentlichung
Dies ist eine experimentelle Integration, die die Bereitstellung auf Axelera Metis Hardware demonstriert. Eine vollständige Integration wird bis Februar 2026 erwartet, mit Modellausgabe ohne Axelera Hardware und Standard-Pip-Installation.
Ultralytics kooperiert mit Axelera AI, um eine hochleistungsfähige, energieeffiziente Inferenz auf Edge AI-Geräten zu ermöglichen. Exportieren und deployen Sie Ultralytics YOLO Modelle direkt auf die Metis® AIPU mithilfe des Voyager SDK.
Axelera AI bietet dedizierte Hardware-Beschleunigung für Computer Vision am Edge, unter Verwendung einer proprietären Datenflussarchitektur und In-Memory-Computing, um bis zu 856 TOPS bei geringem Stromverbrauch zu liefern.
Auswahl der richtigen Hardware
Axelera AI bietet verschiedene Formfaktoren, um unterschiedlichen Bereitstellungsanforderungen gerecht zu werden. Die folgende Tabelle hilft bei der Identifizierung der optimalen Hardware für Ihre Ultralytics YOLO-Bereitstellung.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Hardware-Portfolio
Die Axelera-Hardware-Produktlinie ist optimiert, um Ultralytics YOLO11 und ältere Versionen mit hoher FPS-pro-Watt-Effizienz auszuführen.
Beschleunigerkarten
Diese Karten ermöglichen die KI-Beschleunigung in bestehenden Host-Geräten, was Brownfield-Bereitstellungen erleichtert.
| Produkt | Formfaktor | Berechnung | Leistung (INT8) | Zielanwendung |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Hochdichte Videoanalyse, Smart Cities |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | Industrie-PCs, Warteschlangenmanagement im Einzelhandel |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, Robotik, tragbare medizinische Geräte |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Umgebungen, die ein fortschrittliches Wärmemanagement erfordern |
Integrierte Systeme
Für schlüsselfertige Lösungen arbeitet Axelera mit Herstellern zusammen, um Systeme bereitzustellen, die für die Metis AIPU vorvalidiert sind.
- Metis Compute Board: Ein eigenständiges Edge-Gerät, das die Metis AIPU mit einer Rockchip RK3588 ARM CPU kombiniert.
- Workstations: Enterprise-Tower von Dell (Precision 3460XE) und Lenovo (ThinkStation P360 Ultra).
- Industrie-PCs: Robuste Systeme von Advantech und Aetina, entwickelt für die Fertigungsautomatisierung.
Unterstützte Aufgaben
Derzeit können Objekterkennungsmodelle in das Axelera-Format exportiert werden. Zusätzliche Aufgaben werden integriert:
| Aufgabe | Status |
|---|---|
| Objekterkennung | ✅ Unterstützt |
| Pose-Schätzung | Demnächst verfügbar |
| Segmentation | Demnächst verfügbar |
| Orientierte Bounding Boxes | Demnächst verfügbar |
Installation
Plattformanforderungen
Der Export ins Axelera-Format erfordert:
- Betriebssystem: Nur Linux (Ubuntu 22.04/24.04 empfohlen)
- Hardware: Axelera KI-Beschleuniger (Metis-Geräte)
- Python: Version 3.10 (3.11 und 3.12 demnächst verfügbar)
Ultralytics Installation
pip install ultralytics
Detaillierte Anweisungen finden Sie in unserem Ultralytics Installationsleitfaden. Bei Schwierigkeiten konsultieren Sie bitte unseren Leitfaden für häufige Probleme.
Axelera Treiberinstallation
Fügen Sie den Axelera-Repository-Schlüssel hinzu:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"Fügen Sie das Repository zu apt hinzu:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"Installieren Sie das SDK und laden Sie den Treiber:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
Export von YOLO-Modellen nach Axelera
Exportieren Sie Ihre trainierten YOLO-Modelle mit dem Standard-Exportbefehl von Ultralytics.
Export ins Axelera-Format
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera
Export-Argumente
| Argument | Typ | Standard | Beschreibung |
|---|---|---|---|
format | str | 'axelera' | Zielformat für Axelera Metis AIPU Hardware |
imgsz | int oder tuple | 640 | Bildgröße für Modelleingabe |
int8 | bool | True | Aktiviert die INT8-Quantisierung für AIPU |
data | str | 'coco128.yaml' | Dataset-Konfiguration für die Quantisierungskalibrierung |
fraction | float | 1.0 | Anteil des Datensatzes für die Kalibrierung (100-400 Bilder empfohlen) |
device | str | None | Exportgerät: GPU (device=0) oder CPU (device=cpu) |
Für alle Exportoptionen siehe die Dokumentation zum Exportmodus.
Ausgabestruktur
yolo11n_axelera_model/
├── yolo11n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
Inferenz ausführen
Laden Sie das exportierte Modell mit der Ultralytics API und führen Sie die Inferenz aus, ähnlich dem Laden von ONNX-Modellen.
Inferenz mit Axelera-Modell
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
Bekanntes Problem
Der erste Inferenzlauf kann einen Fehler auslösen ImportError. Nachfolgende Ausführungen werden korrekt funktionieren. Dies wird in einer zukünftigen Version behoben.
Inferenzleistung
Die Metis AIPU maximiert den Durchsatz und minimiert gleichzeitig den Energieverbrauch.
| Metrik | Metis PCIe x4 | Metis M.2 | Hinweis |
|---|---|---|---|
| Spitzendurchsatz | 856 TOPS | 214 TOPS | INT8-Präzision |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 Eingabe |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 Eingabe |
| Effizienz | Hoch | Sehr hoch | Ideal für Akkubetrieb |
Benchmarks basierend auf Axelera AI Daten. Die tatsächliche FPS hängt von der Modellgröße, dem Batching und der Eingangsauflösung ab.
Anwendungen in der realen Welt
Ultralytics YOLO auf Axelera-Hardware ermöglicht fortschrittliche Edge-Computing-Lösungen:
- Smart Retail: Echtzeit-Objektzählung und Heatmap-Analysen zur Ladenoptimierung.
- Arbeitssicherheit: Low-Latency PSA-Erkennung in Fertigungsumgebungen.
- Drohnen-Analysen: Hochgeschwindigkeits- Objekterkennung auf UAVs für die Landwirtschaft und Such- und Rettungseinsätze.
- Verkehrssysteme: Edge-basierte Kennzeichenerkennung und Geschwindigkeitsmessung.
Empfohlener Workflow
- Trainieren Sie Ihr Modell mit dem Ultralytics Trainingsmodus
- Export in das Axelera-Format mittels
model.export(format="axelera") - Validieren Genauigkeit mit
yolo valum minimale Quantisierungsverluste zu überprüfen - Vorhersagen mit
yolo predictfür die qualitative Validierung
Geräte-Integritätsprüfung
Überprüfen Sie, ob Ihr Axelera-Gerät ordnungsgemäß funktioniert:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
Für detaillierte Diagnosen siehe die AxDevice-Dokumentation.
Maximale Leistung
Diese Integration verwendet eine Single-Core-Konfiguration zur Kompatibilität. Für die Produktion, die maximalen Durchsatz erfordert, bietet das Axelera Voyager SDK:
- Mehrkernnutzung (Quad-Core Metis AIPU)
- Streaming-Inferenz-Pipelines
- Kachelbasiertes Inferencing für hochauflösende Kameras
Siehe den model-zoo für FPS-Benchmarks oder kontaktieren Sie Axelera für Produktionsunterstützung.
Bekannte Probleme
Bekannte Einschränkungen
PyTorch 2.9-Kompatibilität: Der erste
yolo export format=axeleraBefehl kann aufgrund eines automatischen PyTorch-Downgrades auf 2.8 fehlschlagen. Führen Sie den Befehl ein zweites Mal aus, um erfolgreich zu sein.M.2-Leistungsbeschränkungen: Große oder extragroße Modelle können auf M.2-Beschleunigern aufgrund von Stromversorgungsbeschränkungen Laufzeitfehler aufweisen.
Erster Inferenz-Importfehler: Der erste Inferenzlauf kann einen
ImportError. Nachfolgende Ausführungen funktionieren korrekt.
Für Unterstützung besuchen Sie die Axelera Community.
FAQ
Welche YOLO-Versionen werden auf Axelera unterstützt?
Das Voyager SDK unterstützt den Export von YOLOv8- und YOLO11-Modellen.
Kann ich benutzerdefiniert trainierte Modelle bereitstellen?
Ja. Jedes Modell, das mit dem Ultralytics Train Mode trainiert wurde, kann in das Axelera-Format exportiert werden, sofern es unterstützte Schichten und Operationen verwendet.
Wie beeinflusst die INT8-Quantisierung die Genauigkeit?
Axeleras Voyager SDK quantisiert Modelle für die Mixed-Precision AIPU-Architektur automatisch. Für die meisten Objekterkennung durchzuführen Aufgaben, überwiegen die Leistungssteigerungen (höhere FPS, geringerer Stromverbrauch) den minimalen Einfluss auf mAP. Die Quantisierung dauert Sekunden bis mehrere Stunden, abhängig von der Modellgröße. Führen Sie aus yolo val nach dem Export zur Überprüfung der Genauigkeit.
Wie viele Kalibrierungsbilder sollte ich verwenden?
Wir empfehlen 100 bis 400 Bilder. Mehr als 400 Bilder bieten keinen zusätzlichen Nutzen und erhöhen die Quantisierungszeit. Experimentieren Sie mit 100, 200 und 400 Bildern, um die optimale Balance zu finden.
Wo finde ich das Voyager SDK?
Das SDK, die Treiber und die Compiler-Tools sind über das Axelera Developer Portal verfügbar.