Axelera AI-Beschleunigung
Demnächst verfügbar - Q1 2026
Axelera-Unterstützung in ultralytics ist in Arbeit. Die Beispiele hier zeigen die geplante UI/UX und werden lauffähig sein, sobald das Axelera-Laufzeitpaket veröffentlicht ist.
Ultralytics arbeitet mit Axelera AI zusammen, um die hochleistungsfähige, energieeffiziente Inferenz auf Edge AI-Geräten zu optimieren. Diese Integration ermöglicht es Anwendern, Ultralytics YOLO mithilfe des Voyager SDK direkt auf die Metis® AIPU- und Europa®-Plattformen zu exportieren und einzusetzen.
Axelera AI bietet dedizierte Hardware-Beschleunigung für Computer Vision und generative KI im Edge-Bereich. Ihre Technologie nutzt eine proprietäre Datenflussarchitektur und In-Memory-Computing, um einen hohen Durchsatz (bis zu 856 TOPS) bei geringem Stromverbrauch zu erzielen.
Für Ultralytics bietet dies einen skalierbaren Weg zur Bereitstellung von Objekterkennung, Posenschätzung und anderen YOLO auf Geräten, die von eingebetteten Drohnen bis zu Edge-Servern reichen.
Auswahl der richtigen Hardware
Axelera AI bietet verschiedene Formfaktoren für unterschiedliche Einsatzbedingungen. Die folgende Tabelle hilft Ihnen, die optimale Hardware für Ihren Ultralytics YOLO zu finden.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Hardware-Portfolio
Die Axelera-Hardware-Produktreihe ist optimiert für die Ausführung von Ultralytics YOLO11 und ältere Versionen mit hoher FPS-pro-Watt-Effizienz auszuführen.
Beschleunigerkarten
Diese Karten ermöglichen die KI-Beschleunigung in bestehenden Host-Geräten und erleichtern so den Einsatz von Brownfield-Lösungen.
| Produkt | Formfaktor | Berechnen Sie | Leistung (INT8) | Ziel Anwendung |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Videoanalyse mit hoher Dichte, intelligente Städte |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | Industrie-PCs, Verwaltung von Warteschlangen im Einzelhandel |
| Metis M.2 | M.2 2280 M-Schlüssel | 1x Metis AIPU | 214 TOPS | Drohnen, Robotik, tragbare medizinische Geräte |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Umgebungen, die ein fortschrittliches Wärmemanagement erfordern |
Integrierte Systeme
Für schlüsselfertige Lösungen arbeitet Axelera mit Herstellern zusammen, die für die Metis AIPU vorvalidierte Systeme anbieten.
- Metis Compute Board: Ein eigenständiges Edge-Gerät, das die Metis AIPU mit einer Rockchip RK3588 ARM CPU verbindet.
- Workstations: Enterprise-Tower von Dell (Precision 3460XE) und Lenovo (ThinkStation P360 Ultra).
- Industrie-PCs: Robuste Systeme von Advantech und Aetina für die Fertigungsautomatisierung.
Voyager SDK-Integration
Das Voyager SDK dient als Brücke zwischen Ultralytics Modellen und Axelera Hardware. Es übernimmt die Kompilierung, Quantisierung und Laufzeitausführung von neuronalen Netzen.
Hauptmerkmale für Ultralytics :
- Nahtloser Export: Der Compiler des SDK optimiert die YOLO für die Metis-Datenflussarchitektur.
- Quantisierungs-Engine: Konvertiert FP32-Modelle automatisch in INT8-Präzision mit minimalem Genauigkeitsverlust.
- Pipeline Builder: Ein YAML-basiertes Framework zur Verkettung mehrerer Modelle (z. B. Erkennung + Posenschätzung) ohne das Schreiben von komplexem C++-Code.
Installation und Einrichtung
Um die Axelera-Beschleunigung zu nutzen, benötigen Sie die ultralytics Paket installiert. Beachten Sie, dass das Voyager SDK eine separate Installation auf Systemebene ist, die für die Schnittstelle zur Hardware erforderlich ist. Laufzeit-Räder werden erwartet in Q1 2026Die folgenden Befehle spiegeln den beabsichtigten Ablauf der Einrichtung wider.
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
Exportieren von YOLO nach Axelera
Wenn das Axelera-Laufzeitpaket ausgeliefert wird (Ziel: Q1 2026), exportieren Sie Ihre trainierten YOLO mit dem Ultralytics export in das Axelera-Format. Dieser Prozess erzeugt die vom Voyager-Compiler benötigten Artefakte.
Voyager SDK erforderlich
Die format='axelera' Export erfordert, dass die Axelera-Bibliotheken in Ihrer Umgebung verfügbar sind. Alternativ können Sie auch exportieren nach ONNX und kompilieren Sie manuell mit der Voyager-Toolchain.
Export-Beispiele
Konvertieren Sie ein YOLO11 für den Einsatz in Metis.
Exportieren ins Axelera-Format
Zukünftiges Beispiel - wird funktionieren, wenn die Laufzeitumgebung freigegeben ist
Dieser Codeblock veranschaulicht den geplanten Ablauf. Er erfordert das kommende Axelera-Laufzeitpaket (voraussichtliches Q1 2026), um erfolgreich ausgeführt zu werden.
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
Die verfügbaren Argumente finden Sie in der Dokumentation zum Exportmodus.
Inferenz ausführen
Einmal exportiert, können Sie das von Axelera kompilierte Modell direkt mit der ultralytics API (ähnlich dem Laden von ONNX Modelle). Das folgende Beispiel zeigt das erwartete Verwendungsmuster für die Ausführung der Inferenz und die Speicherung der Ergebnisse nach der Auslieferung des Laufzeitpakets.
Inferenz mit Axelera Format
Zukünftiges Beispiel - wird funktionieren, wenn die Laufzeitumgebung freigegeben ist
Dieser Codeblock veranschaulicht den geplanten Ablauf. Er erfordert das kommende Axelera-Laufzeitpaket (voraussichtliches Q1 2026), um erfolgreich ausgeführt zu werden.
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
Leistung der Inferenz
Die Metis AIPU ist darauf ausgelegt, den Durchsatz zu maximieren und gleichzeitig den Energieverbrauch zu minimieren. Die nachstehenden Benchmarks veranschaulichen die mit Ultralytics erreichbare Leistung.
| Metrik | Metis PCIe x4 | Metis M.2 | Hinweis |
|---|---|---|---|
| Spitzen-Durchsatz | 856 TOPS | 214 TOPS | INT8 Genauigkeit |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 Eingabe |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 Eingabe |
| Wirkungsgrad | Hoch | Sehr hoch | Ideal für Batteriestrom |
Die Benchmarks basieren auf Axelera AI-Daten (September 2025). Tatsächliche FPS hängen von der Modellgröße, der Stapelverarbeitung und der Eingabeauflösung ab.
Anwendungen in der realen Welt
Ultralytics YOLO auf Axelera-Hardware ermöglicht fortschrittliche Edge-Computing-Lösungen:
- Intelligenter Einzelhandel: Objektzählung in Echtzeit und Heatmap-Analysen für die Ladenoptimierung.
- Industrielle Sicherheit: Erkennung von PSA mit geringer Latenz in Produktionsumgebungen.
- Drohnen-Analytik: Hochgeschwindigkeits-Objekterkennung durch UAVs für die Landwirtschaft und für Such- und Rettungsdienste.
- Verkehrssysteme: Kantenbasierte Nummernschilderkennung und Geschwindigkeitsschätzung.
FAQ
Welche YOLO Versionen werden auf Axelera unterstützt?
Das Voyager SDK und die Ultralytics unterstützen den Export von YOLOv8 und YOLO11 Modellen.
Kann ich individuell trainierte Modelle einsetzen?
Ja. Jedes mit Ultralytics Train Mode trainierte Modell kann in das Axelera-Format exportiert werden, sofern es unterstützte Ebenen und Operationen verwendet.
Wie wirkt sich die INT8-Quantisierung auf die Genauigkeit aus?
Die Quantisierungs-Engine von Axelera nutzt fortschrittliche Kalibrierungstechniken, um den Genauigkeitsverlust zu minimieren. Bei den meisten Erkennungsaufgaben überwiegt der Leistungsgewinn deutlich die vernachlässigbaren Auswirkungen auf mAP.
Wo kann ich das Voyager SDK finden?
Das SDK, die Treiber und die Compiler-Tools sind über das Axelera Developer Portal verfügbar.