Zum Inhalt springen

Axelera AI-Beschleunigung

Demnächst verfügbar - Q1 2026

Axelera-Unterstützung in ultralytics ist in Arbeit. Die Beispiele hier zeigen die geplante UI/UX und werden lauffähig sein, sobald das Axelera-Laufzeitpaket veröffentlicht ist.

Ultralytics arbeitet mit Axelera AI zusammen, um die hochleistungsfähige, energieeffiziente Inferenz auf Edge AI-Geräten zu optimieren. Diese Integration ermöglicht es Anwendern, Ultralytics YOLO mithilfe des Voyager SDK direkt auf die Metis® AIPU- und Europa®-Plattformen zu exportieren und einzusetzen.

Axelera AI-Ökosystem

Axelera AI bietet dedizierte Hardware-Beschleunigung für Computer Vision und generative KI im Edge-Bereich. Ihre Technologie nutzt eine proprietäre Datenflussarchitektur und In-Memory-Computing, um einen hohen Durchsatz (bis zu 856 TOPS) bei geringem Stromverbrauch zu erzielen.

Für Ultralytics bietet dies einen skalierbaren Weg zur Bereitstellung von Objekterkennung, Posenschätzung und anderen YOLO auf Geräten, die von eingebetteten Drohnen bis zu Edge-Servern reichen.

Auswahl der richtigen Hardware

Axelera AI bietet verschiedene Formfaktoren für unterschiedliche Einsatzbedingungen. Die folgende Tabelle hilft Ihnen, die optimale Hardware für Ihren Ultralytics YOLO zu finden.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Hardware-Portfolio

Die Axelera-Hardware-Produktreihe ist optimiert für die Ausführung von Ultralytics YOLO11 und ältere Versionen mit hoher FPS-pro-Watt-Effizienz auszuführen.

Beschleunigerkarten

Diese Karten ermöglichen die KI-Beschleunigung in bestehenden Host-Geräten und erleichtern so den Einsatz von Brownfield-Lösungen.

ProduktFormfaktorBerechnen SieLeistung (INT8)Ziel Anwendung
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSVideoanalyse mit hoher Dichte, intelligente Städte
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSIndustrie-PCs, Verwaltung von Warteschlangen im Einzelhandel
Metis M.2M.2 2280 M-Schlüssel1x Metis AIPU214 TOPSDrohnen, Robotik, tragbare medizinische Geräte
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSUmgebungen, die ein fortschrittliches Wärmemanagement erfordern

Integrierte Systeme

Für schlüsselfertige Lösungen arbeitet Axelera mit Herstellern zusammen, die für die Metis AIPU vorvalidierte Systeme anbieten.

  • Metis Compute Board: Ein eigenständiges Edge-Gerät, das die Metis AIPU mit einer Rockchip RK3588 ARM CPU verbindet.
  • Workstations: Enterprise-Tower von Dell (Precision 3460XE) und Lenovo (ThinkStation P360 Ultra).
  • Industrie-PCs: Robuste Systeme von Advantech und Aetina für die Fertigungsautomatisierung.

Voyager SDK-Integration

Das Voyager SDK dient als Brücke zwischen Ultralytics Modellen und Axelera Hardware. Es übernimmt die Kompilierung, Quantisierung und Laufzeitausführung von neuronalen Netzen.

Hauptmerkmale für Ultralytics :

  1. Nahtloser Export: Der Compiler des SDK optimiert die YOLO für die Metis-Datenflussarchitektur.
  2. Quantisierungs-Engine: Konvertiert FP32-Modelle automatisch in INT8-Präzision mit minimalem Genauigkeitsverlust.
  3. Pipeline Builder: Ein YAML-basiertes Framework zur Verkettung mehrerer Modelle (z. B. Erkennung + Posenschätzung) ohne das Schreiben von komplexem C++-Code.

Installation und Einrichtung

Um die Axelera-Beschleunigung zu nutzen, benötigen Sie die ultralytics Paket installiert. Beachten Sie, dass das Voyager SDK eine separate Installation auf Systemebene ist, die für die Schnittstelle zur Hardware erforderlich ist. Laufzeit-Räder werden erwartet in Q1 2026Die folgenden Befehle spiegeln den beabsichtigten Ablauf der Einrichtung wider.

# Install Ultralytics
pip install ultralytics

# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.

Exportieren von YOLO nach Axelera

Wenn das Axelera-Laufzeitpaket ausgeliefert wird (Ziel: Q1 2026), exportieren Sie Ihre trainierten YOLO mit dem Ultralytics export in das Axelera-Format. Dieser Prozess erzeugt die vom Voyager-Compiler benötigten Artefakte.

Voyager SDK erforderlich

Die format='axelera' Export erfordert, dass die Axelera-Bibliotheken in Ihrer Umgebung verfügbar sind. Alternativ können Sie auch exportieren nach ONNX und kompilieren Sie manuell mit der Voyager-Toolchain.

Export-Beispiele

Konvertieren Sie ein YOLO11 für den Einsatz in Metis.

Exportieren ins Axelera-Format

Zukünftiges Beispiel - wird funktionieren, wenn die Laufzeitumgebung freigegeben ist

Dieser Codeblock veranschaulicht den geplanten Ablauf. Er erfordert das kommende Axelera-Laufzeitpaket (voraussichtliches Q1 2026), um erfolgreich ausgeführt zu werden.

from ultralytics import YOLO

# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640

Die verfügbaren Argumente finden Sie in der Dokumentation zum Exportmodus.

Inferenz ausführen

Einmal exportiert, können Sie das von Axelera kompilierte Modell direkt mit der ultralytics API (ähnlich dem Laden von ONNX Modelle). Das folgende Beispiel zeigt das erwartete Verwendungsmuster für die Ausführung der Inferenz und die Speicherung der Ergebnisse nach der Auslieferung des Laufzeitpakets.

Inferenz mit Axelera Format

Zukünftiges Beispiel - wird funktionieren, wenn die Laufzeitumgebung freigegeben ist

Dieser Codeblock veranschaulicht den geplanten Ablauf. Er erfordert das kommende Axelera-Laufzeitpaket (voraussichtliches Q1 2026), um erfolgreich ausgeführt zu werden.

from ultralytics import YOLO

# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel")  # will work once Axelera runtime is released

# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)

# Iterate over result objects to inspect or render detections
for r in results:
    boxes = r.boxes  # bounding boxes tensor + metadata
    print(f"Detected {len(boxes)} objects")

    # Save visuals per result (files saved alongside inputs)
    r.save()  # saves annotated image(s) to disk
    # Or display interactively (desktop environments)
    # r.show()

Leistung der Inferenz

Die Metis AIPU ist darauf ausgelegt, den Durchsatz zu maximieren und gleichzeitig den Energieverbrauch zu minimieren. Die nachstehenden Benchmarks veranschaulichen die mit Ultralytics erreichbare Leistung.

MetrikMetis PCIe x4Metis M.2Hinweis
Spitzen-Durchsatz856 TOPS214 TOPSINT8 Genauigkeit
YOLOv5m FPS~1539 FPS~326 FPS640x640 Eingabe
YOLOv5s FPSN/A~827 FPS640x640 Eingabe
WirkungsgradHochSehr hochIdeal für Batteriestrom

Die Benchmarks basieren auf Axelera AI-Daten (September 2025). Tatsächliche FPS hängen von der Modellgröße, der Stapelverarbeitung und der Eingabeauflösung ab.

Anwendungen in der realen Welt

Ultralytics YOLO auf Axelera-Hardware ermöglicht fortschrittliche Edge-Computing-Lösungen:

FAQ

Welche YOLO Versionen werden auf Axelera unterstützt?

Das Voyager SDK und die Ultralytics unterstützen den Export von YOLOv8 und YOLO11 Modellen.

Kann ich individuell trainierte Modelle einsetzen?

Ja. Jedes mit Ultralytics Train Mode trainierte Modell kann in das Axelera-Format exportiert werden, sofern es unterstützte Ebenen und Operationen verwendet.

Wie wirkt sich die INT8-Quantisierung auf die Genauigkeit aus?

Die Quantisierungs-Engine von Axelera nutzt fortschrittliche Kalibrierungstechniken, um den Genauigkeitsverlust zu minimieren. Bei den meisten Erkennungsaufgaben überwiegt der Leistungsgewinn deutlich die vernachlässigbaren Auswirkungen auf mAP.

Wo kann ich das Voyager SDK finden?

Das SDK, die Treiber und die Compiler-Tools sind über das Axelera Developer Portal verfügbar.



📅 Erstellt vor 0 Tagen ✏️ Aktualisiert vor 0 Tagen
glenn-jocher

Kommentare