Ir al contenido

Aceleración de IA Axelera

Próximamente - T1 2026

Apoyo de Axelera en ultralytics es en curso. Estos ejemplos muestran la interfaz de usuario y la interfaz de usuario planificadas y serán ejecutables una vez que se publique el paquete de ejecución Axelera.

Ultralytics se asocia con Axelera AI para agilizar la inferencia de alto rendimiento y eficiencia energética en dispositivos Edge AI. Esta integración permite a los usuarios exportar y desplegar modelosUltralytics YOLO directamente en las plataformas Metis® AIPU y Europa® mediante el SDK Voyager.

Ecosistema Axelera AI

Axelera AI proporciona aceleración de hardware dedicada para visión por ordenador e inteligencia artificial generativa en el perímetro. Su tecnología aprovecha una arquitectura de flujo de datos propia y la computación en memoria para ofrecer un alto rendimiento (hasta 856 TOPS) con un bajo consumo de energía.

Para los usuarios Ultralytics , esto ofrece una vía escalable para implantar la detección de objetos, la estimación de la pose y otras tareas YOLO en dispositivos que van desde drones integrados hasta servidores periféricos.

Selección del hardware adecuado

Axelera AI ofrece varios factores de forma para adaptarse a diferentes limitaciones de despliegue. La siguiente tabla le ayudará a identificar el hardware óptimo para su despliegue Ultralytics YOLO .

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Cartera de hardware

La línea de hardware de Axelera está optimizada para ejecutar Ultralytics YOLO11 y las versiones anteriores con una alta eficiencia de FPS por vatio.

Tarjetas aceleradoras

Estas tarjetas permiten acelerar la IA en dispositivos host existentes, lo que facilita las implantaciones brownfield.

ProductoFactor de formaComputeRendimiento (INT8)Aplicación de destino
Metis PCIe x4PCIe Gen3 x164x Metis AIPUs856 TOPSAnálisis de vídeo de alta densidad, ciudades inteligentes
Metis PCIe x1PCIe Gen3 x11x Metis AIPU214 TOPSOrdenadores industriales, gestión de colas en comercios
Metis M.2M.2 2280 M-Key1x Metis AIPU214 TOPSDrones, robótica, dispositivos médicos portátiles
Metis M.2 MAXM.2 22801x Metis AIPU214 TOPSEntornos que requieren una gestión térmica avanzada

Sistemas integrados

Para las soluciones llave en mano, Axelera se asocia con fabricantes para proporcionar sistemas validados previamente para la AIPU Metis.

  • Tarjeta Metis Compute Board: Un dispositivo autónomo que combina la AIPU Metis con una CPU ARM Rockchip RK3588.
  • Estaciones de trabajo: Torres empresariales de Dell (Precision 3460XE) y Lenovo (ThinkStation P360 Ultra).
  • PC industriales: Sistemas reforzados de Advantech y Aetina diseñados para la automatización de la fabricación.

Integración del SDK de Voyager

El SDK Voyager sirve de puente entre los modelos Ultralytics y el hardware Axelera. Se encarga de la compilación, cuantificación y ejecución en tiempo de ejecución de las redes neuronales.

Características principales para los usuarios Ultralytics :

  1. Exportación sin fisuras: El compilador del SDK optimiza los modelos YOLO para la arquitectura de flujo de datos Metis.
  2. Motor de cuantización: Convierte automáticamente modelos FP32 a precisión INT8 con una pérdida de precisión mínima.
  3. Pipeline Builder: Un marco basado en YAML para encadenar múltiples modelos (por ejemplo, detección + estimación de pose) sin escribir código C++ complejo.

Instalación y configuración

Para utilizar la aceleración Axelera, se necesita el módulo ultralytics instalado. Tenga en cuenta que el SDK de Voyager es una instalación independiente a nivel de sistema necesaria para interactuar con el hardware. Las ruedas de ejecución se esperan en Q1 2026Los siguientes comandos reflejan el flujo de configuración previsto.

# Install Ultralytics
pip install ultralytics

# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.

Exportación de modelos YOLO a Axelera

Cuando se distribuya el paquete de ejecución Axelera (objetivo para el primer trimestre de 2026), exportará sus modelos YOLO entrenados al formato Axelera utilizando el comando estándar de exportación de Ultralytics . Este proceso genera los artefactos requeridos por el compilador Voyager.

Se requiere Voyager SDK

El format='axelera' La exportación requiere que las bibliotecas Axelera estén disponibles en su entorno. Como alternativa, puede exportar a ONNX y compilar manualmente utilizando la cadena de herramientas Voyager.

Ejemplos de Export

Convertir un modelo YOLO11 para su despliegue en Metis.

Exportar a formato Axelera

Ejemplo futuro: funcionará cuando se publique el tiempo de ejecución

Este bloque de código muestra el flujo previsto. Requerirá el próximo paquete de ejecución Axelera (ETA Q1 2026) para ejecutarse correctamente.

from ultralytics import YOLO

# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")

# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640

Para conocer los argumentos disponibles, consulte la documentación del modo de exportación.

Ejecutando la inferencia

Una vez exportado, podrá cargar directamente el modelo compilado en Axelera con la función ultralytics API (similar a cargar ONNX modelos). El siguiente ejemplo muestra el patrón de uso esperado para ejecutar la inferencia y guardar los resultados después de que se envíe el paquete de tiempo de ejecución.

Inferencia con formato Axelera

Ejemplo futuro: funcionará cuando se publique el tiempo de ejecución

Este bloque de código muestra el flujo previsto. Requerirá el próximo paquete de ejecución Axelera (ETA Q1 2026) para ejecutarse correctamente.

from ultralytics import YOLO

# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel")  # will work once Axelera runtime is released

# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)

# Iterate over result objects to inspect or render detections
for r in results:
    boxes = r.boxes  # bounding boxes tensor + metadata
    print(f"Detected {len(boxes)} objects")

    # Save visuals per result (files saved alongside inputs)
    r.save()  # saves annotated image(s) to disk
    # Or display interactively (desktop environments)
    # r.show()

Rendimiento de la inferencia

La AIPU Metis está diseñada para maximizar el rendimiento y minimizar el consumo de energía. Las pruebas comparativas que se muestran a continuación ilustran el rendimiento alcanzable con los modelos Ultralytics estándar.

MétricaMetis PCIe x4Metis M.2Nota
Rendimiento máximo856 TOPS214 TOPSINT8 Precisión
YOLOv5m FPS~1539 FPS~326 FPS640x640 Entrada
YOLOv5s FPSN/A~827 FPS640x640 Entrada
EficaciaAltaMuy altaIdeal para pilas

Benchmarks basados en datos de Axelera AI (Sept 2025). Los FPS reales dependen del tamaño del modelo, el procesamiento por lotes y la resolución de entrada.

Aplicaciones en el mundo real

Ultralytics YOLO en hardware Axelera permite soluciones avanzadas de edge computing:

Preguntas frecuentes

¿Qué versiones de YOLO son compatibles con Axelera?

El SDK de Voyager y la integración Ultralytics admiten la exportación de YOLOv8 y YOLO11 .

¿Puedo desplegar modelos entrenados a medida?

Sí. Cualquier modelo entrenado con el modo de entrenamientoUltralytics puede exportarse al formato Axelera, siempre que utilice capas y operaciones compatibles.

¿Cómo afecta la cuantización INT8 a la precisión?

El motor de cuantificación de Axelera utiliza técnicas de calibración avanzadas para minimizar la caída de precisión. Para la mayoría de las tareas de detección, el aumento de rendimiento supera con creces el insignificante impacto en mAP.

¿Dónde puedo encontrar el SDK de Voyager?

El SDK, los controladores y las herramientas de compilación están disponibles en el portal para desarrolladores de Axelera.



Creado hace 0 días ✏️ Actualizado hace 0 días
glenn-jocher

Comentarios