Aceleración de IA Axelera
Próximamente - T1 2026
Apoyo de Axelera en ultralytics es en curso. Estos ejemplos muestran la interfaz de usuario y la interfaz de usuario planificadas y serán ejecutables una vez que se publique el paquete de ejecución Axelera.
Ultralytics se asocia con Axelera AI para agilizar la inferencia de alto rendimiento y eficiencia energética en dispositivos Edge AI. Esta integración permite a los usuarios exportar y desplegar modelosUltralytics YOLO directamente en las plataformas Metis® AIPU y Europa® mediante el SDK Voyager.
Axelera AI proporciona aceleración de hardware dedicada para visión por ordenador e inteligencia artificial generativa en el perímetro. Su tecnología aprovecha una arquitectura de flujo de datos propia y la computación en memoria para ofrecer un alto rendimiento (hasta 856 TOPS) con un bajo consumo de energía.
Para los usuarios Ultralytics , esto ofrece una vía escalable para implantar la detección de objetos, la estimación de la pose y otras tareas YOLO en dispositivos que van desde drones integrados hasta servidores periféricos.
Selección del hardware adecuado
Axelera AI ofrece varios factores de forma para adaptarse a diferentes limitaciones de despliegue. La siguiente tabla le ayudará a identificar el hardware óptimo para su despliegue Ultralytics YOLO .
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Cartera de hardware
La línea de hardware de Axelera está optimizada para ejecutar Ultralytics YOLO11 y las versiones anteriores con una alta eficiencia de FPS por vatio.
Tarjetas aceleradoras
Estas tarjetas permiten acelerar la IA en dispositivos host existentes, lo que facilita las implantaciones brownfield.
| Producto | Factor de forma | Compute | Rendimiento (INT8) | Aplicación de destino |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Análisis de vídeo de alta densidad, ciudades inteligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | Ordenadores industriales, gestión de colas en comercios |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robótica, dispositivos médicos portátiles |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Entornos que requieren una gestión térmica avanzada |
Sistemas integrados
Para las soluciones llave en mano, Axelera se asocia con fabricantes para proporcionar sistemas validados previamente para la AIPU Metis.
- Tarjeta Metis Compute Board: Un dispositivo autónomo que combina la AIPU Metis con una CPU ARM Rockchip RK3588.
- Estaciones de trabajo: Torres empresariales de Dell (Precision 3460XE) y Lenovo (ThinkStation P360 Ultra).
- PC industriales: Sistemas reforzados de Advantech y Aetina diseñados para la automatización de la fabricación.
Integración del SDK de Voyager
El SDK Voyager sirve de puente entre los modelos Ultralytics y el hardware Axelera. Se encarga de la compilación, cuantificación y ejecución en tiempo de ejecución de las redes neuronales.
Características principales para los usuarios Ultralytics :
- Exportación sin fisuras: El compilador del SDK optimiza los modelos YOLO para la arquitectura de flujo de datos Metis.
- Motor de cuantización: Convierte automáticamente modelos FP32 a precisión INT8 con una pérdida de precisión mínima.
- Pipeline Builder: Un marco basado en YAML para encadenar múltiples modelos (por ejemplo, detección + estimación de pose) sin escribir código C++ complejo.
Instalación y configuración
Para utilizar la aceleración Axelera, se necesita el módulo ultralytics instalado. Tenga en cuenta que el SDK de Voyager es una instalación independiente a nivel de sistema necesaria para interactuar con el hardware. Las ruedas de ejecución se esperan en Q1 2026Los siguientes comandos reflejan el flujo de configuración previsto.
# Install Ultralytics
pip install ultralytics
# Note: Download and install the Axelera Voyager SDK from the Axelera Developer Portal
# to enable the 'axelera' export format and runtime.
Exportación de modelos YOLO a Axelera
Cuando se distribuya el paquete de ejecución Axelera (objetivo para el primer trimestre de 2026), exportará sus modelos YOLO entrenados al formato Axelera utilizando el comando estándar de exportación de Ultralytics . Este proceso genera los artefactos requeridos por el compilador Voyager.
Se requiere Voyager SDK
El format='axelera' La exportación requiere que las bibliotecas Axelera estén disponibles en su entorno. Como alternativa, puede exportar a ONNX y compilar manualmente utilizando la cadena de herramientas Voyager.
Ejemplos de Export
Convertir un modelo YOLO11 para su despliegue en Metis.
Exportar a formato Axelera
Ejemplo futuro: funcionará cuando se publique el tiempo de ejecución
Este bloque de código muestra el flujo previsto. Requerirá el próximo paquete de ejecución Axelera (ETA Q1 2026) para ejecutarse correctamente.
from ultralytics import YOLO
# Load a standard or custom trained YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
# int8=True enables quantization for the NPU
model.export(format="axelera", int8=True, imgsz=640)
# Export a model via CLI
yolo export model=yolo11n.pt format=axelera int8=True imgsz=640
Para conocer los argumentos disponibles, consulte la documentación del modo de exportación.
Ejecutando la inferencia
Una vez exportado, podrá cargar directamente el modelo compilado en Axelera con la función ultralytics API (similar a cargar ONNX modelos). El siguiente ejemplo muestra el patrón de uso esperado para ejecutar la inferencia y guardar los resultados después de que se envíe el paquete de tiempo de ejecución.
Inferencia con formato Axelera
Ejemplo futuro: funcionará cuando se publique el tiempo de ejecución
Este bloque de código muestra el flujo previsto. Requerirá el próximo paquete de ejecución Axelera (ETA Q1 2026) para ejecutarse correctamente.
from ultralytics import YOLO
# Load the Axelera-compiled model (example path; same flow as ONNX)
model = YOLO("yolo11n_axelera.axmodel") # will work once Axelera runtime is released
# Run inference; you can pass a file, folder, glob, or list of sources
results = model("path/to/images", imgsz=640, save=True)
# Iterate over result objects to inspect or render detections
for r in results:
boxes = r.boxes # bounding boxes tensor + metadata
print(f"Detected {len(boxes)} objects")
# Save visuals per result (files saved alongside inputs)
r.save() # saves annotated image(s) to disk
# Or display interactively (desktop environments)
# r.show()
Rendimiento de la inferencia
La AIPU Metis está diseñada para maximizar el rendimiento y minimizar el consumo de energía. Las pruebas comparativas que se muestran a continuación ilustran el rendimiento alcanzable con los modelos Ultralytics estándar.
| Métrica | Metis PCIe x4 | Metis M.2 | Nota |
|---|---|---|---|
| Rendimiento máximo | 856 TOPS | 214 TOPS | INT8 Precisión |
| YOLOv5m FPS | ~1539 FPS | ~326 FPS | 640x640 Entrada |
| YOLOv5s FPS | N/A | ~827 FPS | 640x640 Entrada |
| Eficacia | Alta | Muy alta | Ideal para pilas |
Benchmarks basados en datos de Axelera AI (Sept 2025). Los FPS reales dependen del tamaño del modelo, el procesamiento por lotes y la resolución de entrada.
Aplicaciones en el mundo real
Ultralytics YOLO en hardware Axelera permite soluciones avanzadas de edge computing:
- Comercio inteligente: Recuento de objetos en tiempo real y análisis de mapas de calor para la optimización de tiendas.
- Seguridad industrial: Detección de EPI de baja latencia en entornos de fabricación.
- Análisis de drones: Detección de objetos a alta velocidad en UAV para agricultura y búsqueda y rescate.
- Sistemas de tráfico: Reconocimiento de matrículas basado en bordes y estimación de la velocidad.
Preguntas frecuentes
¿Qué versiones de YOLO son compatibles con Axelera?
El SDK de Voyager y la integración Ultralytics admiten la exportación de YOLOv8 y YOLO11 .
¿Puedo desplegar modelos entrenados a medida?
Sí. Cualquier modelo entrenado con el modo de entrenamientoUltralytics puede exportarse al formato Axelera, siempre que utilice capas y operaciones compatibles.
¿Cómo afecta la cuantización INT8 a la precisión?
El motor de cuantificación de Axelera utiliza técnicas de calibración avanzadas para minimizar la caída de precisión. Para la mayoría de las tareas de detección, el aumento de rendimiento supera con creces el insignificante impacto en mAP.
¿Dónde puedo encontrar el SDK de Voyager?
El SDK, los controladores y las herramientas de compilación están disponibles en el portal para desarrolladores de Axelera.