Exportación e implementación de Axelera AI
Lanzamiento experimental
Se trata de una integración experimental que muestra la implementación en el hardware Axelera Metis. Se prevé que la integración completa esté lista en febrero de 2026, con exportación de modelos sin necesidad de hardware Axelera y con instalación estándar de pip.
Ultralytics con Axelera AI para permitir una inferencia de alto rendimiento y eficiencia energética en dispositivos Edge AI. Exporte e implemente YOLO Ultralytics YOLO directamente en Metis® AIPU utilizando el SDK Voyager.
Axelera AI proporciona aceleración de hardware dedicada para la visión artificial en el borde, utilizando una arquitectura de flujo de datos patentada y computación en memoria para ofrecer hasta 856 TOPS con un bajo consumo de energía.
Seleccionar el hardware adecuado
Axelera AI ofrece varios factores de forma para adaptarse a diferentes restricciones de implementación. El siguiente gráfico ayuda a identificar el hardware óptimo para su implementación de Ultralytics YOLO.
graph TD
A[Start: Select Deployment Target] --> B{Device Type?}
B -->|Edge Server / Workstation| C{Throughput Needs?}
B -->|Embedded / Robotics| D{Space Constraints?}
B -->|Standalone / R&D| E[Dev Kits & Systems]
C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]
D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]
E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]
click F "https://store.axelera.ai/"
click G "https://store.axelera.ai/"
click H "https://store.axelera.ai/"
click J "https://store.axelera.ai/"
Portfolio de hardware
La línea de hardware de Axelera está optimizada para ejecutar Ultralytics YOLO11 y versiones heredadas con alta eficiencia de FPS por vatio.
Tarjetas aceleradoras
Estas tarjetas permiten la aceleración de la IA en los dispositivos host existentes, lo que facilita las implementaciones brownfield.
| Producto | Factor de forma | Calcular | Rendimiento (INT8) | Aplicación Objetivo |
|---|---|---|---|---|
| Metis PCIe x4 | PCIe Gen3 x16 | 4x Metis AIPUs | 856 TOPS | Analítica de vídeo de alta densidad, ciudades inteligentes |
| Metis PCIe x1 | PCIe Gen3 x1 | 1x Metis AIPU | 214 TOPS | PCs industriales, gestión de colas minorista |
| Metis M.2 | M.2 2280 M-Key | 1x Metis AIPU | 214 TOPS | Drones, robótica, dispositivos médicos portátiles |
| Metis M.2 MAX | M.2 2280 | 1x Metis AIPU | 214 TOPS | Entornos que requieren una gestión térmica avanzada |
Sistemas Integrados
Para soluciones llave en mano, Axelera se asocia con fabricantes para proporcionar sistemas prevalidados para el Metis AIPU.
- Placa de cómputo Metis: Un dispositivo de borde independiente que combina el Metis AIPU con una CPU ARM Rockchip RK3588.
- Estaciones de trabajo: Torres empresariales de Dell (Precision 3460XE) y Lenovo (ThinkStation P360 Ultra).
- PCs industriales: Sistemas robustecidos de Advantech y Aetina diseñados para la automatización de la fabricación.
Tareas admitidas
Actualmente, los modelos de detección de objetos se pueden exportar al formato Axelera. Se están integrando tareas adicionales:
| Tarea | Estado |
|---|---|
| Detección de objetos | ✅ Compatible |
| Estimación de pose | Próximamente |
| Segmentación | Próximamente |
| Cuadros delimitadores orientados | Próximamente |
Instalación
Requisitos de la plataforma
Para exportar al formato Axelera se requiere:
- Sistema operativo: solo Linux (se recomienda Ubuntu 22.04/24.04)
- Hardware: Acelerador de IA Axelera (dispositivos Metis)
- Python: Versión 3.10 (3.11 y 3.12 próximamente)
Instalación de Ultralytics
pip install ultralytics
Para obtener instrucciones detalladas, consulte nuestra guíaUltralytics . Si tiene dificultades, consulte nuestra guía de problemas comunes.
Instalación del controlador Axelera
Añade la clave del repositorio Axelera:
sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"Añade el repositorio a apt:
sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"Instala el SDK y carga el controlador:
sudo apt update sudo apt install -y axelera-voyager-sdk-base sudo modprobe metis yes | sudo /opt/axelera/sdk/latest/axelera_fix_groups.sh $USER
Exportación de modelos YOLO a Axelera
Exporte sus YOLO entrenados utilizando el comando Ultralytics estándar Ultralytics .
Exportar al formato Axelera
from ultralytics import YOLO
# Load a YOLO11 model
model = YOLO("yolo11n.pt")
# Export to Axelera format
model.export(format="axelera") # creates 'yolo11n_axelera_model' directory
yolo export model=yolo11n.pt format=axelera
Argumentos de exportación
| Argumento | Tipo | Predeterminado | Descripción |
|---|---|---|---|
format | str | 'axelera' | Formato objetivo para el hardware Axelera Metis AIPU |
imgsz | int o tuple | 640 | Tamaño de imagen para la entrada del modelo |
int8 | bool | True | Habilitar cuantificación INT8 para AIPU |
data | str | 'coco128.yaml' | Configuración del conjunto de datos para la calibración de la cuantificación |
fraction | float | 1.0 | Fracción del conjunto de datos para la calibración (se recomiendan entre 100 y 400 imágenes) |
device | str | None | Dispositivo de exportación: GPUdevice=0) o CPUdevice=cpu) |
Para conocer todas las opciones de exportación, consulte la documentación del Modo de exportación.
Estructura de Salida
yolo11n_axelera_model/
├── yolo11n.axm # Axelera model file
└── metadata.yaml # Model metadata (classes, image size, etc.)
Ejecutando la inferencia
Cargue el modelo exportado con la Ultralytics y ejecute la inferencia, de forma similar a la carga de ONNX .
Inferencia con el modelo Axelera
from ultralytics import YOLO
# Load the exported Axelera model
model = YOLO("yolo11n_axelera_model")
# Run inference
results = model("https://ultralytics.com/images/bus.jpg")
# Process results
for r in results:
print(f"Detected {len(r.boxes)} objects")
r.show() # Display results
yolo predict model='yolo11n_axelera_model' source='https://ultralytics.com/images/bus.jpg'
Problema conocido
La primera ejecución de inferencia puede generar un ImportError. Las ejecuciones posteriores funcionarán correctamente. Esto se solucionará en una versión futura.
Rendimiento de la Inferencia
El Metis AIPU maximiza el rendimiento y minimiza el consumo de energía.
| Métrica | Metis PCIe x4 | Metis M.2 | Nota |
|---|---|---|---|
| Rendimiento máximo | 856 TOPS | 214 TOPS | Precisión INT8 |
| FPS de YOLOv5m | ~1539 FPS | ~326 FPS | Entrada de 640x640 |
| FPS de YOLOv5s | N/A | ~827 FPS | Entrada de 640x640 |
| Eficiencia | Alta | Muy alto | Ideal para alimentación por batería |
Puntos de referencia basados en datos de Axelera AI. Los FPS reales dependen del tamaño del modelo, el procesamiento por lotes y la resolución de entrada.
Aplicaciones en el mundo real
Ultralytics YOLO en hardware de Axelera permite soluciones avanzadas de computación en el borde:
- Retail Inteligente: Conteo de objetos en tiempo real y análisis de mapas de calor para la optimización de la tienda.
- Seguridad industrial: Detección de EPI de baja latencia en entornos de fabricación.
- Análisis con drones: Detección de objetos de alta velocidad en UAV para agricultura y búsqueda y rescate.
- Sistemas de tráfico: Reconocimiento de matrículas y estimación de velocidad basados en Edge.
Flujo de trabajo recomendado
- Entrena tu modelo utilizandoel modo de entrenamiento de Ultralytics
- Exportar al formato Axelera utilizando
model.export(format="axelera") - Validar precisión con
yolo valpara verificar la pérdida mínima de cuantificación - Predecir usando
yolo predictpara la validación cualitativa
Comprobación del estado del dispositivo
Comprueba que tu dispositivo Axelera funciona correctamente:
. /opt/axelera/sdk/latest/axelera_activate.sh
axdevice
Para obtener diagnósticos detallados, consulte la documentación de AxDevice.
Máximo rendimiento
Esta integración utiliza una configuración de un solo núcleo para garantizar la compatibilidad. Para entornos de producción que requieren el máximo rendimiento, el SDK Axelera Voyager ofrece:
- Utilización multinúcleo (Metis AIPU de cuatro núcleos)
- Canales de inferencia de streaming
- Inferencia en mosaico para cámaras de mayor resolución
Consulte el modelo-zoo para ver los puntos de referencia FPS o póngase en contacto con Axelera para obtener asistencia sobre la producción.
Problemas conocidos
Limitaciones conocidas
Compatibilidad con PyTorch .9: El primero
yolo export format=axeleraEl comando puede fallar debido a PyTorch automática PyTorch a la versión 2.8. Ejecute el comando una segunda vez para que se ejecute correctamente.Limitaciones de potencia de M.2: los modelos grandes o extragrandes pueden experimentar errores de tiempo de ejecución en los aceleradores M.2 debido a restricciones en el suministro de energía.
Primera inferencia ImportError: La primera ejecución de inferencia puede generar un
ImportError. Las ejecuciones posteriores funcionan correctamente.
Para obtener ayuda, visite la comunidad Axelera.
Preguntas frecuentes
¿Qué versiones de YOLO son compatibles con Axelera?
El SDK de Voyager admite la exportación de YOLOv8 y YOLO11 .
¿Puedo implementar modelos entrenados a medida?
Sí. Cualquier modelo entrenado usando el Modo de entrenamiento de Ultralytics se puede exportar al formato Axelera, siempre que utilice capas y operaciones compatibles.
¿Cómo afecta la cuantificación INT8 a la precisión?
El SDK Voyager de Axelera cuantifica automáticamente los modelos para la arquitectura AIPU de precisión mixta. Para la mayoría detección de objetos tareas, las mejoras en el rendimiento (mayor FPS, menor consumo) superan con creces el impacto mínimo en mAPLa cuantificación tarda entre unos segundos y varias horas, dependiendo del tamaño del modelo. Ejecutar yolo val después de la exportación para verificar la exactitud.
¿Cuántas imágenes de calibración debo utilizar?
Recomendamos entre 100 y 400 imágenes. Más de 400 no aporta ningún beneficio adicional y aumenta el tiempo de cuantificación. Pruebe con 100, 200 y 400 imágenes para encontrar el equilibrio óptimo.
¿Dónde puedo encontrar el SDK de Voyager?
El SDK, los controladores y las herramientas del compilador están disponibles a través del Portal para desarrolladores de Axelera.