Exportación y Despliegue de Axelera AI

Q: What YOLO versions are supported on Axelera?

El SDK de Voyager admite la exportación de modelos YOLOv8, YOLO11 y YOLO26. Consulte la sección «Tareas compatibles» para ver las tareas disponibles para cada modelo.

Q: How does INT8 quantization affect accuracy?

El Voyager SDK de Axelera cuantifica automáticamente los modelos para la arquitectura AIPU de precisión mixta. Para la mayoría de las tareas de detect de objetos, las mejoras de rendimiento (mayor FPS, menor consumo de energía) superan significativamente el impacto mínimo en el mAP. La cuantificación tarda desde segundos hasta varias horas, dependiendo del tamaño del modelo. Ejecute yolo val después de la exportación para verificar la precisión.

Ultralytics se asocia con Axelera AI para habilitar inferencia de alto rendimiento y eficiencia energética en dispositivos Edge AI. Exporte y despliegue modelos Ultralytics YOLO directamente a la Metis® AIPU utilizando el Voyager SDK.

Ecosistema de despliegue en el borde de Axelera AI para YOLO

Axelera AI proporciona aceleración de hardware dedicada para visión artificial en el edge, utilizando una arquitectura de flujo de datos propietaria y computación en memoria para ofrecer hasta 856 TOPS con bajo consumo de energía.

Seleccionar el hardware adecuado

Axelera AI ofrece varios factores de forma para adaptarse a diferentes restricciones de implementación. El siguiente gráfico ayuda a identificar el hardware óptimo para su implementación de Ultralytics YOLO.

graph TD
    A[Start: Select Deployment Target] --> B{Device Type?}
    B -->|Edge Server / Workstation| C{Throughput Needs?}
    B -->|Embedded / Robotics| D{Space Constraints?}
    B -->|Standalone / R&D| E[Dev Kits & Systems]

    C -->|Max Density <br> 30+ Streams| F[**Metis PCIe x4**<br>856 TOPS]
    C -->|Standard PC <br> Low Profile| G[**Metis PCIe x1**<br>214 TOPS]

    D -->|Drones & Handhelds| H[**Metis M.2**<br>2280 M-Key]
    D -->|High Performance Embedded| I[**Metis M.2 MAX**<br>Extended Thermal]

    E -->|ARM-based All-in-One| J[**Metis Compute Board**<br>RK3588 + AIPU]
    E -->|Prototyping| K[**Arduino Portenta x8**<br>Integration Kit]

    click F "https://store.axelera.ai/"
    click G "https://store.axelera.ai/"
    click H "https://store.axelera.ai/"
    click J "https://store.axelera.ai/"

Portfolio de hardware

La línea de hardware de Axelera está optimizada para ejecutar Ultralytics YOLO26 y versiones anteriores con una alta eficiencia de FPS por vatio.

Tarjetas aceleradoras

Estas tarjetas permiten la aceleración de la IA en los dispositivos host existentes, lo que facilita las implementaciones brownfield.

Producto	Factor de forma	Calcular	Rendimiento (INT8)	Aplicación Objetivo
Metis PCIe x4	PCIe Gen3 x16	4x Metis AIPUs	856 TOPS	Analítica de vídeo de alta densidad, ciudades inteligentes
Metis PCIe x1	PCIe Gen3 x1	1x Metis AIPU	214 TOPS	PCs industriales, gestión de colas minorista
Metis M.2	M.2 2280 M-Key	1x Metis AIPU	214 TOPS	Drones, robótica, dispositivos médicos portátiles
Metis M.2 MAX	M.2 2280	1x Metis AIPU	214 TOPS	Entornos que requieren una gestión térmica avanzada

Sistemas Integrados

Para soluciones llave en mano, Axelera se asocia con fabricantes para proporcionar sistemas prevalidados para el Metis AIPU.

Placa de cómputo Metis: Un dispositivo de borde independiente que combina el Metis AIPU con una CPU ARM Rockchip RK3588.
Estaciones de trabajo: Torres empresariales de Dell (Precision 3460XE) y Lenovo (ThinkStation P360 Ultra).
PCs industriales: Sistemas robustecidos de Advantech y Aetina diseñados para la automatización de la fabricación.

Tareas admitidas

Las siguientes tareas son compatibles con los modelos YOLOv8, YOLO11 y YOLO26.

Tarea	YOLOv8	YOLO11	YOLO26
Detección de objetos	✅	✅	✅
Estimación de pose	✅	✅	✅
Segmentación	✅	✅	⚠️ Solo SDK de Voyager
Cajas Delimitadoras Orientadas	✅	✅	✅
Clasificación	✅	✅	✅

Nota

La segmentación YOLO26 aún no es compatible con Ultralytics export comando. Los usuarios que necesiten YOLO26-seg pueden implementarlo mediante el Kit de desarrollo de aplicaciones (SDK) de Voyager usando deploy.py, que ofrece una solución alternativa en el espacio de usuario. En una versión futura se añadirá compatibilidad nativa con el compilador.

Instalación

Requisitos de la Plataforma

La exportación al formato Axelera requiere:

Sistema Operativo: Solo Linux (Ubuntu 22.04/24.04 recomendado)
Hardware: acelerador de IA Axelera (dispositivos Metis)
Python: Versiones 3.10, 3.11 y 3.12
Dependencia del sistema: sudo apt install libgl1 (requerido por OpenCV, no incluido a través de pip)

Instalación de Ultralytics

pip install ultralytics

Para obtener instrucciones detalladas, consulte nuestra guía de instalación de Ultralytics. Si encuentra dificultades, consulte nuestra guía de problemas comunes.

Instalación del Controlador de Axelera

Añada la clave del repositorio de Axelera:

sudo sh -c "curl -fsSL https://software.axelera.ai/artifactory/api/security/keypair/axelera/public | gpg --dearmor -o /etc/apt/keyrings/axelera.gpg"

Añada el repositorio a apt:

sudo sh -c "echo 'deb [signed-by=/etc/apt/keyrings/axelera.gpg] https://software.axelera.ai/artifactory/axelera-apt-source/ ubuntu22 main' > /etc/apt/sources.list.d/axelera.list"

Instale el SDK y cargue el controlador:

sudo apt update
sudo apt install -y metis-dkms=1.4.16
sudo modprobe metis

Exportación de modelos YOLO a Axelera

Exporte sus modelos YOLO entrenados utilizando el comando de exportación estándar de Ultralytics.

Exportar al formato Axelera

PythonCLI

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Axelera format
model.export(format="axelera")  # creates 'yolo26n_axelera_model' directory

yolo export model=yolo26n.pt format=axelera

Es posible que la primera exportación falle tras actualizar las dependencias

El compilador Axelera requiere numpy<2. Si tu entorno tiene numpy>=2, el primero yolo export Se realizará una actualización a una versión anterior automáticamente, pero la exportación fallará debido al estado obsoleto del módulo. Basta con volver a ejecutar el mismo comando de exportación: en la segunda ejecución se realizará correctamente.

Argumentos de exportación

Argumento	Tipo	Predeterminado	Descripción
`format`	`str`	`'axelera'`	Formato de destino para el hardware AIPU Metis de Axelera
`imgsz`	`int` o `tuple`	`640`	Tamaño de imagen para la entrada del modelo
`int8`	`bool`	`True`	Habilitar cuantificación INT8 para AIPU
`data`	`str`	`'coco128.yaml'`	Configuración del conjunto de datos para la calibración de cuantificación
`fraction`	`float`	`1.0`	Fracción del conjunto de datos para la calibración (se recomiendan 100-400 imágenes)
`device`	`str`	`None`	Dispositivo de exportación: GPU (`device=0`) o CPU (`device=cpu`)

Para todas las opciones de exportación, consulte la documentación del modo de exportación.

Estructura de Salida

yolo26n_axelera_model/
├── yolo26n.axm              # Axelera model file
└── metadata.yaml            # Model metadata (classes, image size, etc.)

Ejecutando la inferencia

Cargue el modelo exportado con la API de Ultralytics y ejecute la inferencia, de forma similar a la carga de modelos ONNX.

Inferencia con el modelo Axelera

PythonCLI

from ultralytics import YOLO

# Load the exported Axelera model
model = YOLO("yolo26n_axelera_model")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

# Process results
for r in results:
    print(f"Detected {len(r.boxes)} objects")
    r.show()  # Display results

yolo predict model='yolo26n_axelera_model' source='https://ultralytics.com/images/bus.jpg'

Pruebas de rendimiento de Axelera AI

La AIPU Metis maximiza el rendimiento minimizando el consumo de energía.

Modelo	Metis PCIe FPS (fotogramas por segundo)	Metis M.2 FPS (fotogramas por segundo)
YOLOv8n	847	771
YOLO11n	746	574
YOLO26n	648.6	484.9

Puntos de referencia basados en datos de Axelera AI. Los FPS reales dependen del tamaño del modelo, el procesamiento por lotes y la resolución de entrada.

Aplicaciones en el mundo real

Ultralytics YOLO en hardware de Axelera permite soluciones avanzadas de computación en el borde:

Retail Inteligente: Conteo de objetos en tiempo real y análisis de mapas de calor para la optimización de la tienda.
Seguridad industrial: Detección de EPI de baja latencia en entornos de fabricación.
Análisis con drones: Detección de objetos de alta velocidad en UAV para agricultura y búsqueda y rescate.
Sistemas de tráfico: Reconocimiento de matrículas y estimación de velocidad basados en Edge.

Flujo de Trabajo Recomendado

Entrene su modelo utilizando el modo de entrenamiento de Ultralytics
Exportar a formato Axelera utilizando model.export(format="axelera")
Validar precisión con yolo val para verificar la pérdida mínima de cuantificación
Predecir usando yolo predict para validación cualitativa
Despliegue a un proceso integral de alto rendimiento sin PyTorch ; consulta el Ejemplos de YOLO el SDK de Voyager para Python modulables que utilizan axelera-rt

Verificación del Estado del Dispositivo

Verifique que su dispositivo Axelera esté funcionando correctamente:

# if axdevice cannot be found, please run at least one inference (see above) to ensure the required packages are installed
axdevice

Para diagnósticos detallados, consulte la documentación de AxDevice.

Rendimiento Máximo

Esta integración utiliza una configuración de un solo núcleo para compatibilidad. Para producción que requiera el máximo rendimiento, el SDK Axelera Voyager ofrece:

Utilización multinúcleo (AIPU Metis de cuatro núcleos)
Pipelines de inferencia en streaming
Inferencia por teselas para cámaras de mayor resolución

Consulte el model-zoo para puntos de referencia de FPS o contacte a Axelera para soporte de producción.

Problemas Conocidos

Limitaciones Conocidas

Limitaciones de energía M.2: Los modelos grandes o extragrandes pueden encontrar errores en tiempo de ejecución en aceleradores M.2 debido a restricciones de la fuente de alimentación.

Para soporte, visite la Comunidad Axelera.

Preguntas frecuentes

¿Qué versiones de YOLO son compatibles con Axelera?

El SDK de Voyager permite exportar YOLOv8, YOLO11y YOLO26. Consulte Tareas compatibles para ver la disponibilidad de tareas por modelo.

¿Puedo desplegar modelos entrenados a medida?

Sí. Cualquier modelo entrenado usando el Modo de entrenamiento de Ultralytics se puede exportar al formato Axelera, siempre que utilice capas y operaciones compatibles.

¿Cómo afecta la cuantificación INT8 a la precisión?

El SDK Voyager de Axelera cuantifica automáticamente los modelos para la arquitectura AIPU de precisión mixta. Para la mayoría de las detección de objetos tareas, las mejoras de rendimiento (mayor FPS, menor consumo de energía) superan significativamente el impacto mínimo en mAP. La cuantificación tarda desde segundos hasta varias horas, dependiendo del tamaño del modelo. Ejecute yolo val después de la exportación para verificar la precisión.

¿Cuántas imágenes de calibración debo usar?

Recomendamos de 100 a 400 imágenes. Más de 400 no proporciona ningún beneficio adicional y aumenta el tiempo de cuantificación. Experimente con 100, 200 y 400 imágenes para encontrar el equilibrio óptimo.

¿Dónde puedo encontrar el SDK de Voyager?

El SDK, los controladores y las herramientas del compilador están disponibles a través del Portal para desarrolladores de Axelera.

📅 Creado hace 4 meses ✏️ Actualizado hace 3 días