Ir al contenido

Optimizaci贸n de las inferencias en YOLO11 con el motor DeepSparse de Neural Magic

Al desplegar modelos de detecci贸n de objetos como Ultralytics YOLO11 en distintos equipos, pueden surgir problemas espec铆ficos, como la optimizaci贸n. Aqu铆 es donde entra en juego la integraci贸n de YOLO11 con el motor DeepSparse de Neural Magic. Transforma la forma en que se ejecutan los modelos YOLO11 y permite un rendimiento de nivel GPU directamente en las CPU.

Esta gu铆a le muestra c贸mo desplegar YOLO11 utilizando Neural Magic's DeepSparse, c贸mo ejecutar inferencias, y tambi茅n c贸mo comparar el rendimiento para asegurarse de que est谩 optimizado.

Neural MagicDeepSparse

Neural MagicVisi贸n general de DeepSparse

Neural MagicDeepSparse es un tiempo de ejecuci贸n de inferencia dise帽ado para optimizar la ejecuci贸n de redes neuronales en CPU. Aplica t茅cnicas avanzadas como la sparsity, la poda y la cuantizaci贸n para reducir dr谩sticamente las demandas computacionales manteniendo la precisi贸n. DeepSparse ofrece una soluci贸n 谩gil para la ejecuci贸n eficiente y escalable de redes neuronales en diversos dispositivos.

Ventajas de integrar Neural Magic's DeepSparse con YOLO11

Antes de entrar en c贸mo desplegar YOLOV8 utilizando DeepSparse, vamos a entender las ventajas de utilizar DeepSparse. Algunas ventajas clave incluyen:

  • Mayor velocidad de inferencia: Alcanza hasta 525 FPS (en YOLO11n), lo que acelera considerablemente la capacidad de inferencia de YOLO11 en comparaci贸n con los m茅todos tradicionales.

Mayor velocidad de inferencia

  • Eficiencia optimizada del modelo: Utiliza la poda y la cuantizaci贸n para mejorar la eficiencia de YOLO11, reduciendo el tama帽o del modelo y los requisitos computacionales, al tiempo que mantiene la precisi贸n.

Modelo optimizado Eficiencia

  • Alto rendimiento en CPU est谩ndar: Ofrece un rendimiento similar al de GPU en CPU, lo que supone una opci贸n m谩s accesible y rentable para diversas aplicaciones.

  • Integraci贸n y despliegue racionalizados: Ofrece herramientas de f谩cil uso para integrar f谩cilmente YOLO11 en las aplicaciones, incluidas funciones de anotaci贸n de im谩genes y v铆deos.

  • Compatibilidad con varios tipos de modelos: Compatible con los modelos est谩ndar y optimizados para sparsity YOLO11 , lo que a帽ade flexibilidad de despliegue.

  • Soluci贸n rentable y escalable: Reduce los gastos operativos y ofrece una implantaci贸n escalable de modelos avanzados de detecci贸n de objetos.

驴C贸mo funciona la tecnolog铆a DeepSparse de Neural Magic?

Neural Magicse inspira en la eficacia del cerebro humano en el c谩lculo de redes neuronales. Adopta dos principios clave del cerebro:

  • Dispersi贸n: El proceso de sparsificaci贸n consiste en podar la informaci贸n redundante de las redes de aprendizaje profundo, lo que da lugar a modelos m谩s peque帽os y r谩pidos sin comprometer la precisi贸n. Esta t茅cnica reduce significativamente el tama帽o de la red y sus necesidades computacionales.

  • Localidad de referencia: DeepSparse utiliza un m茅todo de ejecuci贸n 煤nico, dividiendo la red en Tensor Columnas. Estas columnas se ejecutan en profundidad y caben 铆ntegramente en la cach茅 de CPU. Este enfoque imita la eficiencia del cerebro, minimizando el movimiento de datos y maximizando el uso de la cach茅 de CPU.

C贸mo funciona la tecnolog铆a DeepSparse de Neural Magic

Para m谩s detalles sobre el funcionamiento de la tecnolog铆a DeepSparse de Neural Magic, consulte la entrada de su blog.

Creaci贸n de una versi贸n dispersa de YOLO11 entrenada con un conjunto de datos personalizado

SparseZoo, un repositorio de modelos de c贸digo abierto de Neural Magic, ofrece una colecci贸n de puntos de comprobaci贸n de modelos YOLO11 preespaciados. Con SparseML, perfectamente integrado en Ultralytics, los usuarios pueden ajustar sin esfuerzo estos puntos de control dispersos en sus conjuntos de datos espec铆ficos mediante una sencilla interfaz de l铆nea de comandos.

Consulte la documentaci贸n deNeural Magic's SparseML YOLO11 para m谩s detalles.

Utilizaci贸n: Despliegue de YOLOV8 con DeepSparse

Desplegar YOLO11 con DeepSparse de Neural Magic implica unos cuantos pasos sencillos. Antes de sumergirte en las instrucciones de uso, aseg煤rate de consultar la gama de modelos deYOLO11 que ofrece Ultralytics. Esto te ayudar谩 a elegir el modelo m谩s apropiado para los requisitos de tu proyecto. A continuaci贸n te explicamos c贸mo empezar.

Paso 1: Instalaci贸n

Para instalar los paquetes necesarios, ejecute

Instalaci贸n

# Install the required packages
pip install deepsparse[yolov8]

Paso 2: Exportar YOLO11 al formato ONNX

El motor DeepSparse requiere modelos YOLO11 en formato ONNX . Exportar su modelo a este formato es esencial para la compatibilidad con DeepSparse. Utilice el siguiente comando para exportar modelos YOLO11 :

Modelo de exportaci贸n

# Export YOLO11 model to ONNX format
yolo task=detect mode=export model=yolo11n.pt format=onnx opset=13

Este comando guardar谩 el yolo11n.onnx modelo a su disco.

Paso 3: Despliegue y ejecuci贸n de inferencias

Con su modelo YOLO11 en formato ONNX , puede desplegar y ejecutar inferencias utilizando DeepSparse. Esto se puede hacer f谩cilmente con su intuitiva API Python :

Despliegue y ejecuci贸n de inferencias

from deepsparse import Pipeline

# Specify the path to your YOLO11 ONNX model
model_path = "path/to/yolo11n.onnx"

# Set up the DeepSparse Pipeline
yolo_pipeline = Pipeline.create(task="yolov8", model_path=model_path)

# Run the model on your images
images = ["path/to/image.jpg"]
pipeline_outputs = yolo_pipeline(images=images)

Paso 4: Evaluaci贸n comparativa de resultados

Es importante comprobar que su modelo YOLO11 funciona de forma 贸ptima en DeepSparse. Puedes comparar el rendimiento de tu modelo para analizar el rendimiento y la latencia:

Evaluaci贸n comparativa

# Benchmark performance
deepsparse.benchmark model_path="path/to/yolo11n.onnx" --scenario=sync --input_shapes="[1,3,640,640]"

Paso 5: Funciones adicionales

DeepSparse proporciona funciones adicionales para la integraci贸n pr谩ctica de YOLO11 en aplicaciones, como la anotaci贸n de im谩genes y la evaluaci贸n de conjuntos de datos.

Caracter铆sticas adicionales

# For image annotation
deepsparse.yolov8.annotate --source "path/to/image.jpg" --model_filepath "path/to/yolo11n.onnx"

# For evaluating model performance on a dataset
deepsparse.yolov8.eval --model_path "path/to/yolo11n.onnx"

Al ejecutar el comando de anotaci贸n se procesa la imagen especificada, se detectan los objetos y se guarda la imagen anotada con cuadros delimitadores y clasificaciones. La imagen anotada se guardar谩 en una carpeta de resultados de anotaci贸n. Esto ayuda a proporcionar una representaci贸n visual de las capacidades de detecci贸n del modelo.

Funci贸n de anotaci贸n de im谩genes

Despu茅s de ejecutar el comando eval, recibir谩 m茅tricas de salida detalladas como precisi贸n, recuperaci贸n y mAP (precisi贸n media). Esto proporciona una visi贸n completa del rendimiento del modelo en el conjunto de datos. Esta funci贸n es especialmente 煤til para ajustar y optimizar sus modelos YOLO11 para casos de uso espec铆ficos, garantizando una gran precisi贸n y eficacia.

Resumen

Esta gu铆a explora la integraci贸n de Ultralytics' YOLO11 con Neural Magic's DeepSparse Engine. Destaca c贸mo esta integraci贸n mejora el rendimiento de YOLO11 en plataformas CPU , ofreciendo una eficiencia de nivel GPU y t茅cnicas avanzadas de dispersi贸n de redes neuronales.

Para informaci贸n m谩s detallada y uso avanzado, visita Neural Magic's DeepSparse documentation. Adem谩s, consulte la documentaci贸n de Neural Magic sobre la integraci贸n con YOLO11 aqu铆 y vea una magn铆fica sesi贸n al respecto aqu铆.

Adem谩s, para conocer mejor las distintas integraciones de YOLO11 , visite la p谩gina de la gu铆a de integraci贸nUltralytics , donde podr谩 descubrir otras interesantes posibilidades de integraci贸n.

PREGUNTAS FRECUENTES

驴Qu茅 es el motor DeepSparse de Neural Magic y c贸mo optimiza el rendimiento de YOLO11 ?

Neural MagicDeepSparse Engine es un tiempo de ejecuci贸n de inferencia dise帽ado para optimizar la ejecuci贸n de redes neuronales en CPU mediante t茅cnicas avanzadas como la dispersi贸n, la poda y la cuantizaci贸n. Integrando DeepSparse con YOLO11, se puede conseguir un rendimiento similar al de GPU en CPUs est谩ndar, mejorando significativamente la velocidad de inferencia, la eficiencia del modelo y el rendimiento general, manteniendo la precisi贸n. Para m谩s informaci贸n, consulte la secci贸n DeepSparse deNeural Magic.

驴C贸mo puedo instalar los paquetes necesarios para desplegar YOLO11 utilizando Neural Magic's DeepSparse?

La instalaci贸n de los paquetes necesarios para desplegar YOLO11 con Neural Magic's DeepSparse es sencilla. Puedes instalarlos f谩cilmente usando el comando CLI. Este es el comando que necesitas ejecutar:

pip install deepsparse[yolov8]

Una vez instalado, siga los pasos indicados en la secci贸n Instalaci贸n para configurar su entorno y empezar a utilizar DeepSparse con YOLO11.

驴C贸mo convierto los modelos YOLO11 al formato ONNX para utilizarlos con DeepSparse?

Para convertir los modelos YOLO11 al formato ONNX , necesario para la compatibilidad con DeepSparse, puede utilizar el siguiente comando CLI :

yolo task=detect mode=export model=yolo11n.pt format=onnx opset=13

Este comando exportar谩 su modelo YOLO11 (yolo11n.pt) a un formato (yolo11n.onnx) que pueden ser utilizados por el motor DeepSparse. M谩s informaci贸n sobre la exportaci贸n de modelos se puede encontrar en el Secci贸n de exportaci贸n de modelos.

驴C贸mo puedo comparar el rendimiento de YOLO11 con el motor DeepSparse?

La evaluaci贸n comparativa del rendimiento de YOLO11 en DeepSparse le ayuda a analizar el rendimiento y la latencia para asegurarse de que su modelo est谩 optimizado. Puede utilizar el siguiente comando CLI para ejecutar una prueba comparativa:

deepsparse.benchmark model_path="path/to/yolo11n.onnx" --scenario=sync --input_shapes="[1,3,640,640]"

Este comando le proporcionar谩 m茅tricas de rendimiento vitales. Para obtener m谩s informaci贸n, consulte la secci贸n Evaluaci贸n comparativa del rendimiento.

驴Por qu茅 deber铆a utilizar Neural Magic's DeepSparse con YOLO11 para tareas de detecci贸n de objetos?

La integraci贸n de Neural Magic's DeepSparse con YOLO11 ofrece varias ventajas:

  • Velocidad de inferencia mejorada: Alcanza hasta 525 FPS, lo que acelera considerablemente la capacidad de YOLO11.
  • Eficiencia optimizada del modelo: Utiliza t茅cnicas de sparsity, poda y cuantificaci贸n para reducir el tama帽o del modelo y las necesidades computacionales manteniendo la precisi贸n.
  • Alto rendimiento en CPU est谩ndar: Ofrece un rendimiento similar al de GPU en el rentable hardware CPU .
  • Integraci贸n simplificada: Herramientas f谩ciles de usar para facilitar la implantaci贸n y la integraci贸n.
  • Flexibilidad: Admite modelos est谩ndar y optimizados para la dispersi贸n YOLO11 .
  • Rentable: Reduce los gastos operativos gracias a una utilizaci贸n eficiente de los recursos.

Para profundizar en estas ventajas, visite la secci贸n Ventajas de la integraci贸n de Neural Magic's DeepSparse con YOLO11 .

Creado hace 11 meses 鉁忥笍 Actualizado hace 2 meses

Comentarios