Ir al contenido

Comparación técnica: YOLOX frente a PP-YOLOE+ para la detección de objetos

Elegir el modelo de detección de objetos adecuado es crucial para las tareas de visión por ordenador. Esta página ofrece una comparación técnica detallada entre YOLOX y PP-YOLOE+, dos modelos sin anclaje de última generación, destacando sus arquitecturas, rendimiento y casos de uso para ayudar a tomar una decisión informada.

YOLOX: Detector sin anclaje de alto rendimiento

YOLOX, presentado en julio de 2021 por Megvii, es un modelo de detección de objetos sin anclaje conocido por su sencillez y alto rendimiento. Su objetivo es tender un puente entre la investigación y las aplicaciones industriales proporcionando una arquitectura simplificada pero eficaz.

Arquitectura y características principales

YOLOX simplifica la serie YOLO adoptando un enfoque sin anclajes, eliminando la necesidad de complejos cálculos de cajas de anclaje. Las innovaciones arquitectónicas clave incluyen:

  • Detección sin anclajes: Elimina las cajas de anclaje, simplificando el diseño y reduciendo el número de hiperparámetros.
  • Cabezal desacoplado: YOLOX separa los cabezales de clasificación y localización, mejorando el rendimiento, especialmente en precisión.
  • Asignación de etiquetas SimOTA: Una estrategia avanzada de asignación de etiquetas que optimiza el entrenamiento asignando dinámicamente los objetivos en función de las cajas delimitadoras predichas.
  • Fuerte aumento de datos: Utiliza aumentos MixUp y Mosaic para mejorar la solidez y la generalización.

Métricas de rendimiento

Los modelos YOLOX demuestran un gran equilibrio entre precisión y velocidad. Como se indica en la tabla comparativa, YOLOX consigue puntuaciones mAP competitivas con tiempos de inferencia eficientes. Por ejemplo, YOLOX-x obtiene un 51,1% de mAP en el conjunto de datos COCO val.

Casos prácticos

  • Conducción autónoma: La detección de objetos en tiempo real es crucial para los sistemas autónomos de navegación y seguridad.
  • Robótica: Permite a los robots percibir e interactuar eficazmente con su entorno.
  • Inspección industrial: Una alta precisión y velocidad son esenciales para el control de calidad en los procesos de fabricación.

Puntos fuertes y débiles

Puntos fuertes:

  • Alto compromiso entre precisión y velocidad: consigue un rendimiento excelente tanto en precisión como en velocidad de inferencia.
  • Arquitectura simplificada: El diseño sin anclajes simplifica la implementación y reduce la complejidad computacional.
  • Gran rendimiento en todos los tamaños de modelo: Ofrece modelos de Nano a X para adaptarse a diversas limitaciones de recursos.

Debilidades:

  • Velocidad de inferencia en comparación con los modelos en tiempo real: Aunque son rápidos, modelos como YOLOv10 pueden ofrecer velocidades de inferencia aún mayores, priorizando la velocidad sobre la precisión final.

Más información sobre YOLOX

Detalles:

PP-YOLOE+: Excelencia sin anclajes de PaddlePaddle

PP-YOLOE+, una versión mejorada de PP-YOLOE de PaddlePaddleestá diseñada para ofrecer una gran precisión y eficacia en la detección de objetos. Lanzada en abril de 2022 por Baidu, se basa en el paradigma sin anclajes y se centra en aplicaciones industriales que requieren una detección robusta y precisa.

Arquitectura y características principales

PP-YOLOE+ hace hincapié en la precisión sin sacrificar la velocidad de inferencia, lo que lo hace adecuado para tareas exigentes de detección de objetos. Su arquitectura incluye:

  • Diseño sin anclajes: Simplifica el modelo y reduce el ajuste de hiperparámetros eliminando las cajas de anclaje.
  • Cabezal desacoplado: similar a YOLOX, utiliza cabezales desacoplados para la clasificación y la localización con el fin de mejorar la precisión.
  • VariFocal Loss: emplea VariFocal Loss para la clasificación refinada y la regresión del cuadro delimitador, mejorando la precisión de la detección.
  • Red troncal CSPRepResNet y cuello ELAN: Utiliza arquitecturas backbone y neck eficientes para la extracción y agregación de características.

Métricas de rendimiento

Los modelos PP-YOLOE+ proporcionan un sólido equilibrio entre precisión y velocidad. La tabla comparativa muestra puntuaciones mAP competitivas y tiempos de inferencia TensorRT eficientes. PP-YOLOE+x alcanza un 54,7% de mAP en el conjunto de datos COCO val, lo que demuestra una precisión excelente.

Casos prácticos

  • Inspección de calidad industrial: La alta precisión es crucial para identificar defectos en la fabricación.
  • Eficiencia en el reciclaje: La detección precisa de objetos mejora la clasificación automatizada en las plantas de reciclaje.
  • Vigilancia: Una detección robusta y precisa es necesaria para una vigilancia fiable en los sistemas de seguridad.

Puntos fuertes y débiles

Puntos fuertes:

  • Alta precisión: Da prioridad a lograr la máxima precisión en la detección de objetos.
  • Diseño eficiente: Equilibra una gran precisión con una velocidad de inferencia razonable.
  • Enfoque industrial: Ideal para aplicaciones industriales que requieren una detección de objetos fiable y precisa.

Debilidades:

  • Complejidad: Aunque sin anclajes, las mejoras "+" añaden complejidad en comparación con modelos más sencillos.
  • Enclavamiento en el ecosistema: Principalmente dentro del ecosistema PaddlePaddle , lo que podría ser una consideración para los usuarios que prefieren otros marcos.

Documentación de PP-YOLOE+ (PaddleDetection)

Detalles:

Tabla comparativa de modelos

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59

Otros modelos

Los usuarios interesados en YOLOX y PP-YOLOE+ también podrían encontrar interesantes los modelosYOLO de Ultralytics , como:

  • YOLOv5: Conocida por su eficiencia aerodinámica y su flexibilidad, ofrece una gama de tamaños de modelo adecuados para diversas aplicaciones. Más información sobre YOLOv5.
  • YOLOv8: La última iteración de la serie YOLO , que ofrece un equilibrio entre velocidad y precisión en las tareas de detección de objetos, segmentación y estimación de poses. Más información sobre YOLOv8.
  • YOLOv10: Representa la vanguardia en detección de objetos en tiempo real, diseñada para una velocidad y eficacia excepcionales, ideal para dispositivos de vanguardia. Más información sobre YOLOv10.
  • YOLO11: El último modeloYOLO Ultralytics , que redefine los límites de lo que es posible en IA con un rendimiento y unas capacidades mejorados. Más información sobre YOLO11.
Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios