Comparación técnica: YOLOX frente a PP-YOLOE+ para la detección de objetos
Elegir el modelo de detección de objetos adecuado es crucial para las tareas de visión por ordenador. Esta página ofrece una comparación técnica detallada entre YOLOX y PP-YOLOE+, dos modelos sin anclaje de última generación, destacando sus arquitecturas, rendimiento y casos de uso para ayudar a tomar una decisión informada.
YOLOX: Detector sin anclaje de alto rendimiento
YOLOX, presentado en julio de 2021 por Megvii, es un modelo de detección de objetos sin anclaje conocido por su sencillez y alto rendimiento. Su objetivo es tender un puente entre la investigación y las aplicaciones industriales proporcionando una arquitectura simplificada pero eficaz.
Arquitectura y características principales
YOLOX simplifica la serie YOLO adoptando un enfoque sin anclajes, eliminando la necesidad de complejos cálculos de cajas de anclaje. Las innovaciones arquitectónicas clave incluyen:
- Detección sin anclajes: Elimina las cajas de anclaje, simplificando el diseño y reduciendo el número de hiperparámetros.
- Cabezal desacoplado: YOLOX separa los cabezales de clasificación y localización, mejorando el rendimiento, especialmente en precisión.
- Asignación de etiquetas SimOTA: Una estrategia avanzada de asignación de etiquetas que optimiza el entrenamiento asignando dinámicamente los objetivos en función de las cajas delimitadoras predichas.
- Fuerte aumento de datos: Utiliza aumentos MixUp y Mosaic para mejorar la solidez y la generalización.
Métricas de rendimiento
Los modelos YOLOX demuestran un gran equilibrio entre precisión y velocidad. Como se indica en la tabla comparativa, YOLOX consigue puntuaciones mAP competitivas con tiempos de inferencia eficientes. Por ejemplo, YOLOX-x obtiene un 51,1% de mAP en el conjunto de datos COCO val.
Casos prácticos
- Conducción autónoma: La detección de objetos en tiempo real es crucial para los sistemas autónomos de navegación y seguridad.
- Robótica: Permite a los robots percibir e interactuar eficazmente con su entorno.
- Inspección industrial: Una alta precisión y velocidad son esenciales para el control de calidad en los procesos de fabricación.
Puntos fuertes y débiles
Puntos fuertes:
- Alto compromiso entre precisión y velocidad: consigue un rendimiento excelente tanto en precisión como en velocidad de inferencia.
- Arquitectura simplificada: El diseño sin anclajes simplifica la implementación y reduce la complejidad computacional.
- Gran rendimiento en todos los tamaños de modelo: Ofrece modelos de Nano a X para adaptarse a diversas limitaciones de recursos.
Debilidades:
- Velocidad de inferencia en comparación con los modelos en tiempo real: Aunque son rápidos, modelos como YOLOv10 pueden ofrecer velocidades de inferencia aún mayores, priorizando la velocidad sobre la precisión final.
Detalles:
- Autores: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li y Jian Sun
- Organización: Megvii
- Fecha: 2021-07-18
- Enlace Arxiv: YOLOX: Superación de la serie YOLO en 2021
- Enlace GitHub: Megvii-BaseDetection/YOLOX
- Enlace Docs: Documentación de YOLOX
PP-YOLOE+: Excelencia sin anclajes de PaddlePaddle
PP-YOLOE+, una versión mejorada de PP-YOLOE de PaddlePaddleestá diseñada para ofrecer una gran precisión y eficacia en la detección de objetos. Lanzada en abril de 2022 por Baidu, se basa en el paradigma sin anclajes y se centra en aplicaciones industriales que requieren una detección robusta y precisa.
Arquitectura y características principales
PP-YOLOE+ hace hincapié en la precisión sin sacrificar la velocidad de inferencia, lo que lo hace adecuado para tareas exigentes de detección de objetos. Su arquitectura incluye:
- Diseño sin anclajes: Simplifica el modelo y reduce el ajuste de hiperparámetros eliminando las cajas de anclaje.
- Cabezal desacoplado: similar a YOLOX, utiliza cabezales desacoplados para la clasificación y la localización con el fin de mejorar la precisión.
- VariFocal Loss: emplea VariFocal Loss para la clasificación refinada y la regresión del cuadro delimitador, mejorando la precisión de la detección.
- Red troncal CSPRepResNet y cuello ELAN: Utiliza arquitecturas backbone y neck eficientes para la extracción y agregación de características.
Métricas de rendimiento
Los modelos PP-YOLOE+ proporcionan un sólido equilibrio entre precisión y velocidad. La tabla comparativa muestra puntuaciones mAP competitivas y tiempos de inferencia TensorRT eficientes. PP-YOLOE+x alcanza un 54,7% de mAP en el conjunto de datos COCO val, lo que demuestra una precisión excelente.
Casos prácticos
- Inspección de calidad industrial: La alta precisión es crucial para identificar defectos en la fabricación.
- Eficiencia en el reciclaje: La detección precisa de objetos mejora la clasificación automatizada en las plantas de reciclaje.
- Vigilancia: Una detección robusta y precisa es necesaria para una vigilancia fiable en los sistemas de seguridad.
Puntos fuertes y débiles
Puntos fuertes:
- Alta precisión: Da prioridad a lograr la máxima precisión en la detección de objetos.
- Diseño eficiente: Equilibra una gran precisión con una velocidad de inferencia razonable.
- Enfoque industrial: Ideal para aplicaciones industriales que requieren una detección de objetos fiable y precisa.
Debilidades:
- Complejidad: Aunque sin anclajes, las mejoras "+" añaden complejidad en comparación con modelos más sencillos.
- Enclavamiento en el ecosistema: Principalmente dentro del ecosistema PaddlePaddle , lo que podría ser una consideración para los usuarios que prefieren otros marcos.
Documentación de PP-YOLOE+ (PaddleDetection)
Detalles:
- Autores: PaddlePaddle Autores
- Organización: Baidu
- Fecha: 2022-04-02
- Enlace Arxiv: PP-YOLOE: Detector evolutivo de objetos sin anclaje
- Enlace GitHub: PaddlePaddle
- Enlace Docs: Documentación PP-YOLOE
Tabla comparativa de modelos
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Otros modelos
Los usuarios interesados en YOLOX y PP-YOLOE+ también podrían encontrar interesantes los modelosYOLO de Ultralytics , como:
- YOLOv5: Conocida por su eficiencia aerodinámica y su flexibilidad, ofrece una gama de tamaños de modelo adecuados para diversas aplicaciones. Más información sobre YOLOv5.
- YOLOv8: La última iteración de la serie YOLO , que ofrece un equilibrio entre velocidad y precisión en las tareas de detección de objetos, segmentación y estimación de poses. Más información sobre YOLOv8.
- YOLOv10: Representa la vanguardia en detección de objetos en tiempo real, diseñada para una velocidad y eficacia excepcionales, ideal para dispositivos de vanguardia. Más información sobre YOLOv10.
- YOLO11: El último modeloYOLO Ultralytics , que redefine los límites de lo que es posible en IA con un rendimiento y unas capacidades mejorados. Más información sobre YOLO11.