Ir al contenido

YOLOv7 vs YOLOX: Comparación técnica detallada

Elegir el modelo óptimo de detección de objetos es una decisión crítica para los proyectos de visión por ordenador. Ultralytics ofrece un conjunto de modelos de vanguardia, y entender sus puntos fuertes específicos es clave para lograr el máximo rendimiento. Esta página proporciona una comparación técnica de dos modelos populares, YOLOv7 y YOLOX, detallando sus matices arquitectónicos, puntos de referencia de rendimiento y escenarios de despliegue ideales.

YOLOv7: Detección eficaz y de gran precisión

YOLOv7, presentado en julio de 2022 por Chien-Yao Wang, Alexey Bochkovskiy y Hong-Yuan Mark Liao, del Instituto de Ciencias de la Información de la Academia Sinica de Taiwán, está diseñado para la detección eficaz y precisa de objetos. Se basa en modelos YOLO anteriores e incorpora mejoras arquitectónicas para aumentar la velocidad y la precisión.

Arquitectura y características principales

YOLOv7 (paper: arXiv, GitHub: Official Repo) introduce varias innovaciones, como la red de agregación de capas eficiente (E-ELAN), que optimiza la utilización de parámetros y cálculos. También emplea técnicas de escalado de modelos y una re-parametrización planificada para aumentar aún más la eficiencia del entrenamiento y la precisión de la detección. Estas características permiten a YOLOv7 obtener resultados de vanguardia con un tamaño de modelo relativamente compacto, lo que lo hace adecuado para aplicaciones en tiempo real y su despliegue en dispositivos con recursos limitados. Para más información, consulte la documentación oficial de YOLOv7.

Métricas de rendimiento y casos de uso

YOLOv7 destaca en escenarios que exigen tanto una inferencia rápida como una gran precisión. Sus impresionantes métricas de mAP y velocidad lo convierten en la mejor opción para aplicaciones como el análisis de vídeo en tiempo real, los sistemas de conducción autónoma y el procesamiento de imágenes de alta resolución. En las implantaciones de ciudades inteligentes, YOLOv7 podría utilizarse para la gestión del tráfico o la mejora de los sistemas de seguridad para la detección inmediata de amenazas.

Más información sobre YOLOv7

YOLOX: excelencia en la detección de objetos sin anclajes

YOLOX, desarrollado por Zheng Ge, Songtao Liu, Feng Wang, Zeming Li y Jian Sun en Megvii y publicado en julio de 2021 (paper: arXiv, GitHub: Official Repo), adopta un enfoque sin anclajes para la detección de objetos, simplificando el proceso de detección y mejorando la generalización.

Arquitectura y características principales

YOLOX (documentación: ReadTheDocs) se aleja de los modelos YOLO tradicionales al eliminar las cajas de anclaje predefinidas. Este diseño sin anclajes reduce la complejidad y puede mejorar el rendimiento, especialmente en el caso de objetos con formas variables. Incorpora cabezales desacoplados para tareas separadas de clasificación y regresión, y emplea estrategias avanzadas de asignación de etiquetas como SimOTA (Simplified Optimal Transport Assignment). Estas opciones arquitectónicas contribuyen a la robustez y facilidad de implementación de YOLOX.

Métricas de rendimiento y casos de uso

YOLOX ofrece un equilibrio convincente entre velocidad y precisión. Su naturaleza libre de anclajes puede resultar especialmente ventajosa en aplicaciones con objetos de diversos tamaños y relaciones de aspecto. YOLOX es idóneo para aplicaciones como la robótica, la inspección industrial y la analítica comercial. Por ejemplo, en la fabricación, puede utilizarse para la inspección de calidad con el fin de detectar defectos de forma eficaz sin estar limitado por formas de anclaje predefinidas.

Más información sobre YOLOX

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Los usuarios interesados en otros modelos YOLO también podrían considerar explorar:

  • YOLOv8: La última iteración de la serie YOLO de Ultralytics, que ofrece un rendimiento y una versatilidad de vanguardia.
  • YOLOv5: Conocido por su facilidad de uso y eficiencia, con múltiples tamaños de modelos para diferentes necesidades.
  • YOLOv6: un marco de detección de objetos en una sola fase de alto rendimiento.
  • YOLO11: Un modelo reciente centrado en la mejora de la eficiencia y el rendimiento.
Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios