Ir al contenido

YOLO vs YOLOX: comparación técnica detallada

Los modelos de detección de objetos son esenciales para diversas aplicaciones de visión por ordenador, y la elección del más adecuado depende de las necesidades específicas del proyecto. Esta página ofrece una comparación técnica entre YOLO y YOLOX, dos modelos de detección de objetos de última generación, analizando su arquitectura, rendimiento y aplicaciones.

DAMO-YOLO

YOLO es un modelo de detección de objetos rápido y preciso desarrollado por el Grupo Alibaba. Introduce varias técnicas nuevas, como los backbones NAS y un RepGFPN eficiente, con el objetivo de obtener un alto rendimiento en las tareas de detección de objetos.

Arquitectura y características principales

La arquitectura de YOLO incorpora varios componentes innovadores:

  • Red troncal NAS: Utiliza una arquitectura neuronal de búsqueda (NAS) para optimizar la extracción de características.
  • RepGFPN: Emplea una eficaz red de pirámide de características de gradiente reparametrizado (GFPN) para mejorar la fusión de características.
  • Cabeza Cero: Presenta un cabezal de detección ligero llamado ZeroHead para reducir la sobrecarga computacional.
  • AlignedOTA: Utiliza la asignación de transporte óptima alineada (OTA) para mejorar la asignación de etiquetas durante el entrenamiento.

Métricas de rendimiento

YOLO demuestra un gran equilibrio entre velocidad y precisión, y ofrece diferentes tamaños de modelo para adaptarse a diversas necesidades computacionales.

  • mAP: Alcanza una precisión media competitiva en conjuntos de datos como COCO.
  • Velocidad de inferencia: Diseñada para una inferencia rápida, lo que la hace adecuada para aplicaciones en tiempo real.
  • Tamaño del modelo: Disponible en diferentes tamaños (diminuto, pequeño, mediano, grande) con distintos recuentos de parámetros y FLOPs.

Puntos fuertes y débiles

Puntos fuertes:

  • Alta precisión: Alcanza excelentes puntuaciones mAP, lo que indica una gran precisión de detección.
  • Arquitectura eficiente: Componentes innovadores como RepGFPN y ZeroHead contribuyen a la eficiencia.
  • Capacidad en tiempo real: Diseñado para velocidades de inferencia rápidas adecuadas para sistemas en tiempo real.

Debilidades:

  • Complejidad: Los componentes arquitectónicos avanzados podrían introducir complejidad en la personalización e implementación.
  • Comunidad limitada: En comparación con modelos más consolidados, la comunidad y los recursos pueden ser más reducidos.

Casos prácticos

YOLO es idóneo para aplicaciones que exigen gran precisión y rendimiento en tiempo real, como:

  • Robótica avanzada: Detección precisa de objetos para tareas robóticas complejas.
  • Vigilancia de alta resolución: Procesamiento de secuencias de vídeo de alta definición para el reconocimiento detallado de objetos.
  • Control de calidad industrial: Detección de defectos finos en los procesos de fabricación.

Más información sobre YOLO

YOLOX

YOLOX, desarrollado por Megvii, es una versión sin anclaje de YOLO, que hace hincapié en la simplicidad y el alto rendimiento. Con su eficiente diseño, pretende tender un puente entre la investigación y las aplicaciones industriales.

Arquitectura y características principales

YOLOX destaca por su enfoque sin anclajes y su arquitectura simplificada:

  • Detección sin anclajes: Simplifica el proceso de detección al eliminar la necesidad de cajas de anclaje, lo que reduce la complejidad y el ajuste de hiperparámetros.
  • Cabezal desacoplado: separa los cabezales de clasificación y regresión para mejorar el rendimiento y la eficacia del entrenamiento.
  • Asignación de etiquetas SimOTA: Utiliza la estrategia de asignación de etiquetas SimOTA (Simplified Optimal Transport Assignment) para una formación más eficaz.
  • Aumentos sólidos: Emplea técnicas avanzadas de aumento de datos para mejorar la solidez y la generalización de los modelos.

Métricas de rendimiento

YOLOX ofrece un sólido equilibrio entre precisión y velocidad, con varios tamaños de modelos disponibles.

  • mAP: Consigue puntuaciones mAP competitivas en conjuntos de datos de referencia como COCO, superando a menudo a las versiones anteriores de YOLO .
  • Velocidad de inferencia: Proporciona velocidades de inferencia rápidas, adecuadas para el despliegue en tiempo real.
  • Tamaño del modelo: Ofrece diferentes tamaños de modelo (Nano, Tiny, s, m, l, x) para adaptarse a diversas limitaciones de recursos.

Puntos fuertes y débiles

Puntos fuertes:

  • Simplicidad: El diseño sin anclajes simplifica el modelo y reduce la necesidad de ajustes complejos.
  • Alto rendimiento: Alcanza una precisión y velocidad excelentes, superando a menudo a los modelos YOLO basados en anclas.
  • Facilidad de implantación: Bien documentada y relativamente fácil de implantar y desplegar.

Debilidades:

  • Coste computacional: Los modelos YOLOX de mayor tamaño pueden requerir muchos recursos informáticos.
  • Optimización para hardware específico: Puede requerir optimización para el despliegue en dispositivos de borde con recursos muy limitados en comparación con los modelos extremadamente ligeros.

Casos prácticos

YOLOX es versátil y adecuado para una amplia gama de tareas de detección de objetos, incluidas:

  • Videovigilancia en tiempo real: Procesamiento eficaz de señales de vídeo para seguridad y vigilancia.
  • Conducción autónoma: Detección robusta y rápida de objetos para vehículos autónomos.
  • Despliegue en el borde: Despliegue de modelos YOLOX más pequeños en dispositivos periféricos para aplicaciones con recursos limitados.

Más información sobre YOLOX

Tabla comparativa de modelos

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Tanto YOLO como YOLOX son potentes modelos de detección de objetos. YOLO hace hincapié en la precisión y la eficacia mediante innovaciones arquitectónicas, mientras que YOLOX se centra en la sencillez y el alto rendimiento con su diseño sin anclajes. La elección entre ambos depende de los requisitos específicos de la aplicación, teniendo en cuenta factores como las necesidades de precisión, los requisitos de velocidad y el entorno de despliegue.

Los usuarios interesados en otros modelos de detección de objetos de alto rendimiento también podrían considerar Ultralytics YOLOv8YOLOv10 y YOLO11. Para comparaciones con estos y otros modelos, consulte los documentos de comparación de modelos de Ultralytics .

Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios