Ir al contenido

YOLOX frente a YOLOv8: una inmersión técnica en la evolución de la detección de objetos

El panorama de la visión por ordenador cambia rápidamente, con nuevas arquitecturas que amplían continuamente los límites de la velocidad y la precisión. Dos hitos significativos en este camino son YOLOX e YOLOv8. Esta comparación explora los matices técnicos entre la innovación sin anclajes de YOLOX y la versatilidad de vanguardia de Ultralytics YOLOv8. Analizamos sus arquitecturas, métricas de rendimiento e idoneidad para aplicaciones del mundo real para ayudarle a elegir la herramienta adecuada para sus proyectos de aprendizaje automático.

Actualícese con la última tecnología

Aunque YOLOv8 es un modelo potente, el campo ha avanzado más. Eche un vistazo a YOLO11la última iteración de Ultralytics, que ofrece una eficacia aún mayor, un procesamiento más rápido y una precisión mejorada para las tareas de detección, segmentación y estimación de la pose.

Métricas de rendimiento y puntos de referencia

A la hora de evaluar los modelos de detección de objetos, el equilibrio entre la velocidad de inferencia y la precisión media (mAP) es fundamental. La tabla siguiente muestra que Ultralytics YOLOv8 consigue sistemáticamente una mayor precisión con una latencia menor en modelos de tamaños comparables.

En particular, YOLOv8 proporciona puntos de referencia transparentes para la inferencia de CPU a través de ONNXuna métrica crucial para el despliegue en hardware sin GPU dedicadas. Por el contrario, las pruebas estándar de YOLOX se centran principalmente en el rendimiento GPU , lo que deja un vacío para los usuarios que buscan aplicaciones de IA en procesadores estándar.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8

YOLOX: el pionero sin anclajes

Lanzado en 2021 por los investigadores de Megvii, YOLOX introdujo un cambio significativo en la familia YOLO al adoptar un mecanismo sin anclajes. Esta elección de diseño eliminó la necesidad de cajas de anclaje predefinidas, simplificando el proceso de entrenamiento y mejorando el rendimiento en escenarios específicos.

Arquitectura y puntos fuertes

YOLOX integra un cabezal desacoplado que separa las tareas de clasificación y localización para mejorar la velocidad de convergencia y la precisión. Utiliza SimOTA (Simplified Optimal Transport Assignment) para la asignación dinámica de etiquetas, que trata el proceso de formación como un problema de transporte óptimo. Aunque revolucionario en su momento, YOLOX es principalmente un modelo de detección de objetos, que carece de soporte nativo para otras tareas como la segmentación o la estimación de la pose dentro de la misma base de código.

Más información sobre YOLOX

YOLOv8: el estándar moderno para la IA de visión

Lanzado a principios de 2023 por Ultralytics, YOLOv8 representa la culminación de una extensa investigación sobre eficiencia, precisión y usabilidad. Se basa en el legado sin anclajes, pero lo perfecciona con un asignador de tareas de última generación y una arquitectura modernizada que destaca en un amplio espectro de hardware.

Principales ventajas

YOLOv8 no es sólo un modelo de detección; es un marco unificado. Ofrece soporte nativo para la clasificación de imágenes, la segmentación de instancias, la estimación de poses y la detección de objetos orientados (OBB). Esta versatilidad permite a los desarrolladores resolver complejos problemas multimodales utilizando una única API cohesionada.

Más información sobre YOLOv8

Comparación de arquitecturas y casos de uso

Comprender las diferencias técnicas entre estas arquitecturas ayuda a seleccionar la herramienta adecuada para los sistemas de inferencia y producción en tiempo real.

1. Eficacia del entrenamiento y memoria

Una de las características más destacadas de los modelosYOLO Ultralytics es su eficacia de entrenamiento. YOLOv8 implementa estrategias avanzadas de aumento, como el mosaico y la mezcla, optimizadas para evitar el sobreajuste y mantener al mismo tiempo una alta velocidad de entrenamiento.

YOLOv8 presenta unos requisitos de memoria inferiores durante el entrenamiento y la inferencia en comparación con arquitecturas más antiguas o modelos basados en transformadores pesados. Esta eficiencia permite entrenar modelos personalizados en GPU de consumo o implementarlos en dispositivos de última generación con limitaciones de memoria. YOLOX, aunque eficiente, suele requerir un mayor ajuste manual de los hiperparámetros para lograr una estabilidad óptima.

2. Ecosistema y facilidad de uso

Para desarrolladores e investigadores, el ecosistema que rodea a un modelo es tan importante como la propia arquitectura.

  • YOLOX sigue una estructura de repositorio de investigación tradicional. Configurarlo suele implicar complejos archivos de configuración y la gestión manual de dependencias.
  • Ultralytics YOLOv8 da prioridad a la facilidad de uso. Cuenta con un paquete instalable mediante pip, una APIPython simplificada y una CLI que funciona desde el primer momento.

Facilidad de uso con Ultralytics API

Ejecutar predicciones con YOLOv8 es increíblemente sencillo y sólo requiere unas pocas líneas de código.

from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

3. Ecosistema bien mantenido

Elegir YOLOv8 significa acceder a un ecosistema bien mantenido. Ultralytics proporciona una documentación exhaustiva, actualizaciones frecuentes y un soporte activo por parte de la comunidad. La integración con el amplio ecosistema de Ultralytics simplifica los flujos de trabajo, incluida la anotación de datos, la gestión de conjuntos de datos y la implementación de modelos en formatos como TensorRT y OpenVINO.

Aplicaciones en el mundo real

En qué destaca YOLOv8

  • Comercio inteligente: Utilización de las capacidades de segmentación para comprender la disposición de los estantes y la colocación de los productos con precisión a nivel de píxel.
  • Análisis deportivo: Aprovechamiento de la estimación de la pose para track los movimientos y la biomecánica de los jugadores en tiempo real, una tarea que YOLOX no puede realizar de forma nativa.
  • Inspección industrial: Despliegue de modelos OBB para detect con gran precisión objetos girados, como componentes en una cinta transportadora.
  • Despliegue en los bordes: La superior relación velocidad-precisión de YOLOv8 lo convierte en la opción preferida para aplicaciones móviles y sistemas integrados como Raspberry Pi o NVIDIA Jetson.

Nicho YOLOX

YOLOX sigue siendo un firme candidato para la investigación académica centrada específicamente en los aspectos teóricos de los cabezales de detección sin anclaje. Su código base constituye una referencia clara para los investigadores que estudian la transición de las metodologías basadas en anclajes a las libres de anclajes en la era 2021.

Conclusión

Mientras que YOLOX desempeñó un papel fundamental en la popularización de la detección sin anclaje, Ultralytics YOLOv8 representa la evolución natural de esta tecnología. Al ofrecer métricas de rendimiento superiores, un marco de aprendizaje multitarea versátil y una experiencia de usuario inigualable, YOLOv8 destaca como la opción superior para el desarrollo moderno de IA.

Para los desarrolladores que buscan una solución robusta y preparada para el futuro que se adapte desde la creación rápida de prototipos hasta la implantación en la empresa, Ultralytics YOLOv8el más reciente YOLO11-proporcionan las herramientas necesarias para alcanzar el éxito.

Explorar Otros Modelos

Amplíe su comprensión del panorama de la detección de objetos explorando estas comparaciones:


Comentarios