Comparación de modelos: YOLOv8 frente a YOLOX para la detección de objetos
Elegir el modelo de detección de objetos adecuado es crucial para diversas aplicaciones de visión por ordenador. Esta página ofrece una comparación técnica detallada entre Ultralytics YOLOv8 y YOLOX, dos modelos populares y eficientes para la detección de objetos. Exploraremos sus matices arquitectónicos, puntos de referencia de rendimiento e idoneidad para diferentes casos de uso para ayudarle a tomar una decisión informada.
Ultralytics YOLOv8: eficacia y versatilidad
Ultralytics YOLOv8 es un modelo de última generación de la serie YOLO , conocido por su velocidad y precisión en la detección de objetos y otras tareas de visión. Desarrollado por Glenn Jocher, Ayush Chaurasia y Jing Qiu en UltralyticsYOLOv8 , desarrollado por Glenn Jocher, Ayush Chaurasia y Jing Qiu de Ultralytics y publicado el 2023-01-10, se basa en las versiones anteriores de YOLO con mejoras arquitectónicas centradas en la eficacia y la facilidad de uso. Está diseñado para ser versátil, con un buen rendimiento en tareas de detección, segmentación, estimación de pose y clasificación de objetos.
Arquitectura y características principales:
YOLOv8 adopta un enfoque sin anclajes, lo que simplifica la arquitectura y mejora la generalización. Entre sus principales características se incluyen:
- Espina dorsal racionalizada: Extracción eficiente de características.
- Cabezal de detección sin anclaje: aumenta la velocidad y la sencillez.
- Función de pérdida compuesta: Optimizada para la precisión y el entrenamiento robusto.
Puntos fuertes:
- Excelente rendimiento: YOLOv8 logra un gran equilibrio entre velocidad y precisión, lo que lo hace adecuado para una amplia gama de aplicaciones. Consulte las métricas de rendimiento en la siguiente tabla comparativa.
- Fácil de usar: Ultralytics hace hincapié en la facilidad de uso con una documentación clara y un paquetePython fácil de usar.
- Versatilidad multitarea: Admite detección de objetos, segmentación de instancias, estimación de poses y clasificación de imágenes.
- Integración con el ecosistema: Se integra perfectamente con Ultralytics HUB para la gestión y despliegue de modelos, agilizando los flujos de trabajo de MLOps.
Debilidades:
- Aunque son muy eficientes, para dispositivos con recursos extremadamente limitados, modelos más pequeños como el YOLOX-Nano podrían ofrecer modelos de menor tamaño.
Casos de uso ideales:
La versatilidad de YOLOv8 lo hace ideal para aplicaciones que requieren un equilibrio entre alta precisión y rendimiento en tiempo real, como:
- Detección de objetos en tiempo real: Aplicaciones como sistemas de alarma de seguridad, robótica y vehículos autónomos.
- Soluciones versátiles de IA de visión: En sectores como la agricultura, la fabricación y la sanidad.
- Creación rápida de prototipos y despliegue: Gracias a su facilidad de uso y a sus completas herramientas, incluido Ultralytics HUB.
YOLOX: alto rendimiento y sencillez
YOLOX, presentado por Zheng Ge, Songtao Liu, Feng Wang, Zeming Li y Jian Sun de Megvii el 2021-07-18, es otro modelo YOLO sin anclaje que busca un alto rendimiento con un diseño simplificado. YOLOX se centra en la detección de objetos y está diseñado para salvar la brecha entre la investigación y las aplicaciones industriales.
Arquitectura y características principales:
YOLOX también adopta un enfoque sin anclajes, lo que simplifica el proceso de formación e inferencia. Los componentes arquitectónicos clave son:
- Cabezal desacoplado: separa las tareas de clasificación y localización para mejorar el rendimiento.
- Asignación de etiquetas SimOTA: Estrategia avanzada de asignación de etiquetas para una formación optimizada.
- Aumento sólido de datos: Se utilizan técnicas como MixUp y Mosaic para aumentar la robustez.
Puntos fuertes:
- Alta precisión: YOLOX alcanza una precisión competitiva, a menudo superior a la de otros modelos YOLO , sobre todo en los modelos de menor tamaño. Consulte la tabla comparativa para obtener métricas detalladas.
- Inferencia eficiente: Ofrece velocidades de inferencia rápidas, adecuadas para aplicaciones en tiempo real.
- Redes troncales flexibles: Admite varios backbones, entre ellos Darknet53 y opciones ligeras como Nano, lo que permite la personalización en función de las limitaciones de recursos.
- Código abierto: Megvii ha abierto completamente el código, fomentando las contribuciones y el uso por parte de la comunidad.
Debilidades:
- Comunidad y ecosistema: Aunque es de código abierto, es posible que no tenga el mismo nivel de integración con el ecosistema y las herramientas que Ultralytics YOLOv8, como la integración perfecta con plataformas como Ultralytics HUB.
Casos de uso ideales:
YOLOX es idóneo para aplicaciones que exigen gran precisión e inferencia eficiente, como:
- Detección de objetos de alto rendimiento: Escenarios que requieren la máxima precisión en tareas de detección de objetos.
- Despliegue en el borde: Las variantes más pequeñas como YOLOX-Nano y YOLOX-Tiny son excelentes para el despliegue en dispositivos periféricos con recursos computacionales limitados.
- Investigación y desarrollo: Gracias a su diseño claro y modular, es una buena opción para la investigación y el desarrollo en la detección de objetos.
Comparación de resultados
A continuación se muestra una comparación de los modelos YOLOv8 y YOLOX basada en métricas de rendimiento en el conjunto de datos COCO.
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Conclusión
Tanto YOLOv8 como YOLOX son excelentes opciones para la detección de objetos, cada una con sus puntos fuertes. YOLOv8 destaca por su versatilidad, facilidad de uso y sólido ecosistema, lo que lo convierte en un excelente modelo polivalente para diversas tareas de visión y escenarios de despliegue. YOLOX destaca por su precisión y eficacia, especialmente en escenarios que exigen un alto rendimiento y adaptabilidad a las limitaciones de recursos.
Para los usuarios interesados en explorar otros modelos, Ultralytics también ofrece una gama de modelos de vanguardia, entre ellos YOLOv5YOLOv7, YOLOv9, YOLOv10 y el más reciente YOLO11 cada uno de ellos diseñado para necesidades y aplicaciones específicas.