Ir al contenido

YOLOv5 vs. YOLOv8: Un análisis comparativo detallado

La comparación entre Ultralytics YOLOv5 y Ultralytics YOLOv8 para la detección de objetos revela avances significativos y puntos fuertes distintos en cada modelo. Ambos modelos, desarrollados por Ultralytics, son reconocidos por su velocidad y precisión, pero se adaptan a diferentes necesidades y prioridades de los usuarios en el campo de la visión artificial. Esta página proporciona una comparación técnica para ayudar a los usuarios a tomar decisiones informadas basadas en los requisitos de su proyecto, destacando las ventajas del ecosistema Ultralytics.

YOLOv5: El estándar establecido y versátil

Autor: Glenn Jocher
Organización: Ultralytics
Fecha: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentación: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 se convirtió rápidamente en un estándar de la industria tras su lanzamiento, celebrado por su excepcional equilibrio entre velocidad, precisión y facilidad de uso. Construido íntegramente en PyTorch, YOLOv5 presenta una arquitectura robusta con un backbone CSPDarknet53 y un cuello PANet para una agregación eficiente de características. Su encabezado de detección basado en anclajes es muy eficaz, y el modelo está disponible en varios tamaños (n, s, m, l, x), lo que permite a los desarrolladores seleccionar la compensación óptima para sus necesidades específicas de rendimiento y computación.

Fortalezas

  • Velocidad y Eficiencia Excepcionales: YOLOv5 está altamente optimizado para una inferencia rápida, lo que lo convierte en una opción primordial para aplicaciones en tiempo real en diversos hardware, desde servidores potentes hasta dispositivos edge con recursos limitados.
  • Facilidad de uso: Reconocido por su experiencia de usuario optimizada, YOLOv5 ofrece interfaces sencillas de Python y CLI, respaldadas por una documentación extensa.
  • Ecosistema Maduro y Bien Mantenido: Como modelo de larga trayectoria, se beneficia de una comunidad grande y activa, actualizaciones frecuentes y una integración perfecta con el ecosistema de Ultralytics, incluidas herramientas como Ultralytics HUB para el entrenamiento sin código.
  • Eficiencia en el entrenamiento: YOLOv5 ofrece un proceso de entrenamiento eficiente con pesos pre-entrenados disponibles, lo que permite ciclos de desarrollo rápidos. Generalmente requiere menos memoria para el entrenamiento y la inferencia en comparación con arquitecturas más complejas como los transformers.

Debilidades

  • Detección Basada en Anclas: Su dependencia de cuadros de anclaje predefinidos a veces puede requerir un ajuste manual para un rendimiento óptimo en conjuntos de datos con objetos de forma inusual, a diferencia de los detectores sin anclaje modernos.
  • Precisión: Si bien fue muy preciso, los modelos más nuevos como YOLOv8 han superado su rendimiento en benchmarks estándar como el conjunto de datos COCO.

Casos de Uso Ideales

La velocidad y eficiencia de YOLOv5 lo hacen perfecto para:

  • Videovigilancia en tiempo real y sistemas de seguridad.
  • Deployment on edge devices como NVIDIA Jetson y Raspberry Pi.
  • Automatización industrial y control de calidad en la fabricación.
  • Prototipado rápido para proyectos de visión artificial debido a su simplicidad y tiempos de entrenamiento rápidos.

Más información sobre YOLOv5

YOLOv8: El framework de última generación y vanguardia

Autores: Glenn Jocher, Ayush Chaurasia y Jing Qiu
Organización: Ultralytics
Fecha: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Documentación: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 representa la siguiente evolución en la serie YOLO, diseñado como un marco unificado que soporta un espectro completo de tareas de IA de visión. Más allá de la detección de objetos, destaca en la segmentación de instancias, la clasificación de imágenes, la estimación de poses y la detección de objetos orientados. YOLOv8 introduce mejoras arquitectónicas clave, como un encabezado de detección sin anclajes y un nuevo módulo C2f, para ofrecer un rendimiento de última generación.

Fortalezas

  • Precisión y velocidad mejoradas: YOLOv8 ofrece un equilibrio superior de velocidad y precisión, logrando puntuaciones mAP más altas que YOLOv5 en todos los tamaños de modelo, manteniendo al mismo tiempo velocidades de inferencia competitivas.
  • Versatilidad: Su soporte para múltiples tareas de visión dentro de un marco de trabajo único y cohesivo la convierte en una herramienta increíblemente potente y flexible para desarrollar sistemas de IA complejos.
  • Arquitectura moderna: El encabezado de detección sin anclaje simplifica la capa de salida y mejora el rendimiento al eliminar la necesidad de ajustar el cuadro de anclaje.
  • Ecosistema bien mantenido: Como modelo insignia, YOLOv8 se beneficia de un desarrollo activo, actualizaciones frecuentes y un sólido apoyo de la comunidad. Está totalmente integrado en el ecosistema de Ultralytics, incluida la plataforma Ultralytics HUB para un MLOps optimizado.
  • Eficiencia de memoria: A pesar de su arquitectura avanzada, YOLOv8 está optimizado para un bajo uso de memoria, lo que lo hace accesible en una amplia gama de hardware.

Debilidades

  • Demanda computacional: Los modelos YOLOv8 más grandes (por ejemplo, YOLOv8x) requieren importantes recursos computacionales, lo que podría ser un factor a tener en cuenta para su implementación en entornos muy limitados.

Casos de Uso Ideales

YOLOv8 es la opción recomendada para aplicaciones que exigen la máxima precisión y flexibilidad:

  • Robótica avanzada que requiere una comprensión compleja de la escena y la interacción con múltiples objetos.
  • Análisis de imágenes de alta resolución para imágenes médicas o de satélite donde el detalle preciso es fundamental.
  • Sistemas de visión multi-tarea que necesitan realizar detección, segmentación y estimación de pose simultáneamente.
  • Nuevos proyectos donde comenzar con el modelo de última generación es una prioridad.

Más información sobre YOLOv8

Benchmarks de rendimiento: YOLOv5 vs. YOLOv8

La diferencia de rendimiento entre YOLOv5 y YOLOv8 es evidente al comparar sus métricas en el conjunto de datos COCO. En general, los modelos YOLOv8 demuestran una mayor precisión (mAP) para un número comparable de parámetros y coste computacional (FLOPs). Por ejemplo, YOLOv8n alcanza un mAP de 37.3, casi igualando a YOLOv5s (37.4 mAP) pero con un 68% menos de parámetros y una inferencia de CPU significativamente más rápida.

Sin embargo, YOLOv5 sigue siendo un competidor formidable, especialmente en escenarios donde la velocidad bruta de la GPU es la máxima prioridad. El modelo YOLOv5n, por ejemplo, cuenta con el tiempo de inferencia más rápido en una GPU T4. Esto lo convierte en una excelente opción para aplicaciones en tiempo real que se ejecutan en hardware optimizado.

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Diferencias Arquitectónicas Clave

La evolución de YOLOv5 a YOLOv8 introdujo varios cambios arquitectónicos significativos que contribuyen a su rendimiento y flexibilidad superiores.

Backbone y Neck

YOLOv5 utiliza el módulo C3 en su backbone y cuello de botella. En cambio, YOLOv8 lo reemplaza con el módulo C2f. El módulo C2f (Cross Stage Partial BottleNeck with 2 convolutions) proporciona una fusión de características más eficiente y un flujo de gradiente más rico, lo que mejora la precisión general del modelo.

Cabezal de detección

Una distinción importante radica en el encabezado de detección. YOLOv5 emplea un encabezado acoplado, basado en anclajes, lo que significa que se utiliza el mismo conjunto de características tanto para la clasificación de objetos como para la regresión del bounding box. YOLOv8 utiliza un encabezado sin anclajes y desacoplado. Esta separación de tareas (un encabezado para la clasificación, otro para la regresión) permite que cada uno se especialice, mejorando la precisión. El enfoque sin anclajes también simplifica el proceso de entrenamiento y elimina la necesidad de ajustar las prioridades de los anchor box, lo que hace que el modelo sea más adaptable a diferentes conjuntos de datos.

Metodologías de entrenamiento y ecosistema

Tanto YOLOv5 como YOLOv8 están construidos sobre PyTorch y aprovechan los flujos de trabajo de entrenamiento optimizados de Ultralytics, ofreciendo una experiencia consistente y fácil de usar.

  • Facilidad de uso: Ambos modelos se pueden entrenar fácilmente utilizando las interfaces de la CLI o de Python proporcionadas con una configuración mínima. La documentación completa (Documentación de YOLOv5, Documentación de YOLOv8) y las API sencillas facilitan el entrenamiento personalizado.
  • Entrenamiento eficiente: Los scripts de entrenamiento optimizados y los pesos pre-entrenados disponibles reducen significativamente el tiempo de entrenamiento y los costes computacionales.
  • Aumento de datos: Ambos modelos incorporan un conjunto robusto de técnicas de aumento de datos integradas para mejorar la generalización del modelo y reducir el sobreajuste.
  • Ecosistema Ultralytics: La integración con herramientas como Ultralytics HUB y plataformas de registro como TensorBoard y Comet simplifica el seguimiento de experimentos, la gestión de modelos y el despliegue.

Conclusión: ¿Qué modelo debería elegir?

Tanto YOLOv5 como YOLOv8 son modelos de detección de objetos potentes desarrollados por Ultralytics, que ofrecen un excelente rendimiento y facilidad de uso. La elección entre ellos depende en gran medida de los requisitos específicos de su proyecto.

  • YOLOv5 sigue siendo un contendiente fuerte y fiable, especialmente para las aplicaciones en las que es fundamental maximizar la velocidad de inferencia en un hardware específico. Su madurez significa que tiene un vasto ecosistema y ha sido probado en innumerables implementaciones del mundo real. Es una excelente opción para proyectos con un presupuesto de recursos ajustado o para aquellos que requieren una rápida implementación en dispositivos de borde.

  • YOLOv8 representa la vanguardia de la serie YOLO, ofreciendo una precisión superior, una versatilidad mejorada en múltiples tareas de visión y una arquitectura más moderna. Su diseño sin anclajes y sus características avanzadas lo convierten en la opción ideal para nuevos proyectos que buscan un rendimiento de última generación y la flexibilidad para manejar desafíos complejos y multifacéticos de IA.

Ultralytics continúa innovando, asegurando que ambos modelos estén bien soportados, sean fáciles de usar y proporcionen un gran equilibrio entre velocidad y precisión, adecuados para diversos escenarios del mundo real.

Explore otros modelos de Ultralytics

Para los usuarios que estén explorando otras opciones de última generación, Ultralytics también ofrece modelos como YOLOv9, YOLOv10 y el último YOLO11, cada uno con ventajas únicas en rendimiento y eficiencia. Puede encontrar más comparaciones en la documentación de Ultralytics.



📅 Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios