YOLOv8 vs YOLO: Comparación técnica detallada
Elegir el modelo de detección de objetos adecuado es fundamental para los proyectos de visión por ordenador. Esta página ofrece una comparación técnica entre Ultralytics YOLOv8 y YOLO, dos modelos de última generación, analizando sus arquitecturas, rendimiento y aplicaciones.
Ultralytics YOLOv8
Ultralytics YOLOv8 es la última iteración de la serie YOLO , conocida por su equilibrio entre velocidad y precisión en la detección de objetos y otras tareas de visión como la segmentación de instancias y la estimación de poses. Desarrollado por Glenn Jocher, Ayush Chaurasia y Jing Qiu de Ultralytics y publicado el 2023-01-10, YOLOv8 se basa en las versiones anteriores de YOLO con mejoras arquitectónicas y un enfoque en la facilidad de uso. Su documentación hace hincapié en la facilidad de uso y la versatilidad, por lo que es adecuado para una amplia gama de aplicaciones y usuarios, desde principiantes hasta expertos.
Puntos fuertes:
- Rendimiento: YOLOv8 consigue un mAP de última generación manteniendo una velocidad de inferencia impresionante. Ofrece varios tamaños de modelo (n, s, m, l, x) para adaptarse a diferentes necesidades computacionales.
- Versatilidad: Más allá de la detección de objetos, YOLOv8 admite múltiples tareas de visión, como la segmentación, la clasificación y la estimación de la pose, proporcionando una solución unificada para diversas necesidades de visión por ordenador.
- Facilidad de uso: Ultralytics proporciona documentación y herramientas completas, lo que simplifica la formación, la implantación y la integración con plataformas como Ultralytics HUB.
- Apoyo de la comunidad: Una comunidad de código abierto amplia y activa garantiza la mejora continua y un amplio apoyo.
Debilidades:
- Uso intensivo de recursos: Los modelos YOLOv8 de mayor tamaño requieren importantes recursos informáticos para el entrenamiento y la inferencia.
- Necesidades de optimización: En el caso de dispositivos con recursos muy limitados, puede ser necesaria una mayor optimización, como la poda de modelos.
Casos prácticos:
La versatilidad de YOLOv8 la hace ideal para un amplio espectro de aplicaciones, desde el análisis de vídeo en tiempo real en sistemas de seguridad y ciudades inteligentes hasta tareas complejas en sanidad y fabricación. Su facilidad de uso también lo hace excelente para la creación rápida de prototipos y el desarrollo.
DAMO-YOLO
YOLO es un modelo de detección de objetos desarrollado por Alibaba Group y presentado en un artículo publicado en ArXiv el 2022-11-23. YOLO , cuyos autores son Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang y Xiuyu Sun, se centra en crear un detector rápido y preciso empleando técnicas innovadoras. Entre ellas se incluyen los backbones basados en NAS, un RepGFPN eficiente y un ZeroHead, junto con estrategias de entrenamiento avanzadas como AlignedOTA y la mejora de la destilación. La documentación oficial y el repositorio GitHub proporcionan detalles sobre su arquitectura e implementación.
Puntos fuertes:
- Alta precisión: YOLO se ha diseñado para ofrecer una gran precisión y alcanzar puntuaciones mAP competitivas, destacando especialmente en escenarios que requieren una detección precisa de objetos.
- Diseño eficiente: Innovaciones arquitectónicas como el ZeroHead contribuyen a un modelo racionalizado, equilibrando la precisión con la eficiencia computacional.
- Técnicas avanzadas: Incorpora técnicas de vanguardia como la Búsqueda de Arquitectura Neuronal (NAS) para el diseño de la red troncal y AlignedOTA para el entrenamiento optimizado.
Debilidades:
- Versatilidad de tareas limitada: Centrado principalmente en la detección de objetos, carece de las capacidades multitarea de YOLOv8.
- Documentación y comunidad: En comparación con YOLOv8, YOLO puede tener una comunidad más pequeña y una documentación menos extensa, lo que puede suponer un reto para los nuevos usuarios o para aquellos que buscan un amplio apoyo.
- Velocidad de inferencia: Aunque son eficientes, las comparaciones directas de velocidad con YOLOv8 en puntos de referencia estándar están menos disponibles, y la velocidad puede variar en función de implementaciones y hardware específicos.
Casos prácticos:
YOLO es idónea para aplicaciones en las que es fundamental una alta precisión de detección, como la conducción autónoma, la inspección industrial de alta precisión y los sistemas avanzados de videovigilancia. Su enfoque en la precisión y la eficiencia lo convierte en un fuerte competidor para escenarios en los que la detección detallada y fiable de objetos es crucial.
Tabla comparativa de prestaciones
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Conclusión
Tanto YOLOv8 como YOLO son potentes modelos de detección de objetos. YOLOv8 destaca por su versatilidad, facilidad de uso y sólida comunidad, lo que lo hace adecuado para una amplia gama de tareas y escenarios de desarrollo. YOLO destaca por su precisión y su diseño eficiente, lo que lo convierte en una opción sólida para aplicaciones que exigen una detección de objetos precisa. Los usuarios interesados en otros modelos también pueden considerar YOLOv7, YOLOv9 o YOLOX en función de sus necesidades y prioridades específicas.