YOLOv5 vs YOLO11: Una Comparación Técnica
Elegir el modelo de detección de objetos adecuado es una decisión crítica que equilibra la necesidad de precisión, velocidad y eficiencia de recursos. Esta página ofrece una comparación técnica detallada entre dos modelos emblemáticos de Ultralytics: el ampliamente adoptado Ultralytics YOLOv5 y el Ultralytics YOLO11 de última generación. Si bien YOLOv5 estableció un estándar del sector en cuanto a rendimiento y facilidad de uso, YOLO11 representa la siguiente evolución, ofreciendo una precisión superior, una mayor versatilidad y una eficiencia mejorada dentro del mismo potente ecosistema de Ultralytics.
Ultralytics YOLOv5: El Estándar Industrial Establecido
Lanzado en 2020, YOLOv5 se convirtió rápidamente en uno de los modelos de detección de objetos más populares del mundo. Su reputación se basa en una combinación excepcional de velocidad, fiabilidad y facilidad de uso, lo que lo convierte en una opción ideal para innumerables desarrolladores e investigadores.
Detalles técnicos:
- Autores: Glenn Jocher
- Organización: Ultralytics
- Fecha: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Documentación: https://docs.ultralytics.com/models/yolov5/
Arquitectura y Características Clave
YOLOv5 está construido sobre PyTorch y presenta una backbone CSPDarknet53 combinada con un cuello de botella PANet para una agregación de características eficaz. Su arquitectura es altamente escalable, ofreciendo una gama de modelos desde el pequeño y rápido YOLOv5n hasta el grande y preciso YOLOv5x. Una característica clave de YOLOv5 es su encabezado de detección basado en anclajes, que fue muy eficaz en el momento de su lanzamiento.
Fortalezas
- Velocidad de Inferencia Excepcional: YOLOv5 está altamente optimizado para una inferencia rápida, lo que lo convierte en una opción robusta para aplicaciones en tiempo real, especialmente en hardware GPU.
- Ecosistema Maduro: Como modelo bien establecido, YOLOv5 se beneficia de una comunidad masiva, extensos tutoriales y un amplio soporte de terceros. Está probado en batalla en numerosos entornos de producción.
- Facilidad de uso: Reconocido por su API sencilla y su documentación completa, YOLOv5 permite la creación rápida de prototipos y la implementación. El modelo está perfectamente integrado en el ecosistema de Ultralytics, incluyendo Ultralytics HUB para el entrenamiento sin código.
- Eficiencia en el entrenamiento: YOLOv5 ofrece un proceso de entrenamiento eficiente con pesos pre-entrenados disponibles, lo que permite un aprendizaje por transferencia eficaz y ciclos de desarrollo más rápidos.
Debilidades
- Detección Basada en Anclas: Su dependencia de cuadros de anclaje predefinidos a veces puede requerir un ajuste cuidadoso para conjuntos de datos con objetos de forma inusual, una limitación abordada por los detectores sin anclaje más nuevos.
- Límite de precisión: Aunque sigue siendo muy preciso, su rendimiento en benchmarks como COCO ha sido superado por arquitecturas más recientes como YOLO11.
Casos de Uso Ideales
YOLOv5 sigue siendo una excelente opción para aplicaciones donde la velocidad y la estabilidad son primordiales:
- Edge Computing: Sus variantes más pequeñas son perfectas para la implementación en dispositivos con recursos limitados como Raspberry Pi y NVIDIA Jetson.
- Vigilancia en tiempo real: Impulsa sistemas de seguridad y aplicaciones de monitoreo que requieren un alto FPS.
- Automatización industrial: Se utiliza para el control de calidad y la automatización de procesos en entornos de fabricación.
Ultralytics YOLO11: La próxima evolución en IA de visión
YOLO11 es el modelo de última generación de Ultralytics, diseñado para superar los límites de lo posible en la visión artificial. Se basa en los éxitos de sus predecesores, incluyendo YOLOv8, para ofrecer mejoras significativas en precisión, velocidad y versatilidad.
Detalles técnicos:
- Autores: Glenn Jocher, Jing Qiu
- Organización: Ultralytics
- Fecha: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Documentación: https://docs.ultralytics.com/models/yolo11/
Arquitectura y Características Clave
YOLO11 introduce una arquitectura de red refinada con capacidades avanzadas de extracción de características y un diseño optimizado. Un avance importante es su head de detección sin anclajes, que mejora la generalización y simplifica el proceso de entrenamiento. Este diseño moderno permite a YOLO11 lograr una mayor precisión con un uso más eficiente de los parámetros, lo que conduce a velocidades de inferencia más rápidas y a menores exigencias computacionales.
Fortalezas
- Rendimiento de última generación: YOLO11 establece un nuevo estándar de precisión, logrando puntuaciones mAP más altas que YOLOv5 en todos los tamaños de modelo.
- Versatilidad mejorada: YOLO11 es un verdadero marco de trabajo multitarea, que admite detección de objetos, segmentación de instancias, clasificación de imágenes, estimación de poses y cuadros delimitadores orientados (OBB) dentro de un único modelo unificado.
- Eficiencia Superior: El modelo es altamente eficiente, ofreciendo una mejor relación velocidad-precisión. En particular, demuestra una inferencia significativamente más rápida en CPUs en comparación con YOLOv5, haciéndolo accesible para una gama más amplia de hardware. También requiere menos memoria para el entrenamiento y la inferencia que muchas otras arquitecturas.
- Experiencia de usuario optimizada: Como parte del ecosistema de Ultralytics, YOLO11 mantiene el mismo compromiso con la facilidad de uso con una API de Python sencilla, una CLI potente y una amplia documentación.
Debilidades
- Demanda Computacional para Modelos Grandes: Si bien son altamente eficientes, los modelos YOLO11 más grandes (por ejemplo, YOLO11x) aún requieren recursos computacionales sustanciales para lograr la máxima precisión.
- Integraciones en Evolución: Como modelo más nuevo, el ecosistema de herramientas e integraciones de terceros está creciendo rápidamente, pero puede que aún no sea tan extenso como el de YOLOv5, que está establecido desde hace mucho tiempo.
Casos de Uso Ideales
YOLO11 es la opción ideal para proyectos nuevos que demandan los niveles más altos de precisión y flexibilidad:
- Robótica Avanzada: Permite la interacción y navegación precisas de objetos en entornos complejos y dinámicos.
- Atención Sanitaria e Imágenes Médicas: Apoyo a tareas como la detección de tumores, donde la alta precisión es fundamental.
- Ciudades inteligentes: Impulsa la gestión sofisticada del tráfico y los sistemas de seguridad pública.
- Análisis minorista: Mejorando la gestión de inventario y el análisis del comportamiento del cliente con mayor precisión.
Cara a cara de rendimiento: YOLOv5 vs. YOLO11
Las métricas de rendimiento ilustran claramente los avances realizados con YOLO11. En general, los modelos YOLO11 ofrecen un aumento significativo en mAP al tiempo que mantienen o incluso mejoran la velocidad de inferencia. Por ejemplo, YOLO11s alcanza un mAP de 47.0, que es comparable a YOLOv5l, pero con muchos menos parámetros y una inferencia de CPU significativamente más rápida. Del mismo modo, YOLO11m supera a YOLOv5x en precisión (51.5 vs. 50.7 mAP) siendo más de 4 veces más rápido en una CPU.
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4 TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusión: ¿Qué modelo debería elegir?
Si bien YOLOv5 sigue siendo un modelo sólido y fiable, YOLO11 es el sucesor claro y la opción recomendada para casi todos los proyectos nuevos. Ofrece un salto sustancial en el rendimiento, proporcionando mayor precisión, mayor versatilidad de tareas y una eficiencia mejorada sin sacrificar la facilidad de uso que hizo que sus predecesores fueran tan populares.
-
Elija YOLOv5 si está trabajando en un proyecto heredado que ya la utiliza, o si su principal limitación es la implementación en hardware donde sus optimizaciones específicas de velocidad de GPU proporcionan una ventaja crítica.
-
Elija YOLO11 para cualquier nueva aplicación. Su precisión superior, su diseño sin anclajes, sus capacidades multitarea y su excelente rendimiento tanto en CPU como en GPU la convierten en la solución más potente, flexible y preparada para el futuro.
Ambos modelos están respaldados por el robusto ecosistema de Ultralytics, lo que garantiza una experiencia de desarrollo fluida con excelente soporte y documentación.
Explore otras comparaciones de modelos
Si te interesa saber cómo se comparan estos modelos con otras arquitecturas líderes, consulta nuestras otras páginas de comparación: