Ir al contenido

YOLO11 vs YOLOv8: Comparación detallada

Al seleccionar un modelo de visión artificial, particularmente para la detección de objetos, es esencial comprender las fortalezas y debilidades de las diferentes arquitecturas. Esta página ofrece una comparación técnica detallada entre Ultralytics YOLO11 y Ultralytics YOLOv8, dos modelos de última generación diseñados para la detección de objetos y otras tareas de visión. Analizaremos sus matices arquitectónicos, puntos de referencia de rendimiento y aplicaciones adecuadas para guiarle en la toma de una decisión informada para su próximo proyecto de IA.

Ultralytics YOLO11

Autores: Glenn Jocher, Jing Qiu
Organización: Ultralytics
Fecha: 2024-09-27
GitHub: https://github.com/ultralytics/ultralytics
Documentación: https://docs.ultralytics.com/models/yolo11/

Ultralytics YOLO11 representa la evolución más reciente de la serie YOLO, diseñado para una mayor precisión y eficiencia. Basándose en la sólida base de los modelos YOLO anteriores, YOLO11 introduce refinamientos arquitectónicos destinados a mejorar la precisión de la detección manteniendo un rendimiento en tiempo real excepcional. Es un modelo muy versátil, que admite una amplia gama de tareas, incluyendo la segmentación de instancias, la clasificación de imágenes, la estimación de poses y los cuadros delimitadores orientados (OBB).

Arquitectura y Características Clave

YOLO11 incorpora avances en la estructura de la red para optimizar la extracción y el procesamiento de características. Logra una mayor precisión con menos parámetros y FLOPs en comparación con sus predecesores como YOLOv8, como se muestra en la tabla de rendimiento a continuación. Esta eficiencia se traduce en velocidades de inferencia más rápidas y una reducción de las exigencias computacionales, lo que la hace adecuada para su despliegue en diversas plataformas, desde dispositivos de borde hasta una potente infraestructura en la nube. Una ventaja clave de YOLO11 es su perfecta integración en el ecosistema Ultralytics bien mantenido, que proporciona procesos de entrenamiento eficientes, pesos pre-entrenados fácilmente disponibles y un menor uso de memoria en comparación con muchos otros tipos de modelos.

Fortalezas

  • Precisión Superior: Alcanza puntuaciones mAP de última generación, superando consistentemente a YOLOv8 en tamaños de modelo similares.
  • Inferencia altamente eficiente: Ofrece velocidades de procesamiento significativamente más rápidas, especialmente en la CPU, lo cual es fundamental para aplicaciones en tiempo real en entornos con recursos limitados.
  • Versatilidad Multi-Tarea: Un único marco de trabajo unificado soporta múltiples tareas de visión artificial, simplificando los flujos de trabajo de desarrollo.
  • Optimizado y escalable: Funciona bien en diferentes hardware con un uso eficiente de la memoria y una huella computacional más pequeña.
  • Facilidad de uso: Se beneficia de la optimizada API de Ultralytics, la extensa documentación y el soporte activo de la comunidad en GitHub y Discord.

Debilidades

  • Como modelo más nuevo, inicialmente puede tener menos integraciones de terceros en comparación con el YOLOv8 más establecido.
  • Los modelos más grandes (por ejemplo, YOLO11x) todavía requieren recursos computacionales sustanciales, un rasgo común para los detectores de alta precisión.

Casos de uso

El excepcional equilibrio entre precisión y eficiencia de YOLO11 lo convierte en la opción ideal para aplicaciones que demandan una detección de objetos precisa y rápida, como:

  • Robótica: Permite la navegación y la interacción con objetos en entornos dinámicos para sistemas autónomos.
  • Sistemas de Seguridad: Mejora los sistemas de seguridad avanzados para la detección de intrusiones y la monitorización en tiempo real.
  • Análisis minorista: Mejora de la gestión del inventario y el análisis del comportamiento del cliente para la IA en el comercio minorista.
  • Automatización Industrial: Soporte para el control de calidad y la detección de defectos en la fabricación.

Más información sobre YOLO11

Ultralytics YOLOv8

Autores: Glenn Jocher, Ayush Chaurasia y Jing Qiu
Organización: Ultralytics
Fecha: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Documentación: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 estableció un nuevo estándar para la detección de objetos en tiempo real tras su lanzamiento, convirtiéndose rápidamente en uno de los modelos de visión más populares del mundo. Introdujo cambios arquitectónicos clave, como un encabezado de detección sin anclaje y el módulo backbone C2f, que proporcionaron un salto significativo en el rendimiento con respecto a las versiones anteriores. Al igual que YOLO11, YOLOv8 es un modelo versátil y multi-tarea que ha sido ampliamente validado en innumerables aplicaciones del mundo real.

Arquitectura y Características Clave

El diseño de YOLOv8 se centra en un fuerte equilibrio entre velocidad y precisión. Su enfoque sin anclajes reduce el número de predicciones de cajas, simplificando el pipeline de post-procesamiento y mejorando la velocidad de inferencia. El modelo es altamente escalable, con variantes que van desde la versión ligera 'n' (nano) para móviles e IA en el borde hasta la potente versión 'x' (extra-grande) para máxima precisión. YOLOv8 está totalmente integrado en el ecosistema de Ultralytics, beneficiándose de una API sencilla, guías completas y herramientas como el Ultralytics HUB para el entrenamiento y la implementación sin código.

Fortalezas

  • Rendimiento Comprobado: Un modelo altamente confiable y ampliamente adoptado que ofrece resultados sólidos en todas las tareas compatibles.
  • Excelente compromiso entre velocidad y precisión: Ofrece un equilibrio fantástico que lo convirtió en una opción ideal para una amplia variedad de aplicaciones.
  • Ecosistema maduro: Se beneficia del amplio soporte de la comunidad, tutoriales e integraciones de terceros desarrolladas desde su lanzamiento.
  • Versatilidad: Admite la misma amplia gama de tareas de visión que YOLO11, lo que la convierte en una potente solución todo en uno.

Debilidades

  • Aunque sigue siendo uno de los mejores, generalmente es superado por YOLO11 tanto en precisión como en velocidad de inferencia de CPU en todos los tamaños de modelo.
  • Los modelos más grandes tienen un mayor número de parámetros y FLOP en comparación con sus contrapartes YOLO11, lo que conlleva mayores requisitos computacionales.

Casos de uso

YOLOv8 sigue siendo un modelo formidable y muy relevante, que destaca en aplicaciones en las que se ha implementado y probado ampliamente:

Más información sobre YOLOv8

Comparación directa de rendimiento: YOLO11 vs. YOLOv8

La principal distinción entre YOLO11 y YOLOv8 radica en sus métricas de rendimiento. YOLO11 ofrece consistentemente una mayor precisión (mAP) con una arquitectura más eficiente, lo que resulta en menos parámetros y FLOPs. Esta optimización arquitectónica es particularmente evidente en las velocidades de inferencia de la CPU, donde los modelos YOLO11 son sustancialmente más rápidos que sus equivalentes YOLOv8. Si bien YOLOv8n tiene una ligera ventaja en la latencia de la GPU, los modelos YOLO11 de 's' a 'x' también son más rápidos en la GPU, lo que convierte a YOLO11 en la opción superior para la mayoría de los proyectos nuevos.

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8

Evolución Arquitectónica y Ecosistema

YOLO11 es una evolución directa de YOLOv8, que se basa en sus exitosos principios de diseño al tiempo que introduce optimizaciones específicas. Ambos modelos comparten la misma filosofía central de ser rápidos, precisos y fáciles de usar. Se desarrollan y mantienen dentro del repositorio unificado de Ultralytics, lo que garantiza una experiencia de usuario coherente y optimizada.

Este ecosistema compartido es una gran ventaja para los desarrolladores. Migrar un proyecto de YOLOv8 a YOLO11 es sencillo, lo que permite a los equipos aprovechar las mejoras de rendimiento del modelo más reciente con cambios mínimos en el código. El ecosistema proporciona:

  • Una API simple y consistente para el entrenamiento, la validación y la predicción.
  • Documentación extensa con numerosas guías y ejemplos.
  • Flujos de trabajo de entrenamiento eficientes con pesos pre-entrenados disponibles en conjuntos de datos como COCO.
  • Menores requisitos de memoria durante el entrenamiento y la inferencia en comparación con otros tipos de modelos como Transformers.
  • Una comunidad de código abierto vibrante para soporte y colaboración.

Conclusión: ¿Qué modelo debería elegir?

Para los nuevos proyectos o aquellos que requieren el mejor rendimiento posible, YOLO11 es la opción clara. Ofrece una precisión superior y velocidades de inferencia más rápidas, particularmente en las CPUs, con una arquitectura más eficiente. Sus avances la convierten en el nuevo estado del arte para la detección de objetos en tiempo real.

YOLOv8 sigue siendo un modelo excelente y altamente fiable. Es una gran opción para proyectos existentes que ya están optimizados para su arquitectura o en escenarios donde su extensa trayectoria y la gran cantidad de integraciones de terceros son una consideración clave.

En última instancia, ambos modelos representan la cúspide de la detección de objetos en tiempo real, y la elección depende de las necesidades específicas de su proyecto. Sin embargo, con sus claras ventajas de rendimiento y su perfecta integración en el ecosistema de Ultralytics, YOLO11 está a punto de convertirse en el nuevo estándar para desarrolladores e investigadores.

Explorar Otros Modelos

Si bien YOLO11 e YOLOv8 son opciones líderes, el campo de la visión artificial está en constante evolución. También puede estar interesado en compararlos con otros modelos potentes disponibles en el ecosistema de Ultralytics, como YOLOv10, YOLOv9 y el RT-DETR basado en transformadores. Explore nuestra gama completa de comparaciones de modelos para encontrar la opción perfecta para su proyecto.



📅 Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios