YOLOv8 vs YOLO11: comparación técnica
La comparación deYOLOv8 y YOLO11 Ultralytics para la detección de objetos revela avances en la visión por ordenador en tiempo real. Ambos modelos, desarrollados por Ultralytics, están diseñados para ofrecer velocidad y precisión, pero responden a necesidades ligeramente diferentes y se basan en distintas opciones arquitectónicas. En esta página se ofrece una comparación técnica detallada para ayudar a los usuarios a comprender sus principales diferencias y aplicaciones ideales.
Visión general de YOLOv8
YOLOv8presentado por Ultralytics el 2023-01-10, representa una iteración significativa en la serie YOLO . Con Glenn Jocher, Ayush Chaurasia y Jing Qiu como autores, YOLOv8 se centra en la versatilidad y la facilidad de uso en una amplia gama de tareas de visión, como la detección de objetos, la segmentación, la clasificación y la estimación de poses. Se basa en arquitecturas YOLO anteriores, pero incorpora mejoras para aumentar el rendimiento y la flexibilidad. La documentación deYOLOv8 hace hincapié en su facilidad de uso, por lo que resulta accesible tanto para principiantes como para profesionales experimentados en el campo de la detección de objetos.
Arquitectura y características principales:
YOLOv8 mantiene un paradigma de detección de una sola etapa y sin anclajes, lo que racionaliza la arquitectura del modelo y simplifica el proceso de entrenamiento. Entre las principales características arquitectónicas se incluyen:
- Red troncal: Utiliza un backbone CSPDarknet refinado, optimizado para la eficiencia de la extracción de características.
- Cuello: Emplea una red parcial de etapas cruzadas C2f en el cuello para mejorar la fusión de características, mejorando el flujo de información y la propagación del gradiente.
- Cabezal: un cabezal de detección desacoplado separa las tareas de clasificación y regresión, lo que contribuye a mejorar la precisión y acelerar la convergencia.
Métricas de rendimiento:
YOLOv8 alcanza un rendimiento puntero en varios tamaños de modelo. Para la detección de objetos en el conjunto de datos COCO, YOLOv8x, la variante más grande, alcanza 53,9 mAPval50-95, mientras que la versión nano, YOLOv8n, logra 37,3 mAPval50-95, equilibrando precisión y velocidad. Las velocidades de inferencia oscilan entre 80,4 ms en CPU ONNX para YOLOv8n y 479,1 ms para YOLOv8x, lo que ofrece opciones para diferentes restricciones computacionales. Explore las métricas de rendimiento detalladas YOLOv8 .
Casos prácticos:
La versatilidad de YOLOv8 lo hace adecuado para un amplio espectro de aplicaciones, desde sistemas de alarmas de seguridad y despliegues en ciudades inteligentes hasta aplicaciones avanzadas en sanidad y fabricación. Su rendimiento equilibrado lo convierte en una opción sólida para proyectos que requieren una combinación de precisión y velocidad.
Puntos fuertes:
- Soporte versátil de tareas: Detección, segmentación, clasificación y estimación de la pose.
- Alta precisión y velocidad: Ofrece un buen equilibrio entre mAP y velocidad de inferencia.
- Fácil de usar: bien documentado y fácil de usar con Ultralytics Python y CLI interfaces.
- Comunidad activa: Benefits from a large community and continuous updates from Ultralytics.
Debilidades:
- Uso intensivo de recursos: Los modelos de mayor tamaño requieren importantes recursos informáticos para su entrenamiento y despliegue.
- Necesidades de optimización: Puede requerir una mayor optimización para entornos con recursos extremadamente limitados.
Visión general de YOLO11
YOLO11el último modelo de Ultralytics, publicado el 2024-09-27, y cuyos autores son Glenn Jocher y Jing Qiu, se basa en la serie YOLO , con el objetivo de seguir avanzando en eficiencia y rendimiento. Aunque comparte la filosofía básica de velocidad y precisión, YOLO11 introduce mejoras arquitectónicas diseñadas para optimizar la velocidad de inferencia sin comprometer significativamente la precisión. La documentación de YOLO11 destaca su carácter vanguardista y su idoneidad para aplicaciones en tiempo real.
Arquitectura y características principales:
YOLO11 también adopta un enfoque de una sola etapa y sin anclajes, centrándose en un diseño racionalizado y un cálculo eficiente. Los aspectos arquitectónicos clave son:
- Red troncal eficiente: Emplea una arquitectura troncal optimizada que reduce la sobrecarga computacional al tiempo que mantiene las capacidades de extracción de características.
- Diseño del cuello: Presenta una estructura de cuello refinada que mejora la agregación de características con menos parámetros, lo que contribuye a una inferencia más rápida.
- Cabezal optimizado: el cabezal de detección se ha diseñado para reducir al mínimo la latencia, dando prioridad a la velocidad en las últimas capas de predicción.
Métricas de rendimiento:
YOLO11 muestra un rendimiento competitivo centrado en las mejoras de velocidad. Para la detección de objetos en el conjunto de datos COCO, YOLO11x logra un mAPval50-95 ligeramente superior de 54,7 en comparación con YOLOv8x, al tiempo que mantiene velocidades de inferencia más rápidas en CPU y alcanza velocidades comparables en GPU. El modelo YOLO11n alcanza 39,5 mAPval50-95, lo que supone una mejora con respecto a YOLOv8n. Las velocidades de inferencia son notablemente más rápidas en CPU, con YOLO11n a 56,1 ms y YOLO11x a 462,8 ms, lo que lo convierte en un modelo adecuado para aplicaciones CPU. Consulte las métricas de rendimiento deYOLO11 para obtener referencias detalladas.
Casos prácticos:
YOLO11 está especialmente indicado para aplicaciones en las que la velocidad de inferencia es primordial, como el análisis de vídeo en tiempo real, la robótica y los dispositivos de borde con recursos computacionales limitados. Su eficiencia lo hace ideal para su despliegue en escenarios que requieren una rápida detección de objetos sin sacrificar la precisión. Entre sus aplicaciones se incluyen la gestión de residuos, la conservación del medio ambiente y las soluciones para automoción.
Puntos fuertes:
- Velocidad de inferencia superior: Diseñado para una inferencia más rápida, especialmente en CPU.
- Precisión competitiva: Mantiene una gran precisión, a menudo superior a YOLOv8 en los modelos de menor tamaño.
- Arquitectura eficiente: Optimizada para entornos con recursos limitados y despliegue en los bordes.
- Último modelo de Ultralytics : Se beneficia de los avances más recientes y del soporte de Ultralytics.
Debilidades:
- Aumento marginal de la precisión en modelos más grandes: Los modelos YOLO11 de mayor tamaño muestran sólo ligeras mejoras de precisión con respecto a YOLOv8 , aunque siguen siendo intensivos desde el punto de vista computacional.
- Modelo más nuevo: Al ser más nuevo, puede tener una comunidad más pequeña y menos integraciones de terceros en comparación con YOLOv8.
Tabla comparativa de modelos
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Conclusión
La elección entre YOLOv8 y YOLO11 depende de los requisitos específicos de la aplicación. YOLOv8 ofrece una solución robusta y versátil adecuada para una amplia gama de tareas, con un equilibrio eficaz entre precisión y velocidad. Es un modelo maduro y bien respaldado, ideal para necesidades de detección de objetos de uso general. YOLO11, por su parte, se ha diseñado para optimizar la velocidad, lo que lo convierte en una opción superior cuando el tiempo de inferencia es crítico, especialmente en escenarios CPU o de edge computing. Para aplicaciones que exigen el mayor rendimiento posible en tiempo real con una precisión competitiva, YOLO11 es la opción preferida.
Los usuarios interesados en explorar otros modelos también pueden considerar:
- YOLOv5: Para un modelo bien establecido y ampliamente utilizado con una gran comunidad. Comparación entreYOLOv5 y YOLOv8 .
- YOLOv9: para modelos centrados en mejoras de precisión e innovaciones arquitectónicas. Documentación de YOLOv9.
- FastSAM: Para tareas de segmentación extremadamente rápidas. Documentación deFastSAM .