Ir al contenido

Ultralytics YOLOv8 YOLO11: evolución arquitectónica y análisis del rendimiento

La evolución de las arquitecturas de detección de objetos ha sido rápida, y cada iteración ha aportado mejoras significativas en cuanto a precisión, velocidad y facilidad de uso. Ultralytics YOLOv8, lanzado a principios de 2023, estableció un nuevo estándar de versatilidad y facilidad de uso en la visión artificial. A finales de 2024, Ultralytics YOLO11 , que perfeccionó la arquitectura para lograr una mayor eficiencia y rendimiento en una gama más amplia de tareas.

Esta guía completa compara estos dos potentes modelos, analizando sus diferencias arquitectónicas, métricas de rendimiento y casos de uso ideales para ayudarte a elegir la herramienta adecuada para tu próximo proyecto de visión artificial.

Descripción general del modelo

Antes de entrar en las especificaciones técnicas, es esencial comprender el contexto y los objetivos que hay detrás del desarrollo de cada modelo. Ambos son fruto del compromiso Ultralytics por crear una IA visual accesible y de vanguardia.

Ultralytics YOLOv8

Lanzado en enero de 2023, YOLOv8 un hito importante al unificar múltiples tareas (detección, segmentación, clasificación, estimación de poses y OBB) en una única API fácil de usar. Introdujo una nueva columna vertebral y un cabezal de detección sin anclajes, lo que lo hace muy versátil para diversas aplicaciones.

Detalles Clave:

Más información sobre YOLOv8

Ultralytics YOLO11

Lanzado en septiembre de 2024, YOLO11 en los sólidos cimientos de YOLOv8. Se centra en mejoras arquitectónicas para aumentar la eficiencia de la extracción de características y la velocidad de procesamiento. YOLO11 diseñado para ofrecer una mayor precisión con menos parámetros, lo que lo hace especialmente eficaz para aplicaciones periféricas en tiempo real.

Detalles Clave:

Más información sobre YOLO11

Última Innovación: YOLO26

Si bien YOLO11 un avance significativo con respecto a YOLOv8, los desarrolladores que busquen lo último en tecnología deberían explorar YOLO26. Lanzado en 2026, introduce un diseño integral NMS, el optimizador MuSGD y CPU hasta un 43 % más rápida, lo que establece un nuevo punto de referencia para la IA de nivel de producción.

Diferencias Arquitectónicas

La transición de YOLOv8 YOLO11 varios cambios arquitectónicos clave destinados a optimizar el equilibrio entre el coste computacional y la precisión.

Backbone y Extracción de Características

YOLOv8 una estructura CSPDarknet53 modificada con módulos C2f, que sustituyeron a los módulos C3 de generaciones anteriores. Este diseño mejoró el flujo de gradiente y la riqueza de características.

YOLO11 aún más esto al refinar las estructuras de cuello de botella y los mecanismos de atención dentro de la columna vertebral. Estos cambios permiten al modelo capturar patrones más complejos y jerarquías espaciales con una menor sobrecarga computacional. Esto es especialmente beneficioso para tareas difíciles como la detección de objetos pequeños en imágenes aéreas o el control de calidad en la fabricación.

Jefe de Arquitectura

Ambos modelos emplean cabezas sin anclaje, lo que simplifica el proceso de entrenamiento y mejora la generalización entre diferentes formas de objetos. Sin embargo, YOLO11 técnicas de fusión de características más avanzadas en el cuello y la cabeza, lo que da como resultado una mejor precisión de localización y separación de clases en comparación con YOLOv8.

Análisis de rendimiento

A la hora de seleccionar un modelo para la producción, son fundamentales métricas como la precisión media (mAP), la velocidad de inferencia y el tamaño del modelo. La siguiente tabla ofrece una comparación detallada de los pesos preentrenados en el COCO .

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Conclusiones clave sobre el rendimiento

  • Eficiencia: YOLO11 son sistemáticamente más ligeros (menos parámetros) y rápidos (menor latencia) que sus YOLOv8 , al tiempo que alcanzan una mayor precisión. Por ejemplo, YOLO11n es aproximadamente un 22 % más rápido enONNX CPU que YOLOv8n ofrece un mAP más alto.
  • Cálculo: La reducción de FLOP en YOLO11 lo YOLO11 una excelente opción para dispositivos alimentados por batería o con recursos limitados, como teléfonos móviles o sensores IoT integrados.
  • Precisión: Las mAP YOLO11, especialmente en las variantes de modelos más pequeños (Nano y Small), son significativas para aplicaciones que requieren una alta fiabilidad sin necesidad de un hardware pesado.

Entrenamiento y facilidad de uso

Una de las fortalezas que definen al Ultralytics es la experiencia de usuario unificada y simplificada. Tanto YOLOv8 YOLO11 la misma API intuitiva, lo que permite a los desarrolladores cambiar entre arquitecturas con un solo cambio en la línea de código.

La ventaja de Ultralytics

A diferencia de los complejos modelos de transformadores, que a menudo requieren grandes cantidades de GPU y una configuración intrincada, Ultralytics están optimizados para la eficiencia del entrenamiento. Se pueden entrenar de manera eficaz en GPU de consumo, lo que democratiza el acceso a la IA de alto rendimiento.

Las características comunes a ambos modelos incluyen:

  • Python sencilla Python : carga, entrena e implementa modelos en cuestión de minutos.
  • Documentación sólida: guías completas sobre ajuste de hiperparámetros, aumento de datos e implementación.
  • Integración en el ecosistema: Compatibilidad perfecta con la Ultralytics para la gestión de conjuntos de datos, la formación remota y la exportación de modelos con un solo clic.

Ejemplo de entrenamiento:

El siguiente código muestra lo fácil que es cambiar entre el entrenamiento de YOLOv8 YOLO11.

from ultralytics import YOLO

# Load a YOLOv8 model
model_v8 = YOLO("yolov8n.pt")
# Train YOLOv8
model_v8.train(data="coco8.yaml", epochs=100, imgsz=640)

# Load a YOLO11 model - Same API!
model_11 = YOLO("yolo11n.pt")
# Train YOLO11
model_11.train(data="coco8.yaml", epochs=100, imgsz=640)

Casos de Uso Ideales

Aunque ambos modelos son muy eficaces, sus puntos fuertes específicos los hacen adecuados para diferentes situaciones.

Cuándo elegir YOLOv8

YOLOv8 una opción sólida y fiable, especialmente para:

  • Proyectos heredados: tuberías existentes ya optimizadas para YOLOv8 requieren estabilidad sin necesidad inmediata de actualizaciones arquitectónicas.
  • Amplios recursos comunitarios: debido a su mayor tiempo en el mercado, YOLOv8 una extensa biblioteca de tutoriales, vídeos e implementaciones comunitarias de terceros.
  • Visión de propósito general: excelente para tareas estándar de detección de objetos en las que la optimización extrema de los bordes no es la principal limitación.

Cuándo elegir YOLO11

YOLO11 la opción recomendada para la mayoría de las nuevas implementaciones, especialmente para:

  • Edge Computing: Su menor número de parámetros y su mayor velocidad de inferencia lo hacen ideal para Raspberry Pi, Jetson Nano e implementaciones móviles.
  • Aplicaciones en tiempo real: fundamentales para tareas como la conducción autónoma o las líneas de fabricación de alta velocidad, donde cada milisegundo de latencia cuenta.
  • Tareas complejas: Las mejoras arquitectónicas aumentan el rendimiento en situaciones difíciles, como la estimación de posturas para el análisis deportivo o la segmentación de instancias para imágenes médicas.

Versatilidad en todas las tareas

Tanto YOLOv8 YOLO11 una amplia gama de tareas más allá de la simple detección de cuadros delimitadores, incluyendo segmentación de instancias, estimación de poses, cuadros delimitadores orientados (OBB) y clasificación. Esta versatilidad permite a los desarrolladores resolver problemas multifacéticos utilizando un único marco.

Conclusión

Tanto YOLOv8 YOLO11 la cúspide de la visión artificial eficiente. YOLOv8 estableció un estándar versátil y fácil de usar que impulsó innumerables aplicaciones de IA en todo el mundo. YOLO11 perfecciona este legado, ofreciendo una arquitectura optimizada, más rápida y precisa que amplía los límites de lo que es posible en los dispositivos periféricos.

Para los desarrolladores que comienzan nuevos proyectos hoy en día, YOLO11 ofrece un equilibrio superior entre velocidad y precisión. Sin embargo, para aquellos que exigen las últimas innovaciones, como la detección integral NMS y las funciones de pérdida optimizadas, recomendamos encarecidamente explorar el recién lanzado YOLO26, que representa el futuro de la IA de visión en tiempo real.

Lecturas adicionales

Otros Modelos para Explorar

  • YOLO26: El último modelo de vanguardia de Ultralytics enero de 2026) con diseño NMS.
  • RT-DETR: Detector basado en transformador que ofrece una alta precisión para situaciones en las que la velocidad no es tan importante.
  • SAM : Modelo Segment Anything de Meta, ideal para tareas de segmentación sin entrenamiento previo.

Comentarios