Ir al contenido

YOLOv8 vs YOLO11: Evolución de la detección de objetos en tiempo real

Elegir la arquitectura de visión por ordenador adecuada es una decisión crítica que repercute en la velocidad, precisión y escalabilidad de sus proyectos de IA. Esta guía proporciona una comparación técnica en profundidad entre Ultralytics YOLOv8un estándar ampliamente adoptado en el sector y publicado en 2023, y Ultralytics YOLO11la última evolución de la serie YOLO , diseñada para ofrecer una eficiencia y un rendimiento superiores. Analizaremos sus diferencias arquitectónicas, métricas de referencia y casos de uso ideales para ayudarle a seleccionar el mejor modelo para sus necesidades.

Ultralytics YOLOv8

Autores: Glenn Jocher, Ayush Chaurasia y Jing Qiu
Organización:Ultralytics
Fecha: 2023-01-10
GitHubultralytics
Docsyolov8

Lanzado a principios de 2023, YOLOv8 marcó un hito importante en la historia de la detección de objetos. Introdujo un marco unificado que admite múltiples tareas de visión por ordenador, como la detección, la segmentación de instancias, la estimación de poses y la clasificación de imágenes, enun único repositorio. YOLOv8 se alejó de la detección basada en anclajes para adoptar un enfoque sin anclajes, lo que simplifica el diseño y mejora la generalización a través de diferentes formas de objetos.

Arquitectura y Características Clave

YOLOv8 sustituyó a los módulos C3 que se encontraban en YOLOv5 por el módulo C2f (Cross-Stage Partial bottleneck con dos convoluciones). Este cambio mejoró el flujo de gradientes y la integración de funciones, manteniendo al mismo tiempo un peso ligero. La arquitectura también incluye un cabezal desacoplado que separa las tareas de objetividad, clasificación y regresión para aumentar la precisión.

Legado de fiabilidad

YOLOv8 se ha probado en miles de aplicaciones comerciales, desde la automatización de la fabricación hasta los vehículos autónomos, estableciendo una reputación de estabilidad y facilidad de despliegue.

Fortalezas y Debilidades

  • Ventajas:
    • Ecosistema maduro: Respaldado por una amplia gama de tutoriales, integraciones y guías de implantación de la comunidad.
    • Versatilidad: Soporta de forma nativa OBB (Oriented Bounding Box) y clasificación junto con la detección estándar.
    • Estabilidad probada: Una elección segura para entornos de producción que requieren un modelo con una larga track .
  • Debilidades:
    • Eficacia de la velocidad: Aunque es rápido, es superado por YOLO11 en velocidad de inferencia de CPU y eficiencia de parámetros.
    • Requisitos de cálculo: Las variantes más grandes (L, X) exigen más VRAM y FLOPs en comparación con los equivalentes YOLO11 optimizados.
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

Más información sobre YOLOv8

Ultralytics YOLO11

Autores: Glenn Jocher y Jing Qiu
Organización:Ultralytics
Fecha: 2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 representa la vanguardia de la familia de modelos Ultralytics . Diseñado para redefinir la inferencia en tiempo real, se basa en los éxitos de YOLOv8 pero introduce importantes mejoras arquitectónicas. YOLO11 se centra en maximizar la precisión a la vez que minimiza el coste computacional, lo que lo convierte en la primera opción para las aplicaciones modernas de IA, desde dispositivos periféricos hasta servidores en la nube.

Arquitectura y Características Clave

YOLO11 introduce el bloque C3k2 y el módulo C2PSA (Cross-Stage Partial with Spatial Attention). Estos componentes mejoran la capacidad del modelo para extraer características complejas y gestionar la oclusión con mayor eficacia que las iteraciones anteriores. La arquitectura se ha optimizado para aumentar la velocidad y ofrecer tiempos de procesamiento significativamente más rápidos en CPU, un factor crítico para las implantaciones de IA en los bordes, donde los recursos de GPU pueden no estar disponibles.

El modelo mantiene la interfaz unificada característica de Ultralytics, garantizando que los desarrolladores puedan cambiar entre tareas como OBB o segmentación sin cambiar su flujo de trabajo.

Fortalezas y Debilidades

  • Ventajas:
    • Eficiencia superior: Consigue un mayor mAP con hasta un 22% menos de parámetros que YOLOv8, reduciendo el tamaño del modelo y las necesidades de almacenamiento.
    • Inferencia más rápida: Optimizado específicamente para el hardware moderno, ofrece velocidades más rápidas en los backends de CPU y GPU .
    • Extracción de características mejorada: La nueva columna vertebral mejora la detección de objetos pequeños y el rendimiento en escenas desordenadas.
    • Menor uso de memoria: Requiere menos memoria CUDA durante el entrenamiento en comparación con modelos basados en transformadores como RT-DETRlo que permite el entrenamiento en hardware más accesible.
  • Debilidades:
    • Versión más reciente: Al tratarse de un modelo reciente, las herramientas específicas de nicho de terceros pueden tardar en actualizar completamente el soporte, aunque el ecosistema central de Ultralytics lo soporta desde el primer día.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Más información sobre YOLO11

Cara a cara de rendimiento

La siguiente comparación pone de manifiesto la mayor eficiencia de YOLO11. Aunque YOLOv8 sigue siendo un potente competidor, YOLO11 ofrece sistemáticamente mayor precisiónmAP) con menor complejidad computacional (FLOPs) y mayor velocidad de inferencia. Esto se aprecia especialmente en los modelos "Nano" y "Small", en los que YOLO11n alcanza un mAP de 39,5 en comparación con el 37,3 de YOLOv8n, a la vez que funciona significativamente más rápido en CPU.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Análisis métrico

YOLO11 demuestra una clara ventaja en la relación velocidad-precisión. Por ejemplo, el modelo YOLO11l supera al YOLOv8l en precisión (+0,5 mAP) al tiempo que utiliza aproximadamente un 42% menos de parámetros y funciona un 36% más rápido en CPU.

Ecosistema y facilidad de uso

Ambos modelos se benefician del sólido ecosistemaUltralytics , diseñado para democratizar la IA poniendo la tecnología más avanzada al alcance de todos.

  • API unificada: Pasar de YOLOv8 a YOLO11 es tan sencillo como cambiar la cadena del modelo de yolov8n.pt a datos yolo11n.pt. No es necesario refactorizar el código.
  • Eficacia de la formación: Ultralytics proporciona conjuntos de datos de descarga automática y pesos preentrenados, lo que agiliza el proceso desde la recopilación de datos hasta el entrenamiento del modelo.
  • Versatilidad de despliegue: Ambos modelos admiten la exportación con un solo clic a formatos como ONNX, TensorRT, CoreML y TFLite, lo que facilita el despliegue en hardware diverso, incluidos Raspberry Pis, teléfonos móviles e instancias en la nube.
  • Bien mantenido: Las actualizaciones frecuentes garantizan la compatibilidad con las últimas versiones de PyTorch y CUDA, respaldadas por una comunidad activa en Discord y GitHub.

Conclusión y recomendaciones

En YOLOv8 sigue siendo un modelo fiable y muy capaz, adecuado para el mantenimiento de sistemas heredados, YOLO11 es la recomendación clara para todo nuevo desarrollo.

  • Elija YOLO11 si: Necesita la mayor precisión posible, velocidades de inferencia más rápidas (especialmente en la CPU), o está desplegando en dispositivos de borde con recursos limitados donde la memoria y el almacenamiento son premium. Sus mejoras arquitectónicas proporcionan una base de futuro para aplicaciones comerciales.
  • Elija YOLOv8 si: Tiene un pipeline existente muy ajustado para comportamientos específicos de v8 o está limitado por estrictos requisitos del proyecto que impiden la actualización a la arquitectura más reciente.

Para aquellos interesados en explorar otras arquitecturas, los documentos de Ultralytics también cubren modelos como YOLOv9, YOLOv10y RT-DETR. Puedes ver comparaciones más amplias en nuestra página de comparación de modelos.


Comentarios