Ir al contenido

YOLOv5 YOLO11: tendiendo un puente entre la tradición y la innovación en la detección de objetos

La evolución de la arquitectura YOLO You Only Look Once) ha sido un viaje decisivo en el campo de la visión artificial. Desde la fiabilidad fundamental de YOLOv5 la eficiencia avanzada de YOLO11, cada iteración ha ampliado los límites de la velocidad y la precisión. Esta guía ofrece una comparación técnica detallada para ayudar a los desarrolladores, investigadores e ingenieros a elegir el modelo adecuado para sus necesidades específicas de implementación.

Descripción general del modelo

YOLOv5: el estándar del sector

Publicado en 2020 por Glenn Jocher y Ultralytics, YOLOv5 se convirtió rápidamente en el estándar de referencia para la detección práctica de objetos. Fue el primer YOLO implementado de forma nativa en PyTorch, lo que lo hizo excepcionalmente accesible para la comunidad de IA en general. Su equilibrio entre facilidad de uso, sólidas canalizaciones de entrenamiento y flexibilidad de implementación consolidó su lugar en miles de aplicaciones académicas e industriales.

Más información sobre YOLOv5

YOLO11: El sucesor refinado

YOLO11, lanzado en 2024, representa un importante avance en la Ultralytics . Basándose en los avances arquitectónicos de YOLOv8, introduce una estructura central y principal perfeccionada, diseñada para una extracción de características y una eficiencia superiores. YOLO11 en maximizar la relación entre precisión y computación, ofreciendo una precisión media (mAP) más alta con menos parámetros en comparación con sus predecesores.

Más información sobre YOLO11

Última recomendación

Aunque YOLO11 mejoras significativas con respecto a YOLOv5, los desarrolladores que inicien nuevos proyectos en 2026 también deberían evaluar YOLO26. Cuenta con un diseño nativo de extremo a extremo (sin NMS), un innovador optimizador MuSGD y CPU hasta un 43 % más rápida, lo que lo convierte en la mejor opción para la implementación moderna en el borde.

Comparación de Arquitectura Técnica

Backbone y Extracción de Características

YOLOv5 utiliza una red troncal CSPDarknet. Este diseño de red parcial entre etapas fue revolucionario para reducir la redundancia computacional y mantener al mismo tiempo un flujo de gradiente rico. Equilibra eficazmente la profundidad y la anchura, lo que permite al modelo aprender características complejas sin que se dispare el número de parámetros.

YOLO11 desarrolla este concepto con una columna vertebral CSP mejorada (C3k2) e introduce mecanismos de atención espacial mejorados. La arquitectura está específicamente ajustada para capturar detalles minuciosos, lo que aumenta significativamente el rendimiento en la detección de objetos pequeños. Este diseño refinado permite YOLO11 lograr una mayor precisión con un modelo más pequeño.

Cabezal de detección

El cabezal de detección en YOLOv5 se basa en anclajes, es decir, utiliza cuadros de anclaje predefinidos para predecir la ubicación de los objetos. Aunque es eficaz, este enfoque requiere un ajuste cuidadoso de los hiperparámetros de las dimensiones de los anclajes para los conjuntos de datos personalizados.

YOLO11 adopta un cabezal de detección sin anclaje. Este enfoque moderno simplifica el proceso de entrenamiento al predecir directamente los centros y las dimensiones de los objetos, eliminando la necesidad de realizar cálculos de cuadros de anclaje. Esto no solo agiliza el proceso de entrenamiento, sino que también mejora la generalización entre diversas formas y relaciones de aspecto de los objetos.

Métricas de rendimiento

La siguiente tabla destaca las diferencias de rendimiento entre YOLOv5 YOLO11. Una observación clave es la relación entre velocidad y precisión. YOLO11 alcanza YOLO11 mAP más altas, al tiempo que mantiene velocidades de inferencia competitivas o superiores, especialmente en GPU .

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv5n64028.073.61.121.94.5
YOLOv5s64037.4120.71.927.216.5
YOLOv5m64045.4233.94.0321.249.0
YOLOv5l64049.0408.46.6146.5109.1
YOLOv5x64050.7763.211.8986.7205.7
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Análisis:

  • Precisión: YOLO11n (Nano) alcanza un impresionante 39,5 % mAP, superando significativamente el 28,0 % de YOLOv5n. Esto convierte YOLO11 opción muy superior para aplicaciones ligeras que requieren una alta precisión.
  • Velocidad: YOLO11 demuestran velocidades CPU más rápidas en ONNX , lo cual es crucial para la implementación enGPU .
  • Eficiencia: YOLO11 estas mejoras con un número de parámetros comparable o, a menudo, inferior (por ejemplo, YOLO11x frente a YOLOv5x), lo que demuestra la eficiencia de sus optimizaciones arquitectónicas.

Entrenamiento y ecosistema

Facilidad de uso

Ambos modelos se benefician del reconocido Ultralytics , que prioriza la experiencia del desarrollador.

  • YOLOv5 estableció el estándar de «comenzar el entrenamiento en 5 minutos» con su estructura intuitiva y su dependencia de PyTorch .
  • YOLO11 Se integra perfectamente en el sistema unificado. ultralytics Python . Este paquete proporciona una API coherente para todas las tareas, lo que significa que cambiar de Detección a datos Segmentación de instancias o Estimación de pose requiere cambiar solo un argumento de cadena.

Eficiencia del entrenamiento

YOLO11 rutinas de entrenamiento optimizadas que a menudo conducen a una convergencia más rápida. Se han perfeccionado características como el aumento de mosaicos, y el diseño sin anclajes elimina el paso de preprocesamiento de la evolución de anclajes automáticos que se encuentra en YOLOv5. Además, ambos modelos muestran un uso de memoria significativamente menor durante el entrenamiento en comparación con los detectores basados en transformadores como RT-DETR, lo que permite tamaños de lote más grandes en las GPU de consumo.

Formación con la Ultralytics

El entrenamiento YOLO11 increíblemente sencillo utilizando el Python . La misma sintaxis se aplica a YOLOv5 del ultralytics paquete.

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

Versatilidad

Mientras que YOLOv5 soporte para la segmentación y la clasificación más adelante en su ciclo de vida, YOLO11 diseñó desde cero como un sistema de aprendizaje multitarea. Es compatible de forma nativa con:

  • Detección de objetos
  • Segmentación de instancias
  • Clasificación de imágenes
  • Estimación de pose
  • Caja Delimitadora Orientada (OBB)

Esto convierte YOLO11 «navaja suiza» más versátil para procesos complejos de visión artificial en los que se necesitan múltiples tipos de análisis simultáneamente.

Casos de Uso Ideales

Cuándo elegir YOLOv5

  • Sistemas heredados: Si ya dispone de un proceso de producción basado en el formato YOLOv5 específico YOLOv5 o requirements.txt, continuar con YOLOv5 la estabilidad.
  • Restricciones específicas de hardware: en hardware extremadamente antiguo o implementaciones FPGA específicas, la arquitectura más simple de YOLOv5 tener flujos de bits optimizados existentes.
  • Réplica de la investigación: Para reproducir artículos académicos de 2020-2023 que utilizaron YOLOv5 referencia.

Cuándo elegir YOLO11

  • Implementación de IA en el borde: la excelente relación entre velocidad y precisión hace que YOLO11 sea YOLO11 para dispositivos como NVIDIA o Raspberry Pi, especialmente para el procesamiento de vídeo en tiempo real.
  • Requisitos de alta precisión: aplicaciones en imágenes médicas o detección de defectos, donde cada punto porcentual de mAP .
  • Aplicaciones multitarea: los proyectos que requieren estimación de poses (por ejemplo, análisis deportivos) o cuadros delimitadores rotados (por ejemplo, levantamientos aéreos) se benefician de la compatibilidad nativa YOLO11.
  • Formación en la nube: Utilización de la Ultralytics para la gestión optimizada de conjuntos de datos y el entrenamiento de modelos.

Conclusión

Tanto YOLOv5 YOLO11 prueba del compromiso Ultralytics con la excelencia del código abierto. YOLOv5 sigue siendo una herramienta fiable y probada en la práctica. Sin embargo, YOLO11 ofrece una atractiva vía de actualización con sus mejoras arquitectónicas, su precisión superior y su mayor compatibilidad con tareas.

Para los desarrolladores que miran hacia el futuro, la elección es clara: YOLO11 la ventaja de rendimiento necesaria para las aplicaciones modernas. Para aquellos que buscan lo último en tecnología, también recomendamos encarecidamente explorar YOLO26, que introduce la detección integral NMS para una implementación aún más sencilla.

Explora la documentación de YOLO26

Otros modelos que podrían interesarte son YOLOv10 para la investigación del rendimiento en tiempo real o YOLO para la detección de vocabulario abierto.


Comentarios