Ir al contenido

YOLOv5 PP-YOLOE+: comparación técnica de detectores de objetos en tiempo real

Seleccionar la arquitectura óptima para la detección de objetos es una decisión crítica que afecta a la eficiencia, la precisión y la escalabilidad de las aplicaciones de visión artificial. Esta guía ofrece una comparación técnica detallada entre YOLOv5, el estándar adoptado a nivel mundial para la IA accesible, y PP-YOLOE+, una arquitectura en evolución del PaddlePaddle .

Si bien PP-YOLOE+ introduce conceptos interesantes sin anclajes, YOLOv5 sigue siendo una fuerza dominante debido a su ecosistema sin igual, su robustez y su equilibrio entre velocidad y precisión. Para los desarrolladores que miran hacia el futuro, también abordamos YOLO26, que redefine el rendimiento de vanguardia con inferencia NMS.

Métricas de rendimiento y puntos de referencia

La compensación entre la precisión media (mAP) y la latencia de inferencia define la utilidad de un modelo. La siguiente tabla compara el rendimiento de YOLOv5 PP-YOLOE+ en el COCO .

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

YOLOv5 de Ultralytics YOLOv5

Publicado en 2020 por Glenn Jocher y Ultralytics, YOLOv5 revolucionó el campo al hacer que la detección de objetos de alto rendimiento fuera accesible para todos. Creado de forma nativa en PyTorch, priorizó la usabilidad «de principio a fin», lo que permitió a los desarrolladores pasar del conjunto de datos a la implementación en un tiempo récord.

Arquitectura y Diseño

YOLOv5 una red troncal CSPDarknet (Cross Stage Partial Network) para maximizar el flujo de gradiente y minimizar el coste computacional. Emplea un cabezal de detección basado en anclajes, que utiliza cuadros de anclaje predefinidos para predecir la ubicación de los objetos. Este enfoque ha sido probado en la práctica y proporciona una convergencia estable en una amplia variedad de conjuntos de datos, desde imágenes aéreas hasta exploraciones médicas.

Ventajas clave

  • Preparación para la producción: YOLOv5 utiliza en millones de aplicaciones en todo el mundo, lo que garantiza una estabilidad extrema.
  • Versatilidad: además de la detección, admite de forma nativa la segmentación de instancias y la clasificación de imágenes.
  • Exportabilidad: El modelo ofrece una exportación fluida a ONNX, TensorRT, CoreML y TFLite diversos objetivos de hardware.

Más información sobre YOLOv5

Visión general de PP-YOLOE+

PP-YOLOE+ es una evolución de PP-YOLOE, desarrollado por los PaddlePaddle en Baidu. Lanzado en abril de 2022, se centra en mejorar el mecanismo sin anclaje y perfeccionar la arquitectura troncal para entornos informáticos de alto rendimiento.

Arquitectura y Diseño

PP-YOLOE+ adopta un paradigma sin anclaje, lo que elimina la necesidad de ajustar los hiperparámetros de la caja de anclaje. Utiliza una estructura CSPRepResStage, que combina conexiones residuales con técnicas de reparametrización (estilo RepVGG) para acelerar la inferencia y mantener la capacidad de extracción de características. También emplea el aprendizaje de alineación de tareas (TAL) para alinear mejor las tareas de clasificación y localización durante el entrenamiento.

Consideraciones sobre casos de uso

Aunque PP-YOLOE+ alcanza mAP alto mAP el COCO , está estrechamente vinculado al PaddlePaddle . Esto puede suponer un reto para los equipos cuya infraestructura se basa en TensorFlow estándar PyTorch TensorFlow . Su principal ventaja reside en escenarios en los que se prioriza la máxima precisión frente a la flexibilidad de implementación o la facilidad de entrenamiento.

Más información sobre PP-YOLOE+

Comparación Técnica Detallada

1. Metodología de formación y facilidad de uso

Una de las diferencias fundamentales radica en la experiencia del usuario. YOLOv5 es famoso por su flujo de trabajo «Zero to Hero». El Ultralytics automatiza tareas complejas como el aumento de datos (Mosaic, MixUp) y la evolución de hiperparámetros.

  • YOLOv5: Utiliza una interfaz de línea de comandos (CLI) intuitiva o Python . Gestiona automáticamente los cálculos de los cuadros de anclaje mediante AutoAnchor, lo que garantiza que el modelo se adapte a los conjuntos de datos personalizados sin intervención manual.
  • PP-YOLOE+: Se basa en el sistema de configuración PaddleDetection. Aunque es potente, a menudo requiere un conocimiento más profundo de los archivos de configuración específicos y del PaddlePaddle , lo que supone una curva de aprendizaje más pronunciada para muchos desarrolladores.

2. Velocidad de inferencia y despliegue

YOLOv5 su velocidadCPU , lo que lo convierte en la mejor opción para aplicaciones de IA periférica en dispositivos como Raspberry Pi o teléfonos móviles. Como se muestra en la tabla, el modelo YOLOv5n (Nano) alcanza velocidades increíbles, fundamentales para el seguimiento en tiempo real.

PP-YOLOE+ se centra principalmente en GPU utilizando TensorRT. Aunque funciona bien en hardware de nivel servidor (como la GPU T4), a menudo carece de la optimización ligera necesaria paraGPU en comparación con la Ultralytics , altamente optimizada.

3. Eficiencia de la memoria

Ultralytics están diseñados para ser eficientes en cuanto a memoria. El proceso de entrenamiento YOLOv5 está optimizado para ejecutarse en GPU de consumo, lo que democratiza el acceso a la IA. Por el contrario, los diseños arquitectónicos más nuevos basados en transformadores o complejos suelen requerir CUDA significativa, lo que aumenta la barrera de entrada. La arquitectura equilibrada YOLOv5 garantiza que la extracción de características siga siendo robusta sin una sobrecarga innecesaria de parámetros.

Aplicaciones en el mundo real

  • YOLOv5 es la opción ideal para la tecnología agrícola (por ejemplo, la detección de enfermedades en los cultivos) y el análisis minorista, debido a su capacidad para funcionar en dispositivos periféricos en ubicaciones remotas o tiendas sin servidores dedicados.
  • PP-YOLOE+ suele ser adecuado para la inspección industrial en entornos controlados donde se dispone de potentes GPU para manejar cálculos ligeramente más pesados a cambio de ganancias marginales en precisión.

Consejo sobre el flujo de trabajo: la Ultralytics

Al utilizar Ultralytics , obtienes acceso a la Ultralytics . Esta interfaz unificada te permite gestionar conjuntos de datos, entrenar en la nube e implementar en cualquier formato (ONNX, TFLite, etc.) con un solo clic, lo que reduce significativamente la carga de MLOps en comparación con la gestión de scripts de marco sin procesar.

El futuro: actualización a YOLO26

Aunque YOLOv5 un modelo legendario, el campo ha avanzado. Para los desarrolladores que buscan el mejor rendimiento absoluto, recomendamos YOLO26.

YOLO26 representa un cambio de paradigma con su diseño integral NMS. Al eliminar la supresión no máxima (NMS), YOLO26 reduce la latencia de inferencia y la complejidad de implementación. También cuenta con:

  • Optimizador MuSGD: un híbrido de SGD Muon para una estabilidad de entrenamiento de grado LLM.
  • CPU hasta un 43 % más rápida: optimizada específicamente para la computación periférica.
  • ProgLoss + STAL: Funciones de pérdida avanzadas que mejoran la detección de objetos pequeños, un área crítica para las aplicaciones de drones e IoT.

Más información sobre YOLO26

Facilidad de actualización

La migración de YOLOv5 Ultralytics nuevos Ultralytics es muy sencilla gracias a la Python unificada Python .

from ultralytics import YOLO

# Load the latest YOLO26 model (auto-downloads pretrained weights)
model = YOLO("yolo26n.pt")

# Run inference on an image
# The API remains consistent, allowing easy upgrades
results = model("https://ultralytics.com/images/bus.jpg")

# Display results
results[0].show()

Conclusión

Ambas arquitecturas tienen sus ventajas. PP-YOLOE+ ofrece un sólido rendimiento teórico en el COCO para cargas de trabajo GPU. Sin embargo, YOLOv5 sigue siendo el campeón en cuanto a usabilidad, flexibilidad de implementación y rendimiento de vanguardia.

Para la mayoría de los desarrolladores e investigadores, permanecer dentro del Ultralytics garantiza la mantenibilidad a largo plazo y el acceso a los últimos avances. Tanto si se queda con el fiable YOLOv5 se actualiza al innovador YOLO26, se beneficiará de una plataforma altamente optimizada e impulsada por la comunidad, diseñada para el éxito en el mundo real.

Para explorar otras opciones, considere revisar YOLO11 o modelos especializados como RT-DETR para obtener precisión basada en transformadores.


Comentarios