Meet YOLO26: next-gen vision AI.

Link to this sectionComparativa entre PP-YOLOE+ y YOLOv5#

Al elegir el framework de aprendizaje profundo adecuado para visión artificial, los desarrolladores suelen comparar las capacidades de diferentes arquitecturas para encontrar el equilibrio perfecto entre velocidad, precisión y facilidad de despliegue. En este análisis detallado, exploraremos los matices técnicos entre PP-YOLOE+ y YOLOv5. Al analizar sus arquitecturas, métricas de rendimiento y escenarios de despliegue ideales, podrás tomar una decisión informada para tu próximo proyecto, ya sea que implique robótica en tiempo real, despliegue en el borde o análisis de vídeo basado en la nube.

Link to this sectionOrígenes y metadatos del modelo#

Ambos modelos provienen de equipos de ingeniería altamente capaces, pero se dirigen a ecosistemas ligeramente diferentes. Comprender sus orígenes proporciona un contexto valioso para sus decisiones de diseño arquitectónico.

Detalles de PP-YOLOE+:

Aprende más sobre PP-YOLOE+

Detalles de YOLOv5:

Más información sobre YOLOv5

Link to this sectionComparativa arquitectónica#

Link to this sectionArquitectura de PP-YOLOE+#

PP-YOLOE+ es una evolución dentro del ecosistema de Baidu, construida sobre la base de modelos anteriores como PP-YOLOv2. Introduce una arquitectura dorsal CSPRepResNet altamente optimizada, la cual mejora la extracción de características combinando los principios de las redes Cross Stage Partial (CSP) con técnicas de re-parametrización. Esto permite que el modelo mantenga una alta precisión durante el entrenamiento mientras se reduce a una arquitectura más simplificada para una inferencia más rápida.

Además, PP-YOLOE+ emplea Task Alignment Learning (TAL) y un cabezal eficiente alineado con la tarea (ET-head). Esta combinación tiene como objetivo resolver la falta de alineación entre las tareas de clasificación y localización, un cuello de botella común en los detectores de objetos densos. Aunque es estructuralmente impresionante, la arquitectura está estrechamente vinculada al framework PaddlePaddle, lo que puede plantear desafíos de integración para equipos que estandarizan otras bibliotecas de ML convencionales.

Link to this sectionArquitectura de YOLOv5#

Por el contrario, YOLOv5 fue diseñado de forma nativa en PyTorch, el estándar de la industria tanto para la investigación académica como para la producción empresarial. Utiliza una arquitectura dorsal CSPDarknet53 modificada, conocida por su flujo de gradiente excepcional y eficiencia de parámetros.

Un sello distintivo de YOLOv5 es su algoritmo AutoAnchor, que comprueba y ajusta dinámicamente los tamaños de los cuadros delimitadores (anchor boxes) basándose en tu conjunto de datos personalizado antes del entrenamiento. Esto elimina la necesidad de ajustar manualmente los hiperparámetros para los cuadros delimitadores. El cuello de red Path Aggregation Network (PANet) del modelo asegura una fusión robusta de características a múltiples escalas, haciéndolo altamente eficaz en la detección de objetos de distintos tamaños.

Despliegue optimizado en PyTorch

Dado que YOLOv5 está construido directamente sobre PyTorch, la exportación a formatos optimizados como ONNX y TensorRT requiere significativamente menos configuración de middleware que los modelos vinculados a frameworks localizados.

Link to this sectionAnálisis de rendimiento#

Evaluar estos modelos requiere analizar el equilibrio entre la precisión media (mAP) y la latencia. La siguiente tabla muestra las métricas según los diferentes tamaños de modelo.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4

Aunque PP-YOLOE+ logra puntuaciones de mAP altamente competitivas en las escalas mayores (como la variante X), YOLOv5 ofrece una velocidad superior y un menor número de parámetros en el extremo inferior del espectro. El YOLOv5 Nano (YOLOv5n) requiere apenas 2.6 millones de parámetros, lo que lo hace altamente adecuado para dispositivos de borde restringidos donde los requisitos de memoria son estrictos. Además, el entrenamiento de modelos YOLO suele consumir menos memoria CUDA en comparación con alternativas pesadas basadas en Transformer como RT-DETR.

Link to this sectionLa ventaja de Ultralytics#

Al elegir una arquitectura, las métricas brutas son solo una parte de la ecuación. La experiencia del desarrollador, el soporte del ecosistema y los flujos de trabajo de despliegue a menudo determinan el éxito real de un proyecto. Aquí es donde brillan los modelos de Ultralytics.

Link to this sectionFacilidad de uso inigualable#

La API de Python para Ultralytics abstrae el código repetitivo y complejo. Los desarrolladores pueden iniciar el entrenamiento, validar el rendimiento y desplegar modelos sin complicaciones. La documentación es extensa, se mantiene rigurosamente y cuenta con el apoyo de una enorme comunidad global de código abierto.

Link to this sectionVersatilidad en todas las tareas#

Si bien PP-YOLOE+ es un detector de objetos dedicado, el ecosistema de Ultralytics permite a los usuarios abordar múltiples tareas de visión artificial bajo una única API unificada. Con YOLOv5 y sus sucesores, puedes pasar fácilmente de cuadros delimitadores estándar a flujos de trabajo de Segmentación de imágenes y clasificación.

Link to this sectionEjemplo de código: Entrenamiento de YOLOv5#

Empezar solo requiere unas pocas líneas de código. Esta simplicidad acelera significativamente los ciclos de investigación y desarrollo.

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Run fast inference on an image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this sectionCasos de uso en el mundo real#

Cuándo elegir PP-YOLOE+: Si tu organización está profundamente integrada en la pila de software de Baidu o depende en gran medida de hardware especializado que exige el framework PaddlePaddle, PP-YOLOE+ es un modelo sólido. Se utiliza con frecuencia en procesos de fabricación especializados en toda Asia donde existe integración heredada con Paddle.

Cuándo elegir YOLOv5: Para la gran mayoría de los desarrolladores, investigadores y empresas internacionales, YOLOv5 sigue siendo una potencia. Sus raíces en PyTorch significan que es instantáneamente compatible con herramientas como Weights & Biases para el seguimiento, y se exporta limpiamente a TensorRT para aceleración en GPU NVIDIA o a CoreML para dispositivos Apple. Destaca en diversos campos que van desde el monitoreo de cultivos agrícolas hasta la navegación de drones a alta velocidad.

Link to this sectionEl futuro de la detección: Ultralytics YOLO26#

Aunque YOLOv5 es un modelo icónico, la frontera de la visión artificial ha avanzado. Para todos los desarrollos nuevos, recomendamos encarecidamente migrar a YOLO26, lanzado en enero de 2026. Disponible sin problemas a través de la Plataforma Ultralytics, YOLO26 redefine completamente la eficiencia.

Más información sobre YOLO26

Innovaciones clave en YOLO26:

  • Diseño integral sin NMS: YOLO26 elimina por completo el posprocesamiento de supresión no máxima (Non-Maximum Suppression). Esto reduce la variabilidad de la latencia y simplifica drásticamente el proceso de despliegue.
  • Inferencia en CPU hasta un 43% más rápida: Al eliminar estratégicamente la pérdida focal de distribución (DFL), YOLO26 aumenta drásticamente la velocidad en dispositivos de borde sin GPU.
  • Optimizador MuSGD: Inspirado en los principales modelos de lenguaje grandes (LLM), este optimizador híbrido estabiliza la dinámica de entrenamiento y permite una convergencia mucho más rápida en conjuntos de datos personalizados.
  • Mejoras específicas por tarea: Cuenta con funciones de pérdida avanzadas como ProgLoss y STAL, lo que proporciona una precisión sin precedentes en objetos diminutos. Admite de forma nativa la detección de Oriented Bounding Box (OBB) para imágenes aéreas.

Si estás explorando modelos de visión de vanguardia, también podría interesarte comparar la generación anterior YOLO11 o enfoques basados en Transformer como RT-DETR. En última instancia, el ecosistema robusto, combinado con avances arquitectónicos de vanguardia, consolida a Ultralytics como la opción principal para las tareas modernas de visión artificial.

Colaboradores

Comentarios