Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 frente a PP-YOLOE+#

Elegir la arquitectura de red neuronal correcta es esencial para cualquier proyecto moderno de visión artificial. Cuando los desarrolladores e investigadores evalúan modelos para la detección de objetos en tiempo real, la decisión suele reducirse a equilibrar la precisión, la velocidad de inferencia y la facilidad de implementación. Esta comparativa técnica analiza YOLOv5 y PP-YOLOE+, explorando sus arquitecturas, métricas de rendimiento y metodologías de entrenamiento para ayudarte a seleccionar la solución óptima para tu aplicación.

Link to this sectionComprender las arquitecturas#

Ambos modelos han tenido un impacto significativo en el panorama de la IA de visión, pero abordan los desafíos de la detección de objetos a través de diferentes metodologías estructurales y dependencias de framework.

Link to this sectionUltralytics YOLOv5: El estándar de la industria#

Lanzado a mediados de 2020, Ultralytics YOLOv5 revolucionó la accesibilidad de los modelos de visión de vanguardia. Al ser la primera implementación nativa de PyTorch en la familia YOLO, redujo drásticamente la barrera de entrada para desarrolladores de Python e ingenieros de ML en todo el mundo.

Detalles de YOLOv5:

YOLOv5 utiliza un backbone CSPDarknet modificado, que captura de manera eficiente representaciones ricas de características mientras mantiene un conteo de parámetros ligero. Introdujo cajas de anclaje de autoaprendizaje, calculando automáticamente las dimensiones óptimas de los anclajes para conjuntos de datos personalizados incluso antes de que comience el entrenamiento. Además, su integración de aumento de datos mosaic mejora significativamente la capacidad del modelo para detectar objetos más pequeños y generalizar a través de contextos espaciales complejos.

Una de las mayores fortalezas de YOLOv5 es su increíble versatilidad. A diferencia de los detectores de objetos estándar, la familia YOLOv5 admite a la perfección clasificación de imágenes, segmentación de instancias y detección de cajas delimitadoras dentro de una API unificada. Su arquitectura altamente optimizada también se traduce en un uso de memoria sustancialmente menor durante el entrenamiento y la inferencia en comparación con las redes pesadas basadas en Transformer.

Más información sobre YOLOv5

Link to this sectionPP-YOLOE+: El competidor de PaddlePaddle#

Introducido aproximadamente dos años después, PP-YOLOE+ se basa en los cimientos de iteraciones anteriores de PP-YOLO. Desarrollado para mostrar las capacidades del framework de aprendizaje profundo de Baidu, introduce varios refinamientos arquitectónicos para impulsar la precisión media promedio (mAP).

Detalles de PP-YOLOE+:

PP-YOLOE+ se basa en un paradigma sin anclajes (anchor-free) y utiliza un backbone CSPRepResNet. Incorpora una potente técnica de Task Alignment Learning y un Efficient Task-aligned Head para mejorar la precisión. Si bien PP-YOLOE+ logra puntuaciones de precisión impresionantes, su debilidad principal radica en su estricta dependencia del framework PaddlePaddle. Esto a menudo introduce una curva de aprendizaje pronunciada y fricción en el ecosistema para equipos de investigación y empresas ya profundamente invertidos en entornos de PyTorch o TensorFlow.

Más información sobre PP-YOLOE+

Link to this sectionRendimiento y benchmarks#

Al evaluar estos modelos para producción, es crucial comprender las compensaciones entre precisión, velocidad de inferencia y huella de parámetros. La tabla a continuación describe las métricas de rendimiento clave entre las diferentes variantes de tamaño.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Si bien PP-YOLOE+ logra altos límites de precisión, YOLOv5 demuestra constantemente una eficiencia de parámetros superior y una inferencia más rápida en hardware limitado. Para despliegues en el borde (edge) donde la memoria es escasa, YOLOv5n ofrece una velocidad inigualable y una huella extremadamente pequeña.

Eficiencia de memoria

Los modelos de Ultralytics están diseñados específicamente para la eficiencia en el entrenamiento. En comparación con pesados Vision Transformers como RT-DETR, YOLOv5 utiliza mucha menos memoria CUDA, lo que te permite entrenar con tamaños de lote más grandes o en hardware de consumo.

Link to this sectionLa ventaja de Ultralytics: Ecosistema y facilidad de uso#

El verdadero valor de una arquitectura de aprendizaje automático se extiende más allá de los números brutos; abarca toda la experiencia del desarrollador. La Plataforma Ultralytics y sus herramientas de código abierto correspondientes proporcionan un ecosistema altamente refinado y bien mantenido que acelera drásticamente los ciclos de desarrollo.

  • Facilidad de uso: Ultralytics abstrae el código repetitivo complejo. Puedes entrenar, validar y probar modelos a través de una intuitiva API de Python o CLI.
  • Flexibilidad de despliegue: Exportar modelos es increíblemente sencillo. Con un solo comando, puedes convertir tus pesos de YOLOv5 entrenados a formatos como ONNX, TensorRT u OpenVINO, asegurando una amplia compatibilidad en entornos de borde y nube.
  • Comunidad activa: La vibrante comunidad garantiza actualizaciones frecuentes, documentación extensa y soluciones robustas a desafíos comunes de visión artificial.

Por el contrario, PP-YOLOE+ depende en gran medida de archivos de configuración complejos específicos de PaddleDetection, lo que puede ralentizar la creación rápida de prototipos y complicar la integración en pipelines modernos de MLOps.

Link to this sectionImplementaciones prácticas y ejemplos de código#

Comenzar con Ultralytics es notablemente sencillo. Aquí tienes un ejemplo completo y ejecutable de cómo cargar un modelo YOLOv5 preentrenado, entrenarlo en un conjunto de datos personalizado y exportar los resultados:

from ultralytics import YOLO

# Load a pretrained YOLOv5 small model
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 dataset for 50 epochs
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference on a sample image
predict_results = model("https://ultralytics.com/images/bus.jpg")

# Export the optimized model to ONNX format
path = model.export(format="onnx")

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLOv5 y PP-YOLOE+ depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y las preferencias del ecosistema.

Link to this sectionCuándo elegir YOLOv5#

YOLOv5 es una opción sólida para:

  • Sistemas de producción probados: Despliegues existentes donde se valora la larga trayectoria de estabilidad, la extensa documentación y el enorme soporte de la comunidad de YOLOv5.
  • Entrenamiento con recursos limitados: Entornos con recursos de GPU limitados donde la eficiente canalización de entrenamiento de YOLOv5 y sus menores requisitos de memoria son ventajosos.
  • Amplio soporte de formatos de exportación: Proyectos que requieren despliegue en muchos formatos, incluidos ONNX, TensorRT, CoreML y TFLite.

Link to this sectionCuándo elegir PP-YOLOE+#

Se recomienda PP-YOLOE+ para:

  • Integración con el ecosistema PaddlePaddle: Organizaciones con infraestructura existente construida sobre el marco de trabajo PaddlePaddle de Baidu.
  • Despliegue en el borde con Paddle Lite: Desplegar en hardware con kernels de inferencia altamente optimizados específicamente para el motor de inferencia Paddle Lite o Paddle.
  • Detección de alta precisión en el lado del servidor: Escenarios que priorizan la máxima precisión de detección en potentes servidores GPU donde la dependencia del marco de trabajo no es una preocupación.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionOtros modelos de vanguardia a considerar#

Si bien YOLOv5 es un estándar robusto y probado, el campo de la visión artificial avanza rápidamente. Para los equipos que comienzan nuevos proyectos, recomendamos encarecidamente explorar nuestras arquitecturas más recientes.

Link to this sectionUltralytics YOLO26#

Lanzado en enero de 2026, YOLO26 representa el pináculo absoluto de nuestra investigación. Ofrece mejoras masivas tanto en precisión como en velocidad. Las innovaciones clave incluyen:

  • Diseño integral sin NMS: Basándose en conceptos de YOLOv10, YOLO26 elimina de forma nativa el posprocesamiento de supresión no máxima (NMS), reduciendo la latencia y simplificando la lógica de despliegue.
  • Eliminación de DFL: Al eliminar la Distribution Focal Loss, YOLO26 logra una inferencia en CPU hasta un 43% más rápida, lo que lo hace increíblemente potente para dispositivos de borde de baja potencia.
  • Optimizador MuSGD: Inspirado en técnicas avanzadas de entrenamiento de LLM, este híbrido de SGD y Muon garantiza ejecuciones de entrenamiento excepcionalmente estables y una convergencia más rápida.
  • ProgLoss + STAL: Estas funciones de pérdida avanzadas ofrecen mejoras notables en el reconocimiento de objetos pequeños, lo cual es crítico para imágenes de drones y agricultura inteligente.

Además, puedes considerar YOLO11, que ofrece un rendimiento excelente y sirve como un puente altamente confiable entre los sistemas heredados y las capacidades de vanguardia de YOLO26.

Link to this sectionCasos de uso en el mundo real#

La elección entre YOLOv5 y PP-YOLOE+ depende en última instancia de tu entorno de despliegue y de las restricciones del proyecto.

Aplicaciones ideales de YOLOv5: Los requisitos mínimos de recursos y la increíble facilidad de uso de YOLOv5 lo convierten en la opción principal para edge AI. Destaca en aplicaciones que requieren altas tasas de fotogramas en hardware limitado, como robótica en tiempo real, integración de aplicaciones móviles y sistemas de monitoreo de tráfico con múltiples cámaras. Su capacidad para manejar simultáneamente tareas de estimación de pose y cajas delimitadoras orientadas (OBB) dentro del mismo framework lo hace altamente adaptable.

Aplicaciones ideales de PP-YOLOE+: PP-YOLOE+ es más adecuado para escenarios donde se prioriza la precisión máxima absoluta en imágenes estáticas sobre las restricciones de procesamiento en tiempo real. Encuentra un uso específico en pipelines de inspección industrial, particularmente dentro de sectores de fabricación asiáticos que tienen stacks técnicos preestablecidos profundamente invertidos en el ecosistema de Baidu y PaddlePaddle.

En resumen, aunque PP-YOLOE+ ofrece puntos de referencia de precisión sólidos, los modelos YOLO de Ultralytics proporcionan una combinación inigualable de equilibrio de rendimiento, despliegue fluido y diseño amigable para el desarrollador que impulsa proyectos exitosos de visión artificial desde el concepto hasta la producción.

Colaboradores

Comentarios