Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 frente a PP-YOLOE+#

El campo de la visión artificial ha experimentado una rápida evolución en los modelos de detección de objetos en tiempo real. Para los ingenieros de ML e investigadores que buscan desplegar los modelos de IA de visión más eficientes, comparar arquitecturas como Ultralytics YOLO26 y PP-YOLOE+ es fundamental. Esta guía completa ofrece un análisis detallado de sus arquitecturas, metodologías de entrenamiento, métricas de rendimiento y escenarios ideales de despliegue en el mundo real.

Link to this sectionOrígenes y metadatos del modelo#

Entender los antecedentes de estas arquitecturas de visión artificial ayuda a contextualizar sus filosofías de diseño y entornos de destino.

Visión general de YOLO26
Lanzado en enero de 2026, YOLO26 representa la cúspide del ecosistema Ultralytics. Está diseñado para ser la solución de IA de borde definitiva, alardeando de una huella más pequeña, procesamiento nativo de extremo a extremo y una velocidad inigualable.

Más información sobre YOLO26

Visión general de PP-YOLOE+
Desarrollado como una evolución de la serie PP-YOLO, PP-YOLOE+ es un detector libre de anclas altamente optimizado para el ecosistema PaddlePaddle. Se basa en una estructura base CSPRepResNet y un ET-head para mejorar las métricas de detección estándar.

Aprende más sobre PP-YOLOE+

Link to this sectionInnovaciones arquitectónicas#

Las diferencias en cómo estos modelos procesan los datos visuales afectan drásticamente sus necesidades de memoria, la estabilidad del entrenamiento y la latencia de inferencia.

Link to this sectionYOLO26: La frontera sin NMS#

YOLO26 introduce varios cambios arquitectónicos innovadores diseñados para un despliegue de modelos simplificado:

  • Diseño de extremo a extremo sin NMS: Basándose en conceptos introducidos por primera vez en YOLOv10, YOLO26 elimina de forma nativa el posprocesamiento de Non-Maximum Suppression (NMS). Esto reduce la variabilidad de la latencia y simplifica enormemente las canalizaciones de despliegue.
  • Eliminación de DFL: Al eliminar Distribution Focal Loss (DFL), el modelo es excepcionalmente más ligero, lo que permite una exportación fluida a formatos como TensorRT y CoreML.
  • Optimizador MuSGD: Inspirado en Kimi K2 de Moonshot AI, YOLO26 lleva las innovaciones de entrenamiento de LLM a la visión artificial. El optimizador híbrido MuSGD (SGD + Muon) asegura una dinámica de entrenamiento altamente estable y una rápida convergencia.
  • ProgLoss + STAL: Estas funciones de pérdida avanzadas producen mejoras notables en el reconocimiento de objetos pequeños, haciendo que la arquitectura sea altamente efectiva para imágenes de drones y aplicaciones agrícolas.

Link to this sectionPP-YOLOE+: Un enfoque centrado en Paddle#

PP-YOLOE+ utiliza un paradigma sin anclas con un enfoque en alta precisión en hardware de servidor estándar. Presenta una estructura RepResNet que mejora las capacidades de extracción de características. Sin embargo, debido a que depende en gran medida de las operaciones específicas disponibles dentro de la pila de aprendizaje profundo de Baidu, modificar la red o exportarla para dispositivos de borde altamente restringidos puede ser significativamente más complejo que con los marcos de trabajo de Ultralytics.

Link to this sectionComparación de rendimiento y métricas#

Un fuerte equilibrio de rendimiento entre velocidad y precisión es crucial para diversos escenarios de despliegue en el mundo real. Mientras que PP-YOLOE+ ofrece una precisión competitiva, YOLO26 logra sistemáticamente un equilibrio más favorable, especialmente al evaluar la velocidad de inferencia en CPUs y un menor uso de memoria.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59

Gracias a optimizaciones específicas para el borde y la eliminación de DFL, YOLO26 ofrece hasta un 43% más de rapidez en la inferencia por CPU en comparación con sus predecesores, superando ampliamente a PP-YOLOE+ cuando se despliega en dispositivos como Raspberry Pi o unidades de computación de borde estándar.

Eficiencia de memoria

Al comparar arquitecturas de modelos, ten en cuenta que los modelos YOLO de Ultralytics mantienen un uso de memoria mucho menor durante el entrenamiento que los complejos modelos Transformer, lo que los hace altamente accesibles para la creación de prototipos rápidos en GPUs de grado de consumidor.

Link to this sectionLa ventaja del ecosistema Ultralytics#

Aunque PP-YOLOE+ es un modelo capaz, el verdadero diferenciador radica en la experiencia del desarrollador. El ecosistema Ultralytics integrado proporciona un entorno inigualable para los profesionales de la IA de visión.

  1. Facilidad de uso: Ultralytics ofrece una experiencia de usuario optimizada. Una API de Python sencilla abstrae la complejidad de las canalizaciones de datos y los bucles de entrenamiento, respaldada por una documentación extensa y mantenida activamente.
  2. Versatilidad: A diferencia de PP-YOLOE+, que se centra principalmente en la detección de objetos, YOLO26 admite clasificación de imágenes, segmentación de instancias, estimación de poses y cajas delimitadoras orientadas (OBB) de forma nativa utilizando la misma estructura de API.
  3. Eficiencia de entrenamiento: La descarga automatizada de pesos preentrenados fácilmente disponibles, junto con aumentaciones avanzadas, garantiza procesos de entrenamiento eficientes que requieren menos memoria CUDA y tiempo en comparación con los marcos de trabajo tradicionales.

Link to this sectionEjemplo de código: Simplicidad en acción#

El siguiente código de Python válido demuestra lo fácil que es iniciar un proyecto de IA utilizando la API de Ultralytics:

from ultralytics import YOLO

# Load a pre-trained YOLO26 nano model for optimal edge performance
model = YOLO("yolo26n.pt")

# Train the model effortlessly on the COCO8 dataset
results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device="cpu")

# Perform NMS-free inference on a target image
inference_results = model.predict("https://ultralytics.com/images/bus.jpg")

# Export to ONNX format for deployment
model.export(format="onnx")

Link to this sectionAplicaciones ideales en el mundo real#

Decidir entre YOLO26 y PP-YOLOE+ depende en gran medida de las restricciones de tu entorno de producción.

Cuándo desplegar PP-YOLOE+:

  • Integración con el ecosistema de Baidu: Proyectos profundamente arraigados en la infraestructura de PaddlePaddle o en entornos de fabricación asiáticos específicos donde las pilas de hardware y software de Baidu son aplicadas estrictamente.
  • Procesamiento por lotes del lado del servidor: Escenarios que se ejecutan en hardware de grado empresarial donde la fluctuación de latencia causada por NMS es menos preocupante.

Cuándo desplegar YOLO26:

  • Dispositivos de borde e IoT: Las velocidades de CPU de YOLO26, hasta un 43% más rápidas, lo convierten en la opción definitiva para cámaras inteligentes, drones y robótica de bajo consumo.
  • Despliegues críticos en tiempo: La arquitectura nativamente libre de NMS garantiza una inferencia estable de latencia ultrabaja, crucial para la investigación en conducción autónoma y el control de calidad en fabricación de alta velocidad.
  • Proyectos multitarea: Cuando un proyecto requiere una combinación de detección de objetos, enmascaramiento preciso mediante segmentación o seguimiento de puntos clave mediante estimación de poses, el marco de trabajo unificado de YOLO26 es indispensable.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLO26 y PP-YOLOE+ depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y las preferencias de ecosistema.

Link to this sectionCuándo elegir YOLO26#

YOLO26 es una excelente opción para:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionCuándo elegir PP-YOLOE+#

Se recomienda PP-YOLOE+ para:

  • Integración con el ecosistema PaddlePaddle: Organizaciones con infraestructura existente construida sobre el marco de trabajo PaddlePaddle de Baidu.
  • Despliegue en el borde con Paddle Lite: Desplegar en hardware con kernels de inferencia altamente optimizados específicamente para el motor de inferencia Paddle Lite o Paddle.
  • Detección de alta precisión en el lado del servidor: Escenarios que priorizan la máxima precisión de detección en potentes servidores GPU donde la dependencia del marco de trabajo no es una preocupación.

Link to this sectionExplorando otras arquitecturas#

Para los usuarios que exploran un espectro más amplio de modelos, también recomendamos revisar YOLO11, la generación anterior altamente confiable de modelos de Ultralytics, que sigue siendo un elemento básico en miles de entornos de producción. Además, para escenarios que requieren mecanismos basados en Transformer, la arquitectura RT-DETR ofrece una alternativa intrigante, aunque con mayores demandas de memoria durante el entrenamiento.

En última instancia, al aprovechar el optimizador MuSGD, las capacidades de ProgLoss + STAL y un diseño sin NMS, YOLO26 consolida su posición como la opción principal para soluciones de IA de visión modernas, escalables y altamente eficientes.

Colaboradores

Comentarios