Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX frente a PP-YOLOE+#

Al diseñar un pipeline de computer vision robusto, seleccionar el modelo de detección de objetos adecuado es una decisión crítica. El panorama de los detectores de objetos en tiempo real es altamente competitivo, con numerosas arquitecturas que se esfuerzan por ofrecer el equilibrio definitivo entre la velocidad de inferencia y la precisión de la detección. En esta comparación técnica, evaluaremos dos modelos destacados: YOLOX y PP-YOLOE+. Al examinar sus diseños arquitectónicos, metodologías de entrenamiento y métricas de rendimiento, nuestro objetivo es proporcionar a los desarrolladores e investigadores la información necesaria para elegir la herramienta correcta para sus entornos de despliegue.

Link to this sectionInnovaciones arquitectónicas y diseño#

Ambos modelos se diseñaron para abordar puntos críticos específicos en iteraciones anteriores de YOLO, pero adoptan enfoques fundamentalmente diferentes para resolver el compromiso entre velocidad y precisión.

Link to this sectionYOLOX: Tendiendo un puente entre la investigación y la industria#

Desarrollado por Zheng Ge, Songtao Liu, Feng Wang, Zeming Li y Jian Sun en Megvii, YOLOX se lanzó el 18 de julio de 2021. Marcó un cambio significativo en la familia YOLO al adoptar completamente un diseño sin anclas (anchor-free). Puedes explorar la investigación fundamental en su Arxiv paper oficial y el código fuente original en el repositorio de GitHub de YOLOX.

YOLOX integra un encabezado desacoplado, separando las tareas de clasificación y regresión, lo que mejora significativamente la velocidad de convergencia durante el entrenamiento. Además, introdujo estrategias avanzadas de asignación de etiquetas como SimOTA para asignar muestras positivas de forma dinámica. Esto hace que el modelo sea altamente eficiente, especialmente en entornos de edge AI donde los recursos computacionales están estrictamente limitados.

Más información sobre YOLOX

Link to this sectionPP-YOLOE+: Detección industrial de alto rendimiento#

Presentado por los autores de PaddlePaddle en Baidu el 2 de abril de 2022, PP-YOLOE+ representa una evolución altamente optimizada de la serie PP-YOLO. Detallado en su publicación en Arxiv, PP-YOLOE+ está profundamente integrado en el ecosistema de Baidu y requiere el framework PaddlePaddle. Las configuraciones del modelo pueden encontrarse en el repositorio de GitHub de PaddleDetection.

PP-YOLOE+ se basa en un potente backbone CSPRepResNet y utiliza un encabezado alineado con tareas eficiente (ET-head) junto con el aprendizaje de alineación de tareas (TAL). Esta arquitectura logra un mean Average Precision (mAP) sobresaliente en el dataset COCO, lo que lo convierte en una opción formidable para la detección de defectos industriales y el procesamiento pesado en servidor donde la precisión se prioriza sobre las dependencias mínimas.

Aprende más sobre PP-YOLOE+

Link to this sectionBenchmarks de rendimiento#

Entender cómo funcionan estos modelos en diferentes escalas es esencial para el despliegue. La tabla a continuación describe las métricas clave, incluyendo mAP y las velocidades de inferencia al exportar a TensorRT.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
PP-YOLOE+t64039.9-2.844.8519.15
PP-YOLOE+s64043.7-2.627.9317.36
PP-YOLOE+m64049.8-5.5623.4349.91
PP-YOLOE+l64052.9-8.3652.2110.07
PP-YOLOE+x64054.7-14.398.42206.59
Consideraciones de despliegue

Mientras que PP-YOLOE+x logra la mayor precisión absoluta, YOLOX ofrece variantes extremadamente ligeras (Nano y Tiny) que son altamente adecuadas para microcontroladores de baja potencia y hardware móvil antiguo.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLOX y PP-YOLOE+ depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y tus preferencias de ecosistema.

Link to this sectionCuándo elegir YOLOX#

YOLOX es una opción sólida para:

  • Investigación en detección sin anclas: Investigación académica que utiliza la arquitectura limpia y sin anclas de YOLOX como base para experimentar con nuevas cabeceras de detección o funciones de pérdida.
  • Dispositivos de borde ultraligeros: Despliegue en microcontroladores o hardware móvil antiguo donde la huella extremadamente pequeña de la variante YOLOX-Nano (0.91M de parámetros) es crítica.
  • Estudios de asignación de etiquetas SimOTA: Proyectos de investigación que investigan estrategias de asignación de etiquetas basadas en transporte óptimo y su impacto en la convergencia del entrenamiento.

Link to this sectionCuándo elegir PP-YOLOE+#

Se recomienda PP-YOLOE+ para:

  • Integración con el ecosistema PaddlePaddle: Organizaciones con infraestructura existente construida sobre el marco de trabajo PaddlePaddle de Baidu.
  • Despliegue en el borde con Paddle Lite: Desplegar en hardware con kernels de inferencia altamente optimizados específicamente para el motor de inferencia Paddle Lite o Paddle.
  • Detección de alta precisión en el lado del servidor: Escenarios que priorizan la máxima precisión de detección en potentes servidores GPU donde la dependencia del marco de trabajo no es una preocupación.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionLa ventaja de Ultralytics: Presentamos YOLO26#

Aunque tanto YOLOX como PP-YOLOE+ ofrecen ventajas distintas, la rápida evolución de la IA exige herramientas que combinen una precisión de vanguardia con una facilidad de uso inigualable. Aquí es donde los modelos de Ultralytics, específicamente el recientemente lanzado Ultralytics YOLO26, superan a los repositorios de investigación heredados.

Lanzado en enero de 2026, YOLO26 establece un nuevo estándar para la object detection moderna y más allá, ofreciendo una experiencia de desarrollador que es sencillamente inigualable por los frameworks competidores.

Link to this sectionPor qué los desarrolladores eligen YOLO26#

  1. Diseño end-to-end sin NMS: Construyendo sobre conceptos iniciados en YOLOv10, YOLO26 es nativamente end-to-end. Al eliminar por completo el posprocesamiento de NMS (Non-Maximum Suppression), garantiza una latencia altamente consistente y simplifica drásticamente los pipelines de exportación para entornos de borde (edge).
  2. Optimización de nueva generación: La estabilidad del entrenamiento está revolucionada por el optimizador MuSGD, un híbrido de SGD y Muon (inspirado en metodologías de LLM como Kimi K2 de Moonshot AI). Esto garantiza una convergencia más rápida. Además, YOLO26 utiliza ProgLoss + STAL para mejorar drásticamente el reconocimiento de objetos pequeños, una característica crucial para aplicaciones relacionadas con aerial imagery y robótica.
  3. Eficiencia de hardware inigualable: Al eliminar Distribution Focal Loss (DFL), YOLO26 reduce drásticamente los requisitos de memoria. Cuenta con una inferencia en CPU hasta un 43% más rápida, convirtiéndolo en la opción definitiva para dispositivos que carecen de aceleración por GPU dedicada.
  4. Versatilidad extrema: A diferencia de PP-YOLOE+, que se centra estrictamente en la detección, YOLO26 ofrece soporte unificado en numerosas tareas. Incorpora una pérdida de segmentación semántica especializada para instance segmentation, estimación de log-verosimilitud residual (RLE) para pose estimation precisa, y mecanismos avanzados de pérdida de ángulo para Oriented Bounding Boxes (OBB).

Más información sobre YOLO26

Link to this sectionIntegración perfecta en el ecosistema#

Ultralytics elimina la frustración de las instalaciones complejas de frameworks. Utilizando la API de Python unificada o la intuitiva Ultralytics Platform, puedes entrenar, validar y exportar modelos con solo unas pocas líneas de código.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train on a custom dataset with minimal CUDA memory overhead
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Effortlessly run inference
predictions = model("https://ultralytics.com/images/bus.jpg")

# Export to ONNX natively, fully benefiting from the NMS-free architecture
model.export(format="onnx")

Para los usuarios que evalúan otras arquitecturas robustas dentro del ecosistema de Ultralytics, YOLO11 sigue siendo una opción altamente fiable para despliegues heredados, mientras que RT-DETR basado en Transformer proporciona capacidades excelentes para quienes buscan soluciones basadas en atención.

Link to this sectionResumen#

Elegir entre YOLOX y PP-YOLOE+ a menudo se reduce a las restricciones principales de tu framework, ya sea que prefieras la flexibilidad basada en PyTorch o la integración profunda con PaddlePaddle de Baidu. Sin embargo, para las organizaciones que buscan preparar su infraestructura de IA para el futuro, Ultralytics YOLO26 proporciona una alternativa muy superior. Con su revolucionario diseño sin NMS, su huella de memoria ligera y su versatilidad de tareas integral, YOLO26 permite a los equipos crear aplicaciones de visión por computador más rápidas, inteligentes y eficientes con una facilidad sin precedentes.

Colaboradores

Comentarios