Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOX frente a YOLO26: La evolución desde la detección sin anclas hasta la detección de objetos de extremo a extremo#

El campo de la visión artificial ha experimentado transformaciones increíbles durante la última década. Dos hitos importantes en este viaje son el lanzamiento de YOLOX, que popularizó las arquitecturas sin anclas (anchor-free), y la reciente introducción de Ultralytics YOLO26, que redefine por completo el rendimiento en tiempo real con un diseño nativo de extremo a extremo y sin NMS. Esta comparativa exhaustiva explora sus arquitecturas, métricas de rendimiento y escenarios de despliegue ideales para ayudarte a tomar decisiones informadas para tu próximo proyecto de IA.

Link to this sectionResumen de modelos#

Entender los orígenes y los objetivos de diseño principales de cada modelo proporciona un contexto esencial para sus respectivos logros técnicos.

Link to this sectionYOLOX#

Autores: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li y Jian Sun
Organización: Megvii
Fecha: 2021-07-18
Arxiv: 2107.08430
GitHub: Megvii-BaseDetection/YOLOX
Documentación: YOLOX ReadTheDocs

Introducido a mediados de 2021, YOLOX supuso un cambio importante al adoptar un diseño sin anclas junto con una cabecera desacoplada y la estrategia avanzada de asignación de etiquetas conocida como SimOTA. Al alejarse de los mecanismos tradicionales de cajas de anclaje (anchor boxes) que dominaban las arquitecturas anteriores, YOLOX logró salvar la distancia entre la investigación académica y la aplicación industrial, ofreciendo un marco elegante y altamente efectivo para la detección de objetos.

Más información sobre YOLOX

Link to this sectionYOLO26#

Autores: Glenn Jocher y Jing Qiu
Organización: Ultralytics
Fecha: 2026-01-14
GitHub: ultralytics/ultralytics
Plataforma: Ultralytics Platform

Lanzado a principios de 2026, YOLO26 es la culminación de años de mejoras iterativas, centrándose enormemente en el despliegue en el borde (edge) y en canalizaciones de entrenamiento simplificadas. Introduce un diseño de extremo a extremo sin NMS, eliminando por completo el paso tradicional de postprocesamiento de supresión de no máximos. Este avance simplifica drásticamente el despliegue del modelo en diversos tipos de hardware. Además, al eliminar el módulo de pérdida focal de distribución (DFL), YOLO26 logra una latencia significativamente menor, consolidando su estatus como la opción principal para las aplicaciones de visión artificial modernas.

Más información sobre YOLO26

Link to this sectionInnovaciones arquitectónicas#

Las arquitecturas de estos dos modelos destacan la rápida progresión de las metodologías de aprendizaje profundo, particularmente en lo que respecta a las funciones de pérdida y el postprocesamiento.

Link to this sectionEl enfoque de YOLOX#

YOLOX desacopló las tareas de clasificación y regresión en su cabecera de predicción, lo que aceleró significativamente la convergencia durante el entrenamiento. Su naturaleza sin anclas redujo el número de parámetros de diseño, mitigando la necesidad de un complejo ajuste de anclas previo al entrenamiento. Junto con el algoritmo de asignación de etiquetas SimOTA, YOLOX logró resultados de vanguardia para su época, especialmente en benchmarks estándar como el dataset COCO.

Link to this sectionLa ventaja de YOLO26#

YOLO26 lleva la eficiencia arquitectónica al siguiente nivel. La eliminación de NMS no solo reduce la latencia de inferencia, sino que también garantiza tiempos de ejecución consistentes y deterministas, un factor crítico para vehículos autónomos y robótica.

Las innovaciones clave de YOLO26 incluyen:

  • Optimizador MuSGD: Inspirado en las técnicas de entrenamiento de Grandes Modelos de Lenguaje (LLM), este híbrido de SGD y Muon garantiza ejecuciones de entrenamiento excepcionalmente estables y una convergencia más rápida.
  • Hasta un 43% más rápido en inferencia de CPU: Al eliminar la DFL y simplificar la arquitectura de la red, YOLO26 está fuertemente optimizado para dispositivos de borde con recursos limitados, desde sensores IoT simples hasta placas Raspberry Pi.
  • ProgLoss + STAL: Estas funciones de pérdida avanzadas ofrecen mejoras notables en el reconocimiento de objetos pequeños, lo cual es fundamental para analizar imágenes aéreas y realizar un control de calidad preciso en la automatización de la fabricación.
Optimización centrada en el borde (Edge-First)

Si tu proyecto apunta a sistemas integrados o aplicaciones móviles sin GPUs dedicadas, el rendimiento optimizado en CPU de YOLO26 proporciona una ventaja enorme, requiriendo mucha menos sobrecarga computacional que los modelos de generaciones anteriores.

Link to this sectionRendimiento y benchmarks#

Al evaluar modelos para entornos de producción, analizar el equilibrio entre precisión, velocidad y complejidad computacional es primordial. A continuación, se presenta una comparación detallada de modelos estándar evaluados con un tamaño de imagen de 640 píxeles (y 416 para variantes nano/tiny).

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Como ilustra la tabla, la serie YOLO26 proporciona un equilibrio de rendimiento superior. Por ejemplo, YOLO26x alcanza un impresionante 57.5 mAP mientras utiliza casi la mitad de los parámetros del modelo YOLOXx, lo que se traduce directamente en tiempos de inferencia de GPU más rápidos (11.8 ms frente a 16.1 ms) y una flexibilidad de despliegue muy superior.

Link to this sectionExperiencia de entrenamiento y ecosistema#

Una de las diferencias más profundas entre estas arquitecturas radica en su facilidad de uso y el soporte de su ecosistema.

Aunque YOLOX sigue siendo un repositorio fundamental para investigadores que estudian el flujo de gradiente y la mecánica sin anclas, su configuración puede ser compleja, requiriendo a menudo la configuración manual de dependencias y operadores. Por el contrario, el ecosistema Ultralytics define el estándar de la industria en cuanto a facilidad de uso.

Utilizando la API unificada de Python, puedes inicializar, entrenar y desplegar modelos YOLO26 con una simplicidad inigualable. El sistema gestiona intrínsecamente la descarga de datasets, el ajuste de hiperparámetros y la exportación fluida a formatos como ONNX, TensorRT y OpenVINO.

from ultralytics import YOLO

# Initialize the cutting-edge, end-to-end YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model efficiently with built-in MuSGD optimization
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model's performance on the validation set
metrics = model.val()

# Export the optimized model for edge deployment
model.export(format="onnx")

Además, los modelos YOLO de Ultralytics presentan requisitos de memoria significativamente menores durante el entrenamiento en comparación con las pesadas alternativas basadas en Transformer, lo que permite a los ingenieros entrenar tamaños de lote mayores incluso en hardware de consumo.

Link to this sectionAplicaciones en el mundo real#

Seleccionar entre YOLOX y YOLO26 depende, en última instancia, de tus limitaciones de despliegue y tus requisitos de multitarea.

Link to this sectionDonde YOLOX destaca#

YOLOX sigue siendo un candidato viable para benchmarks académicos específicos y sistemas heredados integrados profundamente con el marco MegEngine. Su importancia histórica lo convierte en una base popular para investigar detectores sin anclas y estrategias de asignación personalizadas.

Link to this sectionDonde YOLO26 destaca#

YOLO26 está diseñado fundamentalmente para aplicaciones industriales modernas. Debido a que soporta nativamente la segmentación de instancias, la estimación de poses y las cajas delimitadoras orientadas (OBB), es mucho más versátil que los motores de detección estándar.

  • Venta minorista inteligente e inventario: Utilizar el diseño sin NMS garantiza que los sistemas de pago automatizados procesen los feeds de vídeo con una latencia ultrabaja, reconociendo los productos sin el cuello de botella de los bucles de postprocesamiento.
  • Análisis de drones y aéreo: La pérdida de ángulo especializada para OBB y la integración de ProgLoss + STAL hacen que YOLO26 sea inigualable en la detección de objetos rotados y artefactos minúsculos en vastas imágenes de satélite.
  • Sistemas de seguridad en el borde: Con su inferencia en CPU un 43% más rápida, YOLO26 permite a las empresas desplegar análisis de seguridad robustos directamente en hardware local económico sin requerir costosos procesos de cómputo en la nube.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLOX y YOLO26 depende de los requisitos específicos de tu proyecto, las limitaciones de despliegue y las preferencias de ecosistema.

Link to this sectionCuándo elegir YOLOX#

YOLOX es una opción sólida para:

  • Investigación en detección sin anclas: Investigación académica que utiliza la arquitectura limpia y sin anclas de YOLOX como base para experimentar con nuevas cabeceras de detección o funciones de pérdida.
  • Dispositivos de borde ultraligeros: Despliegue en microcontroladores o hardware móvil antiguo donde la huella extremadamente pequeña de la variante YOLOX-Nano (0.91M de parámetros) es crítica.
  • Estudios de asignación de etiquetas SimOTA: Proyectos de investigación que investigan estrategias de asignación de etiquetas basadas en transporte óptimo y su impacto en la convergencia del entrenamiento.

Link to this sectionCuándo elegir YOLO26#

Se recomienda YOLO26 para:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionExplorando otros modelos de Ultralytics#

Si estás explorando la evolución de la visión artificial, hay otros modelos altamente capaces dentro de la familia Ultralytics que vale la pena investigar:

  • YOLO11: El predecesor inmediato de YOLO26, que ofrece un rendimiento robusto y un amplio soporte comunitario para entornos de producción estables.
  • YOLOv8: Una arquitectura altamente probada en batalla que estableció el estándar de facilidad de uso y flexibilidad en miles de despliegues en el mundo real.

En conclusión, aunque YOLOX introdujo conceptos cruciales en el panorama de la detección de objetos, el nuevo YOLO26 proporciona un salto generacional en velocidad, precisión y simplicidad de despliegue, convirtiéndolo en la opción definitiva para desarrolladores y empresas con visión de futuro.

Colaboradores

Comentarios