Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 frente a YOLOX#

La evolución de la visión artificial ha estado marcada por importantes saltos arquitectónicos. En 2021, YOLOX introdujo un paradigma altamente influyente sin anclas que cerró la brecha entre la investigación académica y la aplicación industrial. Avanzando hasta 2026, el panorama ha sido redefinido por Ultralytics YOLO, concretamente con el lanzamiento de YOLO26. Esta comparativa exhaustiva explora cómo YOLO26 se basa en innovaciones históricas para ofrecer un rendimiento, versatilidad y facilidad de uso inigualables.

Link to this sectionResumen de modelos#

Comprender los orígenes y las filosofías fundamentales de estos modelos es esencial para tomar decisiones de despliegue informadas.

Link to this sectionDetalles de YOLO26#

Más información sobre YOLO26

YOLO26 representa la cúspide de la ingeniería de IA moderna, ofreciendo un diseño nativo de extremo a extremo que elimina los complejos cuellos de botella del postprocesamiento. Está altamente optimizado tanto para despliegues en la nube como en el borde, con un ecosistema que admite diversas tareas sin problemas.

Link to this sectionDetalles de YOLOX#

Más información sobre YOLOX

YOLOX supuso un gran paso adelante al introducir una cabeza desacoplada y una arquitectura sin anclas junto con la estrategia de asignación de etiquetas SimOTA. Ofrecía un excelente equilibrio entre velocidad y precisión en el momento de su lanzamiento, lo que lo convirtió en una opción popular para muchos sistemas heredados.

Link to this sectionInnovaciones arquitectónicas#

Las diferencias entre YOLO26 y YOLOX destacan cinco años de innovación incesante en el diseño de aprendizaje profundo.

Aunque YOLOX abogó por el enfoque sin anclas, seguía dependiendo en gran medida de la Supresión de No Máximos (NMS) tradicional para filtrar cuadros delimitadores redundantes. YOLO26 introduce un diseño de extremo a extremo sin NMS. Este avance, iniciado por primera vez en YOLOv10, elimina por completo el postprocesamiento de NMS, lo que resulta en procesos de despliegue más rápidos y sencillos con una varianza de latencia significativamente menor.

Además, YOLO26 cuenta con la eliminación de DFL. Al eliminar la pérdida focal de distribución (Distribution Focal Loss), el proceso de exportación del modelo se simplifica drásticamente, garantizando una compatibilidad excepcional con dispositivos de borde y hardware de baja potencia. Cuando se combina con las optimizaciones arquitectónicas del modelo, YOLO26 logra hasta un 43% más de rapidez en la inferencia por CPU en comparación con sus predecesores, convirtiéndolo en una potencia para entornos que carecen de GPUs dedicadas.

La estabilidad del entrenamiento es otro diferenciador fundamental. YOLO26 utiliza el novedoso optimizador MuSGD, un híbrido de SGD y Muon inspirado en innovaciones de entrenamiento de LLM de Moonshot AI. Este optimizador aporta la estabilidad de entrenamiento de modelos de lenguaje grande a la visión artificial, facilitando una convergencia más rápida.

Funciones de pérdida avanzadas

YOLO26 utiliza ProgLoss + STAL, funciones de pérdida especializadas que producen mejoras notables en el reconocimiento de objetos pequeños. Esto es fundamental para tareas complejas como el procesamiento de imágenes aéreas y el análisis de entornos densos.

Link to this sectionRendimiento y benchmarks#

Al comparar estos modelos frente a frente en el conjunto de datos COCO, la superioridad de YOLO26 tanto en precisión como en eficiencia queda clara. Los modelos de Ultralytics ofrecen constantemente menores requisitos de memoria durante el entrenamiento y velocidades de inferencia más rápidas.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOXnano41625.8--0.911.08
YOLOXtiny41632.8--5.066.45
YOLOXs64040.5-2.569.026.8
YOLOXm64046.9-5.4325.373.8
YOLOXl64049.7-9.0454.2155.6
YOLOXx64051.1-16.199.1281.9

Nota: El modelo YOLO26x alcanza unos impresionantes 57.5 mAP mientras requiere significativamente menos parámetros (55.7M) que el modelo YOLOXx (99.1M), destacando la increíble eficiencia de parámetros de la arquitectura Ultralytics.

Link to this sectionEcosistema y facilidad de uso#

Una de las ventajas más importantes de elegir YOLO26 es el ecosistema bien mantenido que ofrece Ultralytics. Mientras que YOLOX requiere navegar por complejas bases de código de investigación y configuraciones manuales del entorno, Ultralytics ofrece una experiencia de desarrollador optimizada y completa desde cero.

Usando la API unificada de Python, puedes cambiar fácilmente entre tareas como detección de objetos, segmentación de instancias, clasificación de imágenes y estimación de pose. YOLOX, por el contrario, está estrictamente limitado a la detección de cuadros delimitadores.

Link to this sectionEjemplo de entrenamiento#

Entrenar un modelo con un conjunto de datos personalizado con Ultralytics es notablemente eficiente. El proceso de entrenamiento minimiza el uso de memoria CUDA, permitiendo tamaños de lote más grandes incluso en hardware de consumo, un marcado contraste con arquitecturas más antiguas o modelos pesados de Transformer.

from ultralytics import YOLO

# Initialize the cutting-edge YOLO26 small model
model = YOLO("yolo26s.pt")

# Train the model effortlessly with the MuSGD optimizer
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, device=0)

# Export the trained model to ONNX format for deployment
model.export(format="onnx")

La Plataforma Ultralytics mejora aún más este flujo de trabajo, proporcionando entrenamiento en la nube, anotación automática de conjuntos de datos y opciones de despliegue con un solo clic. Es una herramienta indispensable para los equipos que pretenden pasar de la creación de prototipos a la producción rápidamente.

Link to this sectionCasos de uso ideales y aplicaciones en el mundo real#

Elegir el modelo adecuado determina el éxito de tu despliegue en el mundo real.

Link to this sectionEdge AI e IoT#

Para aplicaciones que requieren procesamiento local en hardware limitado, como sistemas de alarma de seguridad inteligentes o sensores ambientales remotos, YOLO26 es la elección definitiva. Su arquitectura sin NMS y su ejecución por CPU un 43% más rápida significan que funciona sin problemas en dispositivos como la Raspberry Pi sin complejas soluciones de cuantificación.

Link to this sectionRobótica autónoma#

La robótica requiere alta precisión y baja latencia. Las capacidades de estimación de pose de YOLO26, reforzadas por la Estimación de Probabilidad de Registro Residual (RLE), permiten a los robots comprender la cinemática humana en tiempo real. La falta de detección de puntos clave nativa de YOLOX lo hace inadecuado para tales tareas avanzadas de interacción humano-robot.

Link to this sectionInspección aérea y a gran altitud#

Al inspeccionar infraestructuras mediante drones, detectar defectos mínimos es primordial. Las funciones ProgLoss y STAL en YOLO26 mejoran drásticamente el recuerdo en objetos pequeños. Además, YOLO26 admite de forma nativa cuadros delimitadores orientados (OBB), con una pérdida de ángulo especializada para resolver problemas de límites, lo que lo hace perfecto para imágenes satelitales y aéreas donde los objetos están rotados arbitrariamente.

Link to this sectionDespliegues heredados#

YOLOX todavía puede encontrar uso en entornos heredados donde los procesos de despliegue de C++ existentes se construyeron explícitamente en torno a sus salidas de cabeza desacopladas específicas en 2021. Sin embargo, para cualquier proyecto nuevo, se recomienda encarecidamente migrar al ecosistema Ultralytics para aprovechar las ganancias de rendimiento modernas y el soporte continuo de la comunidad.

Link to this sectionExplorando otros modelos#

Si bien YOLO26 representa el estado actual de la técnica, el ecosistema de Ultralytics ofrece una variedad de modelos adaptados a necesidades específicas. Para los desarrolladores interesados en arquitecturas basadas en Transformer, RT-DETR proporciona un enfoque alternativo a la detección de extremo a extremo. Además, YOLO11 sigue siendo una opción robusta y altamente probada para entornos de producción que requieren una amplia evaluación comparativa histórica.

En resumen, la transición de YOLOX a YOLO26 ilustra el rápido avance del campo. Al combinar una API intuitiva, un conjunto de características versátil y una eficiencia inigualable, YOLO26 se erige como la opción principal para investigadores y desarrolladores de todo el mundo.

Colaboradores

Comentarios