YOLO26 frente a YOLO11: una nueva era de la IA de visión integral

La evolución de la detección de objetos se ha caracterizado por una búsqueda incesante de velocidad, precisión y eficiencia. Dos de los hitos más significativos en este viaje son YOLO26 y YOLO11. Aunque ambos modelos se derivan de la innovadora investigación de Ultralytics, representan diferentes generaciones de filosofía arquitectónica. Esta comparación profundiza en los matices técnicos de estas arquitecturas, ayudando a los desarrolladores e investigadores a elegir la herramienta adecuada para sus aplicaciones específicas de visión artificial.

Comparación de métricas de rendimiento

La siguiente tabla destaca las diferencias de rendimiento entre las dos familias de modelos en el COCO . Obsérvese el importante avance en la velocidad CPU para YOLO26, resultado directo de sus optimizaciones arquitectónicas.

Modelo	tamaño ^(píxeles)	mAP^val 50-95	Velocidad ^{CPU ONNX (ms)}	Velocidad ^{T4 TensorRT10 (ms)}	parámetros ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLO11n	640	39.5	56.1	1.5	2.6	6.5
YOLO11s	640	47.0	90.0	2.5	9.4	21.5
YOLO11m	640	51.5	183.2	4.7	20.1	68.0
YOLO11l	640	53.4	238.6	6.2	25.3	86.9
YOLO11x	640	54.7	462.8	11.3	56.9	194.9

Evolución Arquitectónica

YOLO26: La revolución NMS

Lanzado en enero de 2026, YOLO26 representa un cambio de paradigma hacia la detección nativa de objetos de extremo a extremo. A diferencia de los detectores tradicionales que se basan en pasos de posprocesamiento heurísticos como la supresión no máxima (NMS) para filtrar los cuadros delimitadores duplicados, YOLO26 incorpora esta lógica directamente en la arquitectura de la red. Este concepto, originalmente pionero en investigaciones como YOLOv10, se ha perfeccionado para lograr la estabilidad de la producción en YOLO26.

Las innovaciones arquitectónicas clave incluyen:

Diseño integral NMS: al eliminar NMS, YOLO26 simplifica el proceso de implementación. Esto resulta especialmente beneficioso para entornos de computación periférica, en los que la variabilidad en NMS puede provocar fluctuaciones en las aplicaciones en tiempo real.
Eliminación de DFL: La eliminación de la pérdida focal de distribución (DFL) optimiza las capas de salida del modelo. Este cambio mejora significativamente la compatibilidad con dispositivos de baja potencia y simplifica la exportación del modelo a formatos como ONNX CoreML, ya que se requieren menos operadores personalizados.
Optimizador MuSGD: Inspirado en innovaciones en el entrenamiento de modelos de lenguaje grandes (LLM), como Kimi K2 de Moonshot AI, YOLO26 utiliza un optimizador híbrido que combina SGD Muon. Esto aporta una estabilidad superior a las ejecuciones de entrenamiento, lo que permite una convergencia más rápida incluso con conjuntos de datos complejos.
ProgLoss + STAL: La introducción de Progressive Loss (ProgLoss) y Self-Training Anchor Loss (STAL) proporciona mejoras notables en la detección de objetos pequeños. Estas funciones de pérdida ajustan dinámicamente el enfoque durante el entrenamiento, lo que garantiza que los ejemplos difíciles, a menudo objetos pequeños u ocultos, se aprendan de manera más eficaz.

¿Por qué es importante CPU ?

La tabla anterior muestra que YOLO26n alcanza 38,9 ms en CPU con los 56,1 ms de YOLO11n. Este aumento del 43 % en la velocidad CPU permite realizar análisis en tiempo real en hardware de consumo, lo que reduce la necesidad de costosas GPU dedicadas en implementaciones minoristas y de IoT.

Más información sobre YOLO26

YOLO11: El estándar robusto

YOLO11, lanzado en septiembre de 2024, se basó en el legado de YOLOv8 introducir el bloque C3k2 y mejoras en el módulo SPPF (Spatial Pyramid Pooling - Fast). Si bien sigue siendo un modelo muy capaz y robusto, se basa en el cabezal de detección tradicional sin anclaje que requiere NMS .

YOLO11 en situaciones en las que se requiere un amplio soporte heredado o en las que se depende de peculiaridades arquitectónicas específicas de generaciones anteriores. Sin embargo, en comparación con la arquitectura optimizada de YOLO26, conlleva una sobrecarga computacional ligeramente mayor durante la fase de posprocesamiento, lo que puede convertirse en un cuello de botella en entornos de alto rendimiento.

Más información sobre YOLO11

Casos de Uso Ideales

Cuándo Elegir YOLO26

YOLO26 es la opción recomendada para prácticamente todos los proyectos nuevos, especialmente aquellos que priorizan la eficiencia y la facilidad de implementación.

IA periférica e IoT: con sus enormes CPU y su diseño NMS, YOLO26 es perfecto para dispositivos como Raspberry Pi o NVIDIA . La menor variación de latencia es crucial para la robótica, donde se requiere una sincronización constante para los bucles de control.
Tareas de visión complejas: más allá de la detección, YOLO26 ofrece mejoras específicas para cada tarea. Por ejemplo, la estimación de la verosimilitud logarítmica residual (RLE) aumenta significativamente la precisión en la estimación de la pose, mientras que las funciones de pérdida de ángulo especializadas mejoran la precisión del cuadro delimitador orientado (OBB) para las imágenes aéreas.
Aplicaciones de bajo consumo: la eliminación de DFL y la arquitectura optimizada hacen que YOLO26 consuma menos energía por inferencia, lo que prolonga la duración de la batería en aplicaciones móviles.

Cuándo elegir YOLO11

YOLO11 una opción válida para:

Sistemas heredados: si dispone de un canal existente muy ajustado al formato de salida específico YOLO11 y no puede permitirse el tiempo de ingeniería necesario para actualizar la lógica de posprocesamiento (aunque la transición a YOLO26 suele ser fluida con Ultralytics).
Referencias de referencia: Los investigadores suelen utilizar modelos ampliamente adoptados como YOLO11 YOLOv8 como puntos de referencia para comparar nuevas arquitecturas.

La ventaja de Ultralytics

Tanto si eliges YOLO26 como YOLO11, aprovechar el Ultralytics ofrece ventajas claras frente a otros marcos de trabajo de la competencia.

Facilidad de uso y versatilidad

Ultralytics están diseñados para ofrecer una experiencia «de cero a héroe». Una única Python admite la detección, la segmentación, la clasificación y el seguimiento. Esta versatilidad permite a los equipos de ingeniería alternar entre tareas sin necesidad de aprender nuevos códigos base.

from ultralytics import YOLO

# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")

# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)

# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")

Eficiencia de entrenamiento y memoria

Ambos modelos están optimizados para la eficiencia del entrenamiento, pero el optimizador MuSGD de YOLO26 estabiliza aún más este proceso. A diferencia de los modelos basados en transformadores masivos que requieren una gran cantidad de VRAM,YOLO Ultralytics a menudo se pueden ajustar en GPU de consumo, lo que democratiza el acceso a la IA de última generación.

Ecosistema bien mantenido

Ultralytics y la biblioteca de código abierto garantizan que sus proyectos estén preparados para el futuro. Con actualizaciones frecuentes, documentación exhaustiva y herramientas para la gestión de conjuntos de datos y la formación en la nube, contará con el apoyo de una sólida comunidad y un equipo de desarrollo activo.

Metadatos del modelo

YOLO26

Autores: Glenn Jocher y Jing Qiu
Organización:Ultralytics
Fecha: 2026-01-14
GitHub:https://github.com/ultralytics/ultralytics
Documentos:ultralytics

YOLO11

Autores: Glenn Jocher y Jing Qiu
Organización:Ultralytics
Fecha: 2024-09-27
GitHub:https://github.com/ultralytics/ultralytics
Documentación:https://docs.ultralytics.com/models/yolo11/

Explorar Otros Modelos

Para los usuarios interesados en explorar diferentes arquitecturas, Ultralytics es compatible con RT-DETR para la detección basada en transformadores y SAM para tareas de segmentación sin disparo.

Conclusión

Mientras YOLO11 sigue siendo un modelo robusto y capaz, YOLO26 establece un nuevo estándar en cuanto a eficiencia y velocidad. Su diseño integral NMS, combinado con importantes optimizaciones CPU y funciones de pérdida avanzadas, lo convierten en la opción superior para las aplicaciones modernas de visión por ordenador. Al adoptar YOLO26, los desarrolladores pueden lograr una mayor precisión y un rendimiento más rápido con menos complejidad, todo ello sin salir del Ultralytics , muy fácil de usar.