YOLO26 frente a YOLO11: una nueva era de la IA de visión integral
La evolución de la detección de objetos se ha caracterizado por una búsqueda incesante de velocidad, precisión y eficiencia. Dos de los hitos más significativos en este viaje son YOLO26 y YOLO11. Aunque ambos modelos se derivan de la innovadora investigación de Ultralytics, representan diferentes generaciones de filosofía arquitectónica. Esta comparación profundiza en los matices técnicos de estas arquitecturas, ayudando a los desarrolladores e investigadores a elegir la herramienta adecuada para sus aplicaciones específicas de visión artificial.
Comparación de métricas de rendimiento
La siguiente tabla destaca las diferencias de rendimiento entre las dos familias de modelos en el COCO . Obsérvese el importante avance en la velocidad CPU para YOLO26, resultado directo de sus optimizaciones arquitectónicas.
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | parámetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Evolución Arquitectónica
YOLO26: La revolución NMS
Lanzado en enero de 2026, YOLO26 representa un cambio de paradigma hacia la detección nativa de objetos de extremo a extremo. A diferencia de los detectores tradicionales que se basan en pasos de posprocesamiento heurísticos como la supresión no máxima (NMS) para filtrar los cuadros delimitadores duplicados, YOLO26 incorpora esta lógica directamente en la arquitectura de la red. Este concepto, originalmente pionero en investigaciones como YOLOv10, se ha perfeccionado para lograr la estabilidad de la producción en YOLO26.
Las innovaciones arquitectónicas clave incluyen:
- Diseño integral NMS: al eliminar NMS, YOLO26 simplifica el proceso de implementación. Esto resulta especialmente beneficioso para entornos de computación periférica, en los que la variabilidad en NMS puede provocar fluctuaciones en las aplicaciones en tiempo real.
- Eliminación de DFL: La eliminación de la pérdida focal de distribución (DFL) optimiza las capas de salida del modelo. Este cambio mejora significativamente la compatibilidad con dispositivos de baja potencia y simplifica la exportación del modelo a formatos como ONNX CoreML, ya que se requieren menos operadores personalizados.
- Optimizador MuSGD: Inspirado en innovaciones en el entrenamiento de modelos de lenguaje grandes (LLM), como Kimi K2 de Moonshot AI, YOLO26 utiliza un optimizador híbrido que combina SGD Muon. Esto aporta una estabilidad superior a las ejecuciones de entrenamiento, lo que permite una convergencia más rápida incluso con conjuntos de datos complejos.
- ProgLoss + STAL: La introducción de Progressive Loss (ProgLoss) y Self-Training Anchor Loss (STAL) proporciona mejoras notables en la detección de objetos pequeños. Estas funciones de pérdida ajustan dinámicamente el enfoque durante el entrenamiento, lo que garantiza que los ejemplos difíciles, a menudo objetos pequeños u ocultos, se aprendan de manera más eficaz.
¿Por qué es importante CPU ?
La tabla anterior muestra que YOLO26n alcanza 38,9 ms en CPU con los 56,1 ms de YOLO11n. Este aumento del 43 % en la velocidad CPU permite realizar análisis en tiempo real en hardware de consumo, lo que reduce la necesidad de costosas GPU dedicadas en implementaciones minoristas y de IoT.
YOLO11: El estándar robusto
YOLO11, lanzado en septiembre de 2024, se basó en el legado de YOLOv8 introducir el bloque C3k2 y mejoras en el módulo SPPF (Spatial Pyramid Pooling - Fast). Si bien sigue siendo un modelo muy capaz y robusto, se basa en el cabezal de detección tradicional sin anclaje que requiere NMS .
YOLO11 en situaciones en las que se requiere un amplio soporte heredado o en las que se depende de peculiaridades arquitectónicas específicas de generaciones anteriores. Sin embargo, en comparación con la arquitectura optimizada de YOLO26, conlleva una sobrecarga computacional ligeramente mayor durante la fase de posprocesamiento, lo que puede convertirse en un cuello de botella en entornos de alto rendimiento.
Casos de Uso Ideales
Cuándo Elegir YOLO26
YOLO26 es la opción recomendada para prácticamente todos los proyectos nuevos, especialmente aquellos que priorizan la eficiencia y la facilidad de implementación.
- IA periférica e IoT: con sus enormes CPU y su diseño NMS, YOLO26 es perfecto para dispositivos como Raspberry Pi o NVIDIA . La menor variación de latencia es crucial para la robótica, donde se requiere una sincronización constante para los bucles de control.
- Tareas de visión complejas: más allá de la detección, YOLO26 ofrece mejoras específicas para cada tarea. Por ejemplo, la estimación de la verosimilitud logarítmica residual (RLE) aumenta significativamente la precisión en la estimación de la pose, mientras que las funciones de pérdida de ángulo especializadas mejoran la precisión del cuadro delimitador orientado (OBB) para las imágenes aéreas.
- Aplicaciones de bajo consumo: la eliminación de DFL y la arquitectura optimizada hacen que YOLO26 consuma menos energía por inferencia, lo que prolonga la duración de la batería en aplicaciones móviles.
Cuándo elegir YOLO11
YOLO11 una opción válida para:
- Sistemas heredados: si dispone de un canal existente muy ajustado al formato de salida específico YOLO11 y no puede permitirse el tiempo de ingeniería necesario para actualizar la lógica de posprocesamiento (aunque la transición a YOLO26 suele ser fluida con Ultralytics).
- Referencias de referencia: Los investigadores suelen utilizar modelos ampliamente adoptados como YOLO11 YOLOv8 como puntos de referencia para comparar nuevas arquitecturas.
La ventaja de Ultralytics
Tanto si eliges YOLO26 como YOLO11, aprovechar el Ultralytics ofrece ventajas claras frente a otros marcos de trabajo de la competencia.
Facilidad de uso y versatilidad
Ultralytics están diseñados para ofrecer una experiencia «de cero a héroe». Una única Python admite la detección, la segmentación, la clasificación y el seguimiento. Esta versatilidad permite a los equipos de ingeniería alternar entre tareas sin necesidad de aprender nuevos códigos base.
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimization automatically handled
results = model.train(data="coco8.yaml", epochs=100)
# Export to ONNX for simplified edge deployment
path = model.export(format="onnx")
Eficiencia de entrenamiento y memoria
Ambos modelos están optimizados para la eficiencia del entrenamiento, pero el optimizador MuSGD de YOLO26 estabiliza aún más este proceso. A diferencia de los modelos basados en transformadores masivos que requieren una gran cantidad de VRAM,YOLO Ultralytics a menudo se pueden ajustar en GPU de consumo, lo que democratiza el acceso a la IA de última generación.
Ecosistema bien mantenido
Ultralytics y la biblioteca de código abierto garantizan que sus proyectos estén preparados para el futuro. Con actualizaciones frecuentes, documentación exhaustiva y herramientas para la gestión de conjuntos de datos y la formación en la nube, contará con el apoyo de una sólida comunidad y un equipo de desarrollo activo.
Metadatos del modelo
YOLO26
- Autores: Glenn Jocher y Jing Qiu
- Organización:Ultralytics
- Fecha: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Documentos:ultralytics
YOLO11
- Autores: Glenn Jocher y Jing Qiu
- Organización:Ultralytics
- Fecha: 2024-09-27
- GitHub:https://github.com/ultralytics/ultralytics
- Documentación:https://docs.ultralytics.com/models/yolo11/
Explorar Otros Modelos
Para los usuarios interesados en explorar diferentes arquitecturas, Ultralytics es compatible con RT-DETR para la detección basada en transformadores y SAM para tareas de segmentación sin disparo.
Conclusión
Mientras YOLO11 sigue siendo un modelo robusto y capaz, YOLO26 establece un nuevo estándar en cuanto a eficiencia y velocidad. Su diseño integral NMS, combinado con importantes optimizaciones CPU y funciones de pérdida avanzadas, lo convierten en la opción superior para las aplicaciones modernas de visión por ordenador. Al adoptar YOLO26, los desarrolladores pueden lograr una mayor precisión y un rendimiento más rápido con menos complejidad, todo ello sin salir del Ultralytics , muy fácil de usar.