Ultralytics YOLO26
Descripción general
Ultralytics YOLO26 es la evolución más reciente en la serie YOLO de detectores de objetos en tiempo real, diseñada desde cero para dispositivos de borde (edge) y de bajo consumo. Introduce un diseño optimizado que elimina la complejidad innecesaria mientras integra innovaciones específicas para ofrecer un despliegue más rápido, ligero y accesible.

Explora y ejecuta modelos YOLO26 directamente en la Plataforma de Ultralytics.
La arquitectura de YOLO26 se guía por tres principios fundamentales:
- Simplicidad: YOLO26 es un modelo nativo de extremo a extremo (end-to-end), que genera predicciones directamente sin necesidad de supresión de no máximos (NMS). Al eliminar este paso de posprocesamiento, la inferencia se vuelve más rápida, ligera y fácil de desplegar en sistemas del mundo real. Este enfoque revolucionario fue introducido inicialmente en YOLOv10 por Ao Wang en la Universidad de Tsinghua y ha sido avanzado aún más en YOLO26.
- Eficiencia de despliegue: El diseño de extremo a extremo elimina toda una etapa del proceso, simplificando drásticamente la integración, reduciendo la latencia y haciendo que el despliegue sea más robusto en diversos entornos.
- Innovación en entrenamiento: YOLO26 introduce el optimizador MuSGD, un híbrido de SGD y Muon, inspirado en los avances de Kimi K2 de Moonshot AI en el entrenamiento de LLM. Este optimizador aporta una mayor estabilidad y una convergencia más rápida, transfiriendo los avances en optimización de modelos de lenguaje a la visión artificial.
- Optimizaciones específicas de tareas: YOLO26 introduce mejoras específicas para tareas especializadas, incluyendo pérdida de segmentación semántica y módulos proto multiescala para Segmentación, estimación de verosimilitud logarítmica residual (RLE) para estimación de Pose de alta precisión, y una decodificación optimizada con pérdida angular para resolver problemas de límites en OBB.
Juntas, estas innovaciones ofrecen una familia de modelos que logra una mayor precisión en objetos pequeños, proporciona un despliegue fluido y se ejecuta hasta un 43% más rápido en CPUs, lo que convierte a YOLO26 en uno de los modelos YOLO más prácticos y desplegables hasta la fecha para entornos con recursos limitados.
Características clave
-
Eliminación de DFL
El módulo Distribution Focal Loss (DFL), aunque eficaz, a menudo complicaba la exportación y limitaba la compatibilidad con el hardware. YOLO26 elimina DFL por completo, simplificando la inferencia y ampliando el soporte para dispositivos de borde (edge) y de bajo consumo. -
Inferencia de extremo a extremo sin NMS
A diferencia de los detectores tradicionales que dependen de NMS como un paso de posprocesamiento independiente, YOLO26 es nativamente de extremo a extremo. Las predicciones se generan directamente, reduciendo la latencia y haciendo que la integración en sistemas de producción sea más rápida, ligera y fiable. -
ProgLoss + STAL
Las funciones de pérdida mejoradas aumentan la precisión de la detección, con mejoras notables en el reconocimiento de objetos pequeños, un requisito crítico para IoT, robótica, imágenes aéreas y otras aplicaciones de borde (edge). -
Optimizador MuSGD
Un nuevo optimizador híbrido que combina SGD con Muon. Inspirado en Kimi K2 de Moonshot AI, MuSGD introduce métodos de optimización avanzados del entrenamiento de LLM en la visión artificial, permitiendo un entrenamiento más estable y una convergencia más rápida. -
Hasta un 43% más rápido en inferencia de CPU
Específicamente optimizado para la computación de borde (edge), YOLO26 ofrece una inferencia de CPU significativamente más rápida, garantizando un rendimiento en tiempo real en dispositivos sin GPU. -
Mejoras en segmentación de instancias
Introduce pérdida de segmentación semántica para mejorar la convergencia del modelo y un módulo proto actualizado que aprovecha la información multiescala para una calidad de máscara superior. -
Estimación de pose de precisión
Integra Residual Log-Likelihood Estimation (RLE) para una localización de puntos clave más precisa y optimiza el proceso de decodificación para una mayor velocidad de inferencia. -
Decodificación OBB refinada
Introduce una pérdida angular especializada para mejorar la precisión de detección de objetos cuadrados y optimiza la decodificación OBB para resolver problemas de discontinuidad en los límites.

Tareas y modos admitidos
YOLO26 aprovecha la versátil gama de modelos establecida por versiones anteriores de Ultralytics YOLO, ofreciendo un soporte mejorado en diversas tareas de visión artificial:
| Modelo | Nombres de archivo | Tarea | Inferencia | Validación | Entrenamiento | Exportar (Export) |
|---|---|---|---|---|---|---|
| YOLO26 | yolo26n.pt yolo26s.pt yolo26m.pt yolo26l.pt yolo26x.pt | Detección | ✅ | ✅ | ✅ | ✅ |
| YOLO26-seg | yolo26n-seg.pt yolo26s-seg.pt yolo26m-seg.pt yolo26l-seg.pt yolo26x-seg.pt | Segmentación de instancias | ✅ | ✅ | ✅ | ✅ |
| YOLO26-pose | yolo26n-pose.pt yolo26s-pose.pt yolo26m-pose.pt yolo26l-pose.pt yolo26x-pose.pt | Pose/Puntos clave | ✅ | ✅ | ✅ | ✅ |
| YOLO26-obb | yolo26n-obb.pt yolo26s-obb.pt yolo26m-obb.pt yolo26l-obb.pt yolo26x-obb.pt | Detección orientada | ✅ | ✅ | ✅ | ✅ |
| YOLO26-cls | yolo26n-cls.pt yolo26s-cls.pt yolo26m-cls.pt yolo26l-cls.pt yolo26x-cls.pt | Clasificación | ✅ | ✅ | ✅ | ✅ |
Este marco unificado garantiza que YOLO26 sea aplicable en tareas de detección, segmentación, clasificación, estimación de pose y detección de objetos orientados en tiempo real, todo ello con soporte para entrenamiento, validación, inferencia y exportación.
yolo26-p2.yaml y yolo26-p6.yaml añaden una cabecera de detección P2 (objetos pequeños) o P6 (entrada grande) y se suministran solo como arquitecturas YAML. No se han publicado pesos específicos por escala yolo26*-p2.pt o yolo26*-p6.pt. Instancia una configuración escalada desde YAML (por ejemplo, YOLO("yolo26n-p6.yaml")) y entrénala o ajústala según sea necesario.
Métricas de rendimiento
Consulta los Documentos de detección para ver ejemplos de uso con estos modelos entrenados en COCO, que incluyen 80 clases preentrenadas.
| Modelo | tamaño (píxeles) | mAPval 50-95 | mAPval 50-95(e2e) | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 40.1 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 47.8 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 52.5 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 54.4 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 56.9 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 |
Los valores de Params y FLOPs corresponden al modelo fusionado tras model.fuse(), que combina las capas Conv y BatchNorm y elimina la cabecera auxiliar de detección de uno a muchos. Los puntos de control preentrenados conservan la arquitectura de entrenamiento completa y pueden mostrar recuentos más altos.
Ejemplos de uso
Esta sección proporciona ejemplos sencillos de entrenamiento e inferencia con YOLO26. Para obtener la documentación completa sobre estos y otros modos, consulta las páginas de documentación de Predicción, Entrenamiento, Validación y Exportación.
Ten en cuenta que el ejemplo siguiente es para modelos YOLO26 Detect para detección de objetos. Para otras tareas compatibles, consulta la documentación de Segmentación, Clasificación, OBB y Pose.
Los modelos preentrenados de PyTorch *.pt, así como los archivos de configuración *.yaml, pueden pasarse a la clase YOLO() para crear una instancia de modelo en Python:
from ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Train the model on the COCO8 example dataset for 100 epochs
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")YOLO26 cuenta con una arquitectura de doble cabecera que proporciona flexibilidad para diferentes escenarios de despliegue:
- Cabecera de uno a uno (predeterminada): Genera predicciones de extremo a extremo sin NMS, produciendo
(N, 300, 6)con un máximo de 300 detecciones por imagen. Esta cabecera está optimizada para una inferencia rápida y un despliegue simplificado. - Cabecera de uno a muchos: Genera salidas YOLO tradicionales que requieren posprocesamiento NMS, produciendo
(N, nc + 4, 8400)dondences el número de clases. Esta cabecera suele lograr una precisión ligeramente mayor a costa de un procesamiento adicional.
Puedes cambiar entre cabeceras durante la exportación, la predicción o la validación:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
# Use one-to-one head (default, no NMS required)
results = model.predict("image.jpg") # inference
metrics = model.val(data="coco.yaml") # validation
model.export(format="onnx") # export
# Use one-to-many head (requires NMS)
results = model.predict("image.jpg", end2end=False) # inference
metrics = model.val(data="coco.yaml", end2end=False) # validation
model.export(format="onnx", end2end=False) # exportLa elección depende de tus requisitos de despliegue: utiliza la cabecera de uno a uno para obtener la máxima velocidad y simplicidad, o la cabecera de uno a muchos cuando la precisión sea la prioridad máxima.
YOLOE-26: Segmentación de instancias de vocabulario abierto
YOLOE-26 integra la arquitectura de alto rendimiento YOLO26 con las capacidades de vocabulario abierto de la serie YOLOE. Permite la detección y segmentación en tiempo real de cualquier clase de objeto mediante prompts de texto, prompts visuales o un modo sin prompts para inferencia de disparo cero (zero-shot), eliminando eficazmente las restricciones del entrenamiento por categorías fijas.
Al aprovechar el diseño de extremo a extremo sin NMS de YOLO26, YOLOE-26 ofrece una inferencia rápida en el mundo abierto. Esto la convierte en una solución potente para aplicaciones de borde en entornos dinámicos donde los objetos de interés representan un vocabulario amplio y en evolución.
Consulta la Documentación de YOLOE para ver ejemplos de uso con estos modelos entrenados en los conjuntos de datos Objects365v1, GQA y Flickr30k.
| Modelo | tamaño (píxeles) | Tipo de Prompt | mAPminival 50-95(e2e) | mAPminival 50-95 | mAPr | mAPc | mAPf | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|---|---|---|
| YOLOE-26n-seg | 640 | Texto/Visual | 23.7 / 20.9 | 24.7 / 21.9 | 20.5 / 17.6 | 24.1 / 22.3 | 26.1 / 22.4 | 4.8 | 6.0 |
| YOLOE-26s-seg | 640 | Texto/Visual | 29.9 / 27.1 | 30.8 / 28.6 | 23.9 / 25.1 | 29.6 / 27.8 | 33.0 / 29.9 | 13.1 | 21.7 |
| YOLOE-26m-seg | 640 | Texto/Visual | 35.4 / 31.3 | 35.4 / 33.9 | 31.1 / 33.4 | 34.7 / 34.0 | 36.9 / 33.8 | 27.9 | 70.1 |
| YOLOE-26l-seg | 640 | Texto/Visual | 36.8 / 33.7 | 37.8 / 36.3 | 35.1 / 37.6 | 37.6 / 36.2 | 38.5 / 36.1 | 32.3 | 88.3 |
| YOLOE-26x-seg | 640 | Texto/Visual | 39.5 / 36.2 | 40.6 / 38.5 | 37.4 / 35.3 | 40.9 / 38.8 | 41.0 / 38.8 | 69.9 | 196.7 |
Ejemplo de uso
YOLOE-26 es compatible con avisos basados tanto en texto como visuales. Usar avisos es muy sencillo: solo tienes que pasarlos a través del método predict como se muestra a continuación:
Los avisos de texto te permiten especificar las clases que deseas detectar mediante descripciones textuales. El siguiente código muestra cómo puedes utilizar YOLOE-26 para detectar personas y autobuses en una imagen:
from ultralytics import YOLO
# Initialize model
model = YOLO("yoloe-26l-seg.pt") # or select yoloe-26s/m-seg.pt for different sizes
# Set text prompt to detect person and bus. You only need to do this once after you load the model.
model.set_classes(["person", "bus"])
# Run detection on the given image
results = model.predict("path/to/image.jpg")
# Show results
results[0].show()Para profundizar en técnicas de aviso, entrenamiento desde cero y ejemplos completos de uso, visita la Documentación de YOLOE.
Citas y reconocimientos
Ultralytics no ha publicado un artículo de investigación formal sobre YOLO26 debido a la rápida evolución de estos modelos. En su lugar, nos centramos en ofrecer modelos de vanguardia y hacerlos fáciles de usar. Para obtener las últimas actualizaciones sobre funciones, arquitecturas y uso de YOLO, visita nuestro repositorio de GitHub y nuestra documentación.
Si utilizas YOLO26 u otro software de Ultralytics en tu trabajo, por favor cítalo como:
@software{yolo26_ultralytics,
author = {Glenn Jocher and Jing Qiu},
title = {Ultralytics YOLO26},
version = {26.0.0},
year = {2026},
url = {https://github.com/ultralytics/ultralytics},
orcid = {0000-0001-5950-6979, 0000-0003-3783-7069},
license = {AGPL-3.0}
}DOI pendiente. YOLO26 está disponible bajo licencias AGPL-3.0 y Enterprise.
Preguntas frecuentes
¿Cuáles son las mejoras clave en YOLO26 en comparación con YOLO11?
- Eliminación de DFL: Simplifica la exportación y amplía la compatibilidad en el borde
- Inferencia de extremo a extremo sin NMS: Elimina el NMS para una implementación más rápida y sencilla
- ProgLoss + STAL: Mejora la precisión, especialmente en objetos pequeños
- Optimizador MuSGD: Combina SGD y Muon (inspirado en Kimi K2 de Moonshot) para un entrenamiento más estable y eficiente
- Inferencia en CPU hasta un 43% más rápida: Importantes ganancias de rendimiento para dispositivos solo con CPU
¿Qué tareas admite YOLO26?
YOLO26 es una familia de modelos unificada que ofrece soporte integral para múltiples tareas de visión artificial:
- Detección de objetos
- Segmentación de instancias
- Clasificación de imágenes
- Estimación de pose
- Detección de objetos orientados (OBB)
Cada variante de tamaño (n, s, m, l, x) admite todas las tareas, además de versiones de vocabulario abierto mediante YOLOE-26.
¿Por qué YOLO26 está optimizado para la implementación en el borde?
YOLO26 ofrece un rendimiento de vanguardia en el borde con:
- Inferencia en CPU hasta un 43% más rápida
- Tamaño del modelo y uso de memoria reducidos
- Arquitectura simplificada para mejorar la compatibilidad (sin DFL, sin NMS)
- Formatos de exportación flexibles, incluyendo TensorRT, ONNX, CoreML, TFLite y OpenVINO
¿Cómo empiezo a utilizar YOLO26?
Los modelos YOLO26 se lanzaron el 14 de enero de 2026 y están disponibles para su descarga. Instala o actualiza el paquete ultralytics y carga un modelo:
from ultralytics import YOLO
# Load a pretrained YOLO26 nano model
model = YOLO("yolo26n.pt")
# Run inference on an image
results = model("image.jpg")Consulta la sección Ejemplos de uso para obtener instrucciones sobre entrenamiento, validación y exportación.