Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 frente a YOLO11#

Al crear sistemas de visión artificial de vanguardia, seleccionar el modelo adecuado es fundamental para equilibrar la precisión, la latencia y la eficiencia de los recursos. En el panorama en rápida evolución de la inteligencia artificial, Ultralytics sigue ampliando los límites de lo posible. Esta comparación técnica detallada explora la transición del exitoso YOLO11 al revolucionario nuevo YOLO26, proporcionando a los ingenieros e investigadores de IA la información necesaria para tomar decisiones arquitectónicas fundamentadas.

Link to this sectionLinaje y metadatos del modelo#

Ambos modelos fueron desarrollados por Ultralytics, pero representan paradigmas diferentes en la cronología de la detección de objetos y los modelos de visión multitarea.

Detalles de YOLO26:

Más información sobre YOLO26

Detalles de YOLO11:

Más información sobre YOLO11

Otras arquitecturas

Aunque YOLO26 es nuestro modelo en tiempo real más avanzado, los usuarios que trabajen con hardware altamente especializado o capacidades de memoria masivas también pueden explorar arquitecturas basadas en Transformer como RT-DETR o el pionero revolucionario sin NMS, YOLOv10.

Link to this sectionDiferencias arquitectónicas e innovaciones#

El salto de YOLO11 a YOLO26 implica cambios fundamentales tanto en la arquitectura del modelo como en el régimen de entrenamiento subyacente. Mientras que YOLO11 estableció una base sólida para la detección de objetos y el aprendizaje multitarea, YOLO26 renueva por completo el pipeline de despliegue para la computación en el borde (edge computing).

Link to this sectionDiseño integral sin NMS#

Una de las mejoras más significativas en YOLO26 es su arquitectura nativa integral (end-to-end). A diferencia de YOLO11, que depende del post-procesamiento de Non-Maximum Suppression (NMS) para filtrar las cajas delimitadoras superpuestas, YOLO26 elimina este paso por completo. Este concepto, iniciado primero en YOLOv10, reduce drásticamente la variabilidad de la latencia y simplifica la lógica de despliegue en diversos dispositivos de borde.

Link to this sectionEliminación de DFL para la eficiencia en el borde#

YOLO11 utiliza Distribution Focal Loss (DFL) para refinar las estimaciones de las cajas delimitadoras. Sin embargo, DFL depende de operaciones softmax complejas que a menudo no cuentan con buen soporte en aceleradores de borde de bajo consumo. YOLO26 elimina con éxito la DFL sin sacrificar la precisión. Esta simplificación arquitectónica resulta en una compatibilidad muy mejorada con sistemas integrados y permite que YOLO26 logre hasta un 43% más de velocidad de inferencia en CPU en comparación con su predecesor.

Link to this sectionEl optimizador MuSGD#

La estabilidad y la velocidad de entrenamiento son primordiales. YOLO26 introduce el optimizador MuSGD, un híbrido de Stochastic Gradient Descent (SGD) y Muon, fuertemente inspirado en las innovaciones de entrenamiento de LLM de Kimi K2 de Moonshot AI. Este optimizador aporta la estabilidad del entrenamiento de modelos de lenguaje a la visión artificial, asegurando una convergencia más rápida y reduciendo el uso de memoria durante el entrenamiento en comparación con alternativas de Transformer pesadas.

Link to this sectionProgLoss y STAL#

Para los investigadores que trabajan con imágenes aéreas o aplicaciones de drones, detectar características diminutas es un desafío histórico. YOLO26 introduce ProgLoss combinado con STAL (Scale-Targeted Attention Loss), ofreciendo mejoras notables en el reconocimiento de objetos pequeños respecto a YOLO11.

Link to this sectionComparación de rendimiento y métricas#

Al comparar los modelos cara a cara, YOLO26 demuestra una clara superioridad en precisión y eficiencia en dispositivos de borde, manteniendo al mismo tiempo los requisitos de memoria increíblemente bajos característicos del ecosistema Ultralytics.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Nota: El modelo YOLO26 nano (YOLO26n) muestra una mejora de ~31% en la velocidad de la CPU en comparación con YOLO11n (38,9ms frente a 56,1ms), destacando su filosofía de diseño centrada en el borde.

Link to this sectionVersatilidad en tareas de visión artificial#

Ambos modelos se benefician del ecosistema Ultralytics altamente mantenido, ofreciendo una facilidad de uso inigualable a través de una API de Python unificada. No son solo detectores de objetos; son potencias multitarea. Sin embargo, YOLO26 incorpora varios avances específicos de la tarea:

  • Segmentación de instancias: YOLO26 utiliza una pérdida de segmentación semántica refinada y prototipado multiescala, generando límites de máscara más definidos que YOLO11. Aprende más sobre los flujos de trabajo de segmentación.
  • Estimación de pose: Al integrar Residual Log-Likelihood Estimation (RLE), YOLO26 mejora drásticamente la precisión de los puntos clave en poses humanas complejas. Descubre las capacidades de estimación de pose.
  • Cajas delimitadoras orientadas (OBB): Una función de pérdida de ángulo especializada resuelve problemas históricos de discontinuidad de límites, haciendo que YOLO26 sea excepcionalmente fiable para detectar objetos rotados en transmisiones satelitales. Lee sobre las tareas OBB.
  • Clasificación de imágenes: Ambos modelos manejan la clasificación de alta velocidad de manera eficiente, con YOLO26 ofreciendo mejoras marginales en la precisión top-1 en ImageNet.

Link to this sectionEjemplo de código de entrenamiento e inferencia#

Ultralytics es célebre por su experiencia de desarrollador. Entrenar un modelo SOTA o ejecutar un script de inferencia requiere solo unas pocas líneas de código, minimizando el código repetitivo y maximizando la productividad. Además, entrenar modelos YOLO requiere mucha menos memoria CUDA que las grandes redes Transformer.

from ultralytics import YOLO

# Load the cutting-edge YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer is automatically enabled for YOLO26
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Utilize GPU for accelerated training
)

# Perform NMS-free inference directly on an image
results = model("https://ultralytics.com/images/bus.jpg")

# Display the clean, instant predictions
results[0].show()

Link to this sectionCasos de uso ideales y estrategias de despliegue#

Elegir entre YOLO26 y YOLO11 depende enteramente de las limitaciones de tu entorno de producción.

Link to this sectionCuándo desplegar YOLO26#

YOLO26 es la opción definitiva para proyectos modernos y nuevos. Está construido específicamente para:

  • Computación en el borde e IoT: Su asombroso rendimiento de CPU y la eliminación de DFL lo convierten en el rey de dispositivos como Raspberry Pi, NPUs Coral y procesadores móviles.
  • Análisis de drones y aéreo: La integración de ProgLoss + STAL lo hace singularmente capaz de rastrear objetos pequeños que se mueven rápido a través de paisajes extensos.
  • Latency-Critical Applications: In autonomous robotics or manufacturing quality control, the NMS-free design ensures deterministic latency without unexpected post-processing spikes.

Link to this sectionCuándo conservar YOLO11#

Aunque YOLO26 es superior, YOLO11 sigue siendo un modelo increíblemente capaz. Podrías quedarte con YOLO11 si:

  • Pipelines heredados: Tu infraestructura de despliegue en C++ existente está estrechamente vinculada a las salidas basadas en anclas y a la lógica NMS específica de arquitecturas anteriores.
  • Bases académicas: Estás publicando investigación y necesitas un estándar de 2024 altamente reconocido para comparar tus nuevos algoritmos.

Link to this sectionEl poder del ecosistema Ultralytics#

Independientemente de si despliegas YOLO11 o YOLO26, utilizar modelos de Ultralytics significa aprovechar un ecosistema bien mantenido con actualizaciones frecuentes y un amplio apoyo de la comunidad.

Para equipos empresariales, la Plataforma Ultralytics proporciona una solución integral para anotación de datos, entrenamiento de modelos y despliegue en la nube sin fisuras. Desde exportar tus pesos entrenados a CoreML o TensorRT, hasta configurar el ajuste de hiperparámetros avanzado, las herramientas proporcionadas aseguran que tu ciclo de vida de IA sea lo más optimizado posible.

Colaboradores

Comentarios