Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs YOLOv10#

El panorama de la visión artificial está en constante evolución, impulsado por la demanda de modelos más rápidos, precisos y eficientes. Esta guía proporciona una comparativa técnica exhaustiva entre dos arquitecturas revolucionarias en el ámbito de la detección de objetos en tiempo real: YOLO26 y YOLOv10. Al analizar sus arquitecturas, métricas de rendimiento y capacidades de implementación, nuestro objetivo es ayudarte a ti, desarrollador o investigador, a elegir el modelo óptimo para tus aplicaciones de visión.

Link to this sectionLa evolución de las arquitecturas sin NMS#

Durante años, la familia YOLO (You Only Look Once) dependió en gran medida de la Supresión de no máximos (NMS) para filtrar las cajas delimitadoras redundantes durante el posprocesamiento. Aunque efectiva, la NMS introduce latencia en la inferencia y complica la implementación en dispositivos de borde como la Raspberry Pi o unidades de procesamiento neuronal (NPU) especializadas.

La introducción de YOLOv10 supuso un cambio de paradigma al ser pionero en un diseño integral sin NMS. Basándose en este avance fundamental, Ultralytics YOLO26 refinó la arquitectura para entornos de producción, logrando una eficiencia y facilidad de uso sin precedentes en una mayor variedad de tareas.

El cuello de botella del posprocesamiento

Eliminar la NMS suprime el paso de posprocesamiento dinámico y dependiente de los datos que tradicionalmente obstaculizaba la optimización de modelos de visión artificial en aceleradores de hardware como TensorRT y OpenVINO.

Link to this sectionYOLOv10: Pionero en la detección sin NMS#

Fecha: 2024-05-23
Autores: Ao Wang, Hui Chen, Lihao Liu, et al.
Organización: Tsinghua University
Recursos: ArXiv Paper | GitHub Repository

Desarrollado por investigadores de la Tsinghua University, YOLOv10 introdujo una estrategia de asignación dual consistente para eliminar la necesidad de NMS. Al emplear un diseño de modelo integral basado en la eficiencia y la precisión, se redujo la redundancia computacional manteniendo un sólido mAP (mean Average Precision).

Puntos fuertes:

  • Arquitectura sin NMS: El pionero original del diseño sin NMS en la serie YOLO, lo que reduce drásticamente la latencia para aplicaciones en tiempo real.
  • Eficiencia: Ofrece un buen equilibrio entre el número de parámetros y la velocidad de inferencia en comparación con modelos de generaciones anteriores.

Puntos débiles:

  • Soporte de tareas limitado: Enfocado principalmente en la detección de objetos estándar, carece de soporte nativo listo para usar para tareas avanzadas como segmentación o estimación de poses.
  • Enfoque académico: La base de código, aunque robusta, se inclina más hacia la investigación que hacia una implementación de producción optimizada y de nivel empresarial.

Aprende más sobre YOLOv10

Link to this sectionYOLO26: El nuevo estándar para edge y nube#

Fecha: 2026-01-14
Autores: Glenn Jocher y Jing Qiu
Organización: Ultralytics
Recursos: GitHub Repository | Ultralytics Platform

Lanzado como sucesor de YOLO11, YOLO26 lleva el concepto sin NMS a su realización definitiva. Integra de forma nativa la detección integral en la altamente optimizada Ultralytics Platform, proporcionando un conjunto completo de herramientas para el flujo de trabajo moderno de aprendizaje automático.

YOLO26 presenta varios avances arquitectónicos:

  • Eliminación de DFL: Se ha eliminado por completo la Distribution Focal Loss. Esto simplifica drásticamente el proceso de exportación del modelo y mejora la compatibilidad con dispositivos de borde y de bajo consumo.
  • Hasta un 43% más rápido en inferencia por CPU: Gracias a la eliminación de DFL y a las optimizaciones estructurales, YOLO26 es significativamente más rápido en CPUs, lo que lo hace ideal para despliegues en IoT y dispositivos móviles.
  • Optimizador MuSGD: Inspirado en técnicas de entrenamiento de Grandes Modelos de Lenguaje (LLM) (como Kimi K2 de Moonshot AI), YOLO26 utiliza un híbrido de SGD y Muon. Esto aporta una estabilidad de entrenamiento inigualable y una convergencia más rápida a la visión artificial.
  • ProgLoss + STAL: Estas funciones de pérdida avanzadas producen mejoras notables en el reconocimiento de objetos pequeños, algo crítico para imágenes aéreas y vigilancia de seguridad basada en drones.
  • Mejoras específicas por tarea: YOLO26 no es solo un detector. Incluye pérdida de segmentación semántica y proto multiescala para Segmentación, estimación de log-verosimilitud residual (RLE) para Estimación de poses y pérdida de ángulo especializada para Cajas delimitadoras orientadas (OBB).

Más información sobre YOLO26

Link to this sectionAnálisis de rendimiento y métricas#

La siguiente tabla compara el rendimiento de detección en COCO de los modelos YOLO26 y YOLOv10. Observa cómo YOLO26 logra una precisión superior manteniendo una eficiencia de parámetros excepcional.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv10n64039.5-1.562.36.7
YOLOv10s64046.7-2.667.221.6
YOLOv10m64051.3-5.4815.459.1
YOLOv10b64052.7-6.5424.492.0
YOLOv10l64053.3-8.3329.5120.3
YOLOv10x64054.4-12.256.9160.4

Link to this sectionLa ventaja de Ultralytics: Eficiencia en entrenamiento y memoria#

Al implementar modelos en producción, los requisitos de memoria y la eficiencia del entrenamiento son tan cruciales como la velocidad de inferencia. Los modelos de Ultralytics, particularmente YOLO26, están altamente optimizados para reducir el uso de memoria CUDA durante el entrenamiento. Esto permite que tú, como desarrollador, utilices tamaños de lote más grandes en GPUs de consumo, reduciendo drásticamente el tiempo de entrenamiento y los costes computacionales. Por el contrario, las arquitecturas complejas o los pesados modelos de Transformer como RT-DETR a menudo requieren hardware costoso de alta gama para entrenarse eficazmente.

Integración continua y ecosistema

Uno de los mayores beneficios de elegir YOLO26 es su integración con el ecosistema de Ultralytics, que cuenta con un excelente mantenimiento. Desde el etiquetado de datos hasta el seguimiento de experimentos, la plataforma proporciona todo lo que un ingeniero de aprendizaje automático necesita bajo un mismo techo unificado.

Link to this sectionImplementación práctica: Ejemplo de código#

El sello distintivo de Ultralytics es su facilidad de uso líder en la industria. Con una API de Python intuitiva, migrar de un modelo heredado como YOLOv8 al vanguardista YOLO26 requiere actualizar solo una línea de código.

Aquí tienes un ejemplo 100% ejecutable que demuestra cómo entrenar e inferir usando YOLO26:

from ultralytics import YOLO

# 1. Load the state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# 2. Train the model on the COCO8 dataset efficiently
# The MuSGD optimizer and efficient memory management are handled automatically
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="cpu",  # Easily switch to 0 for GPU
)

# 3. Perform NMS-free inference on a sample image
predictions = model.predict("https://ultralytics.com/images/bus.jpg")

# 4. Display the results to screen
predictions[0].show()

# 5. Export to ONNX for simplified edge deployment
export_path = model.export(format="onnx")
print(f"Model exported successfully to {export_path}")

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLO26 y YOLOv10 depende de los requisitos específicos de tu proyecto, las limitaciones de implementación y las preferencias de ecosistema.

Link to this sectionCuándo elegir YOLO26#

YOLO26 es una excelente opción para:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionCuándo elegir YOLOv10#

YOLOv10 está recomendado para:

  • Detección en tiempo real sin NMS: Aplicaciones que se benefician de una detección integral (end-to-end) sin NMS, lo que reduce la complejidad de la implementación.
  • Equilibrio entre velocidad y precisión: Proyectos que requieren un buen equilibrio entre la velocidad de inferencia y la precisión de detección en varias escalas de modelo.
  • Aplicaciones de latencia constante: Escenarios de despliegue donde los tiempos de inferencia predecibles son críticos, como en robótica o sistemas autónomos.

Link to this sectionConclusión#

Aunque YOLOv10 hizo contribuciones significativas a la comunidad académica al introducir el paradigma sin NMS, YOLO26 eleva esta tecnología a un nivel de preparación empresarial. Con su notable aumento del 43% en la velocidad de la CPU, el innovador optimizador MuSGD y una versatilidad inigualable en tareas de visión, YOLO26 destaca como la elección definitiva tanto para la informática de borde como para implementaciones en la nube a gran escala.

Para los equipos que priorizan una comunidad activa, una documentación exhaustiva y una experiencia de desarrollo sin fricciones, el ecosistema de Ultralytics no tiene rival. Si estás explorando modelos para escenarios especializados, quizás también quieras investigar YOLO-World para detección de vocabulario abierto de disparo cero. Sin embargo, para la gran mayoría de casos de uso del mundo real, YOLO26 es la recomendación definitiva.

Colaboradores

Comentarios