Link to this sectionYOLO26 frente a YOLOv5#
La evolución de la visión artificial ha estado definida por la búsqueda incesante de velocidad, precisión y accesibilidad. Elegir la arquitectura adecuada es fundamental para el éxito de cualquier proyecto de IA. En esta guía completa, comparamos dos lanzamientos monumentales de Ultralytics: el pionero YOLOv5 y el innovador YOLO26. Aunque ambos han influido profundamente en el panorama de la detección de objetos en tiempo real, sus tecnologías subyacentes reflejan un cambio de paradigma masivo en la forma en que las redes neuronales procesan los datos visuales.
Link to this sectionDescripción general del modelo#
Antes de adentrarnos en los matices arquitectónicos, establezcamos los detalles fundamentales de ambos modelos.
Detalles de YOLO26:
- Autores: Glenn Jocher y Jing Qiu
- Organización: Ultralytics
- Fecha: 14-01-2026
- GitHub: https://github.com/ultralytics/ultralytics
- Documentación: Documentación de YOLO26
Detalles de YOLOv5:
- Autores: Glenn Jocher
- Organización: Ultralytics
- Fecha: 2020-06-26
- GitHub: https://github.com/ultralytics/yolov5
- Documentación: YOLOv5 Documentation
Link to this sectionInnovaciones arquitectónicas#
La brecha de seis años entre YOLOv5 y YOLO26 representa un salto masivo en la investigación de aprendizaje profundo. YOLOv5 popularizó el uso generalizado de PyTorch para modelos de visión, ofreciendo un mecanismo de detección basado en anclas altamente optimizado que se convirtió en el estándar de la industria. Sin embargo, dependía en gran medida de la Supresión no máxima (NMS) durante el posprocesamiento, lo que podía introducir cuellos de botella de latencia en dispositivos con recursos limitados.
YOLO26 reimagina por completo el proceso de inferencia con un diseño integral sin NMS. Al eliminar la necesidad de posprocesamiento NMS, YOLO26 ofrece una lógica de despliegue más rápida y mucho más sencilla, un concepto pionero en YOLOv10 pero perfeccionado aquí. Además, YOLO26 cuenta con la eliminación de DFL (Distribution Focal Loss), que simplifica drásticamente el cabezal de salida. Esto hace que exportar el modelo a formatos como ONNX y TensorRT sea increíblemente fluido, garantizando una excelente compatibilidad con dispositivos de borde y de bajo consumo.
Durante el entrenamiento, YOLO26 emplea el optimizador de vanguardia MuSGD Optimizer, un híbrido de SGD y Muon inspirado en el Kimi K2 de Moonshot AI. Esto traslada las innovaciones en el entrenamiento de LLM al ámbito de la visión artificial, garantizando un entrenamiento altamente estable y una convergencia significativamente más rápida en comparación con los optimizadores tradicionales SGD o AdamW utilizados en YOLOv5.
Link to this sectionRendimiento y métricas#
Al evaluar modelos, el equilibrio entre la precisión media promedio (mAP) y la velocidad de inferencia dicta la viabilidad en el mundo real. YOLO26 está optimizado de forma nativa tanto para GPU de gama alta como para CPU de borde.
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Los puntos de referencia revelan una mejora asombrosa. Por ejemplo, YOLO26n alcanza un mAP de 40.9 en comparación con el 28.0 de YOLOv5n, al tiempo que ofrece hasta un 43% más de velocidad en la inferencia por CPU. Esto hace que YOLO26 sea muy superior para despliegues integrados como Raspberry Pi o dispositivos móviles. Aunque YOLOv5 mantiene una ligera ventaja en la velocidad de la GPU con TensorRT en la escala Nano, la compensación en precisión favorece enormemente a YOLO26.
Link to this sectionEcosistema de entrenamiento y facilidad de uso#
Ambos modelos se benefician enormemente del ecosistema Ultralytics, que cuenta con un buen mantenimiento. Ofrecen una experiencia "de cero a cien" con una API de Python simplificada, documentación extensa y soporte activo de la comunidad. Sin embargo, YOLO26 lleva la eficiencia del entrenamiento a un nuevo nivel.
Los modelos de Ultralytics exigen constantemente mucha menos memoria CUDA durante el entrenamiento que las alternativas centradas en Transformer. YOLO26 amplifica esto con sus funciones de pérdida ProgLoss + STAL. Estos avances producen mejoras notables en el reconocimiento de objetos pequeños sin aumentar la carga de memoria.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()Este script sencillo permite a los desarrolladores iterar rápidamente en conjuntos de datos personalizados, pasando sin problemas desde la ingesta de datos hasta un modelo listo para producción.
Al utilizar la plataforma Ultralytics, puedes exportar automáticamente tus modelos YOLO26 entrenados a formatos como CoreML o TensorFlow Lite sin escribir ni una sola línea de código de conversión.
Link to this sectionVersatilidad y casos de uso ideales#
Link to this sectionCuándo usar YOLOv5#
YOLOv5 sigue siendo un caballo de batalla fiable para sistemas heredados. Si tienes un proceso industrial existente fuertemente vinculado a resultados basados en anclas, o si ejecutas inferencia en dispositivos NVIDIA Jetson antiguos con pilas TensorRT maduras y congeladas, YOLOv5 ofrece una solución estable y altamente documentada.
Link to this sectionCuándo usar YOLO26#
YOLO26 es la opción definitiva para los proyectos modernos de visión artificial. Su versatilidad supera con creces a la de su predecesor. Mientras que YOLOv5 se centra principalmente en la detección (con adiciones posteriores de segmentación), YOLO26 ofrece un soporte profundo y nativo para segmentación de instancias, estimación de poses, clasificación de imágenes y cuadros delimitadores orientados (OBB).
YOLO26 introduce mejoras específicas para cada tarea, como una pérdida de segmentación semántica especializada, estimación residual de log-verosimilitud (RLE) para puntos clave de pose de ultra precisión y una pérdida de ángulo avanzada para OBB que resuelve problemas complicados de límites.
- Edge IoT y robótica: La arquitectura sin NMS y la inferencia por CPU un 43% más rápida hacen que YOLO26 sea ideal para la navegación robótica en tiempo real y las cámaras de hogar inteligente.
- Imágenes aéreas: Las mejoras de ProgLoss + STAL hacen que la detección de objetos minúsculos desde drones (como vehículos en aparcamientos o cultivos en campos agrícolas) sea sustancialmente más fiable.
- Analítica de vídeo en tiempo real: Ya sea para realizar el seguimiento de atletas en retransmisiones deportivas o para controlar el flujo del tráfico, el equilibrio de rendimiento de YOLO26 garantiza una alta recuperación sin perder fotogramas.
En última instancia, el compromiso de Ultralytics con un ecosistema accesible y de alto rendimiento garantiza que la transición de YOLOv5 a YOLO26 sea fluida, desbloqueando capacidades de vanguardia tanto para investigadores como para desarrolladores.