Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs YOLO26#

La evolución de la visión artificial ha estado marcada por la búsqueda continua de modelos más rápidos, precisos y accesibles. Al comparar Ultralytics YOLOv5 con el vanguardista Ultralytics YOLO26, observamos un cambio de paradigma que tiende un puente entre los sistemas robustos heredados y la vanguardia del despliegue de IA moderna.

Esta guía proporciona un desglose técnico exhaustivo de ambas arquitecturas, destacando sus métricas de rendimiento, diferencias estructurales y escenarios de despliegue ideales.

Link to this sectionResumen de modelos#

Link to this sectionYOLOv5: El caballo de batalla del sector#

Lanzado en 2020, YOLOv5 revolucionó la accesibilidad de la detección de objetos. Al migrar la arquitectura de forma nativa al framework PyTorch, ofreció a los desarrolladores una experiencia "de cero a héroe" sin precedentes.

YOLOv5 estableció los cimientos del ecosistema Ultralytics, altamente mantenido. Introdujo técnicas de aumento de datos agresivas, bucles de entrenamiento eficientes y rutas de exportación altamente optimizadas a formatos de borde como CoreML y ONNX. Su facilidad de uso y sus bajos requisitos de memoria durante el entrenamiento lo convirtieron en un elemento básico para startups e investigadores de todo el mundo.

Más información sobre YOLOv5

Link to this sectionYOLO26: El estándar de IA de visión de próxima generación#

Avanzando hasta enero de 2026, Ultralytics YOLO26 representa la cúspide de la IA de visión en tiempo real. Integra de forma nativa las lecciones aprendidas de generaciones intermedias como YOLOv8 y YOLO11, al tiempo que introduce avances masivos inspirados en el entrenamiento de Modelos de Lenguaje Extensos (LLM).

YOLO26 establece un nuevo punto de referencia para el equilibrio de rendimiento, ofreciendo una precisión de vanguardia a la vez que está diseñado explícitamente para dominar los escenarios de computación de borde.

Más información sobre YOLO26

Otros modelos de Ultralytics

Si vas a migrar una base de código antigua, quizá también te interese comparar YOLOv5 con YOLO11, el modelo de generación anterior que introdujo soporte inicial para tareas diversas como la Estimación de Pose y las Cajas Delimitadoras Orientadas (OBB).

Link to this sectionAvances arquitectónicos en YOLO26#

Mientras que YOLOv5 se basa en cabezales de detección basados en anclas y funciones de pérdida estándar, YOLO26 revisa por completo los mecanismos internos para eliminar los cuellos de botella en el despliegue.

  1. Diseño integral sin NMS: La diferencia más significativa es la arquitectura nativa de extremo a extremo de YOLO26. A diferencia de YOLOv5, que requiere la Supresión No Máxima (NMS) manual para filtrar cajas delimitadoras redundantes, YOLO26 elimina este paso de posprocesamiento por completo. Esto garantiza una latencia de inferencia determinista y simplifica drásticamente la integración en C++ o hardware integrado.
  2. Eliminación de DFL: YOLO26 elimina la Pérdida Focal de Distribución (DFL). Esta decisión arquitectónica simplifica drásticamente la exportación del modelo y mejora la compatibilidad con dispositivos de borde de baja potencia y microcontroladores que a menudo tienen dificultades con operadores complejos.
  3. Optimizador MuSGD: Siguiendo el ejemplo de Kimi K2 de Moonshot AI, YOLO26 utiliza el Optimizador MuSGD, un híbrido de SGD y Muon. Esto aporta la estabilidad y la rápida convergencia observadas en el entrenamiento de LLM a la visión artificial, lo que resulta en un menor uso de memoria y ciclos de entrenamiento más rápidos en comparación con los modelos centrados en Transformer.
  4. ProgLoss + STAL: YOLO26 utiliza funciones sofisticadas de ProgLoss y STAL, mejorando considerablemente su capacidad para detectar objetos pequeños y densos, un desafío histórico para YOLOv5.

Link to this sectionComparación de rendimiento#

Al comparar los modelos en el conjunto de datos COCO, YOLO26 muestra mejoras masivas en precisión (mAP) mientras reduce simultáneamente el número de parámetros y las velocidades de inferencia de CPU.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9

Nota: El YOLO26 Nano (YOLO26n) alcanza un asombroso 40.9 mAP en comparación con el 28.0 mAP de YOLOv5n, todo ello mientras ofrece hasta un 43% de inferencia de CPU más rápida debido a la eliminación de DFL y al cabezal sin NMS.

Link to this sectionVersatilidad y soporte de tareas#

YOLOv5 es principalmente conocido por la detección de objetos. Aunque las actualizaciones posteriores introdujeron una segmentación básica, YOLO26 se construyó desde cero para ser un motor multitarea unificado.

YOLO26 admite de forma inherente:

  • Segmentación de instancias: Con prototipos multiescala específicos para cada tarea y pérdida de segmentación semántica.
  • Estimación de Pose: Utiliza la Estimación de Log-Verosimilitud Residual (RLE) para una detección de puntos clave altamente precisa.
  • Cajas Delimitadoras Orientadas (OBB): Incluye una pérdida angular especializada para resolver problemas de discontinuidad en los límites, fundamental para el análisis de imágenes por satélite.
  • Clasificación de imágenes: Categorización estándar de imágenes completas.
Integración del ecosistema

Ambos modelos se benefician de la Plataforma Ultralytics, proporcionando anotación de datos fluida, ajuste automatizado de hiperparámetros y despliegue en la nube con un solo clic. Sin embargo, YOLO26 aprovecha al máximo las estructuras modernas de API.

Link to this sectionUso y ejemplos de código#

La API de Python de Ultralytics hace que cambiar entre modelos sea increíblemente sencillo. Como ambos modelos comparten el mismo ecosistema bien mantenido, actualizar un pipeline heredado de YOLOv5 a YOLO26 solo requiere cambiar el archivo de pesos.

Link to this sectionEjemplo en Python#

from ultralytics import YOLO

# To use YOLOv5, load a v5 weights file
# model = YOLO("yolov5su.pt")

# Migrate to the recommended YOLO26 model
model = YOLO("yolo26n.pt")

# Train on the COCO8 dataset using the efficient MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    batch=32,  # YOLO26's low memory footprint allows larger batch sizes
)

# Run an NMS-free inference
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()

Link to this sectionEjemplo en CLI#

Puedes desplegar YOLO26 directamente a través de la línea de comandos utilizando la integración de TensorRT para obtener el máximo rendimiento de la GPU:

# Export the model to TensorRT format
yolo export model=yolo26n.pt format=engine

# Run inference with the compiled engine
yolo predict model=yolo26n.engine source=path/to/video.mp4

Link to this sectionCasos de uso ideales#

Link to this sectionCuándo elegir YOLO26#

Para cualquier proyecto moderno de visión artificial, YOLO26 es la recomendación indiscutible.

  • IA de borde e IoT: Su inferencia de CPU un 43% más rápida y la eliminación de DFL lo hacen perfecto para su despliegue en una Raspberry Pi o dispositivos móviles.
  • Pipelines de alta velocidad: La arquitectura sin NMS garantiza una latencia estable y predecible, algo crucial para la robótica autónoma y los sistemas de alarma de seguridad en tiempo real.
  • Escenarios complejos: Si tu aplicación requiere el seguimiento de objetos pequeños (por ejemplo, monitoreo con drones) u objetos en rotación (OBB), las funciones de pérdida avanzadas de YOLO26 (ProgLoss + STAL) proporcionan una ventaja de precisión masiva.

Link to this sectionCuándo elegir YOLOv5#

  • Sistemas heredados: Si tu entorno de producción tiene dependencias codificadas en la generación de anclas específica o en la lógica de análisis NMS de YOLOv5, la migración podría requerir un breve período de refactorización.
  • Líneas de base académicas específicas: Los investigadores a menudo utilizan YOLOv5 como una línea de base clásica para demostrar la progresión histórica de las arquitecturas de detección de objetos.

Link to this sectionResumen#

La transición de YOLOv5 a YOLO26 no es solo una actualización iterativa; es un salto fundamental en cómo se entrenan y despliegan los modelos de detección de objetos. Al aprovechar el optimizador MuSGD, eliminar el posprocesamiento complejo mediante un diseño sin NMS y acelerar masivamente las velocidades de CPU, Ultralytics YOLO26 ofrece un equilibrio sin concesiones entre velocidad y precisión.

Aunque siempre recordaremos a YOLOv5 como el modelo que democratizó la IA de visión, los desarrolladores que busquen construir aplicaciones robustas, listas para producción y preparadas para el futuro deberían construir con confianza sobre YOLO26.

Colaboradores

Comentarios