YOLOv9 YOLO26: evolución de la detección de objetos en tiempo real
En el campo de la visión artificial, que avanza rápidamente, seleccionar la arquitectura de modelo adecuada es fundamental para equilibrar el rendimiento, la eficiencia y la facilidad de implementación. Esta comparación explora las diferencias técnicas entre YOLOv9, un potente modelo introducido a principios de 2024, y YOLO26, la última versión de vanguardia de Ultralytics en enero de 2026. Si bien ambos modelos representan hitos importantes en la YOLO , satisfacen diferentes necesidades en cuanto a velocidad, estabilidad de entrenamiento y complejidad de implementación.
Descripción general del modelo y autoría
Comprender el linaje de estas arquitecturas proporciona un contexto para sus filosofías de diseño.
YOLOv9: Información de Gradiente Programable
Autores: Chien-Yao Wang, Hong-Yuan Mark Liao
Organización:Instituto de Ciencias de la Información, Academia Sinica
Fecha: 21/02/2024
Enlaces:Artículo de Arxiv | Repositorio de GitHub
YOLOv9 el concepto de información de gradiente programable (PGI) y la red de agregación de capas eficiente generalizada (GELAN). Estas innovaciones abordaron el problema del «cuello de botella de la información» en las redes neuronales profundas, donde los datos se pierden a medida que pasan por capas sucesivas. La PGI garantiza que la información crítica se conserve en toda la red profunda, lo que permite detecciones muy precisas, especialmente en escenas complejas.
YOLO26: El especialista integral en tecnología de vanguardia
Autores: Glenn Jocher, Jing Qiu
Organización:Ultralytics
Fecha: 14/01/2026
Enlaces:Documentación oficial | Repositorio GitHub
Basándose en el legado de YOLOv8 y YOLO11, YOLO26 representa un cambio hacia una implementación simplificada y de alta velocidad. Es nativamente NMS de extremo a extremo, lo que elimina la necesidad del posprocesamiento de supresión no máxima. Esta elección de diseño, combinada con la eliminación de la pérdida focal de distribución (DFL), hace que YOLO26 sea excepcionalmente rápido en CPU dispositivos periféricos. También es pionero en el uso del optimizador MuSGD, un híbrido de SGD Muon (inspirado en el entrenamiento LLM), para garantizar una convergencia estable.
Comparación de rendimiento y métricas
La siguiente tabla compara el rendimiento de los modelos estándar en el conjunto de datos COCO . Cabe destacar la significativa ventaja en velocidad de YOLO26 en CPU , resultado de la optimización de su arquitectura.
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | parámetros (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv9t | 640 | 38.3 | - | 2.3 | 2.0 | 7.7 |
| YOLOv9s | 640 | 46.8 | - | 3.54 | 7.1 | 26.4 |
| YOLOv9m | 640 | 51.4 | - | 6.43 | 20.0 | 76.3 |
| YOLOv9c | 640 | 53.0 | - | 7.16 | 25.3 | 102.1 |
| YOLOv9e | 640 | 55.6 | - | 16.77 | 57.3 | 189.0 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Análisis de rendimiento
YOLO26 demuestra una clara ventaja en cuanto a latencia y eficiencia computacional. Por ejemplo, YOLO26n alcanza un mAP más alto mAP 40,9 %) que YOLOv9t (38,3 %) utilizando un número significativamente menor de FLOP (5,4 mil millones frente a 7,7 mil millones). Esta eficiencia es crucial para las aplicaciones que se ejecutan en dispositivos periféricos alimentados por batería.
Análisis Arquitectónico en Profundidad
Arquitectura de YOLOv9
YOLOv9 en retener el flujo de información. Su estructura GELAN combina las ventajas de CSPNet (planificación de la ruta del gradiente) y ELAN (velocidad de inferencia) para crear un extractor de características ligero pero potente. La rama auxiliar PGI proporciona información fiable sobre el gradiente durante el entrenamiento a capas más profundas, que luego se elimina durante la inferencia para mantener la ligereza del modelo.
- Ventajas: Precisión excepcional en pruebas de rendimiento difíciles; excelente retención de información para escenas complejas.
- Contras: Requiere NMS ; la arquitectura puede ser compleja de modificar para tareas no estándar; mayor carga computacional para un rendimiento equivalente en comparación con las generaciones más recientes.
Arquitectura de YOLO26
YOLO26 prioriza la velocidad de inferencia y la simplicidad de implementación.
- DiseñoNMS: al entrenar el modelo para predecir coincidencias uno a uno de forma nativa, YOLO26 elimina el NMS heurístico NMS . Esto reduce la variabilidad de la latencia y simplifica TensorRT , ya que NMS eficientes ya no son una dependencia.
- Optimizador MuSGD: inspirado en Kimi K2 de Moonshot AI, este optimizador combina el impulso de SGD las propiedades adaptativas del optimizador Muon. Esto aporta estabilidad al entrenamiento de modelos de lenguaje grande (LLM) a la visión artificial.
- ProgLoss + STAL: La introducción de Progressive Loss y Soft-Target Assignment Loss (STAL) mejora significativamente la detección de objetos pequeños, una debilidad común en los detectores sin anclajes.
Entrenamiento y ecosistema
La experiencia del desarrollador difiere significativamente entre los dos modelos, debido en gran parte a los ecosistemas de software en los que se encuentran.
Facilidad de uso con Ultralytics
Mientras que YOLOv9 se YOLOv9 integrado en el Ultralytics , YOLO26 es un ciudadano nativo. Esto garantiza la compatibilidad desde el primer día con todas las funciones, entre las que se incluyen:
- API Unificada: Cambiar entre tareas como Estimación de pose o Cajas delimitadoras orientadas (OBB) simplemente cambiando el archivo de peso del modelo (por ejemplo,
yolo26n-pose.pt). - Ultralytics : Cargue conjuntos de datos sin problemas, añada anotaciones con asistentes de IA y entrene en la nube utilizando la Ultralytics .
- Flexibilidad de exportación: Compatibilidad nativa para exportar con un solo clic a formatos como CoreML para iOS, TFLite Android y OpenVINO Intel .
from ultralytics import YOLO
# Load the latest YOLO26 model
model = YOLO("yolo26n.pt")
# Train on a custom dataset with MuSGD optimizer enabled automatically
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Export to ONNX for simplified deployment (no NMS plugin needed)
path = model.export(format="onnx")
Memoria y eficiencia de recursos
YOLO26 suele requerir menos GPU durante el entrenamiento en comparación con la arquitectura de doble rama (PGI) YOLOv9. Esto permite a los investigadores utilizar lotes de mayor tamaño en hardware de consumo, como NVIDIA 3060 o 4090, lo que acelera el ciclo de experimentación.
Casos de uso en el mundo real
Cuándo elegir YOLOv9
YOLOv9 un fuerte competidor para escenarios en los que la máxima precisión en pruebas estáticas es la única prioridad y los recursos computacionales son abundantes.
- Investigación académica: Estudio de la teoría del cuello de botella de la información y el flujo gradiente en las CNN.
- Procesamiento del lado del servidor: GPU de alta potencia que analizan material de vídeo archivado, donde la latencia en tiempo real es menos crítica.
Cuándo Elegir YOLO26
YOLO26 es la opción recomendada para entornos de producción y computación periférica.
- Sistemas integrados: su CPU hasta un 43 % más rápida lo hace ideal para implementaciones de Raspberry Pi o NVIDIA en robótica.
- Análisis en tiempo real: el diseño NMS garantiza una latencia determinista, fundamental para la conducción autónoma y los sistemas de seguridad.
- Aplicaciones multimodales: con soporte nativo para la segmentación de instancias y la pose, sirve como una columna vertebral versátil para procesos complejos como el análisis del comportamiento humano en el comercio minorista o los deportes.
Conclusión
Mientras que YOLOv9 conceptos teóricos innovadores con PGI, YOLO26 perfecciona estas lecciones en un paquete pragmático y de alto rendimiento. Su arquitectura integral, la eliminación de los cuellos de botella del posprocesamiento y la integración con el robusto Ultralytics lo convierten en la opción ideal para los desarrolladores que crean la próxima generación de aplicaciones de IA.
Explorar Otros Modelos
Si te interesa explorar otras opciones, considera echar un vistazo a YOLO11, el predecesor de YOLO26, o YOLOv10, que fue pionero en el enfoque NMS.