Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 frente a YOLOv9#

El panorama de la visión por computador avanza rápidamente, con nuevas arquitecturas que superan continuamente los límites de velocidad y precisión. En esta comparativa técnica, analizamos las diferencias entre YOLO26 y YOLOv9, dos modelos muy influyentes en el ámbito de la detección de objetos en tiempo real. Aunque ambos modelos ofrecen innovaciones arquitectónicas distintas, comprender sus compromisos de rendimiento, capacidades de despliegue y requisitos de hardware es crucial para seleccionar la herramienta adecuada para tu próximo proyecto de visión.

Link to this sectionYOLO26: la potencia optimizada para el borde (edge)#

Lanzado a principios de 2026, Ultralytics YOLO26 representa un salto generacional en la eficiencia de despliegue y la estabilidad del entrenamiento de modelos. Diseñado como un framework nativo de extremo a extremo, aborda directamente los cuellos de botella de despliegue que históricamente han afectado a las aplicaciones de IA en el borde.

Detalles del modelo:

Link to this sectionArquitectura e innovaciones#

YOLO26 rediseña fundamentalmente el proceso de post-procesamiento al introducir un diseño de extremo a extremo sin NMS. Al eliminar la necesidad de la supresión de no máximos (NMS), el modelo logra una variabilidad de latencia drásticamente menor. Esto facilita enormemente el despliegue en plataformas móviles y de borde, especialmente al exportar a frameworks como ONNX y Apple CoreML.

Además, la eliminación de Distribution Focal Loss (DFL) agiliza el proceso de exportación y aumenta la compatibilidad con microcontroladores de bajo consumo. Para mejorar la estabilidad del entrenamiento, YOLO26 integra el novedoso optimizador MuSGD, un híbrido de descenso de gradiente estocástico (SGD) y Muon (inspirado en las innovaciones en el entrenamiento de grandes modelos de lenguaje). Esto resulta en una convergencia más rápida y una extracción de características más robusta en conjuntos de datos difíciles.

Inferencia en dispositivos de borde

Gracias a las simplificaciones arquitectónicas y la eliminación de DFL, YOLO26 logra una inferencia en CPU hasta un 43 % más rápida, lo que lo convierte en la elección ideal para dispositivos de borde con recursos limitados como la Raspberry Pi o NVIDIA Jetson Nano.

Para detectar elementos muy desafiantes en escenas como imágenes aéreas de drones, YOLO26 utiliza las funciones de pérdida actualizadas ProgLoss + STAL. Estas proporcionan mejoras notables en la recuperación del reconocimiento de objetos pequeños. Además, cuenta con mejoras específicas para tareas, incluyendo multi-scale proto para segmentación de instancias, estimación de log-verosimilitud residual (RLE) para estimación de pose y pérdida de ángulo especializada para detectar cajas delimitadoras orientadas (OBB).

Más información sobre YOLO26

Link to this sectionYOLOv9: información de gradiente programable#

Introducido a principios de 2024, YOLOv9 aportó avances teóricos a la forma en que las redes neuronales manejan el flujo de gradiente durante la fase de entrenamiento, centrándose en la eficiencia de los parámetros y la retención de características profundas.

Detalles del modelo:

Link to this sectionArquitectura y puntos fuertes#

YOLOv9 está construido en torno al concepto de información de gradiente programable (PGI) y la Generalized Efficient Layer Aggregation Network (GELAN). Estos conceptos abordan el problema del cuello de botella de información a menudo observado en las redes neuronales profundas. Al preservar información esencial a través del proceso de propagación hacia adelante, GELAN asegura que los gradientes utilizados para las actualizaciones de peso sigan siendo fiables. Esta arquitectura ofrece una alta precisión y convierte a YOLOv9 en un firme candidato para la investigación académica sobre la teoría de redes neuronales y la optimización de trayectorias de gradiente utilizando el framework PyTorch.

Link to this sectionLimitaciones#

A pesar de su excelente eficiencia de parámetros, YOLOv9 depende en gran medida del NMS tradicional para el post-procesamiento de cajas delimitadoras, lo que puede crear cuellos de botella computacionales durante la inferencia en dispositivos de borde. Además, el repositorio oficial se centra principalmente en la detección de objetos, lo que requiere una ingeniería personalizada significativa para adaptarlo a tareas especializadas como el seguimiento o la estimación de pose.

Aprende más sobre YOLOv9

Link to this sectionComparación de rendimiento#

Al evaluar estos modelos para el despliegue en el mundo real, es fundamental equilibrar la precisión (mAP), la velocidad de inferencia y el uso de memoria. Los modelos de Ultralytics son famosos por sus bajos requisitos de memoria tanto durante el entrenamiento como en la inferencia, requiriendo mucha menos memoria CUDA que las alternativas basadas en Transformer como RT-DETR.

A continuación, se muestra una comparación directa del rendimiento de YOLO26 y YOLOv9 en el conjunto de datos COCO. Los mejores valores en cada columna se destacan en negrita.

Modelotamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
YOLOv9t64038.3-2.32.07.7
YOLOv9s64046.8-3.547.126.4
YOLOv9m64051.4-6.4320.076.3
YOLOv9c64053.0-7.1625.3102.1
YOLOv9e64055.6-16.7757.3189.0

Nota: Se omiten las velocidades de CPU para YOLOv9, ya que varían mucho según la configuración de NMS y son generalmente más lentas que la implementación nativa sin NMS de YOLO26.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLO26 y YOLOv9 depende de los requisitos específicos de tu proyecto, las limitaciones de despliegue y las preferencias del ecosistema.

Link to this sectionCuándo elegir YOLO26#

YOLO26 es una excelente opción para:

  • Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
  • Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
  • Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionCuándo elegir YOLOv9#

YOLOv9 se recomienda para:

  • Investigación del cuello de botella de información: proyectos académicos que estudian arquitecturas de información de gradiente programable (PGI) y redes de agregación de capas eficientes generalizadas (GELAN).
  • Estudios de optimización del flujo de gradiente: investigación enfocada en comprender y mitigar la pérdida de información en capas de red profundas durante el entrenamiento.
  • Evaluación comparativa de detección de alta precisión: escenarios donde el sólido rendimiento de YOLOv9 en el benchmark COCO es necesario como punto de referencia para comparaciones arquitectónicas.

Link to this sectionLa ventaja de Ultralytics#

Elegir un modelo implica mucho más que leer un benchmark de precisión; el ecosistema de software que lo rodea dicta qué tan rápido puedes pasar de la recopilación de datos a la producción.

Link to this sectionFacilidad de uso y ecosistema#

La API de Python de Ultralytics ofrece una experiencia fluida de principio a fin. En lugar de clonar repositorios complejos o configurar manualmente scripts de entrenamiento distribuido, puedes instalar el paquete a través de pip y comenzar a entrenar inmediatamente. El ecosistema de Ultralytics, que se mantiene activamente, garantiza actualizaciones frecuentes, integraciones automatizadas con plataformas de ML como Weights & Biases y una documentación extensa.

Otros modelos de Ultralytics

Si te interesa explorar otros modelos dentro del ecosistema de Ultralytics, podrías considerar comparar YOLO11 o el clásico YOLOv8, los cuales proporcionan una flexibilidad excepcional para aplicaciones personalizadas.

Link to this sectionVersatilidad en tareas de visión#

Aunque YOLOv9 es principalmente un motor de detección, YOLO26 es una herramienta de visión de propósito general. Utilizando una sintaxis unificada, puedes cambiar fácilmente de la detección de objetos a la segmentación de imágenes con precisión de píxel o a la clasificación de imágenes completas. Esta versatilidad reduce la deuda técnica de mantener múltiples bases de código desconectadas para diferentes características de visión por computador.

Link to this sectionEntrenamiento y despliegue eficientes#

La eficiencia en el entrenamiento es una piedra angular de la filosofía de Ultralytics. YOLO26 utiliza pesos preentrenados fácilmente disponibles y cuenta con un uso de memoria significativamente menor en comparación con los voluminosos Transformers de visión. Una vez entrenados, las canalizaciones de exportación integradas permiten conversiones con un solo clic a formatos optimizados como TensorRT o TensorFlow Lite, allanando el camino hacia la producción.

Link to this sectionEjemplo de código: cómo empezar con YOLO26#

Implementar YOLO26 es increíblemente sencillo. El siguiente fragmento de código Python demuestra cómo cargar un modelo preentrenado, entrenarlo con datos personalizados y ejecutar la inferencia utilizando la API de Ultralytics.

from ultralytics import YOLO

# Load the latest state-of-the-art YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on the COCO8 dataset utilizing the MuSGD optimizer
results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device=0,  # Uses GPU 0, or use 'cpu' for CPU training
)

# Run an NMS-free inference on a sample image
predictions = model("https://ultralytics.com/images/bus.jpg")

# Display the bounding boxes and confidences
predictions[0].show()

Al aprovechar la velocidad, la arquitectura simplificada y el ecosistema robusto de YOLO26, los equipos pueden llevar aplicaciones de IA de visión avanzada al mercado más rápido y con menos obstáculos técnicos que nunca.

Colaboradores

Comentarios