Meet YOLO26: next-gen vision AI.

Link to this sectionComparativas de modelos: elige el mejor modelo de detección de objetos para tu proyecto#

Elegir la arquitectura de red neuronal adecuada es la piedra angular de cualquier proyecto de computer vision exitoso. ¡Bienvenido al Ultralytics Model Comparison Hub! Esta página centraliza análisis técnicos detallados y comparativas de rendimiento, diseccionando los compromisos entre el último Ultralytics YOLO26 y otras arquitecturas líderes como YOLO11, YOLOv10, RT-DETR y EfficientDet.

Tanto si tu aplicación exige la latencia de milisegundos de la edge AI como la precisión de alta fidelidad necesaria para imágenes médicas, esta guía proporciona los conocimientos basados en datos necesarios para tomar una decisión informada. Evaluamos los modelos en función de la mean Average Precision (mAP), la inference speed, la eficiencia de parámetros y la facilidad de despliegue.

Link to this sectionComparativas de rendimiento interactivas#

Visualizar la relación entre velocidad y precisión es fundamental para identificar la "frontera de Pareto" de la detección de objetos: modelos que ofrecen la mejor precisión para una restricción de velocidad determinada. El gráfico siguiente contrasta métricas clave en datasets like COCO estándar.

Este gráfico visualiza las performance metrics clave, lo que te permite evaluar rápidamente las contrapartidas entre los diferentes modelos. Entender estas métricas es fundamental para seleccionar un modelo que se ajuste a tus restricciones de despliegue específicas.

Link to this sectionGuía de decisión rápida#

¿No sabes por dónde empezar? Utiliza este árbol de decisión para reducir la búsqueda de la arquitectura que mejor se adapte a tus requisitos de hardware y rendimiento.

graph TD
    A[Start: Define Project Needs] --> B{Deployment Hardware?}
    B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
    B -- "Cloud / GPU" --> D{Accuracy vs Speed?}

    C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
    C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]

    D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
    D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]

    A --> I{Specialized Features?}
    I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
    I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
    I -- "Video Analytics" --> L[YOLO26 + Tracking]

Link to this sectionEl panorama actual: YOLO26 y más allá#

El campo de la detección de objetos avanza rápidamente. Aunque los modelos antiguos siguen siendo relevantes para el soporte heredado, las nuevas arquitecturas superan los límites de lo que es posible.

Link to this sectionUltralytics YOLO26#

Lanzado en enero de 2026, YOLO26 es el modelo más reciente y puntero, y el punto de partida recomendado para todos los proyectos nuevos. Introduce innovaciones arquitectónicas revolucionarias, incluido un diseño integral (End-to-End) sin NMS que elimina la necesidad de postprocesamiento de Non-Maximum Suppression, lo que resulta en tiempos de inferencia más rápidos y predecibles. YOLO26 es hasta un 43% más rápido en CPUs en comparación con generaciones anteriores, lo que lo hace ideal para el despliegue en el extremo (edge).

Entre las innovaciones clave se incluyen:

  • NMS-Free End-to-End: despliegue simplificado sin necesidad de postprocesamiento
  • Eliminación de DFL: exportaciones optimizadas a ONNX, TensorRT y CoreML
  • Optimizador MuSGD: optimizador híbrido SGD/Muon inspirado en el entrenamiento de LLM para una convergencia estable
  • ProgLoss + STAL: rendimiento mejorado en la detección de objetos pequeños
¿Por qué elegir YOLO26?

YOLO26 representa la cúspide de la ingeniería de Ultralytics, combinando lo mejor de la eficiencia de las CNN con capacidades integrales tipo Transformer. Soporta todas las tareas —detección, segmentación, estimación de poses, clasificación y OBB— a la vez que es más pequeño, más rápido y más fácil de desplegar que nunca.

Link to this sectionUltralytics YOLO11#

YOLO11 sigue siendo un modelo altamente capaz, ofreciendo una reducción del 22% en parámetros en comparación con YOLOv8, mejorando al mismo tiempo la precisión de detección. Es totalmente compatible y se recomienda para usuarios que necesiten estabilidad probada o tengan pipelines de YOLO11 existentes.

Link to this sectionModelos de la comunidad: una nota sobre YOLO12 y YOLO13#

Es posible que encuentres referencias a YOLO12 o YOLO13 en debates o repositorios de la comunidad.

Advertencia para producción

Actualmente no recomendamos YOLO12 o YOLO13 para su uso en producción.

  • YOLO12: utiliza capas de atención que a menudo provocan inestabilidad en el entrenamiento, un consumo excesivo de memoria y velocidades de inferencia en CPU significativamente más lentas.
  • YOLO13: las comparativas indican solo ganancias marginales de precisión sobre YOLO11, siendo a su vez más grande y lento. Los resultados reportados han mostrado problemas de reproducibilidad.


Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8

Link to this sectionComparativas detalladas de modelos#

Explora nuestras comparaciones técnicas en profundidad para entender las diferencias arquitectónicas específicas, como la selección del backbone, el diseño de la head y las funciones de pérdida. Los hemos organizado por modelo para facilitar el acceso:

Link to this sectionYOLO26 frente a#

YOLO26 es el modelo más reciente de Ultralytics, con detección integral sin NMS, el optimizador MuSGD y hasta un 43% más de velocidad de inferencia en CPU. Está optimizado para el despliegue en el extremo (edge) a la vez que logra una precisión de última generación.

Link to this sectionYOLO11 frente a#

YOLO11 aprovecha el éxito de sus predecesores con investigación de vanguardia. Cuenta con una arquitectura de backbone y cuello mejorada para una mejor extracción de características y una eficiencia optimizada.

Link to this sectionYOLOv10 frente a#

Desarrollado por la Universidad de Tsinghua, YOLOv10 se centra en eliminar el paso de Non-Maximum Suppression (NMS) para reducir la varianza de latencia, ofreciendo un rendimiento de vanguardia con un menor consumo computacional.

Link to this sectionYOLOv9 frente a#

YOLOv9 introduce Programmable Gradient Information (PGI) y la arquitectura Generalized Efficient Layer Aggregation Network (GELAN) para abordar la pérdida de información en redes neuronales profundas.

Link to this sectionYOLOv8 frente a#

Ultralytics YOLOv8 sigue siendo una opción muy popular, con arquitecturas de backbone y cuello avanzadas y una head dividida sin anclas para obtener un equilibrio óptimo entre precisión y velocidad.

Link to this sectionYOLOv7 frente a#

YOLOv7 introdujo "trainable bag-of-freebies" y la re-parametrización de modelos, centrándose en optimizar el proceso de entrenamiento sin aumentar los costes de inferencia.

Link to this sectionYOLOv6 vs#

El YOLOv6 de Meituan está diseñado para aplicaciones industriales, incorporando módulos de concatenación bidireccional (BiC) y estrategias de entrenamiento con anclajes.

Link to this sectionYOLOv5 vs#

Ultralytics YOLOv5 destaca por su facilidad de uso, estabilidad y velocidad. Sigue siendo una opción sólida para proyectos que requieren una amplia compatibilidad de dispositivos.

Link to this sectionRT-DETR vs#

RT-DETR (Real-Time Detection Transformer) utiliza transformadores de visión para lograr una alta precisión con un rendimiento en tiempo real, destacando en la comprensión del contexto global.

Link to this sectionPP-YOLOE+ vs#

PP-YOLOE+, desarrollado por Baidu, utiliza el aprendizaje de alineación de tareas (TAL) y una cabeza desacoplada para equilibrar eficiencia y precisión.

Link to this sectionDAMO-YOLO vs#

De Alibaba Group, DAMO-YOLO emplea búsqueda de arquitectura neuronal (NAS) y RepGFPN eficiente para maximizar la precisión en pruebas comparativas estáticas.

Link to this sectionYOLOX vs#

YOLOX, desarrollado por Megvii, es una evolución sin anclajes conocida por su cabeza desacoplada y su estrategia de asignación de etiquetas SimOTA.

Link to this sectionEfficientDet vs#

EfficientDet de Google Brain utiliza escalado compuesto y BiFPN para optimizar la eficiencia de los parámetros, ofreciendo un espectro de modelos (D0-D7) para diferentes restricciones.

Este índice se actualiza continuamente a medida que se lanzan nuevos modelos y se refinan los benchmarks. Te animamos a explorar estos recursos para encontrar el ajuste perfecto para tu próximo proyecto de visión artificial. Si buscas soluciones de nivel empresarial con licencias privadas, visita nuestra página de Licencias. ¡Feliz comparación!

Comentarios