Comparativas de modelos: elige el mejor modelo de detección de objetos para tu proyecto
Elegir la arquitectura de red neuronal adecuada es la piedra angular de cualquier proyecto de visión artificial exitoso. ¡Bienvenido al Centro de Comparación de Modelos de Ultralytics! Esta página centraliza análisis técnicos detallados y benchmarks de rendimiento, diseccionando las ventajas y desventajas entre el último Ultralytics YOLO26 y otras arquitecturas líderes como YOLO11, YOLOv10, RT-DETR y EfficientDet.
Ya sea que tu aplicación exija la latencia de milisegundos de la IA de borde o la precisión de alta fidelidad necesaria para imágenes médicas, esta guía proporciona los conocimientos basados en datos necesarios para tomar una decisión informada. Evaluamos los modelos basándonos en la precisión media media (mAP), la velocidad de inferencia, la eficiencia de parámetros y la facilidad de implementación.
Benchmarks de rendimiento interactivos
Visualizar la relación entre velocidad y precisión es esencial para identificar la "frontera de Pareto" de la detección de objetos: modelos que ofrecen la mejor precisión para una restricción de velocidad dada. El gráfico a continuación contrasta métricas clave en datasets estándar como COCO.
Este gráfico visualiza métricas de rendimiento clave, permitiéndote evaluar rápidamente las ventajas y desventajas entre diferentes modelos. Entender estas métricas es fundamental para seleccionar un modelo que se alinee con tus restricciones de implementación específicas.
Guía de decisión rápida
¿No sabes por dónde empezar? Utiliza este árbol de decisión para reducir las opciones de la arquitectura que mejor se adapte a tus requisitos de hardware y rendimiento.
graph TD
A[Start: Define Project Needs] --> B{Deployment Hardware?}
B -- "Edge / Mobile (CPU/NPU)" --> C{Latency Priority?}
B -- "Cloud / GPU" --> D{Accuracy vs Speed?}
C -- "Extreme Speed (Real-time)" --> E[YOLO26n / YOLO26s]
C -- "Balanced Legacy" --> F[YOLO11s / YOLOv8s]
D -- "Max Accuracy (SOTA)" --> G[YOLO26x / YOLO26l]
D -- "Balanced Performance" --> H[YOLO26m / YOLO11m]
A --> I{Specialized Features?}
I -- "NMS-Free Inference" --> J[YOLO26 / YOLOv10]
I -- "Multitask (Seg/Pose/OBB)" --> K[YOLO26 / YOLO11]
I -- "Video Analytics" --> L[YOLO26 + Tracking]El panorama actual: YOLO26 y más allá
El campo de la detección de objetos avanza rápidamente. Si bien los modelos más antiguos siguen siendo relevantes para el soporte heredado, las nuevas arquitecturas superan los límites de lo que es posible.
Ultralytics YOLO26
Lanzado en enero de 2026, YOLO26 es el modelo de vanguardia más reciente y el punto de partida recomendado para todos los proyectos nuevos. Introduce innovaciones arquitectónicas revolucionarias, incluido un diseño integral sin NMS que elimina la necesidad de posprocesamiento de supresión de no máximos (Non-Maximum Suppression), lo que resulta en tiempos de inferencia más rápidos y predecibles. YOLO26 es hasta un 43% más rápido en CPUs en comparación con generaciones anteriores, lo que lo hace ideal para la implementación en el borde.
Las innovaciones clave incluyen:
- Sin NMS integral (End-to-End): implementación simplificada sin necesidad de posprocesamiento
- Eliminación de DFL: exportaciones optimizadas a ONNX, TensorRT y CoreML
- Optimizador MuSGD: optimizador híbrido SGD/Muon inspirado en el entrenamiento de LLM para una convergencia estable
- ProgLoss + STAL: rendimiento mejorado en la detección de objetos pequeños
YOLO26 representa la cima de la ingeniería de Ultralytics, combinando lo mejor de la eficiencia de CNN con capacidades integrales similares a las de los Transformer. Admite todas las tareas (detección, segmentación, estimación de poses, clasificación y OBB) siendo más pequeño, más rápido y más fácil de implementar que nunca.
Ultralytics YOLO11
YOLO11 sigue siendo un modelo altamente capaz, ofreciendo una reducción del 22% en parámetros en comparación con YOLOv8 mientras mejora la precisión de detección. Está totalmente respaldado y se recomienda para usuarios que necesitan estabilidad probada o que tienen tuberías (pipelines) de YOLO11 existentes.
Modelos de la comunidad: una nota sobre YOLO12 y YOLO13
Es posible que encuentres referencias a YOLO12 o YOLO13 en debates de la comunidad o repositorios.
Actualmente no recomendamos YOLO12 o YOLO13 para su uso en producción.
- YOLO12: Utiliza capas de atención que a menudo causan inestabilidad en el entrenamiento, consumo excesivo de memoria y velocidades de inferencia en CPU significativamente más lentas.
- YOLO13: Los benchmarks indican solo ganancias marginales de precisión sobre YOLO11, siendo más grande y lento. Los resultados reportados han mostrado problemas de reproducibilidad.
Watch: YOLO Models Comparison: Ultralytics YOLO11 vs. YOLOv10 vs. YOLOv9 vs. Ultralytics YOLOv8
Comparaciones detalladas de modelos
Explora nuestras comparaciones técnicas en profundidad para comprender las diferencias arquitectónicas específicas, como la selección del backbone, el diseño de la cabecera (head) y las funciones de pérdida. Los hemos organizado por modelo para un acceso fácil:
YOLO26 vs
YOLO26 es el modelo más reciente de Ultralytics que presenta detección integral sin NMS, el optimizador MuSGD y una inferencia en CPU hasta un 43% más rápida. Está optimizado para la implementación en el borde, logrando al mismo tiempo una precisión de vanguardia.
- YOLO26 vs YOLO11
- YOLO26 vs YOLOv10
- YOLO26 vs YOLOv9
- YOLO26 vs YOLOv8
- YOLO26 vs YOLOv7
- YOLO26 vs YOLOv6-3.0
- YOLO26 vs YOLOv5
- YOLO26 vs PP-YOLOE+
- YOLO26 vs DAMO-YOLO
- YOLO26 vs YOLOX
- YOLO26 vs RT-DETR
- YOLO26 vs EfficientDet
YOLO11 vs
YOLO11 se basa en el éxito de sus predecesores con investigación de vanguardia. Cuenta con una arquitectura de backbone y cuello (neck) mejorada para una mejor extracción de características y una eficiencia optimizada.
- YOLO11 vs YOLO26
- YOLO11 vs YOLOv10
- YOLO11 vs YOLOv9
- YOLO11 vs YOLOv8
- YOLO11 vs YOLOv7
- YOLO11 vs YOLOv6-3.0
- YOLO11 vs YOLOv5
- YOLO11 vs PP-YOLOE+
- YOLO11 vs DAMO-YOLO
- YOLO11 vs YOLOX
- YOLO11 vs RT-DETR
- YOLO11 vs EfficientDet
YOLOv10 vs
Desarrollado por la Universidad Tsinghua, YOLOv10 se centra en eliminar el paso de supresión de no máximos (NMS) para reducir la varianza de latencia, ofreciendo un rendimiento de vanguardia con una carga computacional reducida.
- YOLOv10 vs YOLO26
- YOLOv10 vs YOLO11
- YOLOv10 vs YOLOv9
- YOLOv10 vs YOLOv8
- YOLOv10 vs YOLOv7
- YOLOv10 vs YOLOv6-3.0
- YOLOv10 vs YOLOv5
- YOLOv10 vs PP-YOLOE+
- YOLOv10 vs DAMO-YOLO
- YOLOv10 vs YOLOX
- YOLOv10 vs RT-DETR
- YOLOv10 vs EfficientDet
YOLOv9 vs
YOLOv9 introduce la Información de Gradiente Programable (PGI) y la Red de Agregación de Capas Eficiente Generalizada (GELAN) para abordar la pérdida de información en redes neuronales profundas.
- YOLOv9 vs YOLO26
- YOLOv9 vs YOLO11
- YOLOv9 vs YOLOv10
- YOLOv9 vs YOLOv8
- YOLOv9 vs YOLOv7
- YOLOv9 vs YOLOv6-3.0
- YOLOv9 vs YOLOv5
- YOLOv9 vs PP-YOLOE+
- YOLOv9 vs DAMO-YOLO
- YOLOv9 vs YOLOX
- YOLOv9 vs RT-DETR
- YOLOv9 vs EfficientDet
YOLOv8 vs
Ultralytics YOLOv8 sigue siendo una opción muy popular, con arquitecturas de backbone y cuello (neck) avanzadas y una cabecera dividida sin anclas (anchor-free) para obtener equilibrios óptimos entre precisión y velocidad.
- YOLOv8 vs YOLO26
- YOLOv8 vs YOLO11
- YOLOv8 vs YOLOv10
- YOLOv8 vs YOLOv9
- YOLOv8 vs YOLOv7
- YOLOv8 vs YOLOv6-3.0
- YOLOv8 vs YOLOv5
- YOLOv8 vs PP-YOLOE+
- YOLOv8 vs DAMO-YOLO
- YOLOv8 vs YOLOX
- YOLOv8 vs RT-DETR
- YOLOv8 vs EfficientDet
YOLOv7 vs
YOLOv7 introdujo "trainable bag-of-freebies" y la reparametrización de modelos, centrándose en optimizar el proceso de entrenamiento sin aumentar los costes de inferencia.
- YOLOv7 vs YOLO26
- YOLOv7 vs YOLO11
- YOLOv7 vs YOLOv10
- YOLOv7 vs YOLOv9
- YOLOv7 vs YOLOv8
- YOLOv7 vs YOLOv6-3.0
- YOLOv7 vs YOLOv5
- YOLOv7 vs PP-YOLOE+
- YOLOv7 vs DAMO-YOLO
- YOLOv7 vs YOLOX
- YOLOv7 vs RT-DETR
- YOLOv7 vs EfficientDet
YOLOv6 vs
YOLOv6 de Meituan está diseñado para aplicaciones industriales, incorporando módulos de concatenación bidireccional (BiC) y estrategias de entrenamiento asistidas por anclas.
- YOLOv6-3.0 vs YOLO26
- YOLOv6-3.0 vs YOLO11
- YOLOv6-3.0 vs YOLOv10
- YOLOv6-3.0 vs YOLOv9
- YOLOv6-3.0 vs YOLOv8
- YOLOv6-3.0 vs YOLOv7
- YOLOv6-3.0 vs YOLOv5
- YOLOv6-3.0 vs PP-YOLOE+
- YOLOv6-3.0 vs DAMO-YOLO
- YOLOv6-3.0 vs YOLOX
- YOLOv6-3.0 vs RT-DETR
- YOLOv6-3.0 vs EfficientDet
YOLOv5 vs
Ultralytics YOLOv5 destaca por su facilidad de uso, estabilidad y velocidad. Sigue siendo una opción robusta para proyectos que requieren una amplia compatibilidad con dispositivos.
- YOLOv5 vs YOLO26
- YOLOv5 vs YOLO11
- YOLOv5 vs YOLOv10
- YOLOv5 vs YOLOv9
- YOLOv5 vs YOLOv8
- YOLOv5 vs YOLOv7
- YOLOv5 vs YOLOv6-3.0
- YOLOv5 vs PP-YOLOE+
- YOLOv5 vs DAMO-YOLO
- YOLOv5 vs YOLOX
- YOLOv5 vs RT-DETR
- YOLOv5 vs EfficientDet
RT-DETR vs
RT-DETR (Real-Time Detection Transformer) utiliza vision transformers para lograr una alta precisión con un rendimiento en tiempo real, destacando en la comprensión del contexto global.
- RT-DETR vs YOLO26
- RT-DETR vs YOLO11
- RT-DETR vs YOLOv10
- RT-DETR vs YOLOv9
- RT-DETR vs YOLOv8
- RT-DETR vs YOLOv7
- RT-DETR vs YOLOv6-3.0
- RT-DETR vs YOLOv5
- RT-DETR vs PP-YOLOE+
- RT-DETR vs DAMO-YOLO
- RT-DETR vs YOLOX
- RT-DETR vs EfficientDet
PP-YOLOE+ vs
PP-YOLOE+, desarrollado por Baidu, utiliza el aprendizaje de alineación de tareas (Task Alignment Learning, TAL) y un head desacoplado para equilibrar la eficiencia y la precisión.
- PP-YOLOE+ vs YOLO26
- PP-YOLOE+ vs YOLO11
- PP-YOLOE+ vs YOLOv10
- PP-YOLOE+ vs YOLOv9
- PP-YOLOE+ vs YOLOv8
- PP-YOLOE+ vs YOLOv7
- PP-YOLOE+ vs YOLOv6-3.0
- PP-YOLOE+ vs YOLOv5
- PP-YOLOE+ vs DAMO-YOLO
- PP-YOLOE+ vs YOLOX
- PP-YOLOE+ vs RT-DETR
- PP-YOLOE+ vs EfficientDet
DAMO-YOLO vs
De Alibaba Group, DAMO-YOLO emplea la búsqueda de arquitectura neuronal (Neural Architecture Search, NAS) y un RepGFPN eficiente para maximizar la precisión en benchmarks estáticos.
- DAMO-YOLO vs YOLO26
- DAMO-YOLO vs YOLO11
- DAMO-YOLO vs YOLOv10
- DAMO-YOLO vs YOLOv9
- DAMO-YOLO vs YOLOv8
- DAMO-YOLO vs YOLOv7
- DAMO-YOLO vs YOLOv6-3.0
- DAMO-YOLO vs YOLOv5
- DAMO-YOLO vs PP-YOLOE+
- DAMO-YOLO vs YOLOX
- DAMO-YOLO vs RT-DETR
- DAMO-YOLO vs EfficientDet
YOLOX vs
YOLOX, desarrollado por Megvii, es una evolución sin anclas conocida por su head desacoplado y su estrategia de asignación de etiquetas SimOTA.
- YOLOX vs YOLO26
- YOLOX vs YOLO11
- YOLOX vs YOLOv10
- YOLOX vs YOLOv9
- YOLOX vs YOLOv8
- YOLOX vs YOLOv7
- YOLOX vs YOLOv6-3.0
- YOLOX vs YOLOv5
- YOLOX vs RT-DETR
- YOLOX vs PP-YOLOE+
- YOLOX vs DAMO-YOLO
- YOLOX vs EfficientDet
EfficientDet vs
EfficientDet de Google Brain utiliza escalado compuesto y BiFPN para optimizar la eficiencia de los parámetros, ofreciendo un espectro de modelos (D0-D7) para diferentes restricciones.
- EfficientDet vs YOLO26
- EfficientDet frente a YOLO11
- EfficientDet frente a YOLOv10
- EfficientDet frente a YOLOv9
- EfficientDet frente a YOLOv8
- EfficientDet frente a YOLOv7
- EfficientDet frente a YOLOv6-3.0
- EfficientDet frente a YOLOv5
- EfficientDet frente a PP-YOLOE+
- EfficientDet frente a DAMO-YOLO
- EfficientDet frente a YOLOX
- EfficientDet frente a RT-DETR
Este índice se actualiza continuamente a medida que se lanzan nuevos modelos y se perfeccionan los benchmarks. Te animamos a explorar estos recursos para encontrar el modelo perfecto para tu próximo proyecto de visión artificial. Si buscas soluciones de nivel empresarial con licencias privadas, visita nuestra página de licencias. ¡Feliz comparación!