Link to this sectionYOLOv10 frente a EfficientDet#

Seleccionar la red neuronal óptima para la detección de objetos es una decisión crítica que determina el éxito de los sistemas modernos de visión artificial. Dos arquitecturas destacadas que han influido significativamente en el campo son YOLOv10 y EfficientDet. Aunque ambas buscan maximizar la precisión mientras minimizan la carga computacional, adoptan enfoques arquitectónicos muy diferentes para lograr estos objetivos.

Esta guía completa profundiza en sus diseños únicos, metodologías de entrenamiento y características de despliegue, ayudando a desarrolladores e ingenieros de ML a tomar decisiones basadas en datos para aplicaciones de visión artificial. Examinaremos cómo rinden en hardware que va desde dispositivos de IA en el borde integrados hasta potentes GPU en la nube.

Link to this sectionYOLOv10: El pionero sin NMS#

Desarrollado para superar los límites de la latencia en tiempo real, YOLOv10 abordó uno de los cuellos de botella más persistentes de la familia YOLO: la supresión de no máximos (NMS). Al eliminar este paso de postprocesamiento, el modelo logra una latencia altamente predecible, lo cual es crítico para vehículos autónomos y robótica de alta velocidad.

Link to this sectionInnovaciones arquitectónicas#

YOLOv10 introduce asignaciones duales consistentes para el entrenamiento sin NMS. Durante el entrenamiento, aprovecha tanto las asignaciones de etiquetas uno-a-muchos como uno-a-uno, permitiendo que la red aprenda representaciones ricas mientras genera de forma nativa una única mejor caja delimitadora por objeto durante la inferencia. La arquitectura también incorpora un diseño integral impulsado por la eficiencia y la precisión, optimizando la cabecera de clasificación y reduciendo la redundancia computacional encontrada en iteraciones anteriores.

Link to this sectionDetalles del modelo#

Autores: Ao Wang, Hui Chen, Lihao Liu, et al.
Organización: Tsinghua University
Fecha: 23-05-2024
Artículo: YOLOv10: Real-Time End-to-End Object Detection
GitHub: THU-MIG/yolov10
Documentación: Documentación de YOLOv10

Despliegue optimizado

Debido a que YOLOv10 elimina el paso de NMS, es inherentemente más fácil de exportar a formatos como el formato ONNX y NVIDIA TensorRT sin depender de plugins de tiempo de ejecución personalizados para el filtrado de cajas delimitadoras.

Puntos fuertes:

Inferencia predecible: La eliminación de NMS garantiza tiempos de inferencia consistentes independientemente del número de objetos en la escena.
Menor uso de memoria: Comparado con modelos basados en Transformer como RT-DETR, YOLOv10 disfruta de requisitos de memoria significativamente menores tanto durante el entrenamiento como en la inferencia.
Excelente relación velocidad/precisión: Optimizado específicamente para escenarios de baja latencia sin sacrificar métricas de rendimiento.

Puntos débiles:

Enfoque de tarea única: A diferencia del ecosistema Ultralytics más amplio, el repositorio original de YOLOv10 está fuertemente centrado en la detección, careciendo de soporte nativo para segmentación de instancias o estimación de poses.

Aprende más sobre YOLOv10

Link to this sectionEfficientDet: Escalable y equilibrado#

Introducido por Google Brain, EfficientDet aborda la detección de objetos a través de la lente del escalado sistemático de redes. Se basa en la arquitectura de clasificación de imágenes EfficientNet e introduce un mecanismo novedoso de fusión de características.

Link to this sectionInnovaciones arquitectónicas#

El núcleo de EfficientDet es la red de pirámide de características bidireccional (BiFPN), que permite una fusión de características multiescala fácil y rápida. A diferencia de las FPN tradicionales que solo suman características de arriba hacia abajo, BiFPN introduce conexiones bidireccionales entre escalas y pesos entrenables para aprender la importancia de las diferentes características de entrada. Además, EfficientDet utiliza un método de escalado compuesto que escala uniformemente la resolución, la profundidad y el ancho para todas las redes de columna vertebral, redes de características y redes de predicción de cajas/clases.

Link to this sectionDetalles del modelo#

Autores: Mingxing Tan, Ruoming Pang y Quoc V. Le
Organización: Google Brain
Fecha: 20-11-2019
Artículo: EfficientDet: Scalable and Efficient Object Detection
GitHub: Google AutoML EfficientDet

Puntos fuertes:

Alta eficiencia: Excelente relación parámetros-precisión, haciendo que las variantes más pequeñas de -d0 a -d2 sean muy ligeras.
Escalado basado en principios: El escalado compuesto permite a los usuarios elegir fácilmente un tamaño de modelo que se ajuste exactamente a su presupuesto computacional.

Puntos débiles:

Integración con marcos antiguos: La implementación original depende en gran medida de versiones anteriores de TensorFlow, lo que puede complicar los flujos de trabajo de despliegue modernos.
Entrenamiento más lento: Entrenar EfficientDet desde cero es notoriamente lento y requiere un ajuste cuidadoso de hiperparámetros en comparación con la rápida convergencia de las arquitecturas YOLO.
Velocidad de inferencia: Aunque es eficiente en cuanto a parámetros, las complejas operaciones de BiFPN a menudo resultan en velocidades de inferencia más lentas en el mundo real en hardware estándar en comparación con los modelos YOLO altamente optimizados.

Más información sobre EfficientDet

Link to this sectionRendimiento y benchmarks#

La verdadera prueba de estos modelos radica en su rendimiento empírico en puntos de referencia estándar como el conjunto de datos COCO. La siguiente tabla ilustra las diferencias críticas en el recuento de parámetros, las operaciones de punto flotante (FLOPs) y la latencia de inferencia en GPU NVIDIA T4.

Modelo	tamaño ^(píxeles)	mAP^val 50-95	Velocidad ^{CPU ONNX (ms)}	Velocidad ^{T4 TensorRT10 (ms)}	params ^(M)	FLOPs ^(B)
YOLOv10n	640	39.5	-	1.56	2.3	6.7
YOLOv10s	640	46.7	-	2.66	7.2	21.6
YOLOv10m	640	51.3	-	5.48	15.4	59.1
YOLOv10b	640	52.7	-	6.54	24.4	92.0
YOLOv10l	640	53.3	-	8.33	29.5	120.3
YOLOv10x	640	54.4	-	12.2	56.9	160.4

EfficientDet-d0	640	34.6	10.2	3.92	3.9	2.54
EfficientDet-d1	640	40.5	13.5	7.31	6.6	6.1
EfficientDet-d2	640	43.0	17.7	10.92	8.1	11.0
EfficientDet-d3	640	47.5	28.0	19.59	12.0	24.9
EfficientDet-d4	640	49.7	42.8	33.55	20.7	55.2
EfficientDet-d5	640	51.5	72.5	67.86	33.7	130.0
EfficientDet-d6	640	52.6	92.8	89.29	51.9	226.0
EfficientDet-d7	640	53.7	122.0	128.07	51.9	325.0

Como se muestra arriba, YOLOv10 mantiene una ventaja significativa en la velocidad de inferencia bruta. Por ejemplo, YOLOv10-S logra 46.7 mAP con una latencia de TensorRT de solo 2.66 ms, mientras que EfficientDet-d3 logra un 47.5 mAP similar pero toma casi 20 ms, lo que hace que YOLOv10 sea vastamente superior para la transmisión de video en tiempo real o flujos de trabajo de fabricación de rápido movimiento.

Link to this sectionCasos de uso y recomendaciones#

Elegir entre YOLOv10 y EfficientDet depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y tus preferencias de ecosistema.

Link to this sectionCuándo elegir YOLOv10#

YOLOv10 es una opción sólida para:

Detección en tiempo real sin NMS: Aplicaciones que se benefician de una detección integral (end-to-end) sin NMS, lo que reduce la complejidad de la implementación.
Equilibrio entre velocidad y precisión: Proyectos que requieren un buen equilibrio entre la velocidad de inferencia y la precisión de detección en varias escalas de modelo.
Aplicaciones de latencia constante: Escenarios de despliegue donde los tiempos de inferencia predecibles son críticos, como en robótica o sistemas autónomos.

Link to this sectionCuándo elegir EfficientDet#

EfficientDet se recomienda para:

Google Cloud y pipelines de TPU: Sistemas profundamente integrados con las API de Google Cloud Vision o la infraestructura de TPU, donde EfficientDet cuenta con optimización nativa.
Investigación en escalado compuesto: Benchmarking académico centrado en el estudio de los efectos de un escalado equilibrado de profundidad, anchura y resolución de red.
Despliegue móvil mediante TFLite: Proyectos que requieren específicamente la exportación a TensorFlow Lite para dispositivos Android o Linux embebido.

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:

Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.

Link to this sectionEl estándar moderno: llega Ultralytics YOLO26#

Aunque YOLOv10 introdujo el innovador paradigma sin NMS y EfficientDet mostró un escalado basado en principios, el panorama de la visión artificial ha seguido evolucionando. Para los desarrolladores que comienzan nuevos proyectos hoy, Ultralytics YOLO26 representa el estado del arte indiscutible. Lanzado en enero de 2026, combina lo mejor de todos los mundos en un paquete altamente pulido y listo para producción dentro de la Plataforma Ultralytics.

Link to this sectionPor qué YOLO26 supera a la competencia#

Diseño de extremo a extremo sin NMS: YOLO26 adopta de forma nativa la arquitectura de extremo a extremo sin NMS iniciada en YOLOv10, optimizando el despliegue y acelerando la inferencia.
Inferencia en CPU hasta un 43% más rápida: Para dispositivos de borde que carecen de aceleradores dedicados, YOLO26 está optimizado específicamente para ejecutarse eficientemente en CPU estándar.
Optimizador avanzado MuSGD: Inspirado en las innovaciones de entrenamiento de LLM, YOLO26 utiliza un híbrido de SGD y Muon para un entrenamiento increíblemente estable y una convergencia rápida, mejorando enormemente la eficiencia del entrenamiento en comparación con EfficientDet.
ProgLoss + STAL: Estas funciones de pérdida mejoradas ofrecen aumentos notables en el reconocimiento de objetos pequeños, un punto débil tradicional tanto para YOLOv10 como para EfficientDet.
Eliminación de DFL: Al eliminar la pérdida focal de distribución (Distribution Focal Loss), YOLO26 se exporta sin problemas a casi cualquier formato de hardware, incluyendo OpenVINO y CoreML.

Además, YOLO26 proporciona una versatilidad inigualable. Mientras que EfficientDet y YOLOv10 son modelos estrictamente de detección, YOLO26 maneja sin problemas cajas delimitadoras orientadas, clasificación de imágenes y segmentación de instancias utilizando el mismo intuitivo paquete de Python de Ultralytics.

Ecosistema bien mantenido

Tanto YOLO11 como YOLOv8 siguen siendo totalmente compatibles dentro del ecosistema Ultralytics. Para la mejor combinación de rendimiento, estabilidad y soporte a largo plazo, recomendamos utilizar modelos de Ultralytics mantenidos oficialmente.

Link to this sectionFacilidad de uso con Ultralytics#

El ecosistema bien mantenido proporcionado por Ultralytics garantiza una experiencia fluida para el desarrollador. Entrenar un modelo, validarlo y exportarlo a la integración con TensorRT toma solo unas pocas líneas de código.

from ultralytics import YOLO

# Load a pre-trained YOLOv10 model (or upgrade to YOLO26 natively)
model = YOLO("yolov10n.pt")

# Train the model efficiently on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

# Run inference and immediately visualize results
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

# Export for rapid deployment
model.export(format="engine", quantize=16)

Link to this sectionConclusión#

Al comparar YOLOv10 y EfficientDet, la elección depende en gran medida de tus preferencias de marco de trabajo y restricciones de velocidad. EfficientDet ofrece un enfoque estructurado para el escalado de modelos dentro del ecosistema TensorFlow. Sin embargo, YOLOv10 proporciona un rendimiento en tiempo real superior, un menor uso de memoria y una ruta de despliegue más directa debido a su arquitectura sin NMS.

Para obtener el mejor equilibrio de rendimiento, facilidad de uso y versatilidad multitarea, se recomienda encarecidamente actualizar a la Plataforma Ultralytics y utilizar YOLO26. Toma las innovaciones sin NMS de YOLOv10, aplica técnicas de entrenamiento de última generación como el optimizador MuSGD y lo envuelve en un marco de trabajo sólido y de código abierto respaldado por una enorme comunidad global.

Colaboradores

GLglenn-jocher¹⁵

Creado 27 ene 2025Actualizado hace 3 semanas

Link to this sectionYOLOv10 frente a EfficientDet#

Link to this sectionYOLOv10: El pionero sin NMS#

Link to this sectionInnovaciones arquitectónicas#

Link to this sectionDetalles del modelo#

Link to this sectionEfficientDet: Escalable y equilibrado#

Link to this sectionInnovaciones arquitectónicas#

Link to this sectionDetalles del modelo#

Link to this sectionRendimiento y benchmarks#

Link to this sectionCasos de uso y recomendaciones#

Link to this sectionCuándo elegir YOLOv10#

Link to this sectionCuándo elegir EfficientDet#

Link to this sectionCuándo elegir Ultralytics (YOLO26)#

Link to this sectionEl estándar moderno: llega Ultralytics YOLO26#

Link to this sectionPor qué YOLO26 supera a la competencia#

Link to this sectionFacilidad de uso con Ultralytics#

Link to this sectionConclusión#

Comentarios