Link to this sectionEfficientDet frente a DAMO-YOLO#
Al crear pipelines de visión artificial escalables, seleccionar la arquitectura de modelo adecuada es una decisión crítica que influye tanto en la viabilidad del despliegue como en la precisión de la detección. Esta guía ofrece una comparativa técnica en profundidad entre dos arquitecturas bien conocidas en el panorama del reconocimiento visual: EfficientDet y DAMO-YOLO.
Aunque ambos modelos aportaron innovaciones significativas al campo de la detección de objetos, el rápido avance de la IA de visión ha allanado el camino hacia ecosistemas más integrados. A lo largo de este análisis, exploraremos la mecánica central de estas redes tradicionales mientras ilustramos por qué soluciones modernas como Ultralytics Platform y Ultralytics YOLO26 se han convertido en el estándar de la industria para entornos de producción.
Link to this sectionEfficientDet: detección de objetos escalable y eficiente#
Presentada por investigadores de Google, EfficientDet fue diseñada para escalar sistemáticamente la arquitectura del modelo manteniendo una alta eficiencia. Logró esto aprovechando el escalado compuesto a través de la profundidad, la anchura y la resolución de entrada de la red.
Detalles de EfficientDet:
Autores: Mingxing Tan, Ruoming Pang y Quoc V. Le
Organización: Google Brain
Fecha: 20-11-2019
Arxiv: 1911.09070
GitHub: google/automl
Link to this sectionInnovaciones arquitectónicas#
La principal contribución de EfficientDet es la red piramidal de características bidireccional (BiFPN). A diferencia de las FPN tradicionales, la BiFPN permite una fusión de características multiescala fácil y rápida utilizando pesos aprendibles para entender la importancia de las diferentes características de entrada. Esto se combina con el backbone de EfficientNet, dando lugar a una familia de modelos (de D0 a D7) que escalan de forma predecible.
Link to this sectionPuntos fuertes y debilidades#
La fortaleza clave de EfficientDet reside en su eficiencia de parámetros. Para tareas en las que la precisión media (mAP) debe maximizarse en entornos en la nube muy restringidos, su método de escalado compuesto es altamente predecible. Sin embargo, EfficientDet es notoriamente compleja de entrenar desde cero y a menudo requiere un ajuste de hiperparámetros sustancial. Además, su gran dependencia de operaciones específicas de TensorFlow hace que la transición a despliegues en el borde mediante ONNX o TensorRT sea más engorrosa en comparación con las capacidades de exportación optimizadas presentes en los modelos YOLO modernos.
Aprende más sobre EfficientDet
Link to this sectionDAMO-YOLO: búsqueda de arquitectura automatizada en acción#
DAMO-YOLO representa un enfoque distinto, utilizando la búsqueda de arquitectura neuronal (NAS) para diseñar automáticamente estructuras de red óptimas para la inferencia en tiempo real.
Detalles de DAMO-YOLO:
Autores: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang y Xiuyu Sun
Organización: Alibaba Group
Fecha: 23-11-2022
Arxiv: 2211.15444v2
GitHub: tinyvision/DAMO-YOLO
Link to this sectionInnovaciones arquitectónicas#
DAMO-YOLO introduce varias tecnologías novedosas. Utiliza un backbone generado por NAS llamado MAE-NAS, una RepGFPN eficiente para su cuello y un diseño ZeroHead que reduce drásticamente el coste computacional de la cabecera de detección. Además, emplea AlignedOTA para la asignación de etiquetas y se basa en gran medida en la mejora mediante destilación de conocimiento para impulsar el rendimiento de sus variantes más pequeñas.
Link to this sectionPuntos fuertes y debilidades#
DAMO-YOLO destaca en sus velocidades de inferencia en GPU, diseñadas específicamente para el despliegue en arquitecturas NVIDIA utilizando TensorRT. Al eliminar estructuras de cabecera pesadas, el modelo ofrece predicciones de baja latencia. Por el contrario, la búsqueda de arquitectura automatizada puede hacer que la estructura del modelo sea opaca y difícil de depurar manualmente o ajustar para dispositivos de borde personalizados. A diferencia del muy versátil Ultralytics YOLO11, DAMO-YOLO se centra principalmente en la detección estándar de cajas delimitadoras, careciendo de soporte nativo para tareas avanzadas como estimación de poses o detección de cajas delimitadoras orientadas (OBB) de forma inmediata.
Más información sobre DAMO-YOLO
Link to this sectionComparación de rendimiento#
Comprender los compromisos empíricos es esencial para seleccionar un modelo. La siguiente tabla compara la familia EfficientDet con la serie DAMO-YOLO a través de métricas de rendimiento cruciales.
| Modelo | tamaño (píxeles) | mAPval 50-95 | Velocidad CPU ONNX (ms) | Velocidad T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
| DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
| DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
| DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
EfficientDet-d7 logra la mayor precisión teórica pero requiere una potencia de cálculo inmensa, lo que lo hace inadecuado para Edge AI. DAMO-YOLO ofrece velocidades de TensorRT excepcionales, aunque generalmente requiere más parámetros que los modelos EfficientDet de nivel inferior para lograr una precisión comparable.
Link to this sectionCasos de uso y recomendaciones#
Elegir entre EfficientDet y DAMO-YOLO depende de los requisitos específicos de tu proyecto, las restricciones de despliegue y las preferencias del ecosistema.
Link to this sectionCuándo elegir EfficientDet#
EfficientDet es una gran opción para:
- Google Cloud y pipelines de TPU: Sistemas profundamente integrados con las API de Google Cloud Vision o la infraestructura de TPU, donde EfficientDet cuenta con optimización nativa.
- Investigación en escalado compuesto: Benchmarking académico centrado en el estudio de los efectos de un escalado equilibrado de profundidad, anchura y resolución de red.
- Despliegue móvil mediante TFLite: Proyectos que requieren específicamente la exportación a TensorFlow Lite para dispositivos Android o Linux embebido.
Link to this sectionCuándo elegir DAMO-YOLO#
DAMO-YOLO se recomienda para:
- Analítica de vídeo de alto rendimiento: Procesamiento de flujos de vídeo de altos FPS en infraestructura de GPU NVIDIA fija, donde el rendimiento por lote (batch-1) es la métrica principal.
- Líneas de fabricación industrial: Escenarios con restricciones estrictas de latencia de GPU en hardware dedicado, como la inspección de calidad en tiempo real en líneas de montaje.
- Investigación en búsqueda de arquitectura neuronal: Estudio de los efectos de la búsqueda automatizada de arquitectura (MAE-NAS) y backbones reparametrizados eficientes en el rendimiento de detección.
Link to this sectionCuándo elegir Ultralytics (YOLO26)#
Para la mayoría de los proyectos nuevos, Ultralytics YOLO26 ofrece la mejor combinación de rendimiento y experiencia de desarrollo:
- Implementación en el borde sin NMS: Aplicaciones que requieren una inferencia consistente y de baja latencia sin la complejidad del posprocesamiento de supresión de no máximos.
- Entornos solo de CPU: Dispositivos sin aceleración de GPU dedicada, donde la inferencia en CPU hasta un 43% más rápida de YOLO26 proporciona una ventaja decisiva.
- Detección de objetos pequeños: Escenarios desafiantes como imágenes de drones aéreos o análisis de sensores IoT donde ProgLoss y STAL aumentan significativamente la precisión en objetos pequeños.
Link to this sectionLa ventaja de Ultralytics: avanzar más allá de los modelos tradicionales#
Si bien EfficientDet y DAMO-YOLO brindan información académica valiosa, los desarrolladores modernos requieren marcos que equilibren el rendimiento de vanguardia con la ergonomía del desarrollador. Aquí es donde destaca el ecosistema Ultralytics.
Link to this sectionFacilidad de uso y ecosistema inigualables#
Desplegar modelos desde repositorios de investigación separados y altamente personalizados a menudo conduce a pesadillas de integración. Ultralytics proporciona un ecosistema unificado, bien mantenido, con documentación extensa y una API pythonica. Tanto si usas Google Colab para el entrenamiento como si exportas a CoreML para inferencia móvil, el pipeline requiere solo unas pocas líneas de código.
from ultralytics import YOLO
# Load the highly recommended YOLO26 nano model
model = YOLO("yolo26n.pt")
# Train the model effortlessly on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)
# Export the trained model to ONNX for production
model.export(format="onnx")Link to this sectionLa revolución de YOLO26#
Para los desarrolladores que evalúan EfficientDet o DAMO-YOLO, Ultralytics YOLO26 representa el paso evolutivo definitivo. Lanzado a principios de 2026, introduce capacidades que cambian el paradigma:
- Diseño de extremo a extremo sin NMS: Fue iniciado por YOLOv10, y YOLO26 elimina de forma nativa la necesidad de postprocesamiento de supresión no máxima (NMS). Esto se traduce en arquitecturas de despliegue mucho más simples y una latencia consistente en diversos hardware.
- Inferencia en CPU hasta un 43% más rápida: Para despliegues en el borde que carecen de GPUs potentes (escenarios en los que DAMO-YOLO tiene dificultades), YOLO26 está fuertemente optimizado, ofreciendo aumentos masivos de velocidad en CPUs estándar.
- Optimizador MuSGD: Al cerrar la brecha entre las innovaciones de LLM y la visión artificial, YOLO26 incorpora el optimizador MuSGD (inspirado en Moonshot AI), garantizando un entrenamiento increíblemente estable y una convergencia rápida en comparación con los frágiles bucles de entrenamiento de EfficientDet.
- Eliminación de DFL: La eliminación de Distribution Focal Loss simplifica el proceso de exportación, garantizando una compatibilidad superior con microcontroladores de bajo consumo y dispositivos Raspberry Pi.
- ProgLoss + STAL: Estas funciones de pérdida avanzadas ofrecen mejoras drásticas en el reconocimiento de objetos pequeños, un área donde las arquitecturas antiguas tradicionalmente fallan.
Link to this sectionEficiencia de memoria y versatilidad de tareas#
A diferencia de los modelos Transformer o las redes NAS fuertemente fusionadas, los modelos de Ultralytics se caracterizan por su estricta eficiencia de memoria. Consumen notablemente menos memoria CUDA durante el entrenamiento, permitiendo una iteración rápida en hardware de consumo.
Además, mientras que EfficientDet y DAMO-YOLO están rígidamente limitados a cajas delimitadoras, Ultralytics admite de forma nativa la segmentación de instancias y la clasificación de imágenes dentro del mismo marco intuitivo. Para los usuarios que mantienen proyectos más antiguos, Ultralytics YOLOv8 sigue siendo una alternativa sólida y ampliamente desplegada que merece la pena explorar.
Link to this sectionConclusión#
Elegir la arquitectura de visión adecuada implica sopesar el rendimiento teórico bruto frente a la realidad del despliegue. EfficientDet ofrece un enfoque de escalado matemáticamente elegante, y DAMO-YOLO ofrece velocidades de GPU brutas convincentes. Sin embargo, para los equipos que priorizan el desarrollo rápido, los despliegues fiables y las características de vanguardia, los modelos Ultralytics están claramente por delante. Al combinar innovaciones como la inferencia sin NMS y la optimización MuSGD, YOLO26 garantiza que tus proyectos de visión artificial se construyan sobre la base más capaz, mantenible y eficiente disponible hoy en día.