EfficientDet frente a YOLO: comparación detallada de la detección de objetos
Elegir el modelo óptimo de detección de objetos es una decisión crítica para los proyectos de visión por ordenador, ya que los distintos modelos ofrecen ventajas únicas en cuanto a precisión, velocidad y eficacia. Esta página ofrece una comparación técnica detallada entre EfficientDet y YOLO, dos modelos destacados en el campo de la detección de objetos. Analizamos sus arquitecturas, sus puntos de referencia de rendimiento y su idoneidad para diversas aplicaciones con el fin de ayudarle a tomar una decisión informada.
EfficientDet
EfficientDet fue presentado por Google en 2019 y es conocido por su eficiencia y escalabilidad en la detección de objetos. Alcanza una precisión de vanguardia con un número significativamente menor de parámetros y FLOPs en comparación con muchos detectores contemporáneos.
Arquitectura y características principales
EfficientDet emplea una serie de innovaciones arquitectónicas para mejorar tanto la eficacia como la precisión:
- Red troncal: Utiliza EfficientNet como backbone, conocida por su eficiencia y escalabilidad, conseguidas mediante la búsqueda de arquitectura neuronal.
- BiFPN (red piramidal bidireccional de características): Una red de pirámide de características bidireccional ponderada que permite una fusión de características multiescala eficiente y eficaz.
- Escalado compuesto: Escala sistemáticamente todas las dimensiones del detector (columna vertebral, red de características, resolución de la red de predicción de cajas/clases) utilizando un coeficiente compuesto.
Métricas de rendimiento
Los modelos EfficientDet están disponibles en varios tamaños (de d0 a d7), que ofrecen una gama de compensaciones de rendimiento para adaptarse a diferentes recursos computacionales.
- mAP: Alcanza una elevada precisión media (mAP) en el conjunto de datos COCO, lo que demuestra una gran precisión de detección.
- Velocidad de inferencia: Ofrece una gama de velocidades de inferencia en función del tamaño del modelo, siendo los modelos más pequeños adecuados para aplicaciones en tiempo real.
- Tamaño del modelo: Los modelos EfficientDet están diseñados para ser eficientes en parámetros, lo que lleva a tamaños de modelo más pequeños en comparación con otros detectores de alta precisión.
Puntos fuertes y débiles
Puntos fuertes:
- Alta eficacia: Excelente equilibrio entre precisión y coste computacional, lo que lo hace adecuado para entornos con recursos limitados.
- Escalabilidad: El escalado compuesto permite escalar fácilmente el modelo para alcanzar los niveles de rendimiento deseados.
- Precisión: Consigue la máxima precisión con menos parámetros.
- Implementación bien documentada: El repositorio AutoML de Google ofrece una implementación clara y modelos preentrenados.
Debilidades:
- Complejidad: Las estrategias BiFPN y de escalado compuesto añaden complejidad a la arquitectura.
- Velocidad de in ferencia: Aunque eficiente, la velocidad de inferencia puede no ser tan rápida como la de algunos detectores en tiempo real como los modelosYOLO Ultralytics , especialmente para las variantes más grandes de EfficientDet.
Casos prácticos
EfficientDet es idóneo para aplicaciones en las que tanto la precisión como la eficacia son cruciales:
- Dispositivos móviles y de borde: Debido a su eficiencia, puede desplegarse en dispositivos móviles y plataformas de computación de borde.
- Robótica: Adecuado para aplicaciones robóticas que requieren una detección de objetos precisa y eficaz.
- Aplicaciones con recursos limitados: Ideal para escenarios en los que los recursos computacionales son limitados, pero se sigue necesitando una gran precisión.
Más información sobre EfficientDet
DAMO-YOLO
YOLO, presentado por el Grupo Alibaba en 2022, está diseñado para la detección de objetos a alta velocidad y con precisión, haciendo especial hincapié en las aplicaciones industriales. Integra varias técnicas novedosas para lograr un equilibrio entre velocidad y precisión.
Arquitectura y características principales
YOLO incorpora varios componentes innovadores en su arquitectura:
- Red troncal basada en NAS: Utiliza una arquitectura de búsqueda neuronal (NAS), optimizada para ofrecer velocidad y precisión.
- RepGFPN (red piramidal de características de gradiente reparametrizado): Una red de fusión de características eficiente que mejora la representación de características manteniendo la eficiencia computacional.
- ZeroHead: una cabeza de detección ligera diseñada para minimizar la latencia.
- AlignedOTA (asignación de transporte óptima alineada): Una estrategia de asignación avanzada para mejorar la formación y la precisión.
Métricas de rendimiento
Los modelos YOLO están disponibles en diferentes tallas (t, s, m, l) para satisfacer las distintas necesidades de rendimiento.
- mAP: Consigue un mAP competitivo en el conjunto de datos COCO, demostrando un gran rendimiento en la detección de objetos.
- Velocidad de inferencia: Prioriza la alta velocidad de inferencia, lo que la hace adecuada para aplicaciones en tiempo real y sensibles a la latencia.
- Tamaño del modelo: Diseñado para ser eficiente, ofreciendo un buen equilibrio entre el tamaño del modelo y el rendimiento.
Puntos fuertes y débiles
Puntos fuertes:
- Alta velocidad: velocidad de inferencia excepcional, optimizada para aplicaciones en tiempo real.
- Enfoque industrial: Específicamente diseñado para aplicaciones industriales, con un enfoque en el despliegue práctico.
- Precisión: Mantiene una alta precisión a la vez que logra rápidas velocidades de inferencia.
- Técnicas avanzadas: Integra técnicas de vanguardia como el backbone NAS y AlignedOTA para mejorar el rendimiento.
- Código abierto: Disponible públicamente con código y modelos preentrenados.
Debilidades:
- Relativamente nuevo: Al tratarse de un modelo más reciente, la comunidad y el ecosistema podrían estar aún desarrollándose en comparación con modelos más consolidados.
- Complejidad: La integración de múltiples técnicas avanzadas puede hacer que la arquitectura sea compleja de modificar o personalizar en profundidad.
Casos prácticos
YOLO es especialmente eficaz en situaciones que requieren la detección de objetos en tiempo real con gran precisión:
- Inspección industrial: Ideal para control de calidad e inspección en procesos de fabricación.
- Conducción autónoma: Adecuado para vehículos autónomos y sistemas avanzados de asistencia al conductor (ADAS) en los que la baja latencia es fundamental.
- Análisis de vídeo en tiempo real: Aplicaciones como la vigilancia del tráfico y los sistemas de seguridad.
- Edge AI: despliegue en dispositivos periféricos para procesamiento en tiempo real.
Tabla comparativa de modelos
Modelo | tamaño (píxeles) |
mAPval 50-95 |
Velocidad CPU ONNX (ms) |
Velocidad T4TensorRT10 (ms) |
parámetros (M) |
FLOPs (B) |
---|---|---|---|---|---|---|
EficienteDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
EficienteDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
EficienteDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
EficienteDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
EficienteDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
EficienteDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
EficienteDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
DAMO-YOLOt | 640 | 42.0 | - | 2.32 | 8.5 | 18.1 |
DAMO-YOLOs | 640 | 46.0 | - | 3.45 | 16.3 | 37.8 |
DAMO-YOLOm | 640 | 49.2 | - | 5.09 | 28.2 | 61.8 |
DAMO-YOLOl | 640 | 50.8 | - | 7.18 | 42.1 | 97.3 |
Conclusión
Tanto EfficientDet como YOLO son potentes modelos de detección de objetos con distintos puntos fuertes. EfficientDet destaca por ofrecer una gama de modelos eficientes con gran precisión, lo que lo hace versátil para diversas aplicaciones, especialmente aquellas con limitaciones de recursos. YOLO, por su parte, está diseñado para la inferencia a alta velocidad sin sacrificar significativamente la precisión, por lo que es ideal para aplicaciones industriales y de borde en tiempo real.
Para los usuarios interesados en otros modelos de detección de objetos de alto rendimiento, Ultralytics ofrece una gama de modelos YOLO , entre ellos YOLOv5, YOLOv8y el último YOLO11. También hay disponibles comparaciones con otros modelos como YOLOX para ayudarle a encontrar el mejor modelo para sus necesidades específicas. Considere la posibilidad de explorar Ultralytics HUB para agilizar la formación y el despliegue de los modelos YOLO .