Ir al contenido

YOLOv8 vs. EfficientDet: Una comparación técnica

Elegir el modelo de detección de objetos adecuado implica una compensación entre precisión, velocidad y coste computacional. Esta página proporciona una comparación técnica detallada entre dos arquitecturas influyentes: Ultralytics YOLOv8, un modelo de última generación conocido por su velocidad y versatilidad, y EfficientDet, una familia de modelos de Google diseñada para una eficiencia de parámetros excepcional. Si bien ambos son potentes, provienen de diferentes filosofías de diseño, lo que los hace adecuados para diferentes aplicaciones.

Ultralytics YOLOv8: Versatilidad y rendimiento

Autores: Glenn Jocher, Ayush Chaurasia y Jing Qiu
Organización: Ultralytics
Fecha: 2023-01-10
GitHub: https://github.com/ultralytics/ultralytics
Documentación: https://docs.ultralytics.com/models/yolov8/

Ultralytics YOLOv8 es un detector de objetos de última generación de una sola etapa que se basa en los éxitos de las versiones anteriores de YOLO. Se ha establecido como un framework altamente versátil y potente al introducir mejoras arquitectónicas clave. Estas incluyen un nuevo backbone CSPDarknet, un cuello C2f para una fusión de características mejorada y un encabezado desacoplado y sin anclaje. Este diseño no solo impulsa el rendimiento, sino que también proporciona flexibilidad en una amplia gama de tareas de visión artificial.

Ventajas de YOLOv8

  • Equilibrio entre rendimiento: YOLOv8 logra un excelente equilibrio entre la velocidad de inferencia y la precisión, lo que lo hace adecuado para diversas implementaciones en el mundo real, desde dispositivos edge hasta potentes servidores en la nube.
  • Versatilidad: Una gran ventaja de YOLOv8 es su soporte nativo para múltiples tareas de visión dentro de un único marco de trabajo unificado. Esto incluye detección de objetos, segmentación de instancias, clasificación de imágenes, estimación de pose y cajas delimitadoras orientadas (OBB).
  • Facilidad de uso: El modelo forma parte de un ecosistema bien mantenido que prioriza la experiencia del usuario. Ofrece una API de Python optimizada y una CLI sencilla, respaldadas por una amplia documentación y numerosos tutoriales.
  • Eficiencia en el entrenamiento: YOLOv8 presenta procesos de entrenamiento eficientes y proporciona pesos pre-entrenados disponibles, lo que simplifica el desarrollo de modelos personalizados. Generalmente requiere menos memoria CUDA para el entrenamiento en comparación con arquitecturas más complejas.
  • Ecosistema bien mantenido: Los usuarios se benefician de un desarrollo continuo, una sólida comunidad de código abierto, actualizaciones frecuentes y una integración perfecta con herramientas como Ultralytics HUB para flujos de trabajo MLOps integrales.

Debilidades de YOLOv8

  • Los modelos más grandes como YOLOv8x exigen recursos computacionales significativos para el entrenamiento y la implementación.
  • Puede requerir una mayor optimización, como la cuantización, para su implementación en hardware con recursos extremadamente limitados.

Casos de uso ideales para YOLOv8

YOLOv8 es ideal para aplicaciones que requieren alta precisión y rendimiento en tiempo real, como robótica avanzada, sistemas de seguridad inteligentes e infraestructura de ciudades inteligentes. Su versatilidad también la convierte en una opción superior para proyectos que pueden expandirse para incluir otras tareas de visión más allá de la simple detección de objetos.

Más información sobre YOLOv8

EfficientDet: Escalabilidad y eficiencia

Autores: Mingxing Tan, Ruoming Pang y Quoc V. Le
Organización: Google
Fecha: 2019-11-20
Arxiv: https://arxiv.org/abs/1911.09070
GitHub: https://github.com/google/automl/tree/master/efficientdet
Documentación: https://github.com/google/automl/tree/master/efficientdet#readme

EfficientDet es una familia de modelos de detección de objetos introducida por el equipo de Google Brain. Su principal innovación es un enfoque en la eficiencia y la escalabilidad. La arquitectura utiliza un backbone EfficientNet, una novedosa Red Piramidal de Características Bidireccional (BiFPN) para una fusión eficaz de características multiescala y un método de escalado compuesto. Este método escala uniformemente la profundidad, el ancho y la resolución del backbone, la red de características y el encabezado de predicción, lo que permite adaptar el modelo a diferentes limitaciones de recursos.

Ventajas de EfficientDet

  • Alta eficiencia: EfficientDet está diseñado para minimizar el número de parámetros y los FLOPs al tiempo que maximiza la precisión, lo que lo convierte en una de las arquitecturas computacionalmente más eficientes para su época.
  • Escalabilidad: El enfoque de escalado compuesto proporciona una familia de modelos (D0 a D7) que se pueden seleccionar según el presupuesto computacional disponible, desde dispositivos móviles hasta servidores en la nube a gran escala.
  • Precisión: Los modelos EfficientDet más grandes alcanzan una precisión competitiva en benchmarks estándar como el conjunto de datos COCO.

Debilidades de EfficientDet

  • Velocidad de Inferencia: Si bien EfficientDet es eficiente en FLOPs, esto no siempre se traduce en las velocidades de inferencia más rápidas en el mundo real, especialmente en las GPU, en comparación con arquitecturas como YOLOv8 que están altamente optimizadas para el procesamiento paralelo.
  • Versatilidad limitada: EfficientDet es principalmente un modelo de detección de objetos y carece del soporte integrado para otras tareas como la segmentación o la estimación de poses que se encuentran en el framework de Ultralytics.
  • Ecosistema y mantenimiento: El repositorio oficial no se mantiene tan activamente con nuevas características e integraciones como el ecosistema de Ultralytics, lo que puede dificultar la adopción e implementación por parte de los desarrolladores.

Casos de uso ideales para EfficientDet

EfficientDet destaca en escenarios donde el recuento de parámetros y el coste computacional teórico (FLOPs) son las restricciones más críticas. Es una opción sólida para aplicaciones en ciertos dispositivos edge AI donde el tamaño del modelo está estrictamente limitado o en entornos de nube donde minimizar el coste computacional es una prioridad.

Más información sobre EfficientDet

Comparación directa de rendimiento: Velocidad, Precisión y Eficiencia

Al comparar YOLOv8 y EfficientDet, queda claro que están optimizados para diferentes objetivos. YOLOv8 prioriza un equilibrio superior entre la velocidad de inferencia en el mundo real y la precisión, mientras que EfficientDet se centra en minimizar los parámetros del modelo y los FLOPs.

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv8n 640 37.3 80.4 1.47 3.2 8.7
YOLOv8s 640 44.9 128.4 2.66 11.2 28.6
YOLOv8m 640 50.2 234.7 5.86 25.9 78.9
YOLOv8l 640 52.9 375.2 9.06 43.7 165.2
YOLOv8x 640 53.9 479.1 14.37 68.2 257.8
EfficientDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficientDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficientDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficientDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficientDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficientDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficientDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficientDet-d7 640 53.7 122.0 128.07 51.9 325.0

De la tabla, podemos observar:

  • Precisión vs. Parámetros: Los modelos YOLOv8 logran consistentemente puntuaciones mAP más altas que los modelos EfficientDet con un número de parámetros similar o incluso mayor. Por ejemplo, YOLOv8s (11.2M params) alcanza 44.9 mAP, superando a EfficientDet-d2 (8.1M params) con 43.0 mAP.
  • Velocidad de Inferencia: YOLOv8 demuestra una ventaja significativa en la velocidad de inferencia, especialmente en las GPU con optimización TensorRT. El modelo YOLOv8x es más de 8 veces más rápido que el modelo EfficientDet-d7 comparable en una GPU T4, a pesar de tener más parámetros. YOLOv8 también muestra velocidades de inferencia de CPU mucho más rápidas.
  • Compromiso de Eficiencia: Si bien los modelos EfficientDet tienen FLOPs más bajos, esto no se traduce directamente en una inferencia más rápida. La arquitectura de YOLOv8 se adapta mejor a la aceleración de hardware moderna, lo que resulta en una menor latencia en escenarios prácticos.

¿Por qué elegir los modelos YOLO de Ultralytics?

Si bien EfficientDet fue un modelo innovador para su época, los modelos Ultralytics YOLO más nuevos como YOLOv8 y el último YOLO11 ofrecen ventajas significativas para los desarrolladores e investigadores modernos:

  • Rendimiento superior: Los modelos Ultralytics proporcionan un mejor equilibrio entre velocidad y precisión, lo cual es fundamental para la inferencia en tiempo real.
  • Arquitectura moderna: Incorporan los últimos avances en aprendizaje profundo, como la detección sin anclaje y las redes avanzadas de fusión de características.
  • Ecosistema Integral: El ecosistema de Ultralytics proporciona una experiencia perfecta desde el entrenamiento hasta la implementación, con un amplio soporte, documentación e integraciones.
  • Capacidades Multi-Tarea: La capacidad de gestionar detección, segmentación y más dentro de un mismo marco de trabajo ahorra tiempo de desarrollo y reduce la complejidad.

Conclusión

EfficientDet sigue siendo una arquitectura destacable, particularmente por su enfoque innovador en el escalado y la eficiencia del modelo. Es una opción sólida para aplicaciones donde minimizar el número de parámetros y FLOP es la máxima prioridad.

Sin embargo, para la gran mayoría de las aplicaciones modernas de visión artificial, YOLOv8 presenta una opción más atractiva. Ofrece una velocidad superior, mayor precisión y una versatilidad inigualable. Combinado con el ecosistema Ultralytics, fácil de usar y con mantenimiento activo, YOLOv8 permite a los desarrolladores construir e implementar soluciones de IA de alto rendimiento de forma más rápida y eficaz. Para aquellos que buscan la solución más avanzada y fácil de usar, los modelos de Ultralytics son la opción recomendada.

Otras comparaciones de modelos

Para una exploración más exhaustiva, considere estas comparaciones que involucran a YOLOv8, EfficientDet y otros modelos relevantes:



📅 Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios