Ir al contenido

DAMO-YOLO vs YOLOv5: Una comparación técnica detallada

Elegir el modelo de detección de objetos adecuado es una decisión crítica que equilibra la precisión, la velocidad y la facilidad de implementación. Esta página proporciona una comparación técnica detallada entre DAMO-YOLO, un modelo centrado en la precisión del Grupo Alibaba, y Ultralytics YOLOv5, un modelo estándar de la industria reconocido por su excepcional combinación de rendimiento y usabilidad. Profundizaremos en sus diferencias arquitectónicas, métricas de rendimiento y casos de uso ideales para ayudarle a seleccionar el mejor modelo para su proyecto de visión artificial.

DAMO-YOLO: Detección centrada en la precisión

Autores: Xianzhe Xu, Yiqi Jiang, Weihua Chen, Yilun Huang, Yuan Zhang y Xiuyu Sun
Organización: Alibaba Group
Fecha: 2022-11-23
Arxiv: https://arxiv.org/abs/2211.15444v2
GitHub: https://github.com/tinyvision/DAMO-YOLO
Documentación: https://github.com/tinyvision/DAMO-YOLO/blob/master/README.md

DAMO-YOLO es un modelo de detección de objetos desarrollado por Alibaba Group. Introducido a finales de 2022, se centra en lograr un equilibrio superior entre alta precisión e inferencia eficiente mediante la incorporación de varias técnicas novedosas en su arquitectura.

Arquitectura y Características Clave

DAMO-YOLO introduce varios componentes innovadores diseñados para superar los límites de la precisión de detección:

  • Backbones NAS: Utiliza la Búsqueda de Arquitectura Neuronal (NAS) para descubrir e implementar redes backbone altamente eficientes diseñadas para la detección de objetos.
  • RepGFPN Eficiente: El modelo emplea una Red Piramidal de Características de Gradiente Reparametrizada, un módulo de neck avanzado para mejorar la fusión de características en diferentes escalas.
  • ZeroHead: Presenta un encabezado de detección desacoplado diseñado para minimizar la sobrecarga computacional manteniendo un alto rendimiento.
  • AlignedOTA: Esta novedosa estrategia de asignación de etiquetas, Asignación Óptima de Transporte Alineada, asegura una mejor alineación entre las predicciones y las etiquetas reales durante el entrenamiento, lo que conduce a una mayor precisión.
  • Mejora por Destilación: El modelo aprovecha la destilación del conocimiento para transferir el conocimiento de un modelo maestro más grande y potente al modelo estudiante más pequeño, lo que mejora su rendimiento.

Fortalezas

  • Alta precisión: DAMO-YOLO alcanza sólidas puntuaciones mAP, lo que indica una excelente precisión de detección, particularmente con sus variantes de modelos más grandes.
  • Técnicas innovadoras: La integración de métodos novedosos como AlignedOTA y RepGFPN le permite mejorar el rendimiento más allá de las arquitecturas más estándar.

Debilidades

  • Complejidad de la integración: Integrar DAMO-YOLO en los flujos de trabajo existentes puede ser más complejo, especialmente si se compara con la experiencia optimizada que se ofrece dentro del ecosistema de Ultralytics.
  • Soporte del ecosistema: Su documentación y soporte comunitario, aunque disponibles, pueden ser menos extensos que los de YOLOv5, que está bien establecido y se mantiene activamente.
  • Versatilidad de tareas: DAMO-YOLO se centra principalmente en la detección de objetos, y es posible que carezca del soporte integrado para otras tareas como la segmentación o la clasificación que se encuentra en los modelos de Ultralytics.

Casos de uso

DAMO-YOLO es muy adecuado para aplicaciones donde la alta precisión de detección es el requisito principal:

  • Aplicaciones de alta precisión: Análisis detallado de imágenes, como en imágenes médicas e investigación científica.
  • Escenarios Complejos: Entornos con objetos muy ocluidos o que requieren una comprensión profunda de la escena.
  • Investigación y desarrollo: Una herramienta valiosa para los investigadores que exploran arquitecturas y técnicas avanzadas de detección de objetos.

Más información sobre DAMO-YOLO

Ultralytics YOLOv5: El Estándar Industrial Establecido

Autor: Glenn Jocher
Organización: Ultralytics
Fecha: 2020-06-26
GitHub: https://github.com/ultralytics/yolov5
Documentación: https://docs.ultralytics.com/models/yolov5/

Ultralytics YOLOv5 se convirtió rápidamente en un punto de referencia de la industria tras su lanzamiento, celebrado por su excepcional equilibrio entre velocidad, precisión y notable facilidad de uso. Desarrollado íntegramente en PyTorch, YOLOv5 presenta una arquitectura robusta que combina un backbone CSPDarknet53 con un cuello PANet para una agregación de características eficaz. Su escalabilidad, ofrecida a través de varios tamaños de modelo (n, s, m, l, x), permite a los desarrolladores seleccionar el equilibrio perfecto para sus necesidades específicas de computación y rendimiento.

Fortalezas

  • Velocidad y eficiencia excepcionales: YOLOv5 está altamente optimizado para una inferencia rápida, lo que lo convierte en la mejor opción para aplicaciones en tiempo real en una amplia gama de hardware, desde potentes GPUs en la nube hasta dispositivos periféricos con recursos limitados.
  • Facilidad de uso: Una ventaja clave de YOLOv5 es su experiencia de usuario optimizada. Ofrece interfaces sencillas de Python y CLI, documentación completa y un proceso de configuración sencillo.
  • Ecosistema bien mantenido: YOLOv5 cuenta con el respaldo del sólido ecosistema de Ultralytics, que incluye un desarrollo activo, una comunidad grande y útil, actualizaciones frecuentes y una integración perfecta con herramientas como Ultralytics HUB para la formación sin código y MLOps.
  • Equilibrio de rendimiento: Logra una excelente compensación entre la velocidad de inferencia y la precisión de detección, lo que lo hace muy práctico para diversos escenarios de implementación en el mundo real.
  • Versatilidad: Más allá de la detección de objetos, YOLOv5 admite la segmentación de instancias y la clasificación de imágenes, ofreciendo una solución multiuso.
  • Eficiencia en el entrenamiento: YOLOv5 proporciona procesos de entrenamiento eficientes, pesos pre-entrenados disponibles y, por lo general, requiere menos memoria que muchas arquitecturas de la competencia.

Debilidades

  • Precisión: Si bien es muy preciso, los modelos más recientes han superado las puntuaciones mAP de YOLOv5 en pruebas de referencia estándar como COCO.
  • Basado en anclajes: Su dependencia de cajas de anclaje predefinidas puede requerir un ajuste adicional para conjuntos de datos con relaciones de aspecto de objeto no convencionales en comparación con los enfoques sin anclajes.

Casos de uso

YOLOv5 destaca en escenarios donde la velocidad, la eficiencia y la facilidad de implementación son críticas:

  • Sistemas de seguridad: Monitorización en tiempo real para aplicaciones como la prevención de robos y la detección de anomalías.
  • Robótica: Permite a los robots percibir e interactuar con su entorno en tiempo real, crucial para la navegación y manipulación autónomas.
  • Automatización industrial: Control de calidad y detección de defectos en los procesos de fabricación, mejorando la eficiencia en el reciclaje y la supervisión de la línea de producción.
  • Implementación de IA en el Edge: Ejecución eficiente de la detección de objetos en dispositivos con recursos limitados, como Raspberry Pi y NVIDIA Jetson, para el procesamiento en el dispositivo.

Más información sobre YOLOv5

Comparación de rendimiento

Al comparar DAMO-YOLO y YOLOv5, surge una clara compensación entre precisión y velocidad. Los modelos DAMO-YOLO generalmente alcanzan puntuaciones mAP más altas, lo que demuestra su fortaleza en la precisión de detección pura. Sin embargo, los modelos YOLOv5, en particular las variantes más pequeñas, ofrecen velocidades de inferencia significativamente más rápidas, especialmente en hardware de CPU. Esto convierte a YOLOv5 en una opción más práctica para aplicaciones en tiempo real donde la baja latencia es esencial.

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4 TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLOs 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusión

Tanto DAMO-YOLO como Ultralytics YOLOv5 son modelos de detección de objetos potentes, pero responden a diferentes prioridades. DAMO-YOLO es una excelente opción para las aplicaciones en las que el objetivo principal es lograr la mayor precisión posible y en las que los desarrolladores están dispuestos a gestionar una integración más compleja.

Sin embargo, para la gran mayoría de los desarrolladores y las aplicaciones del mundo real, Ultralytics YOLOv5 presenta una solución más atractiva y práctica. Su excepcional equilibrio entre velocidad y precisión, combinado con su inigualable facilidad de uso, la hace increíblemente accesible. El ecosistema bien mantenido proporciona una ventaja significativa, ofreciendo una documentación sólida, un soporte activo de la comunidad y herramientas potentes como Ultralytics HUB. La eficiencia de entrenamiento y la versatilidad de YOLOv5 en múltiples tareas de visión la convierten en una opción muy eficiente y fácil de usar para los desarrolladores en proyectos que van desde la creación rápida de prototipos hasta la implementación en producción.

Para aquellos interesados en los últimos avances, los modelos más nuevos de Ultralytics como YOLOv8 y YOLO11 se basan en las fortalezas de YOLOv5, ofreciendo un rendimiento aún mejor y más características.

Otras comparaciones de modelos

Para una exploración más exhaustiva, considere estas comparaciones que involucran a DAMO-YOLO, YOLOv5 y otros modelos relevantes:



📅 Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios