Ir al contenido

YOLOv10 vs YOLOv7: comparación detallada

Elegir el modelo de detección de objetos adecuado es fundamental para los proyectos de visión por ordenador. Ultralytics YOLO ofrece una gama de modelos adaptados a diferentes necesidades. Esta página ofrece una comparación técnica entre YOLOv10 y YOLOv7, dos opciones populares para tareas de detección de objetos. Analizaremos sus arquitecturas, métricas de rendimiento y aplicaciones ideales para ayudarle a tomar una decisión informada.

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLOv10n 640 39.5 - 1.56 2.3 6.7
YOLOv10s 640 46.7 - 2.66 7.2 21.6
YOLOv10m 640 51.3 - 5.48 15.4 59.1
YOLOv10b 640 52.7 - 6.54 24.4 92.0
YOLOv10l 640 53.3 - 8.33 29.5 120.3
YOLOv10x 640 54.4 - 12.2 56.9 160.4
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

YOLOv10

YOLOv10, presentado en mayo de 2024 por investigadores de la Universidad de Tsinghua, representa la vanguardia de la detección de objetos en tiempo real. En su artículo Arxiv,"YOLOv10: Real-Time End-to-End Object Detection", Ao Wang, Hui Chen, Lihao Liu y otros presentan YOLOv10 como un avance significativo centrado tanto en la eficiencia como en la precisión. La implementación oficial está disponible en GitHub. YOLOv10 está diseñado para un despliegue de extremo a extremo, abordando la dependencia de las versiones anteriores de YOLO en la supresión no máxima (NMS).

Arquitectura y características principales:

YOLOv10 incorpora varias innovaciones arquitectónicas destinadas a aumentar la velocidad y reducir la redundancia computacional. Entre sus principales características se incluyen un enfoque sin anclajes y un diseño sin NMS, lo que agiliza el posprocesamiento y acelera la inferencia. El modelo adopta una estrategia de diseño holística basada en la eficiencia y la precisión, optimizando varios componentes para reducir al mínimo los gastos generales y maximizar la capacidad. El resultado es un modelo que no sólo es más rápido, sino que también mantiene una precisión competitiva, lo que lo hace adecuado para dispositivos periféricos y aplicaciones en tiempo real.

Métricas de rendimiento y puntos de referencia:

Como se muestra en la tabla comparativa, los modelos YOLOv10, en particular las variantes YOLOv10n y YOLOv10s, ofrecen velocidades de inferencia impresionantes en TensorRT, alcanzando 1,56 ms y 2,66 ms respectivamente. YOLOv10n logra un mAPval50-95 de 39,5 con solo 2,3 millones de parámetros y 6,7 mil millones de FLOPs, mientras que YOLOv10x alcanza 54,4 mAPval50-95. Estas métricas ponen de manifiesto la capacidad de YOLOv10 para ofrecer un rendimiento de vanguardia con recursos computacionales optimizados. Para conocer mejor las métricas de rendimiento deYOLO , consulte la documentación de Ultralytics sobre métricas de rendimiento deYOLO .

Casos prácticos:

El énfasis de YOLOv10 en el rendimiento y la eficiencia en tiempo real lo hace ideal para aplicaciones que requieren una rápida detección de objetos con recursos computacionales limitados. Entre los casos de uso adecuados se incluyen:

  • Aplicaciones Edge AI: Despliegue en dispositivos periféricos para procesamiento en tiempo real en escenarios como cámaras inteligentes y dispositivos IoT.
  • Robótica: Permitir un reconocimiento de objetos más rápido y eficaz para la navegación y la interacción en sistemas robóticos, como se expone en El papel de la IA en la robótica.
  • Sistemas autónomos: Aplicaciones en vehículos autónomos y drones donde la baja latencia es crucial para un funcionamiento seguro y eficaz.
  • Sistemas móviles y empotrados: Detección de objetos en aplicaciones móviles y sistemas embebidos con potencia computacional limitada.

Puntos fuertes:

  • Alta eficacia: Diseño sin NMS y arquitectura optimizada para una inferencia más rápida y una latencia reducida.
  • Precisión competitiva: Mantiene una gran precisión a la vez que mejora significativamente la velocidad.
  • Despliegue de extremo a extremo: Diseñada para la detección de objetos en tiempo real, de extremo a extremo y sin fisuras.
  • Modelos más pequeños: La arquitectura eficiente permite reducir el tamaño de los modelos y el número de parámetros en comparación con algunos predecesores.

Debilidades:

  • Relativamente nuevo: Como modelo más reciente, YOLOv10 puede tener una comunidad más pequeña y menos ejemplos de implantación en comparación con modelos más consolidados como YOLOv7.
  • Ajuste del rendimiento: Conseguir un rendimiento óptimo puede requerir un ajuste fino y experimentar con diferentes tamaños y configuraciones de modelos, como se detalla en los consejos para el entrenamiento de modelos.

Más información sobre YOLOv10

YOLOv7

YOLOv7, presentado en julio de 2022 por Chien-Yao Wang, Alexey Bochkovskiy y Hong-Yuan Mark Liao, es un aclamado modelo de detección de objetos conocido por su eficacia y precisión. El modelo se detalla en el artículo de Arxiv"YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors", y en el repositorio oficial de GitHub se ofrecen detalles sobre su implementación. YOLOv7 se basa en las versiones anteriores YOLO e incorpora mejoras arquitectónicas para maximizar el rendimiento sin aumentar sustancialmente el coste computacional.

Arquitectura y características principales:

YOLOv7 incorpora varias innovaciones arquitectónicas para mejorar su rendimiento y eficiencia. Entre sus principales características se incluyen:

  • Redes de Agregación de Capas Eficientes Ampliadas (E-ELAN): Mejora la capacidad de aprendizaje de la red y el flujo de gradiente.
  • Escalado de modelos basados en la concatenación: Proporciona directrices para un escalado eficaz de la profundidad y la anchura.
  • Cabezal auxiliar y cabezal guía de grueso a fino: mejora la eficacia de la formación y la precisión de la detección.

Estas características contribuyen a la capacidad de YOLOv7 para lograr resultados de vanguardia en términos de velocidad y precisión, lo que lo convierte en una opción sólida para diversas tareas de detección de objetos.

Métricas de rendimiento y puntos de referencia:

YOLOv7 demuestra un gran equilibrio entre velocidad y precisión. Como se muestra en la tabla, YOLOv7l logra un mAPval50-95 de 51,4, mientras que YOLOv7x alcanza 53,1 mAPval50-95. Aunque son ligeramente más lentos que YOLOv10n y YOLOv10s en la velocidad de inferencia de TensorRT , los modelos YOLOv7 siguen ofreciendo un rendimiento competitivo, sobre todo si se tienen en cuenta los modelos YOLOv7 de mayor tamaño. Para obtener métricas detalladas, consulte la documentación de YOLOv7.

Casos prácticos:

El equilibrio entre precisión y eficacia de YOLOv7 lo hace adecuado para aplicaciones que requieren una detección fiable de objetos en escenarios en tiempo real. Los casos de uso ideales incluyen:

  • Vehículos autónomos: Detección robusta de objetos en entornos de conducción complejos, fundamental para la IA en los coches autónomos.
  • Sistemas de vigilancia avanzados: Alta precisión para identificar posibles amenazas a la seguridad en sistemas de seguridad.
  • Robótica: Reconocimiento preciso de objetos para manipulación y navegación en robótica, similar a YOLOv10, pero favoreciendo potencialmente la precisión en determinados escenarios.
  • Automatización industrial: Control de calidad y detección de defectos en procesos de fabricación en los que la precisión es primordial.

Puntos fuertes:

  • Alta mAP: Alcanza una alta precisión media, lo que indica una excelente precisión en la detección de objetos.
  • Inferencia eficiente: Diseñada para una inferencia rápida, adecuada para aplicaciones en tiempo real.
  • Bien establecido y maduro: YOLOv7 se beneficia de una comunidad más amplia y de un uso extensivo, lo que proporciona más recursos y apoyo.
  • Modelos de tamaño manejable: Ofrece un buen equilibrio entre el tamaño del modelo y el rendimiento.

Debilidades:

  • Complejidad: La arquitectura es más compleja que la de algunos modelos más sencillos, lo que puede requerir más experiencia para su ajuste y optimización.
  • Uso intensivo de recursos en comparación con los nanomodelos: Aunque eficiente, es más intensivo computacionalmente que modelos más pequeños como YOLOv10n, especialmente en entornos con recursos extremadamente limitados.

Más información sobre YOLOv7

Otros modelos YOLO

Además de YOLOv10 y YOLOv7, Ultralytics ofrece una gama de modelos YOLO , cada uno con puntos fuertes únicos. Considere la posibilidad de explorar YOLOv8 para una opción versátil y fácil de usar, YOLOv9 para los avances en arquitectura de red, y YOLO11 para obtener el rendimiento más avanzado. También puede comparar YOLOv7 con otros modelos como YOLOv5 y YOLOX para conocer sus ventajas y desventajas específicas.

Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios