Ir al contenido

YOLO11 vs YOLOv7: Comparación técnica detallada para la detección de objetos

Elegir el modelo de detección de objetos adecuado es crucial para lograr un rendimiento óptimo en las tareas de visión por ordenador. Esta página ofrece una comparación técnica detallada entre Ultralytics YOLO11 y YOLOv7, dos modelos avanzados diseñados para una detección de objetos eficaz y precisa. Exploraremos sus matices arquitectónicos, puntos de referencia de rendimiento y aplicaciones adecuadas para guiarle en la toma de una decisión informada.

Ultralytics YOLO11

Ultralytics YOLO11, creado por Glenn Jocher y Jing Qiu de Ultralytics y publicado el 2024-09-27, es la última evolución de la serie YOLO . Se centra en mejorar tanto la precisión como la eficacia en la detección de objetos, lo que lo hace versátil para una amplia gama de aplicaciones del mundo real. Ultralytics YOLO11 se basa en los modelos YOLO anteriores, perfeccionando la estructura de la red para lograr una precisión de detección de vanguardia, manteniendo al mismo tiempo el rendimiento en tiempo real.

Arquitectura y características principales:

La arquitectura de YOLO11 incorpora técnicas avanzadas de extracción de características, lo que se traduce en una mayor precisión con un menor número de parámetros en comparación con modelos como YOLOv8. Esta optimización se traduce en una mayor velocidad del motor de inferencia y una menor demanda computacional, lo que lo hace apto para su despliegue en diversas plataformas, desde dispositivos periféricos hasta infraestructuras en la nube. YOLO11 es compatible con múltiples tareas de visión por ordenador, como la detección de objetos, la segmentación de instancias, la clasificación de imágenes y la estimación de poses. El modelo está disponible en GitHub.

Métricas de rendimiento y puntos de referencia:

YOLO11 muestra una impresionante precisión media (mAP) en modelos de distintos tamaños. Por ejemplo, YOLO11m alcanza un mAPval50-95 de 51,5 con un tamaño de imagen de 640, lo que equilibra eficazmente velocidad y precisión. Las variantes más pequeñas, como YOLO11n y YOLO11s, ofrecen una inferencia en tiempo real más rápida para las aplicaciones que priorizan la velocidad, mientras que los modelos más grandes, como YOLO11x, maximizan la precisión. Para conocer en detalle las métricas de rendimientoYOLO , consulte la documentación Ultralytics .

Casos prácticos:

La precisión y eficacia mejoradas de YOLO11 lo hacen ideal para aplicaciones que requieren una detección de objetos precisa y en tiempo real, como:

  • Robótica: Para la navegación precisa y la interacción con objetos en entornos dinámicos.
  • Sistemas de seguridad: En sistemas de alarma de seguridad avanzados para una detección precisa de intrusiones y una supervisión exhaustiva.
  • Análisis del comercio minorista: Para que la IA en el comercio minorista mejore la gestión de inventarios y el análisis en profundidad del comportamiento de los clientes.
  • Automatización industrial: Para un estricto control de calidad y una eficaz detección de defectos en los procesos de fabricación.

Puntos fuertes:

  • Alta precisión: Consigue mAP de última generación con arquitecturas refinadas.
  • Inferencia eficiente: Procesamiento rápido adecuado para aplicaciones en tiempo real.
  • Tareas versátiles: Admite detección de objetos, segmentación, clasificación y estimación de poses.
  • Escalabilidad: Funciona con eficacia en distintos tipos de hardware, desde dispositivos periféricos hasta sistemas en la nube.

Debilidades:

  • Los modelos más grandes pueden exigir más recursos informáticos que los modelos más pequeños de velocidad optimizada.
  • La optimización para dispositivos de borde específicos puede requerir configuraciones de despliegue de modelos adicionales.

Más información sobre YOLO11

YOLOv7

YOLOv7, presentado en julio de 2022 por Chien-Yao Wang, Alexey Bochkovskiy y Hong-Yuan Mark Liao, del Instituto de Ciencias de la Información de la Academia Sinica de Taiwán, es conocido por su bolsa de objetos libres entrenable, que establece un nuevo estado del arte para los detectores de objetos en tiempo real. Detallado en su artículo arXiv y en su repositorio GitHub, YOLOv7 hace hincapié en la velocidad y la eficiencia, al tiempo que mantiene una alta precisión en las tareas de detección de objetos.

Arquitectura y características principales:

YOLOv7 se basa en la Red de Agregación de Capas Eficiente (ELAN) e introduce Extended-ELAN (E-ELAN) para mejorar la capacidad de aprendizaje de la red. Emplea técnicas como la re-parametrización del modelo y la asignación dinámica de etiquetas para mejorar la eficiencia del entrenamiento y la velocidad de inferencia. YOLOv7 está diseñado para la detección de objetos de alto rendimiento en diversas aplicaciones.

Métricas de rendimiento y puntos de referencia:

YOLOv7 demuestra unas métricas de rendimiento excelentes, alcanzando un mAP del 51,4% en el conjunto de datos COCO con un tamaño de imagen de 640. Su velocidad también es notable. Su velocidad también es notable, ya que el modelo básico de YOLOv7 alcanza 161 FPS en la inferencia del lote 1. Para obtener referencias de rendimiento detalladas, consulte el repositorio oficial de YOLOv7 en GitHub.

Casos prácticos:

El equilibrio entre velocidad y precisión de YOLOv7 lo hace adecuado para una amplia gama de aplicaciones, entre ellas:

  • Detección de objetos en tiempo real: Ideal para aplicaciones que requieren una detección rápida, como la conducción autónoma y el análisis de vídeo a gran velocidad.
  • Computación de alto rendimiento: Adecuado para entornos en los que se dispone de recursos informáticos y se prioriza la alta precisión junto con la velocidad.
  • Investigación y desarrollo: Un sólido modelo de referencia para seguir investigando en arquitecturas de detección de objetos y metodologías de formación.

Puntos fuertes:

  • Alta velocidad: Alcanza velocidades de inferencia impresionantes, adecuadas para sistemas en tiempo real.
  • Buena precisión: Ofrece puntuaciones mAP competitivas en conjuntos de datos de referencia.
  • Arquitectura eficiente: Utiliza E-ELAN y la re-parametrización del modelo para mejorar el rendimiento.

Debilidades:

  • Puede requerir más recursos computacionales en comparación con modelos más pequeños y recientes como YOLO11n para escenarios de despliegue en los bordes.
  • La arquitectura, aunque eficiente, es menos versátil a la hora de soportar diversas tareas de visión más allá de la detección de objetos en comparación con YOLO11.

Más información sobre YOLOv7

Tabla comparativa de modelos

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9

Conclusión

Tanto YOLO11 como YOLOv7 son potentes modelos de detección de objetos, cada uno de ellos con puntos fuertes únicos. YOLO11 destaca por su versatilidad y eficacia, ya que admite múltiples tareas de visión con una precisión y velocidad de vanguardia, lo que lo convierte en una opción sólida para diversas aplicaciones y entornos de despliegue. YOLOv7, aunque también es eficiente, está especialmente optimizado para la detección de objetos a alta velocidad, por lo que resulta adecuado para aplicaciones en tiempo real y con fines de investigación. La elección entre uno y otro depende de los requisitos específicos de su proyecto, equilibrando factores como la versatilidad de las tareas, las necesidades de precisión y las limitaciones de despliegue.

Para los usuarios interesados en explorar otros modelos, Ultralytics también ofrece YOLOv8, conocido por su eficiencia aerodinámica y versatilidad, y YOLOv5, ampliamente adoptado por su velocidad y facilidad de uso. También puede considerar comparar YOLO11 con YOLOv9 o explorar modelos como RT-DETR para diferentes enfoques arquitectónicos de la detección de objetos.

Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios