Ir al contenido

Comparación de modelos: PP-YOLOE+ frente a YOLO11 para la detección de objetos

A la hora de seleccionar un modelo de visión por ordenador para la detección de objetos, es esencial comprender los puntos fuertes y débiles de las distintas arquitecturas. Esta página ofrece una comparación técnica detallada entre PP-YOLOE+ y Ultralytics YOLO11, dos modelos de última generación, para ayudarle a tomar una decisión informada.

Ultralytics YOLO11: eficacia y versatilidad de vanguardia

Ultralytics YOLO11, creado por Glenn Jocher y Jing Qiu de Ultralytics y publicado el 2024-09-27, es la última iteración de la aclamada serie YOLO . Está diseñada para la detección de objetos en tiempo real y destaca por su equilibrio entre velocidad y precisión en diversas aplicaciones. YOLO11 se basa en los modelos YOLO anteriores e introduce mejoras arquitectónicas para aumentar el rendimiento y la versatilidad en tareas como la clasificación de imágenes, la segmentación de instancias y la estimación de poses.

Arquitectura y características principales

YOLO11 mantiene el paradigma de detección en una sola etapa y sin anclajes, priorizando la velocidad de inferencia. Entre las principales características arquitectónicas se incluyen:

  • Espina dorsal eficiente: Una columna vertebral racionalizada para la extracción rápida de características.
  • Escalabilidad: Disponible en múltiples tamaños (n, s, m, l, x) para adaptarse a diferentes necesidades computacionales y entornos de implementación, desde dispositivos de borde como NVIDIA Jetson hasta servidores en la nube.
  • Versatilidad: Admite diversas tareas de visión por ordenador más allá de la detección de objetos, ofreciendo una solución flexible dentro del ecosistema Ultralytics .

Métricas de rendimiento

YOLO11 demuestra un gran equilibrio entre velocidad y precisión, lo que lo hace idóneo para aplicaciones en tiempo real.

  • mAP: Alcanza la mejor precisión media (mAP) en conjuntos de datos como COCO. Consulte la guía de métricas de rendimientoYOLO para obtener más información sobre mAP y otras métricas de evaluación.
  • Velocidad de inferencia: Optimizada para una inferencia rápida, crucial para las necesidades de procesamiento en tiempo real como se ve en la IA de visión en aplicaciones de streaming.
  • Tamaño del modelo: Mantiene un tamaño de modelo compacto, lo que facilita la implantación en dispositivos con recursos limitados.

Más información sobre YOLO11

Puntos fuertes y débiles

Puntos fuertes:

  • Versátil y preciso: Sobresale en diversas tareas de visión, ofreciendo alta precisión y velocidad.
  • Ecosistema fácil de usar: Integración sin fisuras en el ecosistema Ultralytics , con un completo Python y CLI .
  • Despliegue escalable: Múltiples tamaños de modelos garantizan la adaptabilidad a diferentes hardware.

Debilidades:

  • Exigencia computacional: Los modelos de mayor tamaño pueden ser muy exigentes desde el punto de vista computacional, lo que requiere un hardware potente para un rendimiento óptimo en tiempo real.
  • Complejidad para los nuevos usuarios: Aunque es fácil de usar, el ajuste y la comprensión de los matices de la arquitectura pueden presentar una curva de aprendizaje para los nuevos usuarios en visión por computador.

Casos de uso ideales

YOLO11 es idóneo para aplicaciones que exigen la detección de objetos en tiempo real con gran precisión:

  • Análisis de vídeo en tiempo real: Aplicaciones como la gestión de colas y los sistemas de seguridad se benefician de su velocidad y precisión.
  • Despliegue Edge AI: Eficiente para el procesamiento en el dispositivo en plataformas como Raspberry Pi.
  • Sistemas autónomos: Ideal para coches autónomos y robótica que requieren una percepción rápida y precisa, como se destaca en la IA de visión en aplicaciones de conducción autónoma.

PP-YOLOE+: Precisión y eficacia

PP-YOLOE+ (Practical YOLO with Evolved Enhancement), desarrollado por los autores de PaddlePaddle en Baidu y lanzado el 2022-04-02, está diseñado para la detección de objetos de alta precisión con una eficiencia razonable. Es una versión mejorada de la serie PP-YOLOE, centrada en aplicaciones industriales en las que la precisión es primordial. PP-YOLOE+ prioriza la precisión sin sacrificar significativamente la velocidad de inferencia y forma parte del zoo de modelos PaddleDetection.

Arquitectura y características principales

PP-YOLOE+ también adopta un enfoque sin anclajes, haciendo hincapié en la precisión y la eficacia. Sus principales características son:

  • Enfoque de alta precisión: Arquitectura perfeccionada para lograr la máxima precisión en tareas de detección de objetos.
  • Diseño eficiente: Equilibra la precisión con una velocidad de inferencia eficiente, adecuada para aplicaciones exigentes.
  • Integración conPaddlePaddle : Aprovecha el marco de aprendizaje profundo PaddlePaddle , beneficiándose de sus optimizaciones y ecosistema.

Métricas de rendimiento

PP-YOLOE+ destaca por su precisión al tiempo que mantiene una velocidad competitiva:

  • Alta mAP: Alcanza una alta precisión media (mAP), demostrando una gran exactitud en conjuntos de datos de referencia como COCO, tal y como se detalla en la documentación de PP-YOLOE+.
  • Inferencia eficiente: Proporciona un buen equilibrio entre precisión y velocidad de inferencia, adecuado para aplicaciones industriales que requieren análisis en tiempo real.
  • Tamaño del modelo: Ofrece varios tamaños de modelo para adaptarse a diferentes recursos computacionales.

Más información sobre PP-YOLOE

Puntos fuertes y débiles

Puntos fuertes:

  • Precisión excepcional: Prioriza la alta precisión de detección, crucial para aplicaciones de precisión crítica como la inspección de calidad en la fabricación.
  • Enfoque industrial: Muy adecuado para entornos industriales que requieren una detección de objetos fiable y precisa.
  • EcosistemaPaddlePaddle : Benefíciate del ecosistema y las optimizaciones del framework PaddlePaddle .

Debilidades:

  • Enclavamiento en el ecosistema: Principalmente dentro del ecosistema PaddlePaddle , que podría ser una consideración para los usuarios profundamente arraigados en otros marcos como PyTorch utilizado por Ultralytics YOLO.
  • Menos versátil en el contexto de Ultralytics : Aunque es capaz, no está tan integrado de forma nativa en el marco versátil de tareas de Ultralytics como YOLO11.

Casos de uso ideales

PP-YOLOE+ es ideal para aplicaciones en las que la precisión es primordial:

Tabla comparativa de modelos

Modelo tamaño
(píxeles)
mAPval
50-95
Velocidad
CPU ONNX
(ms)
Velocidad
T4TensorRT10
(ms)
parámetros
(M)
FLOPs
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusión

Tanto PP-YOLOE+ como YOLO11 son modelos robustos de detección de objetos, cada uno con ventajas únicas. YOLO11 ofrece una solución versátil y de alto rendimiento dentro del ecosistema Ultralytics , ideal para aplicaciones que requieren un equilibrio entre velocidad y precisión en diversas tareas de visión. PP-YOLOE+ destaca por su precisión y eficacia, lo que resulta especialmente beneficioso para los usuarios del marco PaddlePaddle y para quienes dan prioridad a la precisión en entornos industriales.

Los usuarios interesados en explorar otros modelos dentro del ecosistema Ultralytics también pueden considerar:

  • YOLOv8 - Un modelo muy versátil y fácil de usar de la serie YOLO .
  • YOLOv9 - Conocido por sus avances en precisión y eficacia.
  • YOLO - Modelos diseñados mediante búsqueda de arquitectura neuronal para optimizar el rendimiento.
  • RT-DETR - Real-Time DEtection Transformer, que ofrece un enfoque arquitectónico diferente.
  • YOLOv7, YOLOv6 y YOLOv5 - Versiones anteriores de la familia YOLO , cada una con sus propias características de rendimiento y puntos fuertes.
Creado hace 1 año ✏️ Actualizado hace 1 mes

Comentarios