Vai al contenuto

Confronto tra modelli: PP-YOLOE+ vs YOLO11 per il rilevamento degli oggetti

Quando si sceglie un modello di computer vision per il rilevamento di oggetti, è essenziale comprendere i punti di forza e di debolezza delle diverse architetture. Questa pagina offre un confronto tecnico dettagliato tra PP-YOLOE+ e Ultralytics YOLO11, due modelli all'avanguardia, per aiutarvi a prendere una decisione consapevole.

Ultralytics YOLO11: efficienza e versatilità all'avanguardia

Ultralytics YOLO11, scritto da Glenn Jocher e Jing Qiu di Ultralytics e rilasciato il 24-09-27, è l'ultima iterazione dell'acclamata serie YOLO . È stato progettato per il rilevamento di oggetti in tempo reale ed eccelle nel bilanciare velocità e precisione in diverse applicazioni. YOLO11 si basa sui modelli YOLO precedenti, introducendo miglioramenti architettonici per migliorare le prestazioni e la versatilità in compiti come la classificazione delle immagini, la segmentazione delle istanze e la stima della posa.

Architettura e caratteristiche principali

YOLO11 mantiene il paradigma di rilevamento a fase singola e senza ancore, privilegiando la velocità di inferenza. Le principali caratteristiche architettoniche includono:

  • Backbone efficiente: Un backbone semplificato per l'estrazione rapida delle caratteristiche.
  • Scalabilità: Disponibile in diverse dimensioni (n, s, m, l, x) per soddisfare le diverse esigenze di calcolo e gli ambienti di distribuzione, dai dispositivi edge come NVIDIA Jetson ai server cloud.
  • Versatilità: Supporta diverse attività di computer vision oltre al rilevamento degli oggetti, offrendo una soluzione flessibile all'interno dell'ecosistema Ultralytics .

Metriche di prestazione

YOLO11 dimostra un forte equilibrio tra velocità e precisione, che lo rende adatto alle applicazioni in tempo reale.

Per saperne di più su YOLO11

Punti di forza e di debolezza

Punti di forza:

  • Versatile e preciso: Si distingue per le diverse attività di visione, offrendo elevata precisione e velocità.
  • Ecosistema facile da usare: Integrazione perfetta all'interno dell'ecosistema Ultralytics , con un'ampia gamma di funzioni. Python e CLI .
  • Distribuzione scalabile: Le dimensioni multiple dei modelli garantiscono l'adattabilità a diversi hardware.

Punti deboli:

  • Esigenza di calcolo: I modelli più grandi possono essere intensivi dal punto di vista computazionale e richiedono un hardware potente per ottenere prestazioni ottimali in tempo reale.
  • Complessità per i nuovi utenti: Pur essendo di facile utilizzo, la messa a punto e la comprensione delle sfumature dell'architettura possono rappresentare una curva di apprendimento per i nuovi utenti della computer vision.

Casi d'uso ideali

YOLO11 è adatto alle applicazioni che richiedono il rilevamento di oggetti in tempo reale con un'elevata precisione:

  • Analisi video in tempo reale: Applicazioni come la gestione delle code e i sistemi di sicurezza beneficiano della sua velocità e precisione.
  • Implementazione dell'intelligenza artificiale sui bordi: Efficiente per l'elaborazione on-device su piattaforme come Raspberry Pi.
  • Sistemi autonomi: Ideale per le auto a guida autonoma e la robotica che richiede una percezione rapida e accurata, come evidenziato nella visione AI nelle applicazioni di guida autonoma.

PP-YOLOE+: Precisione ed efficienza

PP-YOLOE+ (Practical YOLO with Evolved Enhancement), sviluppato dagli autori di PaddlePaddle presso Baidu e rilasciato il 2022-04-02, è progettato per il rilevamento di oggetti di alta precisione con un'efficienza ragionevole. Si tratta di una versione migliorata della serie PP-YOLOE, incentrata sulle applicazioni industriali in cui la precisione è fondamentale. PP-YOLOE+ privilegia la precisione senza sacrificare in modo significativo la velocità di inferenza e fa parte dello zoo di modelli PaddleDetection.

Architettura e caratteristiche principali

PP-YOLOE+ adotta inoltre un approccio privo di ancore, enfatizzando precisione ed efficienza. Le caratteristiche principali includono:

  • Focus sull'alta precisione: Architettonicamente perfezionato per ottenere la massima precisione nei compiti di rilevamento degli oggetti.
  • Design efficiente: Bilancia l'accuratezza con una velocità di inferenza efficiente, adatta alle applicazioni più esigenti.
  • IntegrazionePaddlePaddle : Sfrutta il framework di deep learning PaddlePaddle , beneficiando delle sue ottimizzazioni e del suo ecosistema.

Metriche di prestazione

PP-YOLOE+ eccelle in precisione pur mantenendo una velocità competitiva:

  • Alta mAP: Raggiunge un'elevata precisione media (mAP), dimostrando una forte accuratezza su set di dati di riferimento come COCO, come descritto nella documentazione di PP-YOLOE+.
  • Inferenza efficiente: Offre un buon equilibrio tra precisione e velocità di inferenza, adatto alle applicazioni industriali che richiedono analisi in tempo reale.
  • Dimensioni del modello: Offre varie dimensioni del modello per adattarsi alle diverse risorse di calcolo.

Per saperne di più su PP-YOLOE+

Punti di forza e di debolezza

Punti di forza:

  • Eccezionale precisione: Privilegia un'elevata accuratezza di rilevamento, fondamentale per le applicazioni di precisione come l'ispezione della qualità nella produzione.
  • Focus industriale: Ideale per gli ambienti industriali che richiedono un rilevamento affidabile e preciso degli oggetti.
  • EcosistemaPaddlePaddle : Beneficia dell'ecosistema e delle ottimizzazioni del framework PaddlePaddle .

Punti deboli:

  • Lock-in nell'ecosistema: Principalmente all'interno dell'ecosistema PaddlePaddle , il che potrebbe essere un problema per gli utenti che sono profondamente legati ad altri framework come PyTorch utilizzato da Ultralytics YOLO.
  • Meno versatile nel contesto di Ultralytics : Pur essendo capace, non è integrato in modo nativo nel framework di Ultralytics come YOLO11.

Casi d'uso ideali

PP-YOLOE+ è ideale per le applicazioni in cui la precisione è fondamentale:

Tabella di confronto dei modelli

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4TensorRT10
(ms)
params
(M)
FLOP
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusione

Sia PP-YOLOE+ che YOLO11 sono modelli robusti di rilevamento degli oggetti, ciascuno con vantaggi unici. YOLO11 rappresenta una soluzione versatile e performante all'interno dell'ecosistema Ultralytics , ideale per le applicazioni che richiedono un equilibrio tra velocità e precisione in diverse attività di visione. PP-YOLOE+ eccelle in accuratezza ed efficienza, particolarmente vantaggioso per gli utenti del framework PaddlePaddle e per coloro che privilegiano la precisione in ambito industriale.

Gli utenti interessati ad esplorare altri modelli all'interno dell'ecosistema Ultralytics possono anche prendere in considerazione:

  • YOLOv8 - Un modello altamente versatile e facile da usare della serie YOLO .
  • YOLOv9 - Conosciuto per i suoi progressi in termini di precisione ed efficienza.
  • YOLO - Modelli progettati attraverso la ricerca di architetture neurali per ottimizzare le prestazioni.
  • RT-DETR - Real-Time DEtection Transformer, che offre un approccio architettonico diverso.
  • YOLOv7, YOLOv6 e YOLOv5 - Le versioni precedenti della famiglia YOLO , ognuna con le proprie caratteristiche e punti di forza.
📅C reato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti