Vai al contenuto

PP-YOLOE+ vs YOLOv5: confronto tecnico dettagliato

La scelta del giusto modello di rilevamento degli oggetti è fondamentale per le attività di computer vision. Questa pagina fornisce un confronto tecnico tra PP-YOLOE+ e Ultralytics YOLOv5, due modelli popolari noti per le loro prestazioni e la loro efficienza nel rilevamento degli oggetti. Approfondiremo le loro architetture, le metriche delle prestazioni e le applicazioni più adatte per aiutarvi a prendere una decisione consapevole.

PP-YOLOE+

PP-YOLOE+, introdotto dagli autori di PaddlePaddle di Baidu il 2022-04-02(link Arxiv), è un rilevatore senza ancore e a stadio singolo noto per la sua efficienza e facilità di implementazione all'interno dell'ecosistema PaddlePaddle (link GitHub). Si concentra su prestazioni elevate con una configurazione semplificata(link ai documenti).

Architettura e caratteristiche principali

PP-YOLOE+ si basa sull'architettura YOLO con diversi miglioramenti:

  • Design senza ancore: Semplifica il processo di rilevamento eliminando la necessità di scatole di ancoraggio e riducendo la regolazione degli iperparametri. Scoprite i rilevatori privi di ancore.
  • Backbone: Utilizza un backbone ResNet con miglioramenti per un'estrazione efficiente delle caratteristiche.
  • Collo: Impiega una Path Aggregation Network (PAN) per una migliore fusione delle caratteristiche su diverse scale, simile alla PANet di YOLOv5.
  • Testa disaccoppiata: separa le teste di classificazione e di regressione, migliorando l'accuratezza e l'efficienza della formazione.
  • Perdita per l'apprendimento dell'allineamento dei compiti (TAL): consente di allineare i compiti di classificazione e localizzazione per ottenere rilevamenti più precisi. Esplorate le funzioni di perdita nei documenti di Ultralytics .

Prestazioni

PP-YOLOE+ è stato progettato per ottenere un equilibrio tra precisione e velocità. Anche se le metriche specifiche variano, è generalmente considerato efficiente dal punto di vista computazionale, il che lo rende adatto alle applicazioni in tempo reale.

Casi d'uso

PP-YOLOE+ è adatto ad applicazioni che richiedono un rilevamento robusto ed efficiente degli oggetti, come ad esempio:

Punti di forza e di debolezza

  • Punti di forza:
    • Il design privo di ancoraggi semplifica l'implementazione.
    • Elevata precisione e capacità di inferenza efficiente.
    • Ben documentato e supportato dal framework PaddlePaddle .
  • Punti di debolezza:
    • Blocco dell'ecosistema per gli utenti esterni all'ambiente PaddlePaddle .
    • Comunità potenzialmente più piccola e meno risorse rispetto a modelli ampiamente adottati come YOLOv5.

Per saperne di più su PP-YOLOE+

YOLOv5

Ultralytics YOLOv5, scritto da Glenn Jocher di Ultralytics e rilasciato il 26.06.2020(link GitHub), è un modello di rilevamento degli oggetti all'avanguardia, famoso per la sua velocità, precisione e facilità d'uso. È costruito interamente in PyTorch e progettato sia per la ricerca che per le applicazioni pratiche(link ai documenti).

Architettura e caratteristiche principali

YOLOv5 è rinomato per la sua architettura snella ed efficiente:

  • Backbone: CSPDarknet53, ottimizzato per l'efficienza dell'estrazione delle caratteristiche.
  • Collo: PANet per la generazione efficace di piramidi di caratteristiche, migliorando la fusione di caratteristiche multiscala.
  • Testina: testina di rilevamento a singolo strato di convoluzione per semplicità e velocità.
  • Aumento dei dati: Utilizza tecniche di incremento dei dati come Mosaic e MixUp per migliorare la robustezza del modello. Per saperne di più sull'incremento dei dati.
  • Dimensioni multiple dei modelli: Offre una gamma di dimensioni dei modelli (n, s, m, l, x) per le diverse esigenze di calcolo.

Prestazioni

YOLOv5 è famoso per il suo equilibrio tra velocità e precisione, in quanto fornisce il rilevamento di oggetti in tempo reale su modelli di varie dimensioni. È stato progettato per essere veloce ed efficiente, il che lo rende ideale per la distribuzione in ambienti diversi. Esplorate le metriche delle prestazioni di YOLO per maggiori dettagli.

Casi d'uso

La versatilità di YOLOv5 lo rende adatto a un'ampia gamma di applicazioni:

Punti di forza e di debolezza

  • Punti di forza:
  • Punti di debolezza:
    • I modelli più grandi possono essere intensivi dal punto di vista computazionale.
    • L'approccio basato sulle ancore può richiedere una maggiore messa a punto per set di dati specifici rispetto ai metodi senza ancore. Per saperne di più sui rilevatori basati sulle ancore.

Per saperne di più su YOLOv5

Tabella delle prestazioni

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4TensorRT10
(ms)
params
(M)
FLOP
(B)
PP-YOLOE+t 640 39.9 - 2.84 4.85 19.15
PP-YOLOE+s 640 43.7 - 2.62 7.93 17.36
PP-YOLOE+m 640 49.8 - 5.56 23.43 49.91
PP-YOLOE+l 640 52.9 - 8.36 52.2 110.07
PP-YOLOE+x 640 54.7 - 14.3 98.42 206.59
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusione

Sia PP-YOLOE+ che YOLOv5 sono modelli robusti di rilevamento degli oggetti. PP-YOLOE+ offre un approccio efficiente senza ancoraggi, particolarmente vantaggioso nell'ecosistema PaddlePaddle . Ultralytics YOLOv5 eccelle nelle applicazioni in tempo reale, offrendo ottimizzazioni della velocità e un'ampia gamma di dimensioni del modello, supportate da una vasta comunità e da un ecosistema completo.

Gli utenti potrebbero anche essere interessati a esplorare altri modelliYOLO di Ultralytics , come ad esempio:

  • YOLOv7, noto per la sua velocità ed efficienza.
  • YOLOv8, l'ultimo modello Ultralytics con prestazioni all'avanguardia.
  • YOLO11, l'ultima iterazione che si concentra sull'efficienza e sulla precisione.
  • YOLOv9, che offre progressi in termini di precisione e velocità.

La scelta tra PP-YOLOE+ e YOLOv5 dipende dalle esigenze del progetto, dalle preferenze della struttura e dall'equilibrio richiesto tra velocità e precisione.

📅C reato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti