Confronto tecnico: YOLOX vs PP-YOLOE+ per il rilevamento degli oggetti
La scelta del giusto modello di rilevamento degli oggetti è fondamentale per le attività di computer vision. Questa pagina offre un confronto tecnico dettagliato tra YOLOX e PP-YOLOE+, due modelli anchor-free all'avanguardia, evidenziandone le architetture, le prestazioni e i casi d'uso per aiutare a prendere una decisione consapevole.
YOLOX: rivelatore senza ancore ad alte prestazioni
YOLOX, introdotto nel luglio 2021 da Megvii, è un modello di rilevamento di oggetti senza ancoraggio noto per la sua semplicità e le sue elevate prestazioni. Il suo obiettivo è quello di colmare il divario tra la ricerca e le applicazioni industriali, fornendo un'architettura snella ma efficace.
Architettura e caratteristiche principali
YOLOX semplifica la serie YOLO adottando un approccio privo di ancoraggi, eliminando la necessità di calcoli complessi per le scatole di ancoraggio. Le principali innovazioni architettoniche includono:
- Rilevamento senza ancore: Elimina le caselle di ancoraggio, semplificando il progetto e riducendo il numero di iperparametri.
- Testa disaccoppiata: YOLOX separa le teste di classificazione e localizzazione, migliorando le prestazioni, soprattutto in termini di precisione.
- SimOTA Label Assignment: Una strategia avanzata di assegnazione delle etichette che ottimizza l'addestramento assegnando dinamicamente i target in base alle bounding box previste.
- Forte incremento dei dati: Utilizza gli ampliamenti MixUp e Mosaic per migliorare la robustezza e la generalizzazione.
Metriche di prestazione
I modelli YOLOX dimostrano un forte equilibrio tra accuratezza e velocità. Come indicato nella tabella di confronto, YOLOX raggiunge punteggi mAP competitivi con tempi di inferenza efficienti. Ad esempio, YOLOX-x raggiunge il 51,1% di mAP sul set di dati COCO val.
Casi d'uso
- Guida autonoma: Il rilevamento degli oggetti in tempo reale è fondamentale per i sistemi di navigazione e sicurezza autonomi.
- Robotica: Consente ai robot di percepire e interagire con l'ambiente in modo efficace.
- Ispezione industriale: L'elevata precisione e velocità sono essenziali per il controllo della qualità nei processi di produzione.
Punti di forza e di debolezza
Punti di forza:
- Elevato compromesso tra precisione e velocità: raggiunge prestazioni eccellenti sia in termini di precisione che di velocità di inferenza.
- Architettura semplificata: Il design privo di ancoraggi semplifica l'implementazione e riduce la complessità computazionale.
- Prestazioni elevate in tutte le dimensioni del modello: Offre modelli da Nano a X per soddisfare i vari vincoli di risorse.
Punti deboli:
- Velocità di inferenza rispetto ai modelli in tempo reale: Pur essendo veloci, modelli come YOLOv10 possono offrire una velocità di inferenza ancora maggiore, privilegiando la velocità rispetto all'accuratezza finale.
Dettagli:
- Autori: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun
- Organizzazione: Megvii
- Data: 2021-07-18
- Collegamento Arxiv: YOLOX: superare la serie YOLO nel 2021
- Collegamento GitHub: Megvii-BaseDetection/YOLOX
- Link ai documenti: Documentazione YOLOX
PP-YOLOE+: Eccellenza senza ancore da PaddlePaddle
PP-YOLOE+, una versione migliorata di PP-YOLOE di PaddlePaddleè stata progettata per garantire un'elevata precisione ed efficienza nel rilevamento degli oggetti. Rilasciato nell'aprile 2022 da Baidu, si basa sul paradigma dell'assenza di ancoraggio, concentrandosi sulle applicazioni industriali che richiedono un rilevamento robusto e preciso.
Architettura e caratteristiche principali
PP-YOLOE+ enfatizza la precisione senza sacrificare la velocità di inferenza, rendendolo adatto a compiti di rilevamento di oggetti impegnativi. La sua architettura comprende:
- Design senza ancore: Semplifica il modello e riduce la regolazione degli iperparametri eliminando le caselle di ancoraggio.
- Testa disaccoppiata: simile a YOLOX, utilizza teste disaccoppiate per la classificazione e la localizzazione per migliorare la precisione.
- VariFocal Loss: impiega VariFocal Loss per la classificazione raffinata e la regressione del rettangolo di selezione, migliorando la precisione del rilevamento.
- CSPRepResNet Backbone e ELAN Neck: Utilizza architetture backbone e neck efficienti per l'estrazione e l'aggregazione delle caratteristiche.
Metriche di prestazione
I modelli PP-YOLOE+ offrono un forte equilibrio tra precisione e velocità. La tabella di confronto mostra punteggi mAP competitivi e tempi di inferenza TensorRT efficienti. PP-YOLOE+x raggiunge il 54,7% di mAP sul dataset COCO val, dimostrando un'eccellente accuratezza.
Casi d'uso
- Ispezione della qualità industriale: L'alta precisione è fondamentale per identificare i difetti nella produzione.
- Efficienza del riciclaggio: Il rilevamento accurato degli oggetti migliora la selezione automatica negli impianti di riciclaggio.
- Sorveglianza: Per un monitoraggio affidabile dei sistemi di sicurezza è necessario un rilevamento robusto e accurato.
Punti di forza e di debolezza
Punti di forza:
- Alta precisione: Privilegia il raggiungimento di una precisione all'avanguardia nel rilevamento degli oggetti.
- Design efficiente: Bilancia l'alta precisione con una ragionevole velocità di inferenza.
- Focus industriale: Ideale per le applicazioni industriali che richiedono un rilevamento affidabile e preciso degli oggetti.
Punti deboli:
- Complessità: Pur essendo privi di ancore, i miglioramenti "+" aggiungono complessità rispetto ai modelli più semplici.
- Lock-in nell'ecosistema: Principalmente all'interno dell'ecosistema PaddlePaddle , il che potrebbe essere un problema per gli utenti che preferiscono altri framework.
PP-YOLOE+ Documentazione (PaddleDetection)
Dettagli:
- Autori: Autori PaddlePaddle
- Organizzazione: Baidu
- Data: 2022-04-02
- Collegamento Arxiv: PP-YOLOE: un rilevatore di oggetti evolutivo privo di ancore
- Collegamento a GitHub: PaddlePaddle
- Link ai documenti: Documentazione PP-YOLOE
Tabella di confronto dei modelli
Modello | dimensione (pixel) |
mAPval 50-95 |
Velocità CPU ONNX (ms) |
Velocità T4TensorRT10 (ms) |
params (M) |
FLOP (B) |
---|---|---|---|---|---|---|
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
PP-YOLOE+t | 640 | 39.9 | - | 2.84 | 4.85 | 19.15 |
PP-YOLOE+s | 640 | 43.7 | - | 2.62 | 7.93 | 17.36 |
PP-YOLOE+m | 640 | 49.8 | - | 5.56 | 23.43 | 49.91 |
PP-YOLOE+l | 640 | 52.9 | - | 8.36 | 52.2 | 110.07 |
PP-YOLOE+x | 640 | 54.7 | - | 14.3 | 98.42 | 206.59 |
Altri modelli
Gli utenti interessati a YOLOX e PP-YOLOE+ potrebbero trovare interessanti anche i modelli Ultralytics YOLO , come ad esempio:
- YOLOv5: Conosciuto per la sua efficienza e flessibilità, offre una gamma di modelli di diverse dimensioni adatti a varie applicazioni. Per saperne di più su YOLOv5.
- YOLOv8: L'ultima iterazione della serie YOLO , che offre un equilibrio tra velocità e precisione nel rilevamento degli oggetti, nella segmentazione e nella stima della posa. Per saperne di più su YOLOv8.
- YOLOv10: rappresenta l'avanguardia nel rilevamento di oggetti in tempo reale, progettato per garantire velocità ed efficienza eccezionali, ideale per i dispositivi edge. Per saperne di più su YOLOv10.
- YOLO11: L'ultimo modelloYOLO di Ultralytics , che ridefinisce i confini di ciò che è possibile fare con l'IA grazie a prestazioni e capacità migliorate. Per saperne di più su YOLO11.