Confronto tra modelli: YOLOv8 vs YOLOX per il rilevamento degli oggetti
La scelta del giusto modello di rilevamento degli oggetti è fondamentale per diverse applicazioni di computer vision. Questa pagina offre un confronto tecnico dettagliato tra Ultralytics YOLOv8 e YOLOX, due modelli popolari ed efficienti per il rilevamento degli oggetti. Esploreremo le loro sfumature architettoniche, i benchmark delle prestazioni e l'idoneità a diversi casi d'uso per aiutarvi a prendere una decisione informata.
Ultralytics YOLOv8: efficienza e versatilità
Ultralytics YOLOv8 è un modello all'avanguardia della serie YOLO , noto per la sua velocità e precisione nel rilevamento di oggetti e in altri compiti di visione. Sviluppato da Glenn Jocher, Ayush Chaurasia e Jing Qiu di Ultralytics e rilasciato il 2023-01-10, YOLOv8 si basa sulle versioni precedenti di YOLO con miglioramenti architetturali incentrati sull'efficienza e sulla facilità d'uso. È stato progettato per essere versatile, con buone prestazioni nel rilevamento degli oggetti, nella segmentazione, nella stima della posa e nella classificazione.
Architettura e caratteristiche principali:
YOLOv8 adotta un approccio privo di ancore, semplificando l'architettura e migliorando la generalizzazione. Le caratteristiche principali includono:
- Backbone semplificato: Estrazione efficiente delle caratteristiche.
- Testa di rilevamento senza ancoraggio: migliora la velocità e la semplicità.
- Funzione di perdita composita: Ottimizzata per l'accuratezza e la robustezza dell'addestramento.
Punti di forza:
- Prestazioni eccellenti: YOLOv8 raggiunge un ottimo equilibrio tra velocità e precisione, rendendolo adatto a un'ampia gamma di applicazioni. Vedere le metriche delle prestazioni nella tabella di confronto qui sotto.
- Facilità d'uso: Ultralytics enfatizza la facilità d'uso con una documentazione chiara e un pacchettoPython di facile utilizzo.
- Versatilità multi-task: Supporta il rilevamento degli oggetti, la segmentazione delle istanze, la stima della posa e la classificazione delle immagini.
- Integrazione dell'ecosistema: Si integra perfettamente con Ultralytics HUB per la gestione e la distribuzione dei modelli, semplificando i flussi di lavoro MLOps.
Punti deboli:
- Pur essendo molto efficienti, per i dispositivi estremamente limitati dal punto di vista delle risorse, i modelli più piccoli come YOLOX-Nano potrebbero offrire dimensioni più ridotte.
Casi d'uso ideali:
La versatilità di YOLOv8 lo rende ideale per le applicazioni che richiedono un equilibrio tra elevata precisione e prestazioni in tempo reale, come ad esempio:
- Rilevamento di oggetti in tempo reale: Applicazioni come i sistemi di allarme di sicurezza, la robotica e i veicoli autonomi.
- Soluzioni AI di visione versatili: In settori come l'agricoltura, la produzione e la sanità.
- Prototipazione e implementazione rapide: Grazie alla facilità d'uso e agli strumenti completi, tra cui Ultralytics HUB.
YOLOX: alte prestazioni e semplicità
YOLOX, presentato da Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun di Megvii il 2021-07-18, è un altro modello YOLO privo di ancoraggio che mira ad ottenere prestazioni elevate con un design semplificato. YOLOX si concentra sul rilevamento degli oggetti ed è progettato per colmare il divario tra ricerca e applicazioni industriali.
Architettura e caratteristiche principali:
YOLOX adotta inoltre un approccio privo di ancore, semplificando il processo di addestramento e inferenza. I componenti architettonici chiave includono:
- Testa disaccoppiata: separa i compiti di classificazione e localizzazione per migliorare le prestazioni.
- Assegnazione delle etichette SimOTA: Strategia avanzata di assegnazione delle etichette per una formazione ottimizzata.
- Forte incremento dei dati: Tecniche come MixUp e Mosaic sono utilizzate per aumentare la robustezza.
Punti di forza:
- Elevata precisione: YOLOX raggiunge una precisione competitiva, spesso superiore a quella di altri modelli YOLO , in particolare per i modelli di dimensioni più piccole. Per informazioni dettagliate sulle metriche, consultare la tabella di confronto.
- Inferenza efficiente: Offre una velocità di inferenza elevata, adatta alle applicazioni in tempo reale.
- Backbone flessibili: Supporta vari backbone, tra cui Darknet53 e opzioni leggere come Nano, consentendo la personalizzazione in base ai vincoli di risorse.
- Open Source: Completamente open source da Megvii, incoraggia i contributi e l'utilizzo da parte della comunità.
Punti deboli:
- Comunità ed ecosistema: Pur essendo open-source, potrebbe non avere lo stesso livello di integrazione dell'ecosistema e di strumenti di Ultralytics YOLOv8, come la perfetta integrazione con piattaforme come Ultralytics HUB.
Casi d'uso ideali:
YOLOX è adatto ad applicazioni che richiedono un'elevata precisione e un'inferenza efficiente, come ad esempio:
- Rilevamento di oggetti ad alte prestazioni: Scenari che richiedono una precisione di alto livello nelle attività di rilevamento degli oggetti.
- Distribuzione ai bordi: Le varianti più piccole, come YOLOX-Nano e YOLOX-Tiny, sono eccellenti per la distribuzione su dispositivi edge con risorse computazionali limitate.
- Ricerca e sviluppo: Grazie al suo design chiaro e modulare, è una buona scelta per la ricerca e l'ulteriore sviluppo del rilevamento di oggetti.
Confronto delle prestazioni
Di seguito è riportato un confronto tra i modelli YOLOv8 e YOLOX in base alle metriche di prestazione sul dataset COCO.
Modello | dimensione (pixel) |
mAPval 50-95 |
Velocità CPU ONNX (ms) |
Velocità T4TensorRT10 (ms) |
params (M) |
FLOP (B) |
---|---|---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 1.47 | 3.2 | 8.7 |
YOLOv8s | 640 | 44.9 | 128.4 | 2.66 | 11.2 | 28.6 |
YOLOv8m | 640 | 50.2 | 234.7 | 5.86 | 25.9 | 78.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 9.06 | 43.7 | 165.2 |
YOLOv8x | 640 | 53.9 | 479.1 | 14.37 | 68.2 | 257.8 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Conclusione
Sia YOLOv8 che YOLOX sono scelte eccellenti per il rilevamento degli oggetti, ognuna con i suoi punti di forza. YOLOv8 si distingue per la sua versatilità, la facilità d'uso e il suo solido ecosistema, che lo rendono un ottimo modello all-around per diversi compiti di visione e scenari di implementazione. YOLOX eccelle per precisione ed efficienza, in particolare negli scenari che richiedono prestazioni elevate e adattabilità ai vincoli di risorse.
Per gli utenti interessati ad esplorare altri modelli, Ultralytics offre anche una gamma di modelli all'avanguardia, tra cui YOLOv5, YOLOv7, YOLOv9, YOLOv10 e il nuovissimo YOLO11 ognuno dei quali è stato progettato per esigenze e applicazioni specifiche.