YOLOv7 vs YOLOX: confronto tecnico dettagliato
La scelta del modello ottimale di rilevamento degli oggetti è una decisione cruciale per i progetti di computer vision. Ultralytics offre una suite di modelli all'avanguardia e la comprensione dei loro punti di forza specifici è fondamentale per ottenere le massime prestazioni. Questa pagina fornisce un confronto tecnico tra due modelli popolari, YOLOv7 e YOLOX, illustrandone le sfumature architettoniche, i benchmark delle prestazioni e gli scenari di implementazione ideali.
YOLOv7: rilevamento efficiente e di alta precisione
YOLOv7, presentato nel luglio 2022 da Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao dell'Institute of Information Science, Academia Sinica, Taiwan, è stato progettato per un rilevamento efficiente e preciso degli oggetti. Si basa sui precedenti modelli YOLO , incorporando miglioramenti architettonici per una maggiore velocità e precisione.
Architettura e caratteristiche principali
YOLOv7 (paper: arXiv, GitHub: Official Repo) introduce diverse innovazioni, tra cui l'Efficient Layer Aggregation Network (E-ELAN) che ottimizza l'utilizzo dei parametri e dei calcoli. Inoltre, impiega tecniche di scalatura del modello e una ri-parametrizzazione pianificata per aumentare ulteriormente l'efficienza dell'addestramento e l'accuratezza del rilevamento. Queste caratteristiche consentono a YOLOv7 di ottenere risultati all'avanguardia con un modello di dimensioni relativamente compatte, rendendolo adatto ad applicazioni in tempo reale e all'implementazione su dispositivi con risorse limitate. Per informazioni più approfondite, consultare la documentazione ufficiale di YOLOv7.
Metriche di prestazione e casi d'uso
YOLOv7 eccelle in scenari che richiedono una rapida inferenza e un'elevata precisione. Le sue impressionanti metriche di mAP e velocità lo rendono una scelta forte per applicazioni come l'analisi video in tempo reale, i sistemi di guida autonoma e l'elaborazione di immagini ad alta risoluzione. Nelle smart city, YOLOv7 potrebbe essere utilizzato per la gestione del traffico o per migliorare i sistemi di sicurezza per il rilevamento immediato delle minacce.
YOLOX: eccellenza senza ancore nel rilevamento di oggetti
YOLOX, sviluppato da Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun presso Megvii e rilasciato nel luglio 2021 (paper: arXiv, GitHub: Official Repo), adotta un approccio privo di ancore al rilevamento degli oggetti, semplificando la pipeline di rilevamento e migliorando la generalizzazione.
Architettura e caratteristiche principali
YOLOX (documentazione: ReadTheDocs) si discosta dai modelli YOLO tradizionali eliminando le caselle di ancoraggio predefinite. Questo design privo di ancore riduce la complessità e può portare a prestazioni migliori, soprattutto per gli oggetti di forma variabile. Incorpora teste disaccoppiate per compiti di classificazione e regressione separati e impiega strategie avanzate di assegnazione delle etichette come SimOTA (Simplified Optimal Transport Assignment). Queste scelte architettoniche contribuiscono alla robustezza e alla facilità di implementazione di YOLOX.
Metriche di prestazione e casi d'uso
YOLOX offre un equilibrio convincente tra velocità e precisione. La sua natura priva di ancoraggi può essere particolarmente vantaggiosa nelle applicazioni che prevedono oggetti di diverse dimensioni e rapporti di aspetto. YOLOX è adatto ad applicazioni come la robotica, l'ispezione industriale e l'analisi della vendita al dettaglio. Ad esempio, nel settore manifatturiero, può essere utilizzato per l'ispezione della qualità per rilevare i difetti in modo efficiente senza essere limitato da forme di ancoraggio predefinite.
Modello | dimensione (pixel) |
mAPval 50-95 |
Velocità CPU ONNX (ms) |
Velocità T4TensorRT10 (ms) |
params (M) |
FLOP (B) |
---|---|---|---|---|---|---|
YOLOv7l | 640 | 51.4 | - | 6.84 | 36.9 | 104.7 |
YOLOv7x | 640 | 53.1 | - | 11.57 | 71.3 | 189.9 |
YOLOXnano | 416 | 25.8 | - | - | 0.91 | 1.08 |
YOLOXtiny | 416 | 32.8 | - | - | 5.06 | 6.45 |
YOLOXs | 640 | 40.5 | - | 2.56 | 9.0 | 26.8 |
YOLOXm | 640 | 46.9 | - | 5.43 | 25.3 | 73.8 |
YOLOXl | 640 | 49.7 | - | 9.04 | 54.2 | 155.6 |
YOLOXx | 640 | 51.1 | - | 16.1 | 99.1 | 281.9 |
Gli utenti interessati ad altri modelli YOLO potrebbero anche considerare di esplorare:
- YOLOv8: L'ultima iterazione della serie YOLO di Ultralytics, che offre prestazioni e versatilità all'avanguardia.
- YOLOv5: Conosciuto per la sua facilità d'uso e l'efficienza, con modelli di diverse dimensioni per le diverse esigenze.
- YOLOv6: un framework ad alte prestazioni per il rilevamento di oggetti in una sola fase.
- YOLO11: Un modello recente che si concentra sul miglioramento dell'efficienza e delle prestazioni.