Vai al contenuto

YOLOv7 vs YOLOX: confronto tecnico dettagliato

La scelta del modello ottimale di rilevamento degli oggetti è una decisione cruciale per i progetti di computer vision. Ultralytics offre una suite di modelli all'avanguardia e la comprensione dei loro punti di forza specifici è fondamentale per ottenere le massime prestazioni. Questa pagina fornisce un confronto tecnico tra due modelli popolari, YOLOv7 e YOLOX, illustrandone le sfumature architettoniche, i benchmark delle prestazioni e gli scenari di implementazione ideali.

YOLOv7: rilevamento efficiente e di alta precisione

YOLOv7, presentato nel luglio 2022 da Chien-Yao Wang, Alexey Bochkovskiy e Hong-Yuan Mark Liao dell'Institute of Information Science, Academia Sinica, Taiwan, è stato progettato per un rilevamento efficiente e preciso degli oggetti. Si basa sui precedenti modelli YOLO , incorporando miglioramenti architettonici per una maggiore velocità e precisione.

Architettura e caratteristiche principali

YOLOv7 (paper: arXiv, GitHub: Official Repo) introduce diverse innovazioni, tra cui l'Efficient Layer Aggregation Network (E-ELAN) che ottimizza l'utilizzo dei parametri e dei calcoli. Inoltre, impiega tecniche di scalatura del modello e una ri-parametrizzazione pianificata per aumentare ulteriormente l'efficienza dell'addestramento e l'accuratezza del rilevamento. Queste caratteristiche consentono a YOLOv7 di ottenere risultati all'avanguardia con un modello di dimensioni relativamente compatte, rendendolo adatto ad applicazioni in tempo reale e all'implementazione su dispositivi con risorse limitate. Per informazioni più approfondite, consultare la documentazione ufficiale di YOLOv7.

Metriche di prestazione e casi d'uso

YOLOv7 eccelle in scenari che richiedono una rapida inferenza e un'elevata precisione. Le sue impressionanti metriche di mAP e velocità lo rendono una scelta forte per applicazioni come l'analisi video in tempo reale, i sistemi di guida autonoma e l'elaborazione di immagini ad alta risoluzione. Nelle smart city, YOLOv7 potrebbe essere utilizzato per la gestione del traffico o per migliorare i sistemi di sicurezza per il rilevamento immediato delle minacce.

Per saperne di più su YOLOv7

YOLOX: eccellenza senza ancore nel rilevamento di oggetti

YOLOX, sviluppato da Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun presso Megvii e rilasciato nel luglio 2021 (paper: arXiv, GitHub: Official Repo), adotta un approccio privo di ancore al rilevamento degli oggetti, semplificando la pipeline di rilevamento e migliorando la generalizzazione.

Architettura e caratteristiche principali

YOLOX (documentazione: ReadTheDocs) si discosta dai modelli YOLO tradizionali eliminando le caselle di ancoraggio predefinite. Questo design privo di ancore riduce la complessità e può portare a prestazioni migliori, soprattutto per gli oggetti di forma variabile. Incorpora teste disaccoppiate per compiti di classificazione e regressione separati e impiega strategie avanzate di assegnazione delle etichette come SimOTA (Simplified Optimal Transport Assignment). Queste scelte architettoniche contribuiscono alla robustezza e alla facilità di implementazione di YOLOX.

Metriche di prestazione e casi d'uso

YOLOX offre un equilibrio convincente tra velocità e precisione. La sua natura priva di ancoraggi può essere particolarmente vantaggiosa nelle applicazioni che prevedono oggetti di diverse dimensioni e rapporti di aspetto. YOLOX è adatto ad applicazioni come la robotica, l'ispezione industriale e l'analisi della vendita al dettaglio. Ad esempio, nel settore manifatturiero, può essere utilizzato per l'ispezione della qualità per rilevare i difetti in modo efficiente senza essere limitato da forme di ancoraggio predefinite.

Per saperne di più su YOLOX

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4TensorRT10
(ms)
params
(M)
FLOP
(B)
YOLOv7l 640 51.4 - 6.84 36.9 104.7
YOLOv7x 640 53.1 - 11.57 71.3 189.9
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9

Gli utenti interessati ad altri modelli YOLO potrebbero anche considerare di esplorare:

  • YOLOv8: L'ultima iterazione della serie YOLO di Ultralytics, che offre prestazioni e versatilità all'avanguardia.
  • YOLOv5: Conosciuto per la sua facilità d'uso e l'efficienza, con modelli di diverse dimensioni per le diverse esigenze.
  • YOLOv6: un framework ad alte prestazioni per il rilevamento di oggetti in una sola fase.
  • YOLO11: Un modello recente che si concentra sul miglioramento dell'efficienza e delle prestazioni.
📅C reato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti