Vai al contenuto

Confronto tecnico: YOLOX vs EfficientDet per il rilevamento di oggetti

I modelliYOLO di Ultralytics sono rinomati per la loro velocità e precisione nelle attività di rilevamento degli oggetti. Questa pagina offre un confronto tecnico dettagliato tra due importanti modelli di rilevamento degli oggetti: Esploreremo i loro progetti architettonici, i benchmark delle prestazioni, le metodologie di addestramento e le applicazioni ottimali per aiutarvi a scegliere il modello più adatto alle vostre esigenze di computer vision.

YOLOX: rivelatore senza ancore ad alte prestazioni

YOLOX ("You Only Look Once X") è un rilevatore di oggetti senza ancoraggio all'avanguardia sviluppato da Megvii. È stato progettato per garantire semplicità e prestazioni elevate, colmando il divario tra ricerca e applicazioni industriali pratiche.

Architettura e caratteristiche principali

YOLOX si distingue per un paradigma di rilevamento privo di ancore, che semplifica l'architettura e aumenta l'efficienza. I punti salienti dell'architettura includono:

  • Design senza ancoraggi: Elimina la complessità delle caselle di ancoraggio, semplificando l'implementazione e migliorando potenzialmente la generalizzazione, soprattutto per oggetti con rapporti di aspetto variabili.
  • Testa disaccoppiata: separa le teste di classificazione e di localizzazione, migliorando l'ottimizzazione per ogni compito e l'accuratezza complessiva.
  • Strategie di formazione avanzate: Utilizza tecniche come l'assegnazione di etichette SimOTA e l'aumento dei dati (MixUp e Mosaic) per garantire una formazione solida e prestazioni migliori.

Autori: Zheng Ge, Songtao Liu, Feng Wang, Zeming Li e Jian Sun Organizzazione: Megvii Data: 2021-07-18 Collegamento Arxiv: https://arxiv.org/abs/2107.08430 Collegamento a GitHub: https://github.com/Megvii-BaseDetection/YOLOX Link alla documentazione: https://yolox.readthedocs.io/en/latest/

Metriche di prestazione

I modelli YOLOX offrono un equilibrio convincente tra velocità e precisione. Come illustrato nella tabella di confronto, YOLOX raggiunge punteggi mAP competitivi mantenendo una velocità di inferenza elevata, che lo rende adatto alle applicazioni in tempo reale. Per conoscere le prestazioni dettagliate dei modelli di varie dimensioni, consultare la tabella seguente.

Casi d'uso

  • Rilevamento di oggetti in tempo reale: Ideale per le applicazioni che richiedono un rilevamento rapido, come i sistemi di sicurezza e l'analisi video in tempo reale.
  • Dispositivi Edge: Prestazioni efficienti su dispositivi con risorse limitate come NVIDIA Jetson e piattaforme mobili.
  • Sistemi autonomi: Ideale per la robotica e i veicoli autonomi, dove la percezione rapida e accurata è fondamentale.

Punti di forza e di debolezza

Punti di forza:

  • Alta velocità di inferenza: L'architettura priva di ancoraggi e il design ottimizzato contribuiscono alla rapidità di elaborazione.
  • Semplicità: Il design semplificato facilita l'addestramento e l'implementazione rispetto ai modelli basati sugli ancoraggi.
  • Buon equilibrio tra precisione e velocità: Offre una precisione competitiva senza sacrificare la velocità di inferenza.

Punti deboli:

  • mAP: Pur essendo molto efficiente, in alcuni scenari potrebbe essere leggermente meno preciso di alcuni modelli più grandi e complessi.

Per saperne di più su YOLOX

EfficientDet: Rilevamento scalabile ed efficiente degli oggetti

EfficientDet, sviluppato da Google Research, è rinomato per la sua scalabilità ed efficienza nel rilevamento degli oggetti. Utilizza una famiglia di modelli che raggiungono un'accuratezza all'avanguardia con un numero di parametri e FLOP significativamente inferiore rispetto ai rilevatori precedenti.

Architettura e caratteristiche principali

EfficientDet introduce diverse innovazioni per migliorare sia l'efficienza che la precisione:

  • BiFPN (Bi-directional Feature Pyramid Network): Consente un'efficiente fusione di caratteristiche multiscala, permettendo alla rete di utilizzare efficacemente caratteristiche a diverse risoluzioni.
  • Scala dei composti: Scala uniformemente tutte le dimensioni della rete (backbone, BiFPN e rete di predizione box/classe) utilizzando un unico coefficiente composto, semplificando il processo di scala e ottimizzando le prestazioni.
  • Backbone efficiente: Utilizza EfficientNet come rete dorsale, nota per la sua efficienza e per le sue forti capacità di estrazione delle caratteristiche.

Autori: Mingxing Tan, Ruoming Pang e Quoc V. Le Organizzazione: Google Data: 2019-11-20 Collegamento Arxiv: https://arxiv.org/abs/1911.09070 Collegamento a GitHub: https:google Link alla documentazione: https:google

Metriche di prestazione

I modelli EfficientDet sono progettati per essere altamente efficienti su diverse scale e offrono una gamma di modelli da d0 a d7. Raggiungono punteggi mAP eccellenti con un numero relativamente ridotto di parametri e FLOP, rendendoli adatti all'impiego in ambienti con risorse limitate. Per le metriche dettagliate, consultare la tabella di confronto.

Casi d'uso

  • Implementazione mobile ed edge: Le dimensioni ridotte del modello EfficientDet e la sua elevata efficienza lo rendono ideale per i dispositivi mobili e gli scenari di edge computing.
  • Applicazioni che richiedono un'elevata precisione con risorse limitate: Adatto per applicazioni in cui l'accuratezza è fondamentale ma le risorse computazionali sono limitate, come ad esempio l'ispezione della qualità sui dispositivi edge.
  • Dispositivi alimentati a batteria: Il design efficiente dal punto di vista energetico consente l'implementazione su dispositivi alimentati a batteria e applicazioni IoT.

Punti di forza e di debolezza

Punti di forza:

  • Alta efficienza: Raggiunge un'accuratezza all'avanguardia con un minor numero di parametri e di FLOP, con conseguente accelerazione dell'inferenza e riduzione dei costi computazionali.
  • Scalabilità: Il metodo di scalatura composto consente di scalare facilmente il modello per soddisfare i diversi requisiti di precisione e di risorse.
  • Precisione: ottime prestazioni in termini di mAP, in particolare per i modelli di piccole e medie dimensioni.

Punti deboli:

  • Velocità di inferenza: pur essendo efficiente, EfficientDet potrebbe essere più lento di modelli specificamente ottimizzati per la velocità come YOLOv10 o YOLOv8soprattutto per le varianti più grandi.

Per saperne di più su EfficientDet

Tabella di confronto delle prestazioni

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4TensorRT10
(ms)
params
(M)
FLOP
(B)
YOLOXnano 416 25.8 - - 0.91 1.08
YOLOXtiny 416 32.8 - - 5.06 6.45
YOLOXs 640 40.5 - 2.56 9.0 26.8
YOLOXm 640 46.9 - 5.43 25.3 73.8
YOLOXl 640 49.7 - 9.04 54.2 155.6
YOLOXx 640 51.1 - 16.1 99.1 281.9
EfficienteDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficienteDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficienteDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficienteDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficienteDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficienteDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficienteDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficienteDet-d7 640 53.7 122.0 128.07 51.9 325.0

Esplorate altri interessanti confronti tra i modelli di rilevamento degli oggetti disponibili nei documenti di Ultralytics :

📅C reato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti