Vai al contenuto

EfficientDet vs. YOLO: un confronto dettagliato per il rilevamento di oggetti

La scelta del modello ottimale di rilevamento degli oggetti è una decisione cruciale per i progetti di computer vision, poiché i diversi modelli offrono vantaggi unici in termini di precisione, velocità ed efficienza. Questa pagina offre un confronto tecnico dettagliato tra EfficientDet e YOLO, due modelli di spicco nel campo del rilevamento degli oggetti. Analizziamo le loro architetture, i benchmark delle prestazioni e l'idoneità a varie applicazioni per aiutarvi a fare una scelta consapevole.

EfficientDet

EfficientDet è stato introdotto da Google nel 2019 ed è noto per la sua efficienza e scalabilità nel rilevamento degli oggetti. Raggiunge un'accuratezza allo stato dell'arte con un numero significativamente inferiore di parametri e FLOP rispetto a molti rilevatori contemporanei.

Architettura e caratteristiche principali

EfficientDet impiega una serie di innovazioni architettoniche per migliorare sia l'efficienza che la precisione:

  • Rete dorsale: Utilizza EfficientNet come backbone, nota per la sua efficienza e scalabilità, ottenuta attraverso la ricerca di architetture neurali.
  • BiFPN (Bi-directional Feature Pyramid Network): Una rete piramidale di caratteristiche ponderate bidirezionali che consente una fusione efficiente ed efficace di caratteristiche multiscala.
  • Scala composta: Scala sistematicamente tutte le dimensioni del rivelatore (backbone, rete di caratteristiche, risoluzione della rete di predizione di box/classi) usando un coefficiente composto.

Metriche di prestazione

I modelli EfficientDet sono disponibili in varie dimensioni (da d0 a d7) e offrono una serie di compromessi di prestazioni per adattarsi alle diverse risorse computazionali.

  • mAP: Raggiunge un'elevata precisione media (mAP) sul set di dati COCO, dimostrando una forte accuratezza di rilevamento.
  • Velocità di inferenza: Offre una gamma di velocità di inferenza a seconda delle dimensioni del modello, con modelli più piccoli adatti ad applicazioni in tempo reale.
  • Dimensioni del modello: I modelli EfficientDet sono progettati per essere efficienti dal punto di vista dei parametri, con conseguente riduzione delle dimensioni del modello rispetto ad altri rilevatori ad alta precisione.

Punti di forza e di debolezza

Punti di forza:

  • Alta efficienza: Eccellente equilibrio tra accuratezza e costo computazionale, che lo rende adatto ad ambienti con risorse limitate.
  • Scalabilità: La scalabilità composta consente di scalare facilmente il modello per raggiungere i livelli di prestazioni desiderati.
  • Precisione: Raggiunge un'accuratezza all'avanguardia con un minor numero di parametri.
  • Implementazione ben documentata: Il repository AutoML di Google fornisce un'implementazione chiara e modelli pre-addestrati.

Punti deboli:

  • Complessità: Le strategie di scalatura BiFPN e composte aggiungono complessità all'architettura.
  • Velocità di inferenza: sebbene efficiente, la velocità di inferenza potrebbe non essere pari a quella di alcuni rilevatori in tempo reale come i modelliYOLO di Ultralytics , soprattutto per le varianti EfficientDet più grandi.

Casi d'uso

EfficientDet è adatto ad applicazioni in cui sono fondamentali sia la precisione che l'efficienza:

  • Dispositivi mobili e periferici: Grazie alla sua efficienza, può essere distribuito su dispositivi mobili e piattaforme di edge computing.
  • Robotica: Adatto alle applicazioni robotiche che richiedono un rilevamento preciso ed efficiente degli oggetti.
  • Applicazioni con risorse limitate: Ideale per scenari in cui le risorse computazionali sono limitate, ma è necessaria un'elevata precisione.

Per saperne di più su EfficientDet

DAMO-YOLO

YOLO, introdotto da Alibaba Group nel 2022, è progettato per il rilevamento di oggetti ad alta velocità e precisione, con particolare attenzione alle applicazioni industriali. Integra diverse tecniche innovative per raggiungere un equilibrio tra velocità e precisione.

Architettura e caratteristiche principali

YOLO incorpora diversi componenti innovativi nella sua architettura:

  • Backbone basato su NAS: Impiega un backbone di ricerca ad architettura neurale (NAS), ottimizzando sia la velocità che la precisione.
  • RepGFPN (Reparameterized Gradient Feature Pyramid Network): Una rete efficiente di fusione di caratteristiche che migliora la rappresentazione delle caratteristiche mantenendo l'efficienza computazionale.
  • ZeroHead: una testina di rilevamento leggera progettata per ridurre al minimo la latenza.
  • AlignedOTA (Aligned Optimal Transport Assignment): Una strategia di assegnazione avanzata per migliorare la formazione e la precisione.

Metriche di prestazione

I modelli YOLO sono disponibili in diverse taglie (t, s, m, l) per soddisfare le diverse esigenze di prestazioni.

  • mAP: Raggiunge una mAP competitiva sul set di dati COCO, dimostrando ottime prestazioni di rilevamento degli oggetti.
  • Velocità di inferenza: Privilegia un'elevata velocità di inferenza, rendendola adatta ad applicazioni in tempo reale e sensibili alla latenza.
  • Dimensioni del modello: Progettato per essere efficiente, offre un buon equilibrio tra dimensioni del modello e prestazioni.

Punti di forza e di debolezza

Punti di forza:

  • Alta velocità: eccezionale velocità di inferenza, ottimizzata per le applicazioni in tempo reale.
  • Focus industriale: Progettato specificamente per le applicazioni industriali, con particolare attenzione all'impiego pratico.
  • Precisione: Mantiene un'elevata precisione pur raggiungendo velocità di inferenza elevate.
  • Tecniche avanzate: Integra tecniche all'avanguardia come NAS backbone e AlignedOTA per migliorare le prestazioni.
  • Open Source: Disponibile pubblicamente con codice e modelli pre-addestrati.

Punti deboli:

  • Relativamente nuovo: Essendo un modello più recente, la comunità e l'ecosistema potrebbero essere ancora in via di sviluppo rispetto a modelli più consolidati.
  • Complessità: L'integrazione di più tecniche avanzate può rendere l'architettura complessa da modificare o personalizzare in profondità.

Casi d'uso

YOLO è particolarmente efficace in scenari che richiedono il rilevamento di oggetti in tempo reale con un'elevata precisione:

  • Ispezione industriale: Ideale per il controllo qualità e l'ispezione nei processi produttivi.
  • Guida autonoma: Adatto ai veicoli autonomi e ai sistemi avanzati di assistenza alla guida (ADAS) dove la bassa latenza è fondamentale.
  • Analisi video in tempo reale: Applicazioni come il monitoraggio del traffico e i sistemi di sicurezza.
  • Edge AI: implementazione su dispositivi edge per l'elaborazione in tempo reale.

Per saperne di più su YOLO

Tabella di confronto dei modelli

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4TensorRT10
(ms)
params
(M)
FLOP
(B)
EfficienteDet-d0 640 34.6 10.2 3.92 3.9 2.54
EfficienteDet-d1 640 40.5 13.5 7.31 6.6 6.1
EfficienteDet-d2 640 43.0 17.7 10.92 8.1 11.0
EfficienteDet-d3 640 47.5 28.0 19.59 12.0 24.9
EfficienteDet-d4 640 49.7 42.8 33.55 20.7 55.2
EfficienteDet-d5 640 51.5 72.5 67.86 33.7 130.0
EfficienteDet-d6 640 52.6 92.8 89.29 51.9 226.0
EfficienteDet-d7 640 53.7 122.0 128.07 51.9 325.0
DAMO-YOLOt 640 42.0 - 2.32 8.5 18.1
DAMO-YOLO 640 46.0 - 3.45 16.3 37.8
DAMO-YOLOm 640 49.2 - 5.09 28.2 61.8
DAMO-YOLOl 640 50.8 - 7.18 42.1 97.3

Conclusione

Sia EfficientDet che YOLO sono potenti modelli di rilevamento degli oggetti con punti di forza distinti. EfficientDet eccelle nel fornire una gamma di modelli efficienti con una forte accuratezza, rendendolo versatile per varie applicazioni, specialmente quelle con vincoli di risorse. YOLO, invece, è progettato per un'inferenza ad alta velocità senza sacrificare in modo significativo l'accuratezza, rendendolo ideale per applicazioni industriali ed edge in tempo reale.

Per gli utenti interessati ad altri modelli di rilevamento degli oggetti ad alte prestazioni, Ultralytics offre una gamma di modelli YOLO , tra cui YOLOv5, YOLOv8e il più recente YOLO11. Sono disponibili anche confronti con altri modelli come YOLOX per aiutarvi a trovare il modello migliore per le vostre esigenze specifiche. Considerate l'opportunità di esplorare Ultralytics HUB per semplificare la formazione e l'implementazione dei modelli YOLO .

📅C reato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti