Link to this sectionEfficientDet vs YOLOv5#
Selezionare l'architettura di rete neurale ottimale è un passaggio decisivo in ogni iniziativa di computer vision. L'equilibrio tra latenza di inferenza, efficienza dei parametri e precisione di rilevamento determina quanto bene un modello si comporterà nel mondo reale. Questa guida tecnica completa fornisce un'analisi approfondita di due framework di rilevamento oggetti altamente influenti: EfficientDet di Google e Ultralytics YOLOv5.
Confrontando le loro innovazioni architettoniche, le metodologie di addestramento e le capacità di distribuzione, gli sviluppatori possono prendere decisioni informate per i loro specifici ambienti di distribuzione, sia che si tratti di scalare su server cloud o di eseguire su dispositivi edge vincolati.
Link to this sectionEfficientDet: Architettura scalabile con BiFPN#
Introdotto da Google Research, EfficientDet è stato progettato per scalare sistematicamente sia la backbone che la rete di funzionalità per ottenere un'elevata precisione con meno parametri rispetto ai precedenti modelli allo stato dell'arte.
Link to this sectionDettagli del modello#
- Autori: Mingxing Tan, Ruoming Pang e Quoc V. Le
- Organizzazione: Google Research
- Data: 20 novembre 2019
- Arxiv: EfficientDet: Scalable and Efficient Object Detection
- GitHub: google/automl/efficientdet
Link to this sectionInnovazioni architettoniche#
EfficientDet sfrutta il modello di classificazione EfficientNet come backbone, utilizzando un metodo di scaling composto che scala uniformemente la larghezza, la profondità e la risoluzione della rete. Il suo contributo più notevole al rilevamento oggetti è l'introduzione della Bi-directional Feature Pyramid Network (BiFPN). A differenza delle standard Feature Pyramid Networks che aggregano semplicemente le funzionalità dall'alto verso il basso, la BiFPN consente connessioni cross-scale bidirezionali complesse e introduce pesi apprendibili per determinare l'importanza delle diverse funzionalità di input.
Sebbene sia altamente accurato, EfficientDet si basa pesantemente sull'ecosistema TensorFlow e su librerie AutoML specifiche. Questa dipendenza può talvolta renderlo complesso da integrare in pipeline di distribuzione personalizzate e leggere o in ambienti che prediligono grafi computazionali dinamici.
Link to this sectionUltralytics YOLOv5: Democratizzare l'IA in tempo reale#
Rilasciato poco dopo EfficientDet, Ultralytics YOLOv5 ha rivoluzionato il settore offrendo un'implementazione PyTorch nativa incredibilmente accessibile dell'architettura YOLO. Ha stabilito un nuovo standard per l'esperienza dello sviluppatore, l'efficienza dell'addestramento e la flessibilità di distribuzione in tempo reale.
Link to this sectionDettagli del modello#
- Autori: Glenn Jocher
- Organizzazione: Ultralytics
- Data: 26 giugno 2020
- GitHub: ultralytics/yolov5
- Documentazione: Documentazione YOLOv5
Link to this sectionInnovazioni architettoniche#
YOLOv5 ha introdotto aggiornamenti significativi rispetto ai suoi predecessori, utilizzando una backbone CSPDarknet (Cross-Stage Partial) che migliora significativamente il flusso del gradiente riducendo al contempo il conteggio totale dei parametri. Inoltre, YOLOv5 incorpora Auto-Learning Anchor Boxes, che calcolano automaticamente i prior dei bounding box ottimali basandosi sui tuoi dati di addestramento personalizzati, eliminando la necessità di una regolazione manuale degli iperparametri.
YOLOv5 utilizza anche intensamente la Mosaic Data Augmentation, fondendo quattro immagini disparate in un unico riquadro di addestramento. Ciò migliora notevolmente la capacità del modello di rilevare oggetti piccoli e generalizza la comprensione contestuale, rendendolo altamente robusto in ambienti vari.
Link to this sectionPrestazioni e benchmark#
Valutare i modelli su benchmark standard come il dataset COCO è fondamentale per comprendere i compromessi tra precisione e velocità. La tabella sottostante illustra come diverse dimensioni di EfficientDet e YOLOv5 performano in condizioni standardizzate.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
Link to this sectionAnalisi dei compromessi#
Mentre EfficientDet-d7 scala fino a un impressionante mAP di picco di 53.7, soffre di una significativa latenza di inferenza su hardware GPU rispetto alle architetture YOLO. Al contrario, YOLOv5 eccelle nell'accelerazione hardware. La variante YOLOv5n raggiunge un tempo di inferenza sorprendentemente veloce di 1.12 ms su una GPU T4 utilizzando NVIDIA TensorRT, rendendolo nettamente superiore per applicazioni in tempo reale come la guida autonoma o le linee di produzione ad alta velocità.
Inoltre, i modelli YOLOv5 dimostrano requisiti di memoria CUDA molto inferiori durante l'addestramento rispetto a reti a scala composta complessa o grandi modelli Transformer. Questo profilo di memoria ridotto democratizza l'accesso all'IA allo stato dell'arte, consentendo ai ricercatori di addestrare modelli robusti su hardware consumer standard.
Per estrarre il massimo numero di frame al secondo (FPS) dal tuo modello YOLOv5 su dispositivi edge, esporta i tuoi pesi PyTorch in TensorRT per GPU NVIDIA o OpenVINO per CPU Intel. Questo passaggio può spesso raddoppiare la tua velocità di inferenza.
Link to this sectionEcosistema di addestramento ed esperienza dello sviluppatore#
Il vero vantaggio dell'ecosistema Ultralytics risiede nella sua esperienza utente semplificata. Mentre EfficientDet richiede una conoscenza approfondita dell'API di rilevamento oggetti di TensorFlow, YOLOv5 fornisce un'API Python coerente e semplice.
L'ecosistema Ultralytics ben mantenuto garantisce agli sviluppatori l'accesso ad aggiornamenti frequenti, supporto attivo della community e integrazioni senza soluzione di continuità con strumenti di tracciamento degli esperimenti come Weights & Biases e ClearML.
Link to this sectionEsempio di codice: Iniziare con YOLOv5#
L'esecuzione dell'inferenza con un modello YOLOv5 pre-addestrato richiede solo poche righe di codice tramite PyTorch Hub:
from ultralytics import YOLO
# Load the highly efficient YOLOv5s model
model = YOLO("yolov5su.pt")
# Run inference on an image
results = model("https://ultralytics.com/images/zidane.jpg")
# Display the detected bounding boxes
results[0].show()Link to this sectionVersatilità e applicazioni nel mondo reale#
EfficientDet è rigorosamente un framework di rilevamento oggetti, il che limita la sua utilità in pipeline di visione complesse. D'altra parte, YOLOv5 si è evoluto per supportare molteplici attività di computer vision. Le versioni moderne del modello supportano un'accurata segmentazione di istanza e classificazione delle immagini, consentendo agli sviluppatori di consolidare il loro stack di machine learning.
Link to this sectionCasi d'uso ideali#
- EfficientDet: Più adatto per l'elaborazione offline, la ricerca accademica e l'analisi basata su cloud dove la massima precisione è prioritaria rispetto alla latenza, e dove sono disponibili TPU di livello server o GPU ad alta memoria.
- YOLOv5: La scelta definitiva per distribuzioni di edge AI. La sua combinazione di bassa latenza, impronta minima dei parametri ed elevata precisione lo rende ideale per l'analisi tramite droni, l'automazione della vendita al dettaglio in tempo reale e le applicazioni mobili tramite CoreML o TFLite.
Link to this sectionLa prossima generazione: Aggiornamento a YOLO26#
Mentre YOLOv5 rimane un modello robusto e ampiamente distribuito, il campo dell'IA si muove rapidamente. Per i team che iniziano nuovi progetti o cercano il massimo livello di performance moderna, Ultralytics ha introdotto YOLO26, rilasciato a gennaio 2026.
YOLO26 ridefinisce la frontiera di Pareto di velocità e precisione, introducendo cambiamenti architettonici rivoluzionari che rendono la distribuzione più semplice e l'inferenza più rapida.
Link to this sectionPrincipali progressi di YOLO26#
- Design end-to-end senza NMS: YOLO26 elimina nativamente la post-elaborazione Non-Maximum Suppression. Ciò semplifica enormemente la logica di distribuzione e riduce la varianza della latenza, un approccio innovativo perfezionato dai primi esperimenti in YOLOv10.
- Fino al 43% di inferenza CPU più veloce: Specificamente progettato per l'edge computing e dispositivi IoT a basso consumo operanti senza GPU dedicate.
- Ottimizzatore MuSGD: Ispirato alle tecniche di addestramento dei modelli linguistici di grandi dimensioni (come Kimi K2 di Moonshot AI), questo ibrido di SGD e Muon porta le innovazioni LLM alla computer vision, consentendo una convergenza più rapida e dinamiche di addestramento altamente stabili.
- ProgLoss + STAL: Queste avanzate funzioni di perdita producono notevoli miglioramenti nel riconoscimento di piccoli oggetti, critico per immagini aeree e robotica.
- Rimozione di DFL: Rimuovendo la Distribution Focal Loss, la testina del modello è notevolmente semplificata, portando a una migliore compatibilità durante l'esportazione verso hardware edge legacy o altamente vincolato.
Per i team che distribuiscono pipeline multi-task, YOLO26 introduce anche aggiornamenti specifici per l'attività, come il multi-scale proto per la segmentazione e la perdita angolare specializzata per oriented bounding boxes (OBB). Per esplorare altre alternative moderne all'interno dell'ecosistema, puoi anche rivedere YOLO11 o l'architettura YOLOv8.
Link to this sectionConclusione#
La scelta tra EfficientDet e YOLOv5 dipende fortemente dal tuo target di distribuzione. EfficientDet offre un approccio di scaling matematicamente elegante adatto per l'inferenza pesante su cloud. Tuttavia, l'esperienza dello sviluppatore superiore di YOLOv5, i cicli di addestramento PyTorch estremamente veloci e le capacità di distribuzione edge altamente ottimizzate lo rendono la scelta preferita per la stragrande maggioranza delle applicazioni reali e in tempo reale. Sfruttando gli strumenti completi forniti da Ultralytics, i team possono accelerare il loro time-to-market e costruire sistemi IA altamente reattivi.