Link to this sectionEfficientDet vs YOLO11: un confronto tecnico completo#
Scegliere l'architettura di rete neurale ottimale è la base di qualsiasi applicazione di computer vision di successo. Questa guida completa fornisce un confronto tecnico approfondito tra EfficientDet di Google e Ultralytics YOLO11, analizzando le loro differenze architetturali, le metriche di prestazione e gli scenari di implementazione ideali.
Che tu stia puntando a una latenza di pochi millisecondi su dispositivi edge AI o che tu necessiti di precisione scalabile per l'inferenza basata su cloud, comprendere le sfumature di questi modelli è fondamentale.
Link to this sectionProfili dei modelli e dettagli tecnici#
Comprendere il lignaggio e la filosofia di progettazione sottostante di ciascuna architettura aiuta a contestualizzare le loro prestazioni in attività di object detection reali.
Link to this sectionEfficientDet#
Sviluppato dai ricercatori di Google Brain, EfficientDet ha introdotto un approccio basato su principi per il ridimensionamento delle reti di object detection, insieme al nuovo BiFPN (Bidirectional Feature Pyramid Network).
- Autori: Mingxing Tan, Ruoming Pang e Quoc V. Le
- Organizzazione: Google
- Data: 20-11-2019
- Arxiv: https://arxiv.org/abs/1911.09070
- GitHub: https://github.com/google/automl/tree/master/efficientdet
- Documentazione: https://github.com/google/automl/tree/master/efficientdet#readme
Link to this sectionYOLO11#
YOLO11 rappresenta un'evoluzione significativa nell'ecosistema Ultralytics, spingendo i confini delle prestazioni in tempo reale, dell'efficienza dei parametri e del multi-task learning.
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione: Ultralytics
- Data: 2024-09-27
- GitHub: https://github.com/ultralytics/ultralytics
- Documentazione: https://docs.ultralytics.com/models/yolo11/
Link to this sectionConfronto architetturale#
Le differenze architetturali tra questi due modelli evidenziano la divergenza nelle strategie di progettazione nel corso degli anni.
EfficientDet sfrutta il backbone EfficientNet e introduce il BiFPN, che consente la fusione di caratteristiche multi-scala top-down e bottom-up. Utilizza un metodo di ridimensionamento composto che scala uniformemente risoluzione, profondità e larghezza per tutti i backbone, le reti di caratteristiche e le reti di previsione box/classe contemporaneamente. Sebbene sia altamente efficace per massimizzare la mean Average Precision (mAP), il complesso instradamento nel BiFPN può a volte creare colli di bottiglia nella larghezza di banda della memoria durante l'inferenza.
YOLO11, d'altra parte, utilizza un modulo C3k2 ottimizzato e una testa di rilevamento avanzata senza ancore. Questo approccio semplificato riduce al minimo il sovraccarico durante l'estrazione delle caratteristiche. Ultralytics ha progettato YOLO11 per massimizzare l'utilizzo dell'hardware GPU, ottenendo requisiti di memoria significativamente inferiori sia durante l'addestramento che durante l'inferenza rispetto alle architetture più vecchie o ai modelli transformer pesanti.
Mentre EfficientDet è rigorosamente un rilevatore di oggetti, YOLO11 vanta un'estrema versatilità. Una singola architettura YOLO11 supporta nativamente Instance Segmentation, Image Classification, Pose Estimation e Oriented Bounding Boxes (OBB).
Link to this sectionBenchmark delle prestazioni#
La tabella sottostante confronta le prestazioni di entrambe le famiglie di modelli su varie scale sul COCO dataset.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| EfficientDet-d0 | 640 | 34.6 | 10.2 | 3.92 | 3.9 | 2.54 |
| EfficientDet-d1 | 640 | 40.5 | 13.5 | 7.31 | 6.6 | 6.1 |
| EfficientDet-d2 | 640 | 43.0 | 17.7 | 10.92 | 8.1 | 11.0 |
| EfficientDet-d3 | 640 | 47.5 | 28.0 | 19.59 | 12.0 | 24.9 |
| EfficientDet-d4 | 640 | 49.7 | 42.8 | 33.55 | 20.7 | 55.2 |
| EfficientDet-d5 | 640 | 51.5 | 72.5 | 67.86 | 33.7 | 130.0 |
| EfficientDet-d6 | 640 | 52.6 | 92.8 | 89.29 | 51.9 | 226.0 |
| EfficientDet-d7 | 640 | 53.7 | 122.0 | 128.07 | 51.9 | 325.0 |
| YOLO11n | 640 | 39.5 | 56.1 | 1.5 | 2.6 | 6.5 |
| YOLO11s | 640 | 47.0 | 90.0 | 2.5 | 9.4 | 21.5 |
| YOLO11m | 640 | 51.5 | 183.2 | 4.7 | 20.1 | 68.0 |
| YOLO11l | 640 | 53.4 | 238.6 | 6.2 | 25.3 | 86.9 |
| YOLO11x | 640 | 54.7 | 462.8 | 11.3 | 56.9 | 194.9 |
Link to this sectionAnalisi equilibrata: punti di forza e debolezze#
Accelerazione GPU: YOLO11 domina negli ambienti GPU. Ad esempio, YOLO11m offre un mAP del 51,5% a una velocità fulminea di 4,7ms su una GPU T4 utilizzando TensorRT. Per ottenere una precisione comparabile, EfficientDet-d5 impiega 67,86ms, oltre 14 volte più lento. Ciò evidenzia l'equilibrio superiore delle prestazioni dei modelli Ultralytics per le applicazioni in tempo reale.
Ambienti CPU: EfficientDet mostra velocità di inferenza CPU altamente ottimizzate nelle sue varianti più piccole (come d0 e d1) utilizzando ONNX. Tuttavia, la sua precisione scala male senza incorrere in massicce penalità di latenza GPU nelle varianti più grandi come d7.
Link to this sectionMetodologia di addestramento ed ecosistema#
L'esperienza dello sviluppatore è spesso critica quanto le capacità teoriche del modello. È qui che l'ecosistema Ultralytics eccelle.
EfficientDet si affida pesantemente al vecchio ecosistema TensorFlow e a complesse librerie AutoML. Configurare una pipeline di addestramento personalizzata comporta ripide curve di apprendimento, una gestione complessa delle dipendenze e la configurazione manuale di ancore e loss functions.
Al contrario, Ultralytics offre una facilità d'uso senza pari. Supportato da un ecosistema PyTorch ben mantenuto, l'addestramento di un modello YOLO richiede solo poche righe di codice. Il framework gestisce automaticamente la hyperparameter tuning, le data augmentation avanzate e la pianificazione ottimale del learning rate fin da subito.
Link to this sectionEsempio di codice: iniziare con Ultralytics#
Questo solido snippet, pronto per la produzione, dimostra quanto siano semplici l'addestramento e l'inferenza all'interno della Python API.
from ultralytics import YOLO
# Load a pre-trained YOLO11 small model
model = YOLO("yolo11s.pt")
# Train the model on your custom dataset with automated hyperparameter tuning
train_results = model.train(data="coco8.yaml", epochs=50, imgsz=640, device=0)
# Perform fast inference on an image
results = model.predict("https://ultralytics.com/images/bus.jpg")
results[0].show()Link to this sectionCasi d'uso ideali#
Quando utilizzare EfficientDet: EfficientDet rimane una scelta valida per gli ambienti di ricerca fortemente radicati in pipeline TensorFlow o specifici vincoli legati alla CPU dove le architetture iniziali come d0 funzionano in modo adeguato.
Quando utilizzare YOLO11: YOLO11 è la scelta definitiva per le implementazioni aziendali moderne. La sua eccezionale velocità lo rende perfetto per autonomous vehicles, analisi sportiva in tempo reale e rilevamento di difetti di produzione ad alto throughput. Inoltre, il suo minor utilizzo di memoria consente un'implementazione flessibile su hardware con risorse limitate come NVIDIA Jetson.
Link to this sectionUno sguardo al futuro: l'aggiornamento a YOLO26#
Sebbene YOLO11 sia eccezionalmente capace, gli sviluppatori che avviano nuovi progetti dovrebbero valutare altre architetture Ultralytics come il collaudato YOLOv8 o il nuovo YOLO26. Rilasciato all'inizio del 2026, YOLO26 prende le basi di YOLO11 e introduce diverse innovazioni rivoluzionarie:
- Design end-to-end senza NMS: Basandosi sull'eredità di YOLOv10, YOLO26 elimina completamente la Non-Maximum Suppression (NMS) durante la post-elaborazione, riducendo drasticamente la latenza e semplificando le pipeline di distribuzione.
- Ottimizzatore MuSGD: Un ottimizzatore ibrido che fonde SGD standard con Muon (ispirato all'addestramento di modelli linguistici di grandi dimensioni), migliorando drasticamente la stabilità dell'addestramento.
- Fino al 43% più veloce nell'inferenza su CPU: Ottimizzazioni specifiche rendono YOLO26 incredibilmente potente su dispositivi edge privi di GPU dedicate.
- ProgLoss + STAL: Funzioni di perdita avanzate che migliorano notevolmente il rilevamento di piccoli oggetti, critico per le immagini aeree e la robotica.
Esplora il panorama più ampio delle architetture di visione, inclusi i rilevatori basati su transformer come RT-DETR, nella nostra completa Ultralytics Docs.