Meet YOLO26: next-gen vision AI.

Link to this sectionConfronto tra YOLOv6-3.0 ed EfficientDet#

Scegliere l'architettura ottimale per progetti di computer vision richiede una profonda comprensione dei compromessi tra velocità, precisione e fattibilità del deployment. Questa pagina di confronto fornisce un'analisi approfondita di due distinti modelli di object detection: YOLOv6-3.0 e EfficientDet. Sebbene entrambi i modelli abbiano contribuito in modo significativo al settore, i moderni deployment edge e la prototipazione rapida beneficiano spesso di framework più unificati come la Ultralytics Platform.

Di seguito è riportato un grafico interattivo che visualizza le differenze di prestazioni tra questi modelli per aiutarti a comprendere i loro rispettivi profili di latenza e precisione.

Link to this sectionYOLOv6-3.0: throughput di livello industriale#

YOLOv6-3.0 è stato progettato esplicitamente da Meituan per fungere da framework di object detection single-stage ad alte prestazioni su misura per applicazioni industriali. Si concentra pesantemente sulla massimizzazione del throughput su hardware GPU, rendendolo un forte candidato per linee di produzione ad alta velocità e analisi video offline.

  • Autori: Chuyi Li, Lulu Li, Yifei Geng, Hongliang Jiang, Meng Cheng, Bo Zhang, Zaidan Ke, Xiaoming Xu e Xiangxiang Chu
  • Organizzazione: Meituan
  • Data: 2023-01-13
  • Arxiv: 2301.05586
  • GitHub: meituan/YOLOv6

Link to this sectionPunti salienti dell'architettura#

L'architettura YOLOv6-3.0 si affida a un modulo Bi-directional Concatenation (BiC) per migliorare la fusione delle feature su diverse scale. Per garantire velocità di inferenza elevate, sfrutta un backbone EfficientRep, altamente ottimizzato per l'esecuzione su GPU. Inoltre, impiega una strategia di Anchor-Aided Training (AAT), che unisce i vantaggi sia dei rilevatori basati su anchor che di quelli anchor-free durante la fase di addestramento, mantenendo al contempo una pipeline di inferenza anchor-free per una latenza ridotta.

Link to this sectionPunti di forza e punti deboli#

YOLOv6-3.0 brilla in ambienti in cui è disponibile hardware GPU dedicato, offrendo un'incredibile inferenza in tempo reale utilizzando TensorRT. Tuttavia, la sua pesante dipendenza da specifiche ottimizzazioni hardware può portare a prestazioni non ottimali su dispositivi edge AI basati solo su CPU. Inoltre, sebbene supporti alcune quantizzazioni, l'ecosistema manca della semplicità complessiva che si trova nei moderni framework Ultralytics.

Scopri di più su YOLOv6

Link to this sectionEfficientDet: Architettura AutoML scalabile#

Sviluppato da Google Research, EfficientDet adotta un approccio fondamentalmente diverso. Invece di creare manualmente la rete, gli autori hanno utilizzato l'Automated Machine Learning (AutoML) per progettare un'architettura scalabile che bilancia parametri, FLOP e precisione.

Link to this sectionPunti salienti dell'architettura#

EfficientDet ha introdotto la Bi-directional Feature Pyramid Network (BiFPN), che consente una fusione delle feature multi-scala facile e veloce. Combinato con un metodo di scaling composto che ridimensiona uniformemente risoluzione, profondità e larghezza per tutti i backbone, reti di feature e reti di predizione box/classe, i modelli EfficientDet spaziano dal modello estremamente compatto d0 al massiccio d7.

Link to this sectionPunti di forza e punti deboli#

EfficientDet è altamente efficiente in termini di parametri. Ottiene una forte mean Average Precision (mAP) con relativamente pochi parametri rispetto ai vecchi rilevatori di oggetti. Tuttavia, l'architettura è profondamente radicata nei legacy ecosistemi TensorFlow. Ciò si traduce in una complessa gestione delle dipendenze, cicli di addestramento più lenti e requisiti di memoria più elevati durante l'addestramento rispetto alle implementazioni PyTorch ottimizzate. Inoltre, la sua velocità di inferenza sulle GPU moderne è significativamente più lenta rispetto alle moderne architetture YOLO.

Scopri di più su EfficientDet

Link to this sectionConfronto dettagliato delle prestazioni#

La tabella sottostante confronta le specifiche tecniche di YOLOv6-3.0 e EfficientDet su diverse metriche. Nota come YOLOv6-3.0 domini nella velocità GPU, mentre EfficientDet scala verso mAP più elevate a costo di una latenza significativa.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv6-3.0n64037.5-1.174.711.4
YOLOv6-3.0s64045.0-2.6618.545.3
YOLOv6-3.0m64050.0-5.2834.985.8
YOLOv6-3.0l64052.8-8.9559.6150.7
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0
Latenza vs. Throughput

Quando confronti i modelli, ricorda che i conteggi di FLOP e parametri non sempre si correlano perfettamente con la latenza nel mondo reale. YOLOv6-3.0 è ottimizzato per TensorRT, raggiungendo velocità in millisecondi nonostante abbia conteggi di FLOP superiori rispetto ai modelli EfficientDet di livello inferiore.

Link to this sectionIl vantaggio dell'ecosistema Ultralytics#

Mentre YOLOv6-3.0 e EfficientDet servono nicchie specifiche, i moderni progetti di computer vision richiedono versatilità, facilità d'uso e un ecosistema ben mantenuto. È qui che i modelli Ultralytics YOLO eccellono davvero.

Link to this sectionFacilità d'uso ed efficienza nell'addestramento#

A differenza di EfficientDet, che richiede di destreggiarsi tra complesse configurazioni TensorFlow, i modelli Ultralytics sono costruiti su una base intuitiva PyTorch. La Ultralytics Platform offre un'API semplificata che rende fluido l'intero ciclo di vita del machine learning. Addestrare un modello Ultralytics richiede drasticamente meno memoria CUDA, accelerando la sperimentazione e riducendo i costi di calcolo.

Link to this sectionVersatilità senza pari#

YOLOv6-3.0 e EfficientDet sono principalmente vincolati all'object detection. Al contrario, le moderne architetture Ultralytics sono intrinsecamente multi-modali. Un'unica interfaccia ti consente di addestrare modelli per compiti di Instance Segmentation, Pose Estimation, Image Classification e Oriented Bounding Box (OBB).

Link to this sectionIntroduzione a Ultralytics YOLO26#

Per gli sviluppatori che cercano il massimo equilibrio di prestazioni, Ultralytics YOLO26 rappresenta un cambio di paradigma. Rilasciato nel gennaio 2026, introduce diverse innovazioni rivoluzionarie che superano sia YOLOv6 che EfficientDet:

  • Design end-to-end senza NMS: YOLO26 elimina nativamente la necessità di post-elaborazione con Non-Maximum Suppression (NMS), riducendo significativamente la varianza della latenza e semplificando la logica di deployment sui dispositivi edge.
  • Optimizer MuSGD: Ispirato all'addestramento LLM, questo ottimizzatore ibrido garantisce un addestramento stabile e una convergenza incredibilmente veloce.
  • Fino al 43% di inferenza CPU più veloce: Con la rimozione della Distribution Focal Loss (DFL), YOLO26 è enormemente più efficiente su CPU e dispositivi IoT a basso consumo rispetto ai modelli precedenti.
  • ProgLoss + STAL: Queste funzioni di perdita avanzate offrono enormi miglioramenti nel riconoscimento di piccoli oggetti, rendendo YOLO26 ideale per applicazioni con droni e immagini aeree.

Scopri di più su YOLO26

Link to this sectionCasi d'uso e raccomandazioni#

Scegliere tra YOLOv6 e EfficientDet dipende dai requisiti specifici del tuo progetto, dai vincoli di deployment e dalle preferenze dell'ecosistema.

Link to this sectionQuando scegliere YOLOv6#

YOLOv6 è un'ottima scelta per:

  • Deployment industriale consapevole dell'hardware: Scenari in cui il design consapevole dell'hardware del modello e l'efficiente riparametrizzazione forniscono prestazioni ottimizzate su specifici hardware target.
  • Rilevamento single-stage rapido: Applicazioni che danno priorità alla velocità di inferenza grezza su GPU per l'elaborazione video in tempo reale in ambienti controllati.
  • Integrazione nell'ecosistema Meituan: Team che lavorano già all'interno dello stack tecnologico e dell'infrastruttura di deployment di Meituan.

Link to this sectionQuando scegliere EfficientDet#

EfficientDet è consigliato per:

  • Pipeline Google Cloud e TPU: Sistemi profondamente integrati con le API di Google Cloud Vision o l'infrastruttura TPU, dove EfficientDet offre un'ottimizzazione nativa.
  • Ricerca sul Compound Scaling: Benchmarking accademico focalizzato sullo studio degli effetti della profondità della rete, della larghezza e del ridimensionamento della risoluzione.
  • Deployment mobile tramite TFLite: Progetti che richiedono specificamente l'esportazione verso TensorFlow Lite per dispositivi Android o Linux embedded.

Link to this sectionQuando scegliere Ultralytics (YOLO26)#

Per la maggior parte dei nuovi progetti, Ultralytics YOLO26 offre la migliore combinazione di prestazioni ed esperienza per gli sviluppatori:

  • Implementazione Edge senza NMS: Applicazioni che richiedono un'inferenza costante e a bassa latenza senza la complessità della post-elaborazione della soppressione dei non massimi.
  • Ambienti solo CPU: Dispositivi senza accelerazione GPU dedicata, dove l'inferenza CPU fino al 43% più veloce di YOLO26 fornisce un vantaggio decisivo.
  • Rilevamento di oggetti piccoli: Scenari impegnativi come immagini di droni aerei o analisi di sensori IoT in cui ProgLoss e STAL aumentano significativamente la precisione su oggetti minuscoli.

Link to this sectionEsempio di implementazione: Addestrare YOLO26#

Il seguente codice dimostra la semplicità dell'ecosistema Ultralytics. Addestrare un modello all'avanguardia è facile quanto caricare i pesi e puntare ai tuoi dati.

from ultralytics import YOLO

# Load the highly optimized YOLO26 nano model
model = YOLO("yolo26n.pt")

# Train the model on a dataset with automatic hyperparameter handling
results = model.train(data="coco8.yaml", epochs=100, imgsz=640)

# Validate the model to check mAP metrics
metrics = model.val()
print(f"Validation mAP50-95: {metrics.box.map}")

# Run inference on a test image seamlessly
prediction = model("https://ultralytics.com/images/bus.jpg")

Link to this sectionAltri modelli da considerare#

Se stai esplorando il panorama più ampio dei modelli di computer vision, considera queste alternative:

  • YOLO11: Il predecessore di grande successo di YOLO26, che offre solide capacità multi-task e un ampio supporto dalla community.
  • YOLOv10: La prima architettura YOLO a introdurre l'addestramento senza NMS, aprendo la strada al moderno rilevamento end-to-end.
  • RT-DETR: Per scenari in cui architetture basate su Transformer e meccanismi di attenzione sono preferiti rispetto alle tradizionali CNN.

Link to this sectionConclusione#

Mentre YOLOv6-3.0 fornisce un eccellente throughput GPU industriale e EfficientDet mostra il potenziale di AutoML nella creazione di reti scalabili ed efficienti nei parametri, entrambi i modelli mostrano limitazioni nella facilità di deployment e nella moderna versatilità multi-task.

Per la stragrande maggioranza delle applicazioni nel mondo reale—dal deployment edge mobile all'analisi basata su cloud—l'ecosistema Ultralytics offre un equilibrio di prestazioni senza pari. Adottando YOLO26, gli sviluppatori ottengono l'accesso a un'inferenza all'avanguardia senza NMS, funzioni di perdita avanzate per oggetti piccoli e una pipeline di addestramento unificata e ben documentata che accelera drasticamente il percorso dal prototipo alla produzione.

Contributori

Commenti