Meet YOLO26: next-gen vision AI.

Link to this sectionYOLOv5 vs. EfficientDet: valutazione delle architetture di object detection in tempo reale#

Quando inizi un nuovo progetto di computer vision, scegliere l'architettura di rete neurale giusta è una delle decisioni più importanti che dovrai prendere. Questa guida fornisce un confronto tecnico approfondito tra Ultralytics YOLOv5 e EfficientDet di Google. Analizzando le loro architetture, le metriche di performance e gli ecosistemi di training, vogliamo aiutare sviluppatori e ricercatori a identificare il miglior modello di object detection per i loro specifici ambienti di deployment.

Mentre EfficientDet ha introdotto concetti innovativi nel compound scaling e nella feature fusion, YOLOv5 ha rivoluzionato il settore rendendo accessibile l'IA ad alte prestazioni grazie alla sua implementazione PyTorch incredibilmente intuitiva, un'esperienza utente semplificata e un equilibrio senza pari tra velocità e precisione.

Link to this sectionUltralytics YOLOv5: lo standard del settore per l'accessibilità#

Rilasciato nell'estate del 2020, YOLOv5 ha segnato un cambiamento cruciale nella linea YOLO. Passando dal framework Darknet basato su C a PyTorch nativo, è diventato l'architettura di riferimento per gli sviluppatori che desiderano costruire, addestrare e distribuire modelli rapidamente.

Link to this sectionInnovazioni architettoniche#

YOLOv5 è celebre per la sua architettura altamente ottimizzata che privilegia un ciclo di vita di machine learning fluido. Utilizza una backbone CSPDarknet53 modificata abbinata a un neck Path Aggregation Network (PANet), che migliora drasticamente la propagazione delle feature su più scale spaziali.

I progressi chiave includono:

  • Mosaic Data Augmentation: questa tecnica di addestramento combina quattro immagini diverse in un singolo mosaico. Ciò costringe il modello a imparare a identificare oggetti in contesti spaziali complessi e potenzia significativamente la sua capacità di rilevare piccoli target.
  • Auto-Learning Anchor Boxes: prima dell'inizio del training, YOLOv5 analizza i tuoi dati di addestramento personalizzati e calcola automaticamente le dimensioni ottimali delle anchor box usando il clustering k-means.
  • Efficienza della memoria: rispetto ai pesanti modelli basati su Transformer, YOLOv5 mantiene un ingombro di memoria significativamente inferiore durante sia l'addestramento che l'inferenza, consentendogli di funzionare senza problemi su hardware di tipo consumer.

Scopri di più su YOLOv5

Link to this sectionEfficientDet: Object Detection scalabile#

Introdotto da Google Research nel 2019, EfficientDet mirava a fornire una famiglia di rilevatori di oggetti scalabili. Si basa sulla backbone di classificazione immagini EfficientNet e introduce un innovativo meccanismo di fusione delle feature.

Link to this sectionInnovazioni architettoniche#

La proposta principale di EfficientDet risiede nel suo approccio sistematico allo scaling e all'aggregazione delle feature:

  • BiFPN (Bi-directional Feature Pyramid Network): a differenza delle FPN tradizionali che passano informazioni solo dall'alto verso il basso, la BiFPN abilita una fusione di feature multi-scala facile e veloce, introducendo pesi apprendibili per imparare l'importanza delle diverse feature di input.
  • Compound Scaling: EfficientDet scala congiuntamente risoluzione, profondità e larghezza per tutte le backbone, le feature network e le reti di previsione box/classe, dando vita a modelli che spaziano dal leggero D0 al massiccio D7.

Scopri di più su EfficientDet

Differenze tra i framework

Mentre EfficientDet si affida pesantemente all'ecosistema TensorFlow e alle librerie AutoML, YOLOv5 opera nativamente all'interno di PyTorch, offrendo quello che molti sviluppatori considerano un flusso di lavoro più intuitivo, pythonic e debuggabile.

Link to this sectionConfronto tra prestazioni e metriche#

Quando confronti questi modelli, valutare le loro performance su benchmark standard come il dataset COCO è cruciale. La tabella qui sotto evidenzia i compromessi tra dimensioni, richieste computazionali (FLOP) e velocità di inferenza.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLOv5n64028.073.61.122.67.7
YOLOv5s64037.4120.71.929.124.0
YOLOv5m64045.4233.94.0325.164.2
YOLOv5l64049.0408.46.6153.2135.0
YOLOv5x64050.7763.211.8997.2246.4
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Link to this sectionAnalisi equilibrata#

YOLOv5 brilla per la sua flessibilità di deployment e la compatibilità con l'accelerazione hardware raw. Nota le velocità estremamente elevate di TensorRT sulla GPU T4. Questo rende YOLOv5 incredibilmente adatto per pipeline di video analytics ad alto throughput e inferenza in tempo reale. Inoltre, l'ecosistema Ultralytics rende l'esportazione verso formati come ONNX, CoreML e TensorRT un comando da una sola riga.

EfficientDet offre un'eccellente efficienza dei parametri. Per un dato conteggio di parametri, spesso estrae un'elevata mean Average Precision (mAP). Tuttavia, questa efficienza teorica non sempre si traduce in tempi di inferenza wall-clock più rapidi su GPU edge a causa del complesso routing del layer BiFPN, che può essere limitato dalla larghezza di banda della memoria piuttosto che dalla capacità di calcolo.

Link to this sectionEcosistema e facilità d'uso#

Il vantaggio decisivo nello scegliere un modello Ultralytics risiede nell'ecosistema circostante. YOLOv5 fa parte di una repository ampiamente mantenuta e sviluppata attivamente con un enorme supporto della community.

Con l'introduzione della piattaforma Ultralytics, gli utenti possono passare senza problemi dalla raccolta dei dati al deployment. Questa piattaforma supporta auto-annotazione, addestramento in cloud e monitoraggio del modello fin da subito. Al contrario, addestrare EfficientDet richiede spesso di affrontare le complessità delle vecchie API di object detection di TensorFlow, che possono presentare una curva di apprendimento ripida per la prototipazione rapida.

Inoltre, la versatilità di YOLOv5 si estende oltre le bounding box. Grazie ad aggiornamenti continui, il framework Ultralytics supporta nativamente instance segmentation e image classification, fornendo un'API unificata per molteplici task di computer vision.

Link to this sectionCasi d'uso ideali#

  • Scegli YOLOv5 quando: ti servono prototipazione rapida, un'esperienza di addestramento senza attriti e un deployment edge altamente ottimizzato. È ideale per droni, retail analytics e applicazioni mobile in cui la bassa latenza è critica.
  • Scegli EfficientDet quando: operi rigorosamente all'interno di un ambiente Google Cloud/TensorFlow AutoML e richiedi la massima precisione per parametro senza vincoli rigidi di latenza in tempo reale.

Link to this sectionLa prossima generazione: accogliere YOLO26#

Mentre YOLOv5 rimane un cavallo di battaglia affidabile, il panorama della computer vision è avanzato. Per gli sviluppatori che cercano lo stato dell'arte assoluto nel 2026, YOLO26 rappresenta il nuovo apice della lineup Ultralytics.

Basandosi sull'eredità dei suoi predecessori (come YOLOv8 e YOLO11), YOLO26 introduce innovazioni rivoluzionarie:

  • Design end-to-end NMS-Free: YOLO26 elimina nativamente la necessità del post-processing Non-Maximum Suppression. Ciò riduce significativamente la varianza della latenza e semplifica l'architettura di deployment.
  • Up to 43% Faster CPU Inference: Heavily optimized for edge AI, it brings unprecedented speeds to low-power edge devices and standard CPUs without dedicated GPUs.
  • Ottimizzatore MuSGD: ispirato alle tecniche di addestramento dei Large Language Model (LLM), questo ibrido tra SGD e Muon assicura un addestramento altamente stabile e una rapida convergenza.
  • Funzioni di perdita avanzate: l'integrazione di ProgLoss e STAL migliora drasticamente il riconoscimento di piccoli target, il che è vitale per le immagini da droni ad alta quota e per la robotica.
  • Rimozione DFL: rimuovendo la Distribution Focal Loss, il processo di esportazione del modello viene semplificato, migliorando ulteriormente la compatibilità tra diversi acceleratori hardware.

Gli utenti interessati a esplorare altre architetture recenti all'interno dell'ecosistema Ultralytics potrebbero confrontare modelli come YOLOv10 o RT-DETR.

Migrare è facile

L'API Python di Ultralytics è progettata per la compatibilità retroattiva e futura. Aggiornare da YOLOv5 a YOLO26 è letteralmente semplice quanto cambiare la stringa dei pesi del modello nel tuo codice!

Link to this sectionEsempio di codice: addestramento e inferenza#

Per dimostrare l'ineguagliabile facilità d'uso dell'ecosistema Ultralytics, ecco come puoi addestrare ed eseguire l'inferenza utilizzando un moderno modello YOLO. Questo codice è eseguibile al 100% e gestisce automaticamente il download del dataset, i cicli di addestramento e la validazione.

from ultralytics import YOLO

# Load a modern model (Swap 'yolov5s.pt' for 'yolo26n.pt' to test the newest architecture!)
model = YOLO("yolov5s.pt")

# Train the model on the COCO8 example dataset for 20 epochs
results = model.train(data="coco8.yaml", epochs=20, imgsz=640)

# Run inference on an image from the web
inference_results = model("https://ultralytics.com/images/bus.jpg")

# Display the image with bounding boxes
inference_results[0].show()

Privilegiando l'esperienza utente, mantenendo un ecosistema robusto e spingendo continuamente oltre i confini di ciò che è possibile con aggiornamenti come YOLO26, Ultralytics assicura che gli sviluppatori abbiano sempre a disposizione i migliori strumenti per risolvere le sfide di intelligenza visiva del mondo reale.

Collaboratori

Commenti