Meet YOLO26: next-gen vision AI.

Link to this sectionYOLO26 vs EfficientDet#

Scegliere la giusta architettura di rete neurale è fondamentale per il successo di qualsiasi applicazione di computer vision. Questa guida tecnica esplora i compromessi, le metriche di prestazione e le innovazioni architetturali di due modelli di spicco: l'avveniristico Ultralytics YOLO26 e il consolidato EfficientDet di Google.

Indipendentemente dal fatto che il tuo deployment sia rivolto a server cloud ad alto throughput o a dispositivi di edge AI con limiti di latenza, comprendere le differenze tra queste architetture garantisce un equilibrio ottimale tra velocità, precisione ed efficienza.

Link to this sectionPanoramica architetturale: YOLO26#

Autori: Glenn Jocher e Jing Qiu
Organizzazione: Ultralytics
Data: 2026-01-14
GitHub: Ultralytics GitHub
Documentazione: Documentazione ufficiale YOLO26

Rilasciato all'inizio del 2026, YOLO26 rappresenta l'ultima evoluzione della famiglia YOLO, progettato specificamente per offrire un'esperienza utente senza pari e una mean Average Precision (mAP) di alto livello. Progettato da zero per l'hardware moderno, offre un'eccezionale versatilità in ambiti quali object detection, instance segmentation, image classification e pose estimation.

YOLO26 introduce diverse funzionalità rivoluzionarie che migliorano drasticamente sia la stabilità dell'addestramento che la velocità di inferenza:

  • Design End-to-End NMS-Free: Basandosi sui concetti introdotti in YOLOv10, YOLO26 è nativamente end-to-end, eliminando completamente la necessità di post-elaborazione tramite Non-Maximum Suppression (NMS). Ciò porta a una logica di deployment più semplice e a una varianza della latenza significativamente inferiore.
  • Inferenza su CPU fino al 43% più veloce: Grazie a profonde ottimizzazioni architetturali, il modello raggiunge velocità di inferenza senza precedenti su CPU standard, rendendolo altamente adatto per ambienti IoT ed embedded.
  • Rimozione DFL: La Distribution Focal Loss è stata rimossa, portando a un processo di esportazione più pulito e a una maggiore compatibilità con dispositivi edge a basso consumo utilizzando strumenti come ONNX.
  • Ottimizzatore MuSGD: Ispirato alle routine di addestramento LLM di Moonshot AI's Kimi K2, questo ibrido tra SGD e Muon porta le innovazioni dell'addestramento dei modelli linguistici di grandi dimensioni direttamente nella computer vision, garantendo una convergenza più rapida e regimi di addestramento più stabili.
  • ProgLoss + STAL: Queste avanzate funzioni di loss offrono notevoli miglioramenti nel riconoscimento di piccoli oggetti, un fattore critico per le applicazioni che coinvolgono immagini da droni aerei e robotica.
Esportazione semplificata

Grazie alla rimozione della DFL e all'architettura senza NMS, l'esportazione dei modelli YOLO26 verso formati ottimizzati per l'edge come NVIDIA TensorRT o Intel OpenVINO non richiede praticamente alcuno sviluppo di plugin personalizzati.

Scopri di più su YOLO26

Link to this sectionPanoramica architettonica: EfficientDet#

Autori: Mingxing Tan, Ruoming Pang e Quoc V. Le
Organizzazione: Google Research
Data: 2019-11-20
Arxiv: Paper EfficientDet
GitHub: Repository Google AutoML

Introdotto da Google, EfficientDet utilizza pesantemente l'ecosistema TensorFlow ed è stato progettato attorno al concetto di compound scaling. La sua architettura scala simultaneamente la rete backbone, la rete di feature e le reti di predizione box/class in base ai vincoli delle risorse.

Le innovazioni chiave di EfficientDet includono:

  • BiFPN (Bi-directional Feature Pyramid Network): Un meccanismo che consente una fusione delle feature multi-scala facile e veloce, permettendo alla rete di comprendere meglio gli oggetti di dimensioni variabili.
  • Compound Scaling: Un metodo euristico per scalare uniformemente risoluzione, profondità e larghezza, creando una famiglia di modelli da d0 (più piccolo) a d7 (più grande).

Sebbene EfficientDet rimanga una scelta solida per la rilevazione rigorosa di bounding box, generalmente manca della moderna versatilità multi-task (come le OBB tasks native) e dell'ecosistema Python semplificato e unificato che gli sviluppatori moderni si aspettano.

Scopri di più su EfficientDet

Link to this sectionConfronto tra prestazioni e metriche#

Per identificare la frontiera di Pareto tra velocità e precisione, abbiamo effettuato il benchmark di entrambe le architetture su ambienti standard utilizzando il COCO dataset. La tabella seguente evidenzia le differenze nelle dimensioni del modello, nella precisione e nella latenza misurate su un'istanza AWS EC2 P4d.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
params
(M)
FLOPs
(B)
YOLO26n64040.938.91.72.45.4
YOLO26s64048.687.22.59.520.7
YOLO26m64053.1220.04.720.468.2
YOLO26l64055.0286.26.224.886.4
YOLO26x64057.5525.811.855.7193.9
EfficientDet-d064034.610.23.923.92.54
EfficientDet-d164040.513.57.316.66.1
EfficientDet-d264043.017.710.928.111.0
EfficientDet-d364047.528.019.5912.024.9
EfficientDet-d464049.742.833.5520.755.2
EfficientDet-d564051.572.567.8633.7130.0
EfficientDet-d664052.692.889.2951.9226.0
EfficientDet-d764053.7122.0128.0751.9325.0

Come mostrato sopra, YOLO26 stabilisce un equilibrio di prestazioni superiore. Il modello YOLO26x raggiunge la massima precisione (57.5 mAP), superando significativamente il più pesante EfficientDet-d7. Inoltre, i modelli YOLO26 mostrano requisiti di memoria sostanzialmente inferiori e velocità di inferenza su GPU molto più elevate (fino a 1.7 ms su TensorRT), sottolineando i vantaggi di un design senza NMS.

Link to this sectionEfficienza di addestramento e il vantaggio dell'ecosistema#

Una distinzione importante tra le due architetture risiede nei loro ambienti di sviluppo. EfficientDet è profondamente integrato nell'ecosistema Google AutoML e TensorFlow che, sebbene potente, può introdurre ripide curve di apprendimento e configurazioni rigide per dataset personalizzati come DOTAv1.

Al contrario, Ultralytics offre un ecosistema incredibilmente ben mantenuto basato su PyTorch. L'utilizzo della memoria durante l'addestramento è rigorosamente ottimizzato, consentendo agli ingegneri di addestrare modelli robusti senza richiedere le eccessive allocazioni di VRAM comuni nelle reti basate su Transformer.

Integrazione della piattaforma unificata

Attraverso la Ultralytics Platform, gli sviluppatori ottengono l'accesso a un flusso di lavoro MLOps end-to-end. Ciò include un'annotazione dei dati fluida, il tuning automatico degli iperparametri e l'addestramento cloud con un solo clic, accelerando significativamente il percorso dalla prototipazione alla produzione.

Link to this sectionEsempio di implementazione#

La facilità d'uso fornita dall'API Ultralytics significa che puoi addestrare e convalidare un modello YOLO26 all'avanguardia in poche righe di codice.

from ultralytics import YOLO

# Initialize the End-to-End NMS-Free YOLO26 model
model = YOLO("yolo26n.pt")

# Train using the innovative MuSGD optimizer on a custom dataset
train_results = model.train(
    data="coco8.yaml",
    epochs=100,
    imgsz=640,
    device="0",  # Train on GPU
)

# Export natively to TensorRT for ultra-low latency deployment
model.export(format="engine")

Link to this sectionCasi d'uso ideali#

Quando usare YOLO26:

  • Edge Computing & Mobile: Con un'inferenza su CPU fino al 43% più veloce e nessun overhead dovuto alla NMS, YOLO26 eccelle su dispositivi con budget di calcolo rigorosamente limitati come Raspberry Pi o telefoni cellulari.
  • Multitasking: Quando una singola pipeline richiede bounding box, segmentation masks e tracking, la versatilità di YOLO26 non ha eguali.
  • Drone & Immagini aeree: La combinazione di ProgLoss e STAL migliora notevolmente il rilevamento di oggetti estremamente piccoli da quote elevate.

Quando usare EfficientDet:

  • Pipeline TensorFlow legacy: Se la tua infrastruttura è fortemente hardcoded per supportare solo TensorFlow SavedModels o richiede specifiche pipeline TensorFlow Serving, EfficientDet fornisce la compatibilità nativa.
  • TPU con risorse limitate: EfficientDet è stato pesantemente ottimizzato per le Tensor Processing Unit personalizzate di Google (TPUs).

Link to this sectionEsplorare altre alternative#

Sebbene questa guida si concentri pesantemente sul paradigma YOLO26 vs EfficientDet, il più ampio ecosistema Ultralytics ospita altre incredibili architetture. Se la tua applicazione si basa pesantemente sui Transformer, RT-DETR offre un rilevamento in tempo reale basato su Transformer. In alternativa, se stai supportando sistemi legacy, YOLO11 rimane pienamente supportato ed estremamente efficace. Per una panoramica più ampia, visita l' Ultralytics Model Comparisons Hub.

In definitiva, per qualsiasi moderna pipeline di computer vision costruita oggi, la pura velocità, la facilità d'uso e la precisione all'avanguardia di YOLO26 lo rendono la raccomandazione indiscussa sia per i ricercatori che per gli sviluppatori.

Collaboratori

Commenti