Link to this sectionYOLO26 contro YOLOv5: un salto generazionale nel rilevamento degli oggetti#
L'evoluzione della computer vision è stata definita dall'incessante ricerca di velocità, accuratezza e accessibilità. Scegliere l'architettura giusta è fondamentale per il successo di qualsiasi progetto di IA. In questa guida completa, confrontiamo due monumentali rilasci di Ultralytics: il pionieristico YOLOv5 e l'innovativo YOLO26. Sebbene entrambi abbiano influenzato pesantemente il panorama del rilevamento di oggetti in tempo reale, le loro tecnologie sottostanti riflettono un massiccio cambio di paradigma nel modo in cui le reti neurali elaborano i dati visivi.
Link to this sectionPanoramica del modello#
Prima di addentrarci nelle sfumature architettoniche, stabiliamo i dettagli fondamentali di entrambi i modelli.
Dettagli di YOLO26:
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione: Ultralytics
- Data: 2026-01-14
- GitHub: https://github.com/ultralytics/ultralytics
- Documentazione: Documentazione YOLO26
Dettagli di YOLOv5:
- Autori: Glenn Jocher
- Organizzazione: Ultralytics
- Data: 26-06-2020
- GitHub: https://github.com/ultralytics/yolov5
- Documentazione: Documentazione YOLOv5
Sebbene questa guida si concentri su YOLO26 e YOLOv5, gli sviluppatori che migrano sistemi legacy potrebbero essere interessati anche al confronto con YOLO11 o la pionieristica architettura priva di NMS di YOLOv10. Entrambi offrono eccellenti punti di partenza per specifici ambienti di distribuzione.
Link to this sectionInnovazioni architettoniche#
Il divario di sei anni tra YOLOv5 e YOLO26 rappresenta un enorme salto nella ricerca sul deep learning. YOLOv5 ha reso popolare l'uso diffuso di PyTorch per i modelli di visione, offrendo un meccanismo di rilevamento basato su ancoraggi altamente ottimizzato che è diventato lo standard del settore. Tuttavia, faceva molto affidamento sulla Non-Maximum Suppression (NMS) durante la post-elaborazione, il che poteva introdurre colli di bottiglia di latenza su dispositivi con risorse limitate.
YOLO26 reimmagina completamente la pipeline di inferenza con un Design End-to-End NMS-Free. Eliminando la necessità di post-elaborazione NMS, YOLO26 offre una logica di distribuzione molto più veloce e semplice, un concetto introdotto per la prima volta in YOLOv10 ma perfezionato qui. Inoltre, YOLO26 presenta la Rimozione di DFL (Distribution Focal Loss), che semplifica drasticamente la head di output. Questo rende l'esportazione del modello in formati come ONNX e TensorRT incredibilmente fluida, garantendo un'eccellente compatibilità con dispositivi edge e a basso consumo.
Durante l'addestramento, YOLO26 impiega l'avanzato Ottimizzatore MuSGD, un ibrido di SGD e Muon ispirato a Kimi K2 di Moonshot AI. Ciò porta le innovazioni dell'addestramento LLM nella sfera della computer vision, garantendo un addestramento altamente stabile e una convergenza significativamente più rapida rispetto ai tradizionali ottimizzatori SGD o AdamW utilizzati in YOLOv5.
Link to this sectionPrestazioni e metriche#
Quando si valutano i modelli, l'equilibrio tra mean Average Precision (mAP) e velocità di inferenza determina la fattibilità nel mondo reale. YOLO26 è ottimizzato nativamente sia per GPU di fascia alta che per CPU edge.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | params (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
I benchmark rivelano un miglioramento sbalorditivo. Ad esempio, YOLO26n raggiunge un mAP di 40.9 rispetto al 28.0 di YOLOv5n, offrendo contemporaneamente un'inferenza su CPU fino al 43% più veloce. Questo rende YOLO26 enormemente superiore per distribuzioni embedded come Raspberry Pi o dispositivi mobili. Sebbene YOLOv5 mantenga un leggero vantaggio nella velocità GPU TensorRT sulla scala Nano, il compromesso sull'accuratezza favorisce pesantemente YOLO26.
Link to this sectionEcosistema di addestramento e facilità d'uso#
Entrambi i modelli beneficiano immensamente dell'ecosistema Ultralytics ben mantenuto. Offrono un'esperienza "zero-to-hero" con un'API Python semplificata, documentazione estesa e supporto attivo della community. Tuttavia, YOLO26 porta l'efficienza dell'addestramento a un nuovo livello.
I modelli Ultralytics richiedono costantemente molta meno memoria CUDA durante l'addestramento rispetto alle alternative incentrate sui Transformer. YOLO26 amplifica questo aspetto con le sue funzioni di perdita ProgLoss + STAL. Questi progressi portano notevoli miglioramenti nel riconoscimento di piccoli oggetti senza aumentare l'overhead di memoria.
from ultralytics import YOLO
# Initialize the cutting-edge YOLO26 Nano model
model = YOLO("yolo26n.pt")
# Train the model with the MuSGD optimizer (default for YOLO26)
results = model.train(data="coco8.yaml", epochs=100, imgsz=640, batch=16, device=0)
# Run fast, NMS-free inference on a test image
predictions = model("https://ultralytics.com/images/bus.jpg")
predictions[0].show()Questo semplice script consente agli sviluppatori di iterare rapidamente su dataset personalizzati, passando senza problemi dall'acquisizione dei dati a un modello pronto per la produzione.
Utilizzando la Piattaforma Ultralytics, puoi esportare automaticamente i tuoi modelli YOLO26 addestrati in formati come CoreML o TensorFlow Lite senza scrivere una sola riga di codice di conversione.
Link to this sectionVersatilità e casi d'uso ideali#
Link to this sectionQuando usare YOLOv5#
YOLOv5 rimane un cavallo di battaglia affidabile per i sistemi legacy. Se hai una pipeline industriale esistente fortemente legata agli output basati su ancoraggi, o se stai eseguendo l'inferenza su vecchi dispositivi NVIDIA Jetson con stack TensorRT maturi e bloccati, YOLOv5 fornisce una soluzione stabile e ampiamente documentata.
Link to this sectionQuando usare YOLO26#
YOLO26 è la scelta definitiva per i moderni progetti di computer vision. La sua versatilità supera di gran lunga quella del suo predecessore. Mentre YOLOv5 si concentra principalmente sul rilevamento (con successive aggiunte di segmentazione), YOLO26 offre un supporto profondo e nativo per Segmentazione di Istanze, Stima della Posa, Classificazione di Immagini e BBox Orientate (OBB).
YOLO26 introduce Miglioramenti Specifici per Compito, come una perdita di segmentazione semantica specializzata, Residual Log-Likelihood Estimation (RLE) per punti chiave di posa ultra-precisi e una perdita angolare avanzata per OBB per risolvere complessi problemi di confine.
- Edge IoT e Robotica: L'architettura priva di NMS e l'inferenza su CPU più veloce del 43% rendono YOLO26 ideale per la navigazione robotica in tempo reale e le telecamere domestiche intelligenti.
- Immagini Aeree: I miglioramenti di ProgLoss + STAL rendono il rilevamento di oggetti minuscoli dai droni—come veicoli nei parcheggi o colture nei campi agricoli—sostanzialmente più affidabile.
- Analisi Video in Tempo Reale: Che si tratti di tracciare atleti nelle trasmissioni sportive o monitorare i flussi di traffico, l'equilibrio delle prestazioni di YOLO26 garantisce un elevato richiamo senza perdere fotogrammi.
In definitiva, l'impegno di Ultralytics verso un ecosistema accessibile e ad alte prestazioni garantisce che la transizione da YOLOv5 a YOLO26 sia priva di attriti, sbloccando capacità all'avanguardia sia per i ricercatori che per gli sviluppatori.