YOLO26 vs. YOLOv5: progressi nel rilevamento di oggetti in tempo reale

L'evoluzione del rilevamento degli oggetti è stata caratterizzata da traguardi significativi e il confronto tra YOLO26 e il leggendario YOLOv5 offre una visione chiara di quanto sia progredita la visione artificiale. Mentre YOLOv5 lo standard industriale in termini di usabilità ed equilibrio nel 2020, YOLO26 rappresenta l'avanguardia della ricerca sull'IA generativa e sulla visione artificiale nel 2026. Questa guida analizza le loro architetture, le metriche di prestazione e gli scenari di implementazione ideali per aiutarti a scegliere lo strumento giusto per il tuo progetto.

Riepilogo

YOLOv5, rilasciato da Ultralytics nel 2020, ha democratizzato l'IA rendendo il rilevamento degli oggetti accessibile, veloce e facile da addestrare. Rimane un affidabile cavallo di battaglia per i sistemi legacy.

YOLO26, rilasciato nel gennaio 2026, si basa su tale eredità con un'architettura nativa end-to-end che elimina la soppressione non massima (NMS). Introduce l'ottimizzatore MuSGD ispirato ai modelli linguistici di grandi dimensioni (LLM), con conseguente convergenza più rapida e precisione notevolmente migliorata, in particolare per oggetti di piccole dimensioni e dispositivi periferici.

Funzionalità	YOLO26	YOLOv5
Architettura	NMS End-to-End	Basato su ancoraggio con NMS
Ottimizzatore	MuSGD (ispirato a LLM)	SGD Adam
Velocità di inferenza	Fino al 43% più veloce sulla CPU	Standard in tempo reale
Attività	Rileva, Segmenta, Classifica, Posizione, OBB	Detect, Segment, Classify
Ideale per	Edge AI,CPU in tempo reale, Robotica	Uso generico, supporto legacy

Benchmark delle prestazioni

La tabella seguente mette a confronto i modelli sul COCO . YOLO26 mostra miglioramenti sostanziali sia in termini di accuratezza (mAP) e velocità di inferenza, in particolare su CPU dove l'elaborazione efficiente è fondamentale.

Modello	dimensione ^(pixel)	mAP^val 50-95	Velocità ^{CPU ONNX (ms)}	Velocità ^{T4 TensorRT10 (ms)}	parametri ^(M)	FLOPs ^(B)
YOLO26n	640	40.9	38.9	1.7	2.4	5.4
YOLO26s	640	48.6	87.2	2.5	9.5	20.7
YOLO26m	640	53.1	220.0	4.7	20.4	68.2
YOLO26l	640	55.0	286.2	6.2	24.8	86.4
YOLO26x	640	57.5	525.8	11.8	55.7	193.9

YOLOv5n	640	28.0	73.6	1.12	2.6	7.7
YOLOv5s	640	37.4	120.7	1.92	9.1	24.0
YOLOv5m	640	45.4	233.9	4.03	25.1	64.2
YOLOv5l	640	49.0	408.4	6.61	53.2	135.0
YOLOv5x	640	50.7	763.2	11.89	97.2	246.4

Nota sulle Prestazioni

YOLO26n offre un notevole miglioramento del 46% in termini di mAP rispetto a YOLOv5n, pur funzionando a una velocità quasi doppia sulle CPU. Ciò lo rende la scelta definitiva per le applicazioni mobili e l'IA edge.

YOLO26: Il Nuovo Standard per l'AI Edge

YOLO26 è progettato per affrontare le complessità delle moderne pipeline di distribuzione. Eliminando la necessità di NMS e Distribution Focal Loss (DFL), il modello semplifica l'esportazione in formati come ONNX e TensorRT, riducendo la variabilità della latenza.

Innovazioni Architetturali Chiave

End-to-End NMS: l'architettura del modello prevede direttamente un riquadro di delimitazione per ogni oggetto, eliminando la NMS euristica NMS . Ciò riduce il sovraccarico computazionale durante l'inferenza, una tecnica introdotta per la prima volta in YOLOv10.
MuSGD Optimizer: Adattando le innovazioni della formazione LLM, YOLO26 utilizza un ibrido di SGD Muon (ispirato al Kimi K2 di Moonshot AI). Ciò si traduce in dinamiche di formazione più stabili e una convergenza più rapida, riducendo il costo della formazione di modelli personalizzati.
ProgLoss + STAL: l'integrazione di Progressive Loss e Soft-Target Anchor Loss migliora significativamente il rilevamento di oggetti di piccole dimensioni, un requisito fondamentale per le immagini dei droni e i veicoli autonomi.
Efficienza: con CPU fino al 43% più veloce, YOLO26 è ottimizzato per dispositivi che non dispongono di GPU potenti, come laptop standard e Raspberry Pi.

Scopri di più su YOLO26

YOLOv5: L'eredità dell'usabilità

YOLOv5 ha trasformato il panorama della visione artificiale dando priorità all'esperienza dell'utente. PyTorch sua PyTorch intuitiva e il suo ecosistema robusto hanno fissato lo standard per lo sviluppo dell'IA "da zero a eroe".

Facilità d'uso: noto per la sua struttura di directory semplice e l'interfaccia "train.py", YOLOv5 uno dei preferiti per scopi didattici e prototipazione rapida.
Ampia compatibilità: l'ampio supporto per i formati di esportazione garantisce il funzionamento su quasi tutti i dispositivi hardware, da Apple CoreML ad Android TFLite.
Supporto della community: anni di sviluppo attivo hanno portato alla creazione di una vasta libreria di tutorial, integrazioni di terze parti e correzioni della community.

Scopri di più su YOLOv5

Confronto tra casi d'uso

La scelta tra questi modelli dipende dai vostri vincoli specifici in termini di hardware, precisione e complessità delle attività.

Scenari Ideali per YOLO26

Edge Computing e IoT: l'eliminazione di DFL e NMS YOLO26 eccezionalmente veloce su CPU e NPU. È perfetto per telecamere intelligenti, analisi di vendita al dettaglio e sensori industriali.
Robotica e navigazione: il design end-to-end garantisce una latenza deterministica, fondamentale per i circuiti di controllo in tempo reale nella robotica.
Attività avanzate: se avete bisogno della stima della posa con stima della log-verosimiglianza residua (RLE) o del rilevamento altamente accurato dell'Oriented Bounding Box (OBB) per le immagini aeree, YOLO26 offre teste architetturali specializzate che YOLOv5 .
Rilevamento di piccoli oggetti: grazie a ProgLoss, YOLO26 eccelle nel rilevare piccoli oggetti come difetti di fabbricazione o oggetti distanti nelle riprese di sicurezza.

Scenari ideali per YOLOv5

Sistemi legacy: i progetti già profondamente integrati con YOLOv5 potrebbero trovare conveniente mantenere il modello attuale se le prestazioni soddisfano i requisiti.
Workshop didattici: il suo codice semplice è eccellente per insegnare i fondamenti delle reti neurali convoluzionali (CNN).

Formazione ed ecosistema

Entrambi i modelli beneficiano del solido Ultralytics , ma YOLO26 introduce moderne efficienze.

Efficienza dell'addestramento

YOLO26 utilizza l'ottimizzatore MuSGD, che stabilizza l'addestramento su batch di dimensioni variabili e tassi di apprendimento diversi. Ciò spesso comporta un minor numero di epoche necessarie per raggiungere la convergenza rispetto SGD standard YOLOv5, con un conseguente risparmio sui costi GPU .

Requisiti di Memoria

Ultralytics sono famosi per la loro efficienza. YOLO26 continua questa tendenza, richiedendo una quantità significativamente inferiore CUDA rispetto alle alternative basate su trasformatori come RT-DETR. Ciò consente agli sviluppatori di addestrare modelli più grandi su GPU di livello consumer come NVIDIA 3060 o 4090.

Ultralytics

Entrambi i modelli sono completamente integrati con la Ultralytics , che semplifica l'intero flusso di lavoro:

Gestione dei set di dati: carica e annota i dati con l'assistenza dell'IA.
Formazione con un solo clic: formazione sul cloud senza dover gestire l'infrastruttura.
Distribuzione: esportazione automatica su TensorRT, OpenVINO e altri per la produzione.

Conclusione

Mentre YOLOv5 rimane un classico rispettato che ha definito una generazione di rilevatori di oggetti, YOLO26 è la scelta migliore per i nuovi progetti nel 2026. I suoi progressi architettonici, in particolare il design NMS e l'ottimizzatore MuSGD, offrono un modello più veloce, più accurato e più facile da implementare sui dispositivi edge.

Per gli sviluppatori che cercano il miglior equilibrio tra velocità e precisione, YOLO26 offre una base a prova di futuro. Consigliamo di migrare YOLOv5 legacy YOLOv5 a YOLO26 per sfruttare questi significativi miglioramenti delle prestazioni.

Autori e riferimenti bibliografici

YOLO26

Autori: Glenn Jocher e Jing Qiu
Organizzazione:Ultralytics
Data: 2026-01-14
Documentazione:Documentazione YOLO26

YOLOv5

Autori: Glenn Jocher
Organizzazione:Ultralytics
Data: 2020-06-26
Documentazione:YOLOv5

Per chi fosse interessato a esplorare altre architetture moderne, consigliamo di dare un'occhiata a YOLO11 per attività di visione generiche o RT-DETR per il rilevamento basato su trasformatori.