YOLOv5 vs. YOLO26: Evoluzione del Detect di Oggetti in Tempo Reale
L'evoluzione del detect di oggetti è stata caratterizzata da significativi balzi in efficienza e precisione. Per anni, YOLOv5 è stato lo standard del settore, apprezzato per il suo equilibrio tra velocità e facilità d'uso. Tuttavia, il panorama della visione artificiale cambia rapidamente. Entra in gioco YOLO26, l'ultima generazione di Ultralytics, che ridefinisce ciò che è possibile sia sui dispositivi edge che sui server ad alte prestazioni.
Questa guida fornisce un confronto tecnico tra il leggendario YOLOv5 e l'avanguardistico YOLO26, analizzando le loro architetture, metriche di performance e casi d'uso ideali per aiutarti a scegliere lo strumento giusto per il tuo prossimo progetto di visione artificiale.
Confronto Rapido
Sebbene entrambi i modelli siano il risultato dell'impegno di Ultralytics per un'IA accessibile, essi rappresentano epoche diverse di filosofia di design. YOLOv5 si è concentrato sulla creazione di un ecosistema robusto e user-friendly, mentre YOLO26 spinge i confini della latenza e dell'efficienza architetturale.
YOLOv5: Lo Standard Legacy
Rilasciato a giugno 2020 da Glenn Jocher, YOLOv5 ha rivoluzionato l'accessibilità del rilevamento di oggetti. È stato uno dei primi modelli a offrire un'esperienza di addestramento fluida direttamente all'interno dell'ecosistema PyTorch, allontanandosi dal framework Darknet dei suoi predecessori.
- Data: 2020-06-26
- Autori: Glenn Jocher
- Organizzazione:Ultralytics
- Caratteristica chiave: Rilevamento basato su anchor che richiede la soppressione non massima (NMS).
YOLOv5 rimane un cavallo di battaglia affidabile, in particolare per i sistemi legacy dove l'aggiornamento della pipeline di inferenza potrebbe essere costoso. La sua architettura "Anchor-Based" si basa su box predefiniti per prevedere le posizioni degli oggetti, un metodo efficace ma che richiede un'attenta messa a punto degli iperparametri.
YOLO26: La Nuova Frontiera
Rilasciato a gennaio 2026 da Glenn Jocher e Jing Qiu, YOLO26 introduce cambiamenti architettonici radicali progettati per l'era moderna dell'Edge AI. Si allontana dagli anchor e dalla complessa post-elaborazione per offrire velocità pura senza compromettere la precisione.
- Data: 2026-01-14
- Autori: Glenn Jocher, Jing Qiu
- Organizzazione:Ultralytics
- Caratteristica chiave: End-to-End NMS-Free, Ottimizzatore MuSGD, Rimozione DFL.
YOLO26 è stato sviluppato per gli sviluppatori che necessitano della massima produttività. Eliminando la necessità di NMS, semplifica la logica di deployment e riduce la latenza, rendendolo la scelta superiore per applicazioni in tempo reale su CPU e dispositivi mobili.
Confronto tecnico delle prestazioni
Le seguenti metriche evidenziano il salto generazionale nelle prestazioni. I test sono stati condotti sul dataset COCO, un benchmark standard per i compiti di object detection.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | parametri (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Punti chiave
- Efficienza CPU: YOLO26n è quasi 2 volte più veloce su CPU rispetto a YOLOv5n, offrendo al contempo un notevole aumento di precisione (28.0% vs 40.9% mAP). Questo è fondamentale per i deployment su Raspberry Pi o dispositivi mobili dove le risorse GPU non sono disponibili.
- Efficienza dei parametri: YOLO26x raggiunge una precisione significativamente più elevata (57.5% mAP) rispetto a YOLOv5x (50.7%) utilizzando quasi la metà dei parametri (55.7M vs 97.2M). Questa riduzione delle dimensioni del modello diminuisce i requisiti di memoria e i costi di archiviazione.
- Compromesso precisione/velocità: La versione "Nano" di YOLO26 supera la versione "Small" di YOLOv5 in termini di precisione, pur essendo una classe di modello più piccola.
Aggiornamento da YOLOv5
Se attualmente utilizzi YOLOv5s, il passaggio a YOLO26n ti fornirà probabilmente una maggiore precisione e un'inferenza più rapida contemporaneamente, riducendo sia i costi di calcolo che la latenza.
Analisi Approfondita dell'Architettura
Il divario di prestazioni deriva da differenze fondamentali nel modo in cui i modelli affrontano il problema del rilevamento.
1. Design End-to-End NMS-Free
YOLOv5 utilizza un approccio tradizionale che genera migliaia di potenziali bounding box. È richiesto un passaggio di post-elaborazione chiamato Non-Maximum Suppression (NMS) per filtrare questi box fino alle rilevazioni finali. Questo passaggio è spesso lento e difficile da accelerare su hardware come FPGA o NPU.
YOLO26 è nativamente end-to-end. Utilizza una strategia di assegnazione a doppia etichetta durante l'addestramento che forza il modello a prevedere un singolo box di alta qualità per oggetto. Questo elimina completamente il passaggio NMS durante l'inferenza.
- Vantaggio: Latenza inferiore e pipeline di deployment più semplici (non è necessario implementare NMS in C++ o CUDA per esportazioni personalizzate).
- Risultato: Fino al 43% più veloce nell'inferenza su CPU rispetto alle generazioni precedenti che si basavano su una pesante post-elaborazione.
2. Funzioni di Loss: Rimozione DFL e ProgLoss
YOLOv5 (e il successivo YOLOv8) hanno utilizzato la Distribution Focal Loss (DFL) per affinare i confini dei box. Sebbene efficace, DFL aggiunge overhead computazionale e complessità al processo di esportazione.
YOLO26 rimuove DFL, tornando a una testa di regressione semplificata più facile da quantizzare per il deployment INT8. Per compensare qualsiasi potenziale perdita di precisione, YOLO26 introduce ProgLoss (Progressive Loss Balancing) e STAL (Small-Target-Aware Label Assignment).
- STAL: Mira specificamente al problema degli "oggetti piccoli", migliorando le prestazioni su bersagli distanti o minuscoli—una debolezza comune nelle versioni precedenti di YOLO, inclusa la v5.
- ProgLoss: Regola dinamicamente il peso dei diversi componenti di perdita durante l'addestramento per stabilizzare la convergenza.
3. L'Ottimizzatore MuSGD
La stabilità dell'addestramento è stata un obiettivo principale per il team di YOLO26. Mentre YOLOv5 si basava tipicamente su ottimizzatori SGD o Adam standard, YOLO26 incorpora MuSGD, un ottimizzatore ibrido ispirato alle tecniche di addestramento di Kimi K2 di Moonshot AI e dei Large Language Model (LLM).
- Innovazione: Apporta la stabilità dell'ottimizzazione Muon alla visione artificiale, consentendo tassi di apprendimento più elevati e una convergenza più rapida senza il rischio di picchi di perdita.
Versatilità e supporto per i task
Entrambi i modelli sono integrati nell'ecosistema Ultralytics, il che significa che supportano un'ampia gamma di compiti di visione artificiale. Tuttavia, YOLO26 include miglioramenti architettonici specifici per i compiti che YOLOv5 non ha.
| Funzionalità | YOLOv5 | YOLO26 |
|---|---|---|
| Rilevamento di oggetti | ✅ Basato su anchor standard | ✅ NMS-Free, STAL per oggetti di piccole dimensioni |
| Segmentazione | ✅ Aggiunto nella v7.0 | ✅ Loss Semantica & Proto Multi-scala |
| Stima della posa | ❌ (Disponibile nei fork) | ✅ RLE (Stima di Log-Verosimiglianza Residua) |
| OBB | ❌ (Disponibile nei fork) | ✅ Loss dell'Angolo per una rotazione precisa |
| Classificazione | ✅ Supportato | ✅ Architetture ottimizzate |
Il supporto di YOLO26 per la Stima di Log-Verosimiglianza Residua (RLE) nella stima della posa fornisce keypoint significativamente più accurati per il tracking della posa umana, rendendolo superiore per l'analisi sportiva e le applicazioni sanitarie.
Addestramento e Utilizzo
Uno dei punti di forza dell'ecosistema Ultralytics è l'API unificata. Sia che si utilizzi YOLOv5 (tramite il pacchetto moderno) o YOLO26, il codice rimane coerente e semplice.
Esempio di Codice python
Ecco come è possibile addestrare ed effettuare inferenze con entrambi i modelli utilizzando il ultralytics pacchetto. Si noti che per YOLOv5, il pacchetto moderno utilizza i yolov5u pesi (adattati anchor-free) per impostazione predefinita per una migliore compatibilità, ma il confronto è valido per l'architettura.
from ultralytics import YOLO
# Load the models
model_v5 = YOLO("yolov5s.pt") # Legacy standard
model_26 = YOLO("yolo26n.pt") # New NMS-free standard
# Comparison: Inference on an image
# YOLO26 requires no NMS post-processing arguments in export/deployment
results_v5 = model_v5("https://ultralytics.com/images/bus.jpg")
results_26 = model_26("https://ultralytics.com/images/bus.jpg")
# Print results to see speed differences
print(f"YOLOv5 Speed: {results_v5[0].speed}")
print(f"YOLO26 Speed: {results_26[0].speed}")
# Train YOLO26 on custom data
# The MuSGD optimizer is handled automatically
results = model_26.train(data="coco8.yaml", epochs=100, imgsz=640)
La Piattaforma Ultralytics (precedentemente HUB) semplifica ulteriormente questo processo consentendo di gestire i dataset e addestrare entrambi i modelli nel cloud senza scrivere codice, sebbene YOLO26 sia l'impostazione predefinita consigliata per i nuovi progetti creati sulla piattaforma.
Distribuzione ed ecosistema
YOLOv5 ha un vasto ecosistema legacy. Esistono migliaia di tutorial, repository di terze parti e integrazioni hardware scritti specificamente per i yolov5 formati. Se si lavora con una pipeline hardware rigida e più datata che richiede rigorosamente la forma esatta del tensor di output di YOLOv5, rimane una scelta valida.
Tuttavia, per il deployment moderno, YOLO26 offre opzioni di esportazione superiori.
- Edge AI: La rimozione di DFL e NMS rende i modelli YOLO26 significativamente più facili da convertire in formati come TensorRT e OpenVINO.
- Quantizzazione: YOLO26 è progettato per essere compatibile con la quantizzazione, mantenendo una maggiore precisione quando convertito in INT8 per i processori mobili.
Conclusione
Mentre YOLOv5 rimane un modello leggendario che ha democratizzato il rilevamento degli oggetti, YOLO26 rappresenta il futuro. Con il suo design end-to-end NMS-free, la rimozione di funzioni di perdita pesanti e l'integrazione di ottimizzatori ispirati agli LLM come MuSGD, YOLO26 offre un profilo di prestazioni che YOLOv5 semplicemente non può eguagliare.
Per gli sviluppatori che avviano nuovi progetti, YOLO26 è la chiara raccomandazione. Offre una maggiore precisione con una latenza inferiore, un consumo di memoria ridotto e un percorso di deployment più semplice.
Esplora altri modelli
Per gli utenti interessati ad architetture specializzate, si consideri di esplorare YOLO11, il diretto predecessore di YOLO26 che offre eccellenti prestazioni per scopi generali, o YOLO-World per compiti di rilevamento a vocabolario aperto dove è necessario rilevare oggetti non presenti nel set di addestramento.