YOLOv5 vs. YOLO26: Evoluzione del Detect di Oggetti in Tempo Reale
L'evoluzione del rilevamento degli oggetti è stata caratterizzata da significativi progressi in termini di velocità, precisione e facilità d'uso. Questo confronto approfondisce YOLOv5, il leggendario modello che ha democratizzato la Vision AI, e YOLO26, l'ultima architettura all'avanguardia di Ultralytics per l'efficienza edge di nuova generazione e le prestazioni end-to-end.
Entrambi i modelli rappresentano momenti cruciali nella storia della visione artificiale. Mentre YOLOv5 lo standard per l'usabilità e l'adozione da parte della comunità nel 2020, YOLO26 ridefinisce il panorama nel 2026 con un'architettura end-to-end NMS, un'ottimizzazione ispirata all'LLM e CPU senza pari.
YOLOv5: il preferito dalla community
YOLOv5 è stato rilasciato nel giugno 2020 da Ultralytics, segnando un passaggio allo sviluppo PyTorch. È diventato famoso non solo per le sue prestazioni, ma anche per la sua impareggiabile facilità d'uso, rendendo la visione artificiale avanzata accessibile a sviluppatori e ricercatori di tutto il mondo.
- Autori: Glenn Jocher
- Organizzazione:Ultralytics
- Data: 2020-06-26
- GitHub:https://github.com/ultralytics/yolov5
- Documentazione:https://docs.ultralytics.com/models/yolov5/
Architettura e punti di forza
YOLOv5 un'architettura semplificata incentrata sull'esperienza utente dell'IA. Ha utilizzato una dorsale CSP-Darknet53 e un collo Path Aggregation Network (PANet), che ha migliorato la propagazione delle caratteristiche su scale diverse.
Le caratteristiche principali includono:
- Aumento dei dati mosaico: una tecnica di addestramento che combina quattro immagini in una sola, migliorando significativamente la capacità del modello di detect oggetti detect e generalizzare in nuovi contesti.
- Anchor box con apprendimento automatico: il modello apprende automaticamente le dimensioni ottimali degli anchor box per il tuo set di dati personalizzato prima dell'inizio dell'addestramento.
- Facilità di implementazione: supporto nativo per l'esportazione in formati come ONNX, CoreMLe TFLite lo hanno reso uno strumento indispensabile per le applicazioni mobili e edge.
YOLO26: il nuovo standard per l'efficienza
Rilasciato nel gennaio 2026, YOLO26 si basa sull'eredità dei suoi predecessori, ma introduce cambiamenti architettonici radicali. È progettato per essere il modello definitivo "edge-first", che dà priorità alla velocità CPU senza sacrificare i miglioramenti in termini di precisione ottenuti negli ultimi anni.
- Autori: Glenn Jocher e Jing Qiu
- Organizzazione:Ultralytics
- Data: 2026-01-14
- GitHub:https://github.com/ultralytics/ultralytics
- Documenti:ultralytics
Caratteristiche innovative
YOLO26 integra diverse innovazioni all'avanguardia che lo distinguono dalla classica YOLOv5 :
- End-to-end nativo (NMS): a differenza di YOLOv5, che richiede la soppressione non massima (NMS) per filtrare i riquadri sovrapposti durante la post-elaborazione, YOLO26 è end-to-end nativo. Ciò elimina la variazione di latenza causata NMS, garantendo tempi di inferenza costanti, fondamentali per i sistemi di controllo in tempo reale nella robotica e nella guida autonoma.
- Ottimizzatore MuSGD: ispirato alla stabilità di addestramento dei modelli linguistici di grandi dimensioni (LLM) come Kimi K2 di Moonshot AI, YOLO26 utilizza un ottimizzatore ibrido che combina SGD Muon. Ciò conferisce alle attività di visione le proprietà di convergenza degli LLM.
- Rimozione DFL: rimuovendo la perdita focale di distribuzione, la struttura del modello viene semplificata, consentendo esportazioni più pulite e una migliore compatibilità con dispositivi edge a bassa potenza e acceleratori come Coral Edge TPU.
- ProgLoss + STAL: le nuove funzioni di perdita (ProgLoss e STAL) apportano miglioramenti significativi nel riconoscimento di oggetti di piccole dimensioni, un punto debole tradizionale per molti rilevatori in tempo reale.
Bilanciamento delle prestazioni
YOLO26 raggiunge un equilibrio straordinario, offrendo CPU fino al 43% più veloce rispetto alle generazioni precedenti, pur mantenendo una maggiore precisione. Ciò lo rende ideale per i dispositivi in cui GPU sono scarse o non disponibili.
Confronto tecnico: metriche delle prestazioni
La tabella seguente evidenzia le differenze di prestazioni tra YOLOv5 YOLO26. Sebbene YOLOv5 un modello valido, YOLO26 dimostra un'efficienza e una precisione superiori su tutte le scale del modello.
| Modello | dimensione (pixel) | mAPval 50-95 | Velocità CPU ONNX (ms) | Velocità T4 TensorRT10 (ms) | parametri (M) | FLOPs (B) |
|---|---|---|---|---|---|---|
| YOLOv5n | 640 | 28.0 | 73.6 | 1.12 | 2.6 | 7.7 |
| YOLOv5s | 640 | 37.4 | 120.7 | 1.92 | 9.1 | 24.0 |
| YOLOv5m | 640 | 45.4 | 233.9 | 4.03 | 25.1 | 64.2 |
| YOLOv5l | 640 | 49.0 | 408.4 | 6.61 | 53.2 | 135.0 |
| YOLOv5x | 640 | 50.7 | 763.2 | 11.89 | 97.2 | 246.4 |
| YOLO26n | 640 | 40.9 | 38.9 | 1.7 | 2.4 | 5.4 |
| YOLO26s | 640 | 48.6 | 87.2 | 2.5 | 9.5 | 20.7 |
| YOLO26m | 640 | 53.1 | 220.0 | 4.7 | 20.4 | 68.2 |
| YOLO26l | 640 | 55.0 | 286.2 | 6.2 | 24.8 | 86.4 |
| YOLO26x | 640 | 57.5 | 525.8 | 11.8 | 55.7 | 193.9 |
Nota: il notevole aumento di velocità di YOLO26 su CPU ONNX) è dovuto alla sua architettura semplificata e all'eliminazione di complesse fasi di post-elaborazione.
Metodologie di training ed ecosistema
Uno dei principali vantaggi della scelta Ultralytics è l'ecosistema condiviso. Il passaggio da YOLOv5 YOLO26 è semplice perché entrambi sono supportati dal ultralytics Python e il Ultralytics Platform.
Facilità d'uso e API
Entrambi i modelli sfruttano un'API unificata che semplifica l'intero ciclo di vita dell'IA. Che utilizziate la CLI Python, la sintassi rimane intuitiva.
from ultralytics import YOLO
# Load a model (YOLOv5 or YOLO26)
model = YOLO("yolo26n.pt") # Switch to 'yolov5s.pt' seamlessly
# Train on a custom dataset
model.train(data="coco8.yaml", epochs=100, imgsz=640)
# Validate performance
metrics = model.val()
Efficienza dell'addestramento
YOLOv5 ha fissato lo standard per un addestramento efficiente, introducendo funzionalità come "AutoBatch" per massimizzare GPU . YOLO26 fa un ulteriore passo avanti con MuSGD Optimizer. Stabilizzando le dinamiche di addestramento, YOLO26 converge spesso più rapidamente, richiedendo un numero inferiore di epoche per raggiungere la massima precisione. Ciò si traduce in costi di elaborazione cloud inferiori e cicli di iterazione più rapidi per i ricercatori.
Inoltre, i requisiti di memoria ridotti di YOLO26 consentono dimensioni di batch più grandi su hardware di livello consumer rispetto alle architetture basate su trasformatori come RT-DETR.
Applicazioni nel mondo reale
La scelta tra questi modelli dipende spesso dall'hardware di implementazione e dai requisiti specifici del caso d'uso.
Edge Computing e IoT
Per le applicazioni in esecuzione su Raspberry Pi o telefoni cellulari, YOLO26 è il chiaro vincitore. CPU sua CPU fino al 43% più veloce e la rimozione di NMS lo NMS incredibilmente reattivo per attività come la gestione intelligente dei parcheggi o la scansione dell'inventario con dispositivi portatili. La rimozione della Distribution Focal Loss (DFL) semplifica anche la conversione in quantizzazione intera per i microcontrollori.
Robotica e sistemi autonomi
Nella robotica, la coerenza della latenza è fondamentale. Il design end-to-end NMS di YOLO26 garantisce che il tempo di inferenza sia deterministico, evitando il tempo di elaborazione variabile introdotto NMS le scene diventano affollate. Questa affidabilità è fondamentale per i sistemi di navigazione autonoma e di prevenzione delle collisioni.
Supporto dei sistemi legacy
YOLOv5 rimane una scelta solida per i sistemi legacy in cui la pipeline di implementazione è già rigidamente definita attorno YOLOv5 (ad esempio, tensor specifiche previste dai bitstream FPGA più vecchi). Il suo enorme supporto da parte della comunità e gli anni di test sul campo significano che le soluzioni per quasi tutti i casi limite sono prontamente disponibili nei forum e nelle issue di GitHub.
Versatilità: oltre il rilevamento
Mentre YOLOv5 per supportare la segmentazione nelle versioni successive (v7.0), YOLO26 è stato progettato fin dall'inizio come un sistema di apprendimento multi-task.
- Segmentazione delle istanze: YOLO26 include miglioramenti specifici per determinate attività, come la perdita di segmentazione semantica e i moduli proto multiscala, che migliorano la qualità delle maschere per attività come l'analisi delle immagini mediche.
- Stima della posa: grazie alla stima della log-verosimiglianza residua (RLE), YOLO26 offre una precisione superiore dei punti chiave per la stima della posa umana nell'analisi sportiva.
- Oriented Bounding Boxes (OBB): per le immagini aeree e i dati satellitari, la perdita angolare specializzata di YOLO26 risolve i problemi di confine comuni nel rilevamento di oggetti ruotati, rendendolo superiore per le attività OBB.
Conclusione
Sia YOLOv5 YOLO26 dimostrano Ultralytics nel rendere l'IA facile, veloce e accurata. YOLOv5 rimane un classico, affidabile e con una presenza massiccia nel settore. Tuttavia, per i nuovi progetti nel 2026, YOLO26 offre un percorso di aggiornamento interessante.
Con il suo designNMS, l'ottimizzatore MuSGD e CPU eccezionali CPU , YOLO26 non è solo un aggiornamento incrementale, ma un vero e proprio balzo in avanti per l'edge AI. Unificando rilevamento, segmentazione, posa e classificazione in un unico framework efficiente, Ultralytics agli sviluppatori gli strumenti migliori per risolvere oggi le sfide di domani nel campo della visione artificiale.
Per gli sviluppatori interessati a esplorare altre architetture moderne, il YOLO11 offre prestazioni eccellenti, anche se YOLO26 rimane la scelta migliore per il suo equilibrio tra velocità e funzionalità di nuova generazione.