Vai al contenuto

YOLOv8 vs YOLO11: evoluzione del rilevamento di oggetti in tempo reale

La scelta della giusta architettura di computer vision è una decisione cruciale che influisce sulla velocità, sulla precisione e sulla scalabilità dei vostri progetti di IA. Questa guida fornisce un confronto tecnico approfondito tra Ultralytics YOLOv8, uno standard di settore ampiamente adottato e rilasciato nel 2023, e Ultralytics YOLO11, l'ultima evoluzione della serie YOLO progettata per garantire efficienza e prestazioni superiori. Analizzeremo le loro differenze architettoniche, le metriche di benchmark e i casi d'uso ideali per aiutarvi a scegliere il modello migliore per le vostre esigenze.

Ultralytics YOLOv8

Autori: Glenn Jocher, Ayush Chaurasia e Jing Qiu
Organizzazione:Ultralytics
Data: 2023-01-10
GitHubultralytics
Docsyolov8

Rilasciato all'inizio del 2023, YOLOv8 ha segnato una tappa significativa nella storia del rilevamento degli oggetti. Ha introdotto un framework unificato che supporta diverse attività di computer vision, tra cui il rilevamento, la segmentazione dell'istanza, la stima della posa e la classificazione delle immagini, all'interno diun unico repository. YOLOv8 ha abbandonato il rilevamento basato sulle ancore per passare a un approccio privo di ancore, che semplifica la progettazione e migliora la generalizzazione tra le diverse forme di oggetto.

Architettura e caratteristiche principali

YOLOv8 ha sostituito i moduli C3 presenti in YOLOv5 con il modulo C2f (Cross-Stage Partial bottleneck con due convoluzioni). Questa modifica ha migliorato il flusso del gradiente e l'integrazione delle funzioni, pur mantenendo un'impronta leggera. L'architettura presenta anche una testa disaccoppiata, che separa i compiti di objectness, classificazione e regressione per aumentare la precisione.

Un'eredità di affidabilità

YOLOv8 è stato testato in migliaia di applicazioni commerciali, dall'automazione manifatturiera ai veicoli autonomi, consolidando una reputazione di stabilità e facilità di implementazione.

Punti di forza e debolezze

  • Punti di forza:
    • Ecosistema maturo: Supportato da una vasta gamma di tutorial, integrazioni e guide all'implementazione della comunità.
    • Versatilità: Supporta in modo nativo l'OBB (Oriented Bounding Box) e la classificazione oltre al rilevamento standard.
    • Stabilità comprovata: Una scelta sicura per gli ambienti di produzione che richiedono un modello con una lunga track .
  • Punti deboli:
    • Efficienza della velocità: Pur essendo veloce, è superato da YOLO11 per quanto riguarda la velocità di inferenza CPU e l'efficienza dei parametri.
    • Requisiti di calcolo: Le varianti più grandi (L, X) richiedono più VRAM e FLOP rispetto agli equivalenti ottimizzati di YOLO11 .
from ultralytics import YOLO

# Load a pretrained YOLOv8 model
model = YOLO("yolov8n.pt")

# Train the model on a custom dataset
model.train(data="coco8.yaml", epochs=50, imgsz=640)

Scopri di più su YOLOv8

Ultralytics YOLO11

Autori: Glenn Jocher e Jing Qiu
Organizzazione:Ultralytics
Data: 2024-09-27
GitHubultralytics
Docsyolo11

YOLO11 rappresenta la punta di diamante della famiglia di modelli Ultralytics . Progettato per ridefinire l'inferenza in tempo reale, si basa sui successi di YOLOv8 ma introduce sostanziali miglioramenti architetturali. YOLO11 si concentra sulla massimizzazione dell'accuratezza e sulla minimizzazione dei costi computazionali, rendendolo la scelta principale per le moderne applicazioni di intelligenza artificiale, dai dispositivi edge ai server cloud.

Architettura e caratteristiche principali

YOLO11 introduce il blocco C3k2 e il modulo C2PSA (Cross-Stage Partial with Spatial Attention). Questi componenti migliorano la capacità del modello di estrarre caratteristiche complesse e di gestire l'occlusione in modo più efficace rispetto alle precedenti iterazioni. L'architettura è ottimizzata per la velocità e offre tempi di elaborazione significativamente più rapidi sulle CPU, un fattore critico per le implementazioni di intelligenza artificiale in cui le risorse GPU potrebbero non essere disponibili.

Il modello mantiene l'interfaccia unificata caratteristica di Ultralytics, garantendo agli sviluppatori la possibilità di passare da un'attività all'altra, come l'OBB o la segmentazione, senza modificare il flusso di lavoro.

Punti di forza e debolezze

  • Punti di forza:
    • Efficienza superiore: Raggiunge un mAP più elevato con un numero di parametri fino al 22% inferiore rispetto a YOLOv8, riducendo le dimensioni del modello e le esigenze di archiviazione.
    • Inferenza più veloce: Ottimizzato specificamente per l'hardware moderno, offre velocità più elevate sia sulla CPU che sulla GPU .
    • Estrazione delle caratteristiche migliorata: La nuova struttura portante migliora il rilevamento di piccoli oggetti e le prestazioni nelle scene ingombre.
    • Minor utilizzo di memoria: Richiede meno memoria CUDA durante l'addestramento rispetto ai modelli basati su trasformatori come RT-DETRconsentendo l'addestramento su hardware più accessibile.
  • Punti deboli:
    • Rilascio più recente: Essendo un modello recente, specifici strumenti di nicchia di terze parti potrebbero richiedere del tempo per aggiornare completamente il supporto, anche se l'ecosistema principale di Ultralytics lo supporta fin dal primo giorno.
from ultralytics import YOLO

# Load the latest YOLO11 model
model = YOLO("yolo11n.pt")

# Run inference on an image
results = model("https://ultralytics.com/images/bus.jpg")
results[0].show()

Scopri di più su YOLO11

Testa a testa sulle prestazioni

Il confronto seguente evidenzia i guadagni di efficienza di YOLO11. Sebbene YOLOv8 rimanga un concorrente potente, YOLO11 offre costantemente una maggiore accuratezzamAP) con una minore complessità computazionale (FLOPs) e una maggiore velocità di inferenza. Ciò è particolarmente evidente nei modelli "Nano" e "Small", dove YOLO11n raggiunge un mAP di 39,5 rispetto al 37,3 di YOLOv8n, il tutto con un'esecuzione significativamente più veloce della CPU.

Modellodimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv8n64037.380.41.473.28.7
YOLOv8s64044.9128.42.6611.228.6
YOLOv8m64050.2234.75.8625.978.9
YOLOv8l64052.9375.29.0643.7165.2
YOLOv8x64053.9479.114.3768.2257.8
YOLO11n64039.556.11.52.66.5
YOLO11s64047.090.02.59.421.5
YOLO11m64051.5183.24.720.168.0
YOLO11l64053.4238.66.225.386.9
YOLO11x64054.7462.811.356.9194.9

Analisi metrica

YOLO11 dimostra un chiaro vantaggio nel compromesso velocità-accuratezza. Ad esempio, il modello YOLO11l supera YOLOv8l in termini di accuratezza (+0,5 mAP) pur utilizzando circa il 42% in meno di parametri e funzionando il 36% più velocemente sulla CPU.

Ecosistema e facilità d'uso

Entrambi i modelli beneficiano del robusto ecosistemaUltralytics , progettato per democratizzare l'IA rendendo accessibile a tutti una tecnologia all'avanguardia.

  • API unificata: Per passare da YOLOv8 a YOLO11 è sufficiente cambiare la stringa del modello da yolov8n.pt a yolo11n.pt. Non è necessaria alcuna rifattorizzazione del codice.
  • Efficienza della formazione: Ultralytics offre set di dati scaricabili automaticamente e pesi pre-addestrati, semplificando la pipeline dalla raccolta dei dati all'addestramento del modello.
  • Versatilità di distribuzione: Entrambi i modelli supportano l'esportazione con un solo clic in formati come ONNX, TensorRT, CoreML e TFLite, facilitando la distribuzione su hardware diversi, come Raspberry Pis, telefoni cellulari e istanze cloud.
  • Ben mantenuto: Aggiornamenti frequenti garantiscono la compatibilità con le ultime versioni di PyTorch e CUDA, grazie a una comunità attiva su Discord e GitHub.

Conclusione e raccomandazioni

Mentre YOLOv8 rimane un modello affidabile e altamente capace, adatto alla manutenzione di sistemi legacy, YOLO11 è la raccomandazione più chiara per tutti i nuovi sviluppi.

  • Scegliete YOLO11 se: Avete bisogno della massima accuratezza possibile, di velocità di inferenza più elevate (soprattutto sulla CPU) o di implementare il sistema su dispositivi edge con risorse limitate, dove la memoria e l'archiviazione sono un fattore determinante. I suoi miglioramenti architettonici forniscono una base a prova di futuro per le applicazioni commerciali.
  • Scegliete YOLOv8 se: Si dispone di una pipeline esistente pesantemente sintonizzata per i comportamenti specifici della v8 o si è vincolati da rigidi requisiti di progetto che impediscono l'aggiornamento all'architettura più recente.

Per coloro che sono interessati ad esplorare altre architetture, i documenti di Ultralytics trattano anche modelli come YOLOv9, YOLOv10e RT-DETR. È possibile visualizzare confronti più ampi nella nostra pagina di confronto dei modelli.


Commenti