Vai al contenuto

YOLO11 vs YOLOv5: Un'evoluzione tecnica nel rilevamento di oggetti

La scelta del modello di object detection più adatto è una decisione fondamentale che bilancia la necessità di accuratezza, velocità e facilità di implementazione. Questa pagina offre un confronto tecnico completo tra due modelli di riferimento di Ultralytics: l'innovativo Ultralytics YOLO11 e l'ampiamente adottato Ultralytics YOLOv5. Mentre YOLOv5 ha stabilito uno standard di settore per le sue prestazioni e usabilità, YOLO11 rappresenta il successivo passo evolutivo, offrendo un'accuratezza superiore, una maggiore versatilità e le più recenti innovazioni architetturali, il tutto all'interno del robusto e intuitivo ecosistema Ultralytics.

Ultralytics YOLO11: Il nuovo stato dell'arte

YOLO11, creato da Glenn Jocher e Jing Qiu, è il modello più recente e avanzato della serie Ultralytics YOLO. Rilasciato nel 2024, si basa sulle solide fondamenta dei suoi predecessori come YOLOv8 per stabilire un nuovo punto di riferimento in termini di prestazioni ed efficienza. È progettato non solo per il rilevamento di oggetti, ma come framework completo per una moltitudine di attività di computer vision.

Architettura e caratteristiche principali

YOLO11 introduce significativi perfezionamenti architetturali, tra cui una detection head anchor-free e una struttura di rete ottimizzata. Questa moderna scelta di design semplifica il processo di addestramento eliminando la necessità di predefinire le anchor box, portando a una migliore generalizzazione su diversi set di dati. Il modello raggiunge una precisione media media (mAP) più alta rispetto a YOLOv5 con meno parametri e requisiti computazionali (FLOP) in molti casi, dimostrando un'efficienza superiore.

Una caratteristica distintiva di YOLO11 è la sua versatilità. È un framework unificato che supporta nativamente il rilevamento di oggetti, la segmentazione di istanze, la classificazione di immagini, la stima della posa e i bounding box orientati (OBB). Questa capacità multi-task lo rende uno strumento incredibilmente potente e flessibile per sistemi di IA complessi.

Punti di forza

  • Accuratezza all'avanguardia: Offre punteggi mAP significativamente più alti rispetto a YOLOv5, stabilendo un nuovo standard di prestazioni.
  • Elevata efficienza: Ottiene una migliore precisione con un'architettura più efficiente, spesso richiedendo meno parametri e FLOP.
  • Design senza anchor: Semplifica il training e migliora le prestazioni rimuovendo la dipendenza dalla configurazione delle anchor box.
  • Versatilità Multi-Task: Un singolo framework per un'ampia gamma di attività di visione, semplificando lo sviluppo di applicazioni multiformi.
  • Ecosistema ben manutenuto: Benefici derivanti da sviluppo continuo, documentazione completa, forte supporto della comunità e integrazione perfetta con strumenti come Ultralytics HUB per MLOps.
  • Efficienza di addestramento: Offre processi di addestramento efficienti con pesi pre-addestrati facilmente disponibili e in genere richiede un utilizzo inferiore della memoria rispetto ad architetture più complesse come i transformer.

Punti deboli

  • Essendo un modello all'avanguardia, le varianti più grandi di YOLO11 possono essere computazionalmente intensive, richiedendo hardware GPU moderno per prestazioni ottimali.

Casi d'uso ideali

YOLO11 è la scelta ideale per i nuovi progetti che richiedono la massima accuratezza e flessibilità:

  • Robotica avanzata: Per un'interazione precisa con gli oggetti e la navigazione in ambienti dinamici.
  • Automazione industriale: Controllo qualità e rilevamento dei difetti ad alta precisione.
  • Sanità: Supporto nell'analisi di immagini medicali per task come il rilevamento di tumori.
  • Smart City: Potenzia sistemi complessi per la gestione del traffico e la sicurezza pubblica.

Scopri di più su YOLO11

YOLOv5: Lo strumento di lavoro affermato e versatile

Rilasciato nel 2020 da Glenn Jocher di Ultralytics, YOLOv5 è diventato rapidamente uno dei modelli di object detection più popolari al mondo. È apprezzato per l'eccezionale equilibrio tra velocità e precisione, la sua facilità d'uso e la sua implementazione robusta e ben documentata in PyTorch.

Architettura e caratteristiche principali

YOLOv5 utilizza un'architettura basata su un backbone CSPDarknet53 e un neck PANet per un'efficace aggregazione delle caratteristiche. Il suo detection head è basato su anchor, che era un approccio standard ed efficace al momento del suo rilascio. Uno dei maggiori punti di forza di YOLOv5 è la sua scalabilità, che offre una gamma di modelli dalla minuscola versione 'n' (nano) alla grande versione 'x' (extra-large), consentendo agli sviluppatori di scegliere facilmente tra velocità e precisione.

Punti di forza

  • Velocità di inferenza eccezionale: Altamente ottimizzato per le prestazioni in tempo reale, il che lo rende una scelta ideale per le applicazioni su dispositivi edge come NVIDIA Jetson.
  • Facilità d'uso: Rinomato per la sua API semplice, i tutorial completi e i flussi di lavoro semplificati di addestramento e distribuzione.
  • Ecosistema Maturo: Supportato da una vasta comunità, anni di sviluppo attivo e innumerevoli implementazioni nel mondo reale, garantendo stabilità e affidabilità.
  • Flessibilità: L'ampia gamma di dimensioni del modello lo rende adattabile a quasi tutti i vincoli hardware.

Punti deboli

  • Accuratezza Inferiore: Pur rimanendo potente, la sua accuratezza è superata da modelli più recenti come YOLO11.
  • Rilevamento basato su anchor: Si basa su anchor box predefiniti, che a volte possono richiedere una messa a punto manuale per ottenere prestazioni ottimali su dataset personalizzati rispetto ai moderni rilevatori anchor-free.

Casi d'uso ideali

YOLOv5 rimane una scelta eccellente per scenari specifici:

  • Edge Computing: Implementazione su dispositivi con risorse limitate come un Raspberry Pi dove la velocità di inferenza è la massima priorità.
  • Prototipazione rapida: La sua semplicità e velocità lo rendono perfetto per costruire e testare rapidamente applicazioni proof-of-concept.
  • Sistemi legacy: Mantenimento o aggiornamento di progetti esistenti basati sul framework YOLOv5.
  • Sorveglianza in tempo reale: Alimenta i sistemi di sicurezza dove un elevato FPS è cruciale.

Scopri di più su YOLOv5

Prestazioni e benchmark: YOLO11 contro YOLOv5

Le metriche di performance illustrano chiaramente l'evoluzione da YOLOv5 a YOLO11. Sul dataset COCO, i modelli YOLO11 raggiungono costantemente punteggi mAP più elevati rispetto alle loro controparti YOLOv5 di dimensioni simili. Ad esempio, YOLO11m raggiunge 51.5 mAP, superando significativamente il 45.4 mAP di YOLOv5m. Inoltre, YOLO11 spesso lo fa con una maggiore efficienza computazionale. In particolare, il modello più piccolo, YOLO11n, è più veloce su CPU rispetto a YOLOv5n, offrendo al contempo un aumento enorme di 11.5 punti nel mAP.

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Conclusione: Quale modello dovresti scegliere?

La scelta tra YOLO11 e YOLOv5 dipende dalle esigenze specifiche del tuo progetto.

YOLOv5 è un modello collaudato, affidabile e incredibilmente veloce. Rimane un'opzione fantastica per le applicazioni in cui la velocità è la priorità assoluta, specialmente su hardware più vecchio o con risorse limitate. La sua maturità e il vasto supporto della comunità forniscono una base stabile per molti progetti.

Tuttavia, per quasi tutti i nuovi progetti, YOLO11 è la scelta chiara e raccomandata. Rappresenta un significativo passo avanti, offrendo una precisione all'avanguardia, un'efficienza superiore e una versatilità senza pari. La sua architettura senza ancore e il supporto nativo per molteplici attività di visione la rendono una soluzione più potente, flessibile e a prova di futuro. Scegliendo YOLO11, gli sviluppatori sfruttano gli ultimi progressi dell'IA per creare applicazioni di computer vision più capaci e accurate, beneficiando al contempo dell'ecosistema Ultralytics semplificato e ben mantenuto.

Esplora altri confronti tra modelli

Se sei interessato a come questi modelli si confrontano con altre architetture leader, consulta le nostre altre pagine di confronto:



📅 Creato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti