Vai al contenuto

YOLOv5 vs YOLO11: Un Confronto Tecnico

La scelta del modello di object detection giusto è una decisione critica che bilancia la necessità di accuratezza, velocità ed efficienza delle risorse. Questa pagina fornisce un confronto tecnico dettagliato tra due modelli di riferimento di Ultralytics: l'ampiamente adottato Ultralytics YOLOv5 e l'all'avanguardia Ultralytics YOLO11. Mentre YOLOv5 ha stabilito uno standard industriale per performance e facilità d'uso, YOLO11 rappresenta la prossima evoluzione, offrendo accuratezza superiore, maggiore versatilità ed efficienza migliorata all'interno dello stesso potente ecosistema Ultralytics.

Ultralytics YOLOv5: Lo standard industriale consolidato

Rilasciato nel 2020, YOLOv5 è diventato rapidamente uno dei modelli di object detection più popolari al mondo. La sua reputazione si basa su un'eccezionale combinazione di velocità, affidabilità e facilità d'uso, rendendolo una scelta ideale per innumerevoli sviluppatori e ricercatori.

Dettagli tecnici:

Architettura e caratteristiche principali

YOLOv5 è costruito su PyTorch e presenta un backbone CSPDarknet53 combinato con un neck PANet per un'efficace aggregazione delle feature. La sua architettura è altamente scalabile, offrendo una gamma di modelli dal piccolo e veloce YOLOv5n al grande e preciso YOLOv5x. Una caratteristica fondamentale di YOLOv5 è la sua detection head anchor-based, che era molto efficace al momento del suo rilascio.

Punti di forza

  • Velocità di inferenza eccezionale: YOLOv5 è altamente ottimizzato per l'inferenza rapida, il che lo rende una scelta solida per le applicazioni in tempo reale, specialmente su hardware GPU.
  • Ecosistema Maturo: Essendo un modello ben consolidato, YOLOv5 beneficia di una vasta comunità, tutorial estesi e un ampio supporto di terze parti. È stato ampiamente testato in numerosi ambienti di produzione.
  • Facilità d'uso: Rinomato per la sua API semplice e la documentazione completa, YOLOv5 consente una prototipazione e una distribuzione rapide. Il modello è perfettamente integrato nell'ecosistema Ultralytics, incluso Ultralytics HUB per l'addestramento senza codice.
  • Efficienza di addestramento: YOLOv5 offre un processo di addestramento efficiente con pesi pre-addestrati facilmente disponibili, consentendo un efficace transfer learning e cicli di sviluppo più rapidi.

Punti deboli

  • Rilevamento basato su anchor: La sua dipendenza da anchor box predefiniti a volte può richiedere un'attenta messa a punto per dataset con oggetti di forma insolita, una limitazione affrontata dai più recenti rilevatori anchor-free.
  • Limite massimo di precisione: Pur rimanendo molto preciso, le sue prestazioni su benchmark come COCO sono state superate da architetture più recenti come YOLO11.

Casi d'uso ideali

YOLOv5 rimane una scelta eccellente per le applicazioni in cui velocità e stabilità sono fondamentali:

  • Edge Computing: Le sue varianti più piccole sono perfette per l'implementazione su dispositivi con risorse limitate come Raspberry Pi e NVIDIA Jetson.
  • Sorveglianza in tempo reale: Alimenta i sistemi di sicurezza e le applicazioni di monitoraggio che richiedono un elevato FPS.
  • Automazione industriale: Utilizzato per il controllo qualità e l'automazione dei processi negli ambienti di produzione.

Scopri di più su YOLOv5

Ultralytics YOLO11: La prossima evoluzione nell'IA visiva

YOLO11 è l'ultimo modello all'avanguardia di Ultralytics, progettato per superare i limiti di ciò che è possibile nella computer vision. Si basa sui successi dei suoi predecessori, tra cui YOLOv8, per offrire miglioramenti significativi in termini di accuratezza, velocità e versatilità.

Dettagli tecnici:

Architettura e caratteristiche principali

YOLO11 introduce un'architettura di rete perfezionata con funzionalità avanzate di estrazione delle caratteristiche e un design semplificato. Un importante progresso è la sua detection head anchor-free, che migliora la generalizzazione e semplifica il processo di addestramento. Questo design moderno consente a YOLO11 di ottenere una maggiore accuratezza con un uso più efficiente dei parametri, portando a velocità di inferenza più elevate e a minori esigenze computazionali.

Punti di forza

  • Prestazioni all'avanguardia: YOLO11 stabilisce un nuovo standard di accuratezza, raggiungendo punteggi mAP più elevati rispetto a YOLOv5 per tutte le dimensioni dei modelli.
  • Versatilità Migliorata: YOLO11 è un vero framework multi-tasking, che supporta object detection, instance segmentation, image classification, pose estimation e oriented bounding boxes (OBB) all'interno di un singolo modello unificato.
  • Efficienza superiore: Il modello è altamente efficiente e offre un miglior compromesso tra velocità e precisione. In particolare, dimostra un'inferenza significativamente più veloce sulle CPU rispetto a YOLOv5, rendendolo accessibile a una gamma più ampia di hardware. Richiede inoltre meno memoria per l'addestramento e l'inferenza rispetto a molte altre architetture.
  • Esperienza utente semplificata: Come parte dell'ecosistema Ultralytics, YOLO11 mantiene lo stesso impegno per la facilità d'uso con una semplice API Python, una potente CLI e una documentazione completa.

Punti deboli

  • Richiesta Computazionale per Modelli Grandi: Pur essendo altamente efficienti, i modelli YOLO11 più grandi (ad esempio, YOLO11x) richiedono comunque risorse computazionali sostanziali per ottenere la massima precisione.
  • Integrazioni in evoluzione: Essendo un modello più recente, l'ecosistema di strumenti e integrazioni di terze parti è in rapida crescita, ma potrebbe non essere ancora così esteso come quello di YOLOv5, che è consolidato da tempo.

Casi d'uso ideali

YOLO11 è la scelta ideale per i nuovi progetti che richiedono i massimi livelli di accuratezza e flessibilità:

  • Robotica avanzata: Permette un'interazione precisa con gli oggetti e la navigazione in ambienti complessi e dinamici.
  • Sanità e imaging medicale: Supporta task come il rilevamento di tumori dove l'alta precisione è fondamentale.
  • Smart City: Potenzia sistemi sofisticati di gestione del traffico e sicurezza pubblica.
  • Analisi Dati nel Retail: Miglioramento della gestione dell'inventario e analisi del comportamento dei clienti con maggiore precisione.

Scopri di più su YOLO11

Confronto diretto delle prestazioni: YOLOv5 contro YOLO11

Le metriche di performance illustrano chiaramente i progressi compiuti con YOLO11. In generale, i modelli YOLO11 offrono un aumento significativo del mAP mantenendo o addirittura migliorando la velocità di inferenza. Ad esempio, YOLO11s raggiunge un mAP di 47.0, paragonabile a YOLOv5l, ma con molti meno parametri e un'inferenza su CPU significativamente più veloce. Allo stesso modo, YOLO11m supera YOLOv5x in accuratezza (51.5 contro 50.7 mAP) pur essendo oltre 4 volte più veloce su una CPU.

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4
YOLO11n 640 39.5 56.1 1.5 2.6 6.5
YOLO11s 640 47.0 90.0 2.5 9.4 21.5
YOLO11m 640 51.5 183.2 4.7 20.1 68.0
YOLO11l 640 53.4 238.6 6.2 25.3 86.9
YOLO11x 640 54.7 462.8 11.3 56.9 194.9

Conclusione: Quale modello dovresti scegliere?

Sebbene YOLOv5 rimanga un modello solido e affidabile, YOLO11 è il chiaro successore e la scelta consigliata per quasi tutti i nuovi progetti. Offre un notevole salto di qualità in termini di prestazioni, fornendo maggiore accuratezza, maggiore versatilità nelle attività e una migliore efficienza senza sacrificare la facilità d'uso che ha reso i suoi predecessori così popolari.

  • Scegli YOLOv5 se stai lavorando a un progetto legacy che già la utilizza, o se il tuo vincolo principale è la distribuzione su hardware dove le sue specifiche ottimizzazioni della velocità della GPU forniscono un vantaggio fondamentale.

  • Scegli YOLO11 per qualsiasi nuova applicazione. La sua accuratezza superiore, il design senza ancore, le capacità multi-task e le eccellenti prestazioni sia su CPU che su GPU la rendono la soluzione più potente, flessibile e a prova di futuro.

Entrambi i modelli sono supportati dal robusto ecosistema Ultralytics, garantendo un'esperienza di sviluppo fluida con eccellente supporto e documentazione.

Esplora altri confronti tra modelli

Se sei interessato a come questi modelli si confrontano con altre architetture leader, consulta le nostre altre pagine di confronto:



📅 Creato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti