Vai al contenuto

Confronto tra modelli: YOLOv6-3.0 e YOLOv5 per il rilevamento di oggetti

La scelta del modello di rilevamento oggetti ottimale è fondamentale per applicazioni di computer vision di successo. Sia Meituan YOLOv6-3.0 che Ultralytics YOLOv5 sono scelte popolari note per la loro efficienza e accuratezza. Questa pagina fornisce un confronto tecnico per aiutarti a decidere quale modello si adatta meglio alle esigenze del tuo progetto. Approfondiamo le loro sfumature architetturali, i benchmark di performance, gli approcci di training e le applicazioni adatte, evidenziando i punti di forza dell'ecosistema Ultralytics.

Meituan YOLOv6-3.0

YOLOv6-3.0, sviluppato da Meituan, è un framework di rilevamento oggetti progettato principalmente per applicazioni industriali. Rilasciato all'inizio del 2023, mirava a fornire un equilibrio tra velocità e precisione adatto per scenari di implementazione nel mondo reale.

Architettura e caratteristiche principali

YOLOv6 ha introdotto modifiche architetturali come un backbone efficiente e riparametrizzabile e un design del neck semplificato. La versione 3.0 ha ulteriormente perfezionato questi elementi e incorporato tecniche come l'auto-distillazione durante l'addestramento per aumentare le prestazioni. Offre inoltre modelli specifici ottimizzati per il deployment mobile (YOLOv6Lite).

Punti di forza

  • Buon compromesso tra velocità e precisione: Offre prestazioni competitive, in particolare per le attività di object detection industriale su GPU.
  • Supporto per la quantizzazione: Fornisce strumenti e tutorial per la quantizzazione del modello, utile per la distribuzione su hardware con risorse limitate.
  • Ottimizzazione Mobile: Include varianti YOLOv6Lite specificamente progettate per l'inferenza su dispositivi mobili o basati su CPU.

Punti deboli

  • Versatilità limitata nei task: Principalmente focalizzato sul rilevamento di oggetti, mancando del supporto nativo per la segmentazione delle istanze, la classificazione delle immagini e la stima della posa presente nei modelli Ultralytics come YOLOv8.
  • Ecosistema e manutenzione: Pur essendo open source, l'ecosistema non è così completo o attivamente manutenuto come la piattaforma Ultralytics. Ciò può comportare aggiornamenti più lenti, meno supporto della community e un'esperienza utente più complessa.
  • Maggiore utilizzo di risorse: Come si evince dalla tabella delle prestazioni, i modelli YOLOv6 più grandi possono avere più parametri e FLOP rispetto ai modelli YOLOv5 comparabili, richiedendo potenzialmente maggiori risorse computazionali.

Scopri di più su YOLOv6

Ultralytics YOLOv5

Ultralytics YOLOv5 è un modello di rilevamento oggetti single-stage, rinomato per la sua velocità, facilità d'uso e adattabilità. Sviluppato da Ultralytics, rappresenta un passo significativo nel rendere accessibile l'object detection ad alte prestazioni a un vasto pubblico.

Costruito interamente in PyTorchYOLOv5 è dotato di una struttura portante CSPDarknet53 e di un collo PANet per un'efficiente estrazione e fusione delle caratteristiche. La sua architettura è altamente modulare e consente di scalare facilmente tra modelli di diverse dimensioni (n, s, m, l, x) per soddisfare diversi requisiti di prestazione.

Punti di forza di YOLOv5

  • Speed and Efficiency: YOLOv5 eccelle nella velocità di inferenza, rendendolo ideale per le applicazioni in tempo reale e la distribuzione su dispositivi edge con risorse limitate. Le sue prestazioni della CPU sono particolarmente degne di nota.
  • Facilità d'uso: Noto per la sua semplicità, YOLOv5 offre un'esperienza utente semplificata con una semplice API, documentazione completa e numerosi tutorial.
  • Ecosistema ben manutenuto: Beneficia dell'ecosistema Ultralytics integrato, che include sviluppo attivo, un forte supporto della community, aggiornamenti frequenti e una perfetta integrazione con Ultralytics HUB per MLOps.
  • Bilanciamento delle prestazioni: Ottiene un forte compromesso tra velocità e accuratezza, adatto a diversi scenari di implementazione nel mondo reale.
  • Efficienza di addestramento: Offre processi di addestramento efficienti, pesi pre-addestrati facilmente disponibili e requisiti di memoria inferiori rispetto a molte altre architetture, specialmente i modelli basati su transformer.
  • Versatilità: Supporta diverse attività, tra cui object detection, instance segmentation e image classification all'interno di un framework unificato.

Punti deboli di YOLOv5

  • Accuratezza di picco: Pur essendo molto accurati ed efficienti, i modelli più recenti come YOLOv6-3.0 o Ultralytics YOLOv8 possono offrire un mAP leggermente superiore su determinati benchmark, in particolare le varianti di modelli più grandi su GPU.

Scopri di più su YOLOv5

Confronto diretto delle prestazioni: YOLOv6-3.0 contro YOLOv5

La tabella seguente fornisce un confronto dettagliato delle prestazioni tra i modelli YOLOv6-3.0 e YOLOv5 sul dataset COCO.

Modello dimensione
(pixel)
mAPval
50-95
Velocità
CPU ONNX
(ms)
Velocità
T4 TensorRT10
(ms)
parametri
(M)
FLOPs
(B)
YOLOv6-3.0n 640 37.5 - 1.17 4.7 11.4
YOLOv6-3.0s 640 45.0 - 2.66 18.5 45.3
YOLOv6-3.0m 640 50.0 - 5.28 34.9 85.8
YOLOv6-3.0l 640 52.8 - 8.95 59.6 150.7
YOLOv5n 640 28.0 73.6 1.12 2.6 7.7
YOLOv5s 640 37.4 120.7 1.92 9.1 24.0
YOLOv5m 640 45.4 233.9 4.03 25.1 64.2
YOLOv5l 640 49.0 408.4 6.61 53.2 135.0
YOLOv5x 640 50.7 763.2 11.89 97.2 246.4

Dai dati, i modelli YOLOv6-3.0 tendono a ottenere punteggi mAP più elevati per le rispettive dimensioni su GPU. Tuttavia, Ultralytics YOLOv5 dimostra un equilibrio superiore di prestazioni, in particolare in termini di velocità della CPU ed efficienza del modello. Ad esempio, YOLOv5n è significativamente più veloce su CPU e ha meno parametri e FLOP di qualsiasi modello YOLOv6-3.0, il che lo rende una scelta eccellente per applicazioni leggere e in tempo reale. Mentre YOLOv6-3.0l ha il mAP più alto, YOLOv5x fornisce un mAP competitivo con un framework ben documentato e supportato.

Metodologia di Addestramento

Entrambi i modelli sfruttano tecniche standard di deep learning per l'addestramento su grandi dataset come COCO. Ultralytics YOLOv5 beneficia significativamente dell'ecosistema Ultralytics, offrendo flussi di lavoro di addestramento semplificati, ampie guide, ottimizzazione AutoAnchor e integrazione con strumenti come Weights & Biases e ClearML per il tracciamento degli esperimenti. L'addestramento di YOLOv6-3.0 segue le procedure delineate nel suo repository, che potrebbe richiedere una configurazione più manuale e mancare degli strumenti MLOps integrati della piattaforma Ultralytics.

Casi d'uso ideali

  • Meituan YOLOv6-3.0: Un forte contendente quando l'obiettivo primario è massimizzare l'accuratezza su GPU, pur richiedendo un'inferenza rapida. È adatto per applicazioni industriali in cui i lievi miglioramenti della mAP rispetto a YOLOv5 giustificano una potenziale maggiore complessità o un minore supporto dell'ecosistema, come nell'automazione industriale specializzata.
  • Ultralytics YOLOv5: Altamente raccomandato per applicazioni che richiedono prestazioni in tempo reale e facilità di implementazione, specialmente su CPU o dispositivi edge. La sua versatilità, l'ampio supporto e l'uso efficiente delle risorse lo rendono ideale per la prototipazione rapida, le applicazioni mobili, la videosorveglianza e i progetti che beneficiano di un ecosistema maturo e ben documentato.

Conclusione

Ultralytics YOLOv5 rimane una scelta eccezionale, particolarmente apprezzata per la sua velocità, facilità d'uso e robusto ecosistema. Offre un eccellente equilibrio tra prestazioni ed efficienza, supportato da una vasta documentazione e dal supporto della comunità, rendendolo altamente accessibile a sviluppatori e ricercatori.

YOLOv6-3.0 offre prestazioni competitive, in particolare in termini di mAP di picco per modelli più grandi su GPU. Rappresenta una valida alternativa per gli utenti che danno priorità alla massima precisione possibile all'interno del framework YOLO, specialmente per applicazioni industriali.

Per chi fosse interessato alle ultime novità, consigliamo di esplorare i modelli Ultralytics più recenti come YOLOv8, YOLOv9, YOLOv10 e YOLO11, che offrono ulteriori miglioramenti in termini di prestazioni, versatilità ed efficienza. Anche i modelli specializzati come RT-DETR offrono vantaggi unici per casi d'uso specifici.

Esplora la gamma completa di opzioni nella Documentazione dei modelli Ultralytics.



📅 Creato 1 anno fa ✏️ Aggiornato 1 mese fa

Commenti