Suggerimenti per ottenere i migliori risultati di training con YOLOv5

📚 Questa guida spiega come produrre i migliori risultati mAP e allenamento con YOLOv5 🚀.

Nella maggior parte dei casi è possibile ottenere buoni risultati senza modificare i modelli o le impostazioni di addestramento, a condizione che il dataset sia sufficientemente grande e ben etichettato. Se all'inizio non si ottengono buoni risultati, si possono adottare misure per migliorare, ma consigliamo sempre agli utenti di allenarsi con tutte le impostazioni predefinite prima di prendere in considerazione qualsiasi modifica. Questo aiuta a stabilire una linea di base delle prestazioni e a individuare le aree di miglioramento.

Se hai domande sui risultati del tuo addestramento raccomandiamo di fornire la massima quantità di informazioni possibile se vi aspettate una risposta utile, compresi i grafici dei risultati (perdite del treno, perdite val, P, R, mAP), la curva PR, matrice di confusione, mosaici di training, risultati dei test e immagini delle statistiche del dataset come labels.png. Tutti questi si trovano nella tua project/name directory, tipicamente yolov5/runs/train/exp.

Abbiamo preparato una guida completa per gli utenti che desiderano ottenere i migliori risultati dai loro addestramenti YOLOv5 qui sotto.

Set di dati

Immagini per classe. Si consiglia ≥ 1500 immagini per classe
Istanze per classe. Si raccomandano ≥ 10000 istanze (oggetti etichettati) per classe
Varietà di immagini. Deve essere rappresentativa dell'ambiente implementato. Per i casi d'uso reali, consigliamo immagini provenienti da diversi momenti della giornata, stagioni diverse, condizioni meteorologiche diverse, illuminazione diversa, angolazioni diverse, fonti diverse (raccolte online, raccolte localmente, fotocamere diverse), ecc.
Coerenza delle etichette. Tutte le istanze di tutte le classi in tutte le immagini devono essere etichettate. L'etichettatura parziale non funziona.
Precisione delle etichette. Le etichette devono racchiudere strettamente ogni oggetto. Non deve esistere spazio tra un oggetto e il suo rettangolo di selezione. Nessun oggetto deve mancare di un'etichetta.
Disciplina di divisione treno/val. Assicurarsi che le immagini di validazione e di test non compaiano mai nel set di addestramento per evitare metriche troppo ottimistiche. Mantenere le distribuzioni delle classi simili tra le suddivisioni.
Verifica delle etichette. Visualizza train_batch*.jpg all'avvio dell'addestramento per verificare che le tue etichette appaiano corrette, ad esempio, guarda esempio mosaic.
Immagini di sfondo. Le immagini di sfondo sono immagini prive di oggetti che vengono aggiunte a un set di dati per ridurre i falsi positivi (FP). Si consiglia di aggiungere circa lo 0-10% di immagini di sfondo per ridurre i PQCOCO ha 1000 immagini di sfondo come riferimento, l'1% del totale). Le immagini di sfondo non richiedono etichette.

Selezione del modello

Modelli più grandi come YOLOv5x e YOLOv5x6 produrranno risultati migliori in quasi tutti i casi, ma hanno più parametri, richiedono più memoria CUDA per l'addestramento e sono più lenti da eseguire. Per implementazioni mobile consigliamo YOLOv5s/m, per implementazioni cloud consigliamo YOLOv5l/x. Consulta la nostra tabella nel file README per un confronto completo di tutti i modelli.

Modelli YOLOv5

Inizia dai pesi pre-addestrati. Consigliato per dataset di dimensioni medio-piccole (es. VOC, VisDrone, GlobalWheat). Passa il nome del modello al --weights argomento. I modelli vengono scaricati automaticamente dal release più recente di YOLOv5.

python train.py --data custom.yaml --weights yolov5s.pt
python train.py --data custom.yaml --weights yolov5m.pt
python train.py --data custom.yaml --weights yolov5l.pt
python train.py --data custom.yaml --weights yolov5x.pt
python train.py --data custom.yaml --weights custom_pretrained.pt

Inizia da zero. Consigliato per dataset di grandi dimensioni (es. COCO, Objects365, OIv6). Passa il file YAML dell'architettura del modello a cui sei interessato, insieme a un --weights '' argomento:

python train.py --data custom.yaml --weights '' --cfg yolov5s.yaml
python train.py --data custom.yaml --weights '' --cfg yolov5m.yaml
python train.py --data custom.yaml --weights '' --cfg yolov5l.yaml
python train.py --data custom.yaml --weights '' --cfg yolov5x.yaml

Impostazioni di addestramento

Prima di modificare qualsiasi cosa, esegui prima l'addestramento con le impostazioni predefinite per stabilire una baseline delle prestazioni. Un elenco completo delle impostazioni di train.py è disponibile nell'argparser di train.py.

Epoche. Inizia con 300 epoche. Se si verifica un overfitting precoce, puoi ridurre il numero di epoche. Se l'overfitting non si verifica dopo 300 epoche, addestra più a lungo, ad esempio 600, 1200, ecc. epoche.
Dimensione dell'immagine. COCO si allena alla risoluzione nativa di --img 640, anche se, a causa dell'elevata quantità di piccoli oggetti nel set di dati, può trarre vantaggio dall'addestramento a risoluzioni più elevate come --img 1280. Se ci sono molti piccoli oggetti, i set di dati personalizzati trarranno vantaggio dall'addestramento a risoluzione nativa o superiore. I migliori risultati di inferenza si ottengono con la stessa --img come l'addestramento è stato eseguito, ad esempio se ti alleni a --img 1280 è necessario testare e detect anche a --img 1280.
Dimensione del batch. Utilizza la più grande --batch-size che il tuo hardware consente. Dimensioni di batch ridotte producono risultati scadenti normalizzazione batch statistiche e dovrebbe essere evitato. Puoi usare --batch-size -1 per selezionare automaticamente la dimensione ottimale del batch per la tua GPU.
Tasso di apprendimento. La pianificazione predefinita del learning rate funziona bene nella maggior parte dei casi. Per una convergenza più rapida, puoi provare a utilizzare --cos-lr flag per abilitare la pianificazione del learning rate coseno, che riduce gradualmente il learning rate seguendo una curva coseno nel corso delle epoche.
Aumento dei dati. YOLOv5 include varie tecniche di aumento come il mosaic, che combina più immagini di addestramento. Per le ultime epoche, considera l'utilizzo di --close-mosaic 10 per disabilitare l'aumento del mosaico, che può aiutare a stabilizzare l'addestramento.
Iperparametri. Gli iperparametri predefiniti sono in hyp.scratch-lowyaml. Si consiglia di allenarsi con gli iperparametri predefiniti prima di pensare di modificarli. In generale, l'aumento degli iperparametri di incremento ridurrà e ritarderà l'overfitting, consentendo allenamenti più lunghi e mAP finali più elevate. Riduzione degli iperparametri di guadagno della componente di perdita come hyp['obj'] aiuterà a ridurre l'overfitting in quelle specifiche componenti di perdita. Per un metodo automatizzato di ottimizzazione di questi iperparametri, consulta la nostra sezione Tutorial sull'evoluzione degli iperparametri.
Addestramento a precisione mista. Abilita l'addestramento a precisione mista con --amp per accelerare l'addestramento e ridurre l'utilizzo della memoria senza sacrificare l'accuratezza del modello.
Addestramento multi-GPU. Se hai più GPU, usa --device 0,1,2,3 per distribuire l'addestramento tra di essi, il che può ridurre significativamente i tempi di addestramento.
Arresto anticipato. Usa --patience 50 per interrompere l'addestramento se le metriche di convalida non migliorano per 50 epoche, risparmiando tempo e prevenendo l'overfitting.

Tecniche di Ottimizzazione Avanzate

Transfer learning. Per dataset specializzati, iniziare con pesi pre-addestrati e sbloccare gradualmente i livelli durante l'addestramento per adattare il modello al tuo compito specifico.
Model pruning. Dopo l'addestramento, considera la potatura del tuo modello per rimuovere i pesi ridondanti e ridurre le dimensioni del modello senza una significativa perdita di prestazioni.
Model ensemble. Per applicazioni critiche, addestra più modelli con configurazioni diverse e combina le loro previsioni per una maggiore accuratezza.
Aumento dei dati in fase di test. Abilita TTA durante l'inferenza con --augment per migliorare l'accuratezza della previsione facendo la media dei risultati da versioni aumentate dell'immagine di input.

Letture aggiuntive

Se desideri saperne di più, un buon punto di partenza è 'Recipe for Training Neural Networks' di Karpathy, che ha ottime idee per l'addestramento che si applicano ampiamente a tutti i domini di ML: https://karpathy.github.io/2019/04/25/recipe/

Per informazioni più dettagliate sulle impostazioni e configurazioni di addestramento, fare riferimento alla documentazione delle impostazioni di addestramento di Ultralytics, che fornisce spiegazioni complete di tutti i parametri disponibili.

Buona fortuna 🍀 e fateci sapere se avete altre domande!

FAQ

Come faccio a sapere se il mio modello è in overfitting?

Il modello potrebbe essere in overfitting se la perdita di addestramento continua a diminuire mentre la perdita di validazione inizia ad aumentare. Monitorare la mAP di validazione: se si stabilizza o diminuisce mentre la perdita di addestramento continua a migliorare, è un segno di overfitting. Le soluzioni possono essere l'aggiunta di altri dati di training, l'incremento dei dati o l'implementazione di tecniche di regolarizzazione.

Qual è la dimensione ottimale del batch per l'addestramento di YOLOv5?

La dimensione ottimale del batch dipende dalla memoria della tua GPU. Dimensioni di batch più grandi generalmente forniscono statistiche di normalizzazione del batch e stabilità di addestramento migliori. Utilizzare la dimensione del batch più grande che l'hardware può gestire senza esaurire la memoria. Puoi usare --batch-size -1 per determinare automaticamente la dimensione ottimale del batch per la tua configurazione.

Come posso velocizzare il training di YOLOv5?

Per accelerare l'addestramento, prova ad abilitare l'addestramento a precisione mista con --amp, utilizzando più GPU con --device 0,1,2,3, memorizzando nella cache il tuo dataset con --cache, e ottimizzare la dimensione del batch. Considera anche l'utilizzo di una variante del modello più piccola come YOLOv5s se l'accuratezza assoluta non è fondamentale.

📅C reato 2 anni fa ✏️ Aggiornato 8 giorni fa