Vai al contenuto

Set di dati HUB

Ultralytics I dataset HUB sono una soluzione pratica per gestire e sfruttare i tuoi dataset personalizzati.

Una volta caricati, i set di dati possono essere immediatamente utilizzati per la formazione dei modelli. Questo approccio integrato facilita la transizione dalla gestione dei set di dati alla formazione dei modelli, semplificando notevolmente l'intero processo.



Guarda: Guarda: Caricare i set di dati su Ultralytics HUB | Guida completa alla funzione di caricamento dei set di dati

Carica il set di dati

Ultralytics I dataset HUB sono come i dataset YOLOv5 e YOLOv8 🚀. Utilizzano la stessa struttura e gli stessi formati di etichetta per mantenere tutto semplice.

Prima di caricare un set di dati su Ultralytics HUB, assicurati di posizionare il file YAML del set di dati all'interno della directory principale del set di dati e che il file YAML, la directory e lo ZIP del set di dati abbiano lo stesso nome, come mostrato nell'esempio seguente, quindi comprimi la directory del set di dati.

Ad esempio, se il tuo dataset si chiama "coco8", come il nostro COCO8 esempio di set di dati, allora dovresti avere un coco8.yaml all'interno del tuo coco8/ che creerà una cartella coco8.zip quando è chiuso con la zip:

zip -r coco8.zip coco8

Puoi scaricare il nostro dataset di esempio COCO8 e decomprimerlo per vedere esattamente come strutturare il tuo dataset.

Struttura del set di dati COCO8

Il dataset YAML è lo stesso formato YAML standard di YOLOv5 e YOLOv8 .

coco8.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# COCO8 dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/detect/coco8/
# Example usage: yolo train data=coco8.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── coco8  ← downloads here (1 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8 # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes
names:
  0: person
  1: bicycle
  2: car
  3: motorcycle
  4: airplane
  5: bus
  6: train
  7: truck
  8: boat
  9: traffic light
  10: fire hydrant
  11: stop sign
  12: parking meter
  13: bench
  14: bird
  15: cat
  16: dog
  17: horse
  18: sheep
  19: cow
  20: elephant
  21: bear
  22: zebra
  23: giraffe
  24: backpack
  25: umbrella
  26: handbag
  27: tie
  28: suitcase
  29: frisbee
  30: skis
  31: snowboard
  32: sports ball
  33: kite
  34: baseball bat
  35: baseball glove
  36: skateboard
  37: surfboard
  38: tennis racket
  39: bottle
  40: wine glass
  41: cup
  42: fork
  43: knife
  44: spoon
  45: bowl
  46: banana
  47: apple
  48: sandwich
  49: orange
  50: broccoli
  51: carrot
  52: hot dog
  53: pizza
  54: donut
  55: cake
  56: chair
  57: couch
  58: potted plant
  59: bed
  60: dining table
  61: toilet
  62: tv
  63: laptop
  64: mouse
  65: remote
  66: keyboard
  67: cell phone
  68: microwave
  69: oven
  70: toaster
  71: sink
  72: refrigerator
  73: book
  74: clock
  75: vase
  76: scissors
  77: teddy bear
  78: hair drier
  79: toothbrush

# Download script/URL (optional)
download: https://ultralytics.com/assets/coco8.zip

Dopo aver zippato il tuo set di dati, devi convalidarlo prima di caricarlo su Ultralytics HUB. Ultralytics HUB esegue il controllo di convalida del set di dati dopo il caricamento, quindi assicurandoti che il tuo set di dati sia formattato correttamente e privo di errori in anticipo, puoi evitare qualsiasi contrattempo dovuto al rifiuto del set di dati.

from ultralytics.hub import check_dataset

check_dataset('path/to/coco8.zip')

Una volta che lo ZIP del tuo dataset è pronto, vai alla pagina Datasets cliccando sul pulsante Datasets nella barra laterale.

Ultralytics Schermata HUB della pagina iniziale con una freccia che punta al pulsante Datasets nella barra laterale

Clicca sul pulsante Carica set di dati in alto a destra della pagina. Questa azione attiverĂ  la finestra di dialogo Upload Dataset.

Ultralytics Schermata HUB della pagina Dataset con una freccia che indica il pulsante Carica Dataset

Carica il tuo set di dati nel campo Dataset .zip file.

Hai la possibilitĂ  di impostare un nome e una descrizione personalizzati per il tuo dataset Ultralytics HUB.

Quando sei soddisfatto della configurazione del set di dati, clicca su Carica.

Ultralytics Schermata HUB della finestra di dialogo Upload Dataset con una freccia che indica il pulsante Upload

Dopo che il tuo set di dati è stato caricato ed elaborato, potrai accedervi dalla pagina Datasets.

Ultralytics Schermata HUB della pagina Datasets con una freccia che indica uno dei dataset

Puoi visualizzare le immagini del tuo set di dati raggruppate per suddivisioni (Train, Validation, Test).

Ultralytics Schermata HUB della pagina Dataset con una freccia che indica la scheda Immagini

Suggerimento

Ogni immagine può essere ingrandita per una migliore visualizzazione.

Ultralytics Schermata di HUB della scheda Immagini all'interno della pagina Dataset con una freccia che indica l'icona di espansione

Ultralytics Schermata HUB della scheda Immagini all'interno della pagina Dataset con una delle immagini espanse

Inoltre, puoi analizzare il tuo set di dati facendo clic sulla scheda Panoramica.

Ultralytics Schermata HUB della pagina Dataset con una freccia che punta alla scheda Panoramica

Quindi, addestra un modello sul tuo set di dati.

Ultralytics Schermata di HUB della pagina Dataset con una freccia che indica il pulsante Train Model (Allena modello)

Condividi il set di dati

Info

Ultralytics La funzionalità di condivisione di HUB offre un modo pratico per condividere i set di dati con altri utenti. Questa funzione è stata pensata sia per gli utenti di Ultralytics HUB che per quelli che non hanno ancora creato un account.

Nota

Hai il controllo sull'accesso generale ai tuoi set di dati.

Puoi scegliere di impostare l'accesso generale su "Privato", nel qual caso solo tu potrai accedervi. In alternativa, puoi impostare l'accesso generale su "Unlisted", che garantisce l'accesso alla visualizzazione a chiunque abbia un link diretto al set di dati, indipendentemente dal fatto che abbia o meno un account Ultralytics HUB.

Vai alla pagina del dataset che vuoi condividere, apri il menu a tendina delle azioni del dataset e clicca sull'opzione Condividi. Questa azione attiverĂ  la finestra di dialogo Condividi dataset.

Ultralytics Schermata HUB della pagina Dataset con la freccia che indica l'opzione Condividi

Suggerimento

Puoi anche condividere un set di dati direttamente dalla pagina Datasets.

Ultralytics Schermata HUB della pagina Datasets con una freccia che indica l'opzione Condividi di uno dei datasets

Imposta l'accesso generale su "Non in lista" e clicca su Salva.

Ultralytics Schermata HUB della finestra di dialogo Condividi Dataset con una freccia che indica il menu a tendina e una che indica il pulsante Salva

Ora chiunque abbia il link diretto al tuo set di dati può visualizzarlo.

Suggerimento

Puoi facilmente cliccare sul link del dataset mostrato nella finestra di dialogo Condividi Dataset per copiarlo.

Ultralytics Schermata HUB della finestra di dialogo Condividi il set di dati con una freccia che indica il link del set di dati

Modifica / Elimina il set di dati

Vai alla pagina Dataset del dataset che vuoi modificare, apri il menu a tendina delle azioni del dataset e clicca sull'opzione Modifica. Questa azione attiverĂ  la finestra di dialogo Aggiorna dataset.

Ultralytics Schermata HUB della pagina Dataset con una freccia che indica l'opzione Modifica e Cancella

Applica le modifiche desiderate al tuo set di dati e poi conferma le modifiche cliccando su Salva.

Vai alla pagina del dataset che vuoi cancellare, apri il menu a tendina delle azioni del dataset e clicca sull'opzione Elimina. Questa azione cancellerĂ  il set di dati.

Nota

Se cambi idea, puoi ripristinare il set di dati dalla pagina Cestino.

Ultralytics Schermata HUB della pagina Cestino con una freccia che indica l'opzione Ripristina di uno dei dataset



Creato 2023-11-12, Aggiornato 2024-02-13
Autori: glenn-jocher (4), priytosh-tripathi (1), RizwanMunawar (1), sergiuwaxmann (1), Laughing-q (1)

Commenti