Vai al contenuto

Set di dati

I set di dati Ultralytics offrono una soluzione semplificata per la gestione dei dati di addestramento. Una volta caricati, i set di dati possono essere immediatamente utilizzati per l'addestramento dei modelli, con elaborazione automatica e generazione di statistiche.


Guarda: Carica i set di dati sulla Ultralytics

Carica dataset

Ultralytics accetta diversi formati di caricamento per garantire la massima flessibilità:

FormatoDescrizione
ImmaginiFile immagine singoli (JPG, PNG, WebP, TIFF, RAW)
Archivio ZIPCartella compressa con immagini ed etichette opzionali
VideoFile MP4, AVI - fotogrammi estratti a ~1 fps
YOLOStruttura standard YOLO con etichette

Estrazione di fotogrammi video

Durante il caricamento dei video, i fotogrammi vengono estratti automaticamente:

  • Frequenza dei fotogrammi: ~1 fotogramma al secondo
  • Numero massimo di fotogrammi: 100 fotogrammi per video
  • Elaborazione: estrazione lato client prima del caricamento
  • Formato: Fotogrammi convertiti in formato immagine standard

È ideale per creare set di dati di addestramento da filmati di sorveglianza, registrazioni di azioni o qualsiasi fonte video.

Preparazione del set di dati

Per i set di dati etichettati, utilizzare il YOLO standard:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Il file YAML definisce la configurazione del set di dati:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Processo di caricamento

  1. Passa a Set di dati nella barra laterale
  2. Clicca su Carica set di dati o trascina i file nell'area di caricamento
  3. Seleziona il tipo di attività (detect, segment, posa, OBB, classify)
  4. Aggiungi un nome e una descrizione facoltativa
  5. Clicca su Carica

Dopo il caricamento, la Piattaforma elabora i tuoi dati:

  1. Normalizzazione: immagini di grandi dimensioni ridimensionate (max 4096px)
  2. Miniature: anteprime generate a 256px
  3. Analisi delle etichette: etichette YOLO estratte
  4. Statistiche: distribuzioni delle classi calcolate
Convalida prima del caricamento

È possibile convalidare il set di dati localmente prima di caricarlo:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Sfoglia immagini

Visualizza le immagini del tuo set di dati in diversi layout:

VisualizzaDescrizione
GrigliaGriglia di miniature con sovrapposizioni di annotazioni
CompattoMiniature più piccole per una rapida scansione
TabellaElenco con nome file, dimensioni e numero di etichette

Visualizzatore a schermo intero

Clicca su qualsiasi immagine per aprire la visualizzazione a schermo intero con:

  • Navigazione: tasti freccia o clicca per sfogliare
  • Metadati: nome file, dimensioni, divisione, numero di etichette
  • Annotazioni: Attiva/disattiva la visibilità delle annotazioni
  • Ripartizione per classe: conteggio delle etichette per classe

Filtra per divisione

Filtra le immagini in base alla suddivisione del set di dati:

DivisioneScopo
AddestramentoUtilizzato per l'addestramento dei modelli
ValutazioneUtilizzato per la convalida durante la formazione
ProvaUtilizzato per la valutazione finale
SconosciutoNessuna divisione assegnata

Statistiche sul set di dati

La scheda Statistiche fornisce un'analisi automatica del set di dati:

classe Distribuzione

Grafico a barre che mostra il numero di annotazioni per classe:

Mappa termica della posizione

Visualizzazione della posizione delle annotazioni nelle immagini:

Analisi dimensionale

Grafico a dispersione delle dimensioni dell'immagine (larghezza vs altezza):

Cache delle statistiche

Le statistiche vengono memorizzate nella cache per 5 minuti. Le modifiche alle annotazioni saranno visibili dopo la scadenza della cache.

Esporta set di dati

Esporta il tuo set di dati in formato NDJSON per l'utilizzo offline:

  1. Apri il menu delle azioni del set di dati
  2. Clicca su Esporta
  3. Scarica il file NDJSON

Il formato NDJSON memorizza un oggetto JSON per riga:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

Per le specifiche complete, consultare la documentazione sul formatoUltralytics .

URI del set di dati

Set di dati della piattaforma di riferimento che utilizzano il ul:// Formato URI:

ul://username/datasets/dataset-slug

Utilizza questo URI per addestrare modelli da qualsiasi luogo:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100

Allenati ovunque con i dati della piattaforma

Il ul:// URI funziona da qualsiasi ambiente:

  • Macchina locale: allenati sul tuo hardware, i dati vengono scaricati automaticamente
  • Google : accedi ai set di dati della tua piattaforma nei notebook
  • Server remoti: formazione su macchine virtuali cloud con accesso completo al set di dati

Impostazioni di visibilità

Controlla chi può vedere il tuo set di dati:

ImpostazioneDescrizione
PrivatoSolo tu puoi accedere
PubblicoChiunque può visualizzare la pagina Esplora

Per modificare la visibilità:

  1. Apri menu azioni set di dati
  2. Clicca su Modifica
  3. Attiva/disattiva l'impostazione di visibilità
  4. Clicca su Salva

Modifica Set di Dati

Aggiorna nome, descrizione o visibilità del set di dati:

  1. Apri menu azioni set di dati
  2. Clicca su Modifica
  3. Apportare modifiche
  4. Clicca su Salva

Elimina dataset

Elimina un set di dati che non ti serve più:

  1. Apri menu azioni set di dati
  2. Clicca su Elimina
  3. Conferma eliminazione

Elimina e ripristina

I set di dati eliminati vengono spostati nel Cestino per 30 giorni. È possibile ripristinarli dalla pagina Cestino in Impostazioni.

Addestramento sul set di dati

Inizia l'addestramento direttamente dal tuo set di dati:

  1. Clicca su Modello di treno nella pagina del set di dati
  2. Seleziona un progetto o creane uno nuovo
  3. Configurare i parametri di allenamento
  4. Inizia l'allenamento

Per ulteriori dettagli, consultare la sezione Formazione sul cloud.

FAQ

Cosa succede ai miei dati dopo il caricamento?

I tuoi dati vengono elaborati e archiviati nella regione selezionata (Stati Uniti, Unione Europea o AP). Le immagini sono:

  1. Convalidato per formato e dimensioni
  2. Normalizzato se superiore a 4096px (mantenendo le proporzioni)
  3. Archiviato utilizzando Content-Addressable Storage (CAS) con hash SHA-256
  4. Miniature generate a 256px per una navigazione veloce
  5. Non condiviso mai senza il tuo permesso

Come funziona l'archiviazione?

Ultralytics utilizza lo storage indirizzabile per contenuto (CAS) per un'archiviazione efficiente:

  • Deduplicazione: le immagini identiche caricate da utenti diversi vengono archiviate una sola volta.
  • Integrità: l'hashing SHA-256 garantisce l'integrità dei dati
  • Efficienza: riduce i costi di stoccaggio e velocizza l'elaborazione
  • Regionale: i dati rimangono nella regione selezionata (Stati Uniti, Unione Europea o AP)

Posso aggiungere immagini a un set di dati esistente?

Sì, utilizza il pulsante Aggiungi immagini nella pagina del set di dati per caricare immagini aggiuntive. Le nuove statistiche verranno calcolate automaticamente.

Come posso spostare le immagini tra i set di dati?

Utilizza la funzione di selezione multipla:

  1. Seleziona le immagini nella galleria
  2. Fai clic su Sposta o Copia
  3. Seleziona il set di dati di destinazione

Quali formati di etichetta sono supportati?

Ultralytics supporta le etichette YOLO :

  • Rileva: class_id x_center y_center width height
  • Segmentazione: class_id x1 y1 x2 y2 ... (punti poligonali)
  • Posa: class_id x_center y_center width height kp1_x kp1_y kp1_v ...
  • OBB: class_id x1 y1 x2 y2 x3 y3 x4 y4

Tutte le coordinate sono normalizzate (intervallo 0-1).



📅 Creato 0 giorni fa ✏️ Aggiornato 0 giorni fa
glenn-jocher

Commenti