Set di dati
I set di dati Ultralytics offrono una soluzione semplificata per la gestione dei dati di addestramento. Una volta caricati, i set di dati possono essere immediatamente utilizzati per l'addestramento dei modelli, con elaborazione automatica e generazione di statistiche.
Guarda: Carica i set di dati sulla Ultralytics
Carica dataset
Ultralytics accetta diversi formati di caricamento per garantire la massima flessibilità:
| Formato | Descrizione |
|---|---|
| Immagini | File immagine singoli (JPG, PNG, WebP, TIFF, RAW) |
| Archivio ZIP | Cartella compressa con immagini ed etichette opzionali |
| Video | File MP4, AVI - fotogrammi estratti a ~1 fps |
| YOLO | Struttura standard YOLO con etichette |
Estrazione di fotogrammi video
Durante il caricamento dei video, i fotogrammi vengono estratti automaticamente:
- Frequenza dei fotogrammi: ~1 fotogramma al secondo
- Numero massimo di fotogrammi: 100 fotogrammi per video
- Elaborazione: estrazione lato client prima del caricamento
- Formato: Fotogrammi convertiti in formato immagine standard
È ideale per creare set di dati di addestramento da filmati di sorveglianza, registrazioni di azioni o qualsiasi fonte video.
Preparazione del set di dati
Per i set di dati etichettati, utilizzare il YOLO standard:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
Il file YAML definisce la configurazione del set di dati:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
Processo di caricamento
- Passa a Set di dati nella barra laterale
- Clicca su Carica set di dati o trascina i file nell'area di caricamento
- Seleziona il tipo di attività (detect, segment, posa, OBB, classify)
- Aggiungi un nome e una descrizione facoltativa
- Clicca su Carica
Dopo il caricamento, la Piattaforma elabora i tuoi dati:
- Normalizzazione: immagini di grandi dimensioni ridimensionate (max 4096px)
- Miniature: anteprime generate a 256px
- Analisi delle etichette: etichette YOLO estratte
- Statistiche: distribuzioni delle classi calcolate
Convalida prima del caricamento
È possibile convalidare il set di dati localmente prima di caricarlo:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Sfoglia immagini
Visualizza le immagini del tuo set di dati in diversi layout:
| Visualizza | Descrizione |
|---|---|
| Griglia | Griglia di miniature con sovrapposizioni di annotazioni |
| Compatto | Miniature più piccole per una rapida scansione |
| Tabella | Elenco con nome file, dimensioni e numero di etichette |
Visualizzatore a schermo intero
Clicca su qualsiasi immagine per aprire la visualizzazione a schermo intero con:
- Navigazione: tasti freccia o clicca per sfogliare
- Metadati: nome file, dimensioni, divisione, numero di etichette
- Annotazioni: Attiva/disattiva la visibilità delle annotazioni
- Ripartizione per classe: conteggio delle etichette per classe
Filtra per divisione
Filtra le immagini in base alla suddivisione del set di dati:
| Divisione | Scopo |
|---|---|
| Addestramento | Utilizzato per l'addestramento dei modelli |
| Valutazione | Utilizzato per la convalida durante la formazione |
| Prova | Utilizzato per la valutazione finale |
| Sconosciuto | Nessuna divisione assegnata |
Statistiche sul set di dati
La scheda Statistiche fornisce un'analisi automatica del set di dati:
classe Distribuzione
Grafico a barre che mostra il numero di annotazioni per classe:
Mappa termica della posizione
Visualizzazione della posizione delle annotazioni nelle immagini:
Analisi dimensionale
Grafico a dispersione delle dimensioni dell'immagine (larghezza vs altezza):
Cache delle statistiche
Le statistiche vengono memorizzate nella cache per 5 minuti. Le modifiche alle annotazioni saranno visibili dopo la scadenza della cache.
Esporta set di dati
Esporta il tuo set di dati in formato NDJSON per l'utilizzo offline:
- Apri il menu delle azioni del set di dati
- Clicca su Esporta
- Scarica il file NDJSON
Il formato NDJSON memorizza un oggetto JSON per riga:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
Per le specifiche complete, consultare la documentazione sul formatoUltralytics .
URI del set di dati
Set di dati della piattaforma di riferimento che utilizzano il ul:// Formato URI:
ul://username/datasets/dataset-slug
Utilizza questo URI per addestrare modelli da qualsiasi luogo:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
Allenati ovunque con i dati della piattaforma
Il ul:// URI funziona da qualsiasi ambiente:
- Macchina locale: allenati sul tuo hardware, i dati vengono scaricati automaticamente
- Google : accedi ai set di dati della tua piattaforma nei notebook
- Server remoti: formazione su macchine virtuali cloud con accesso completo al set di dati
Impostazioni di visibilità
Controlla chi può vedere il tuo set di dati:
| Impostazione | Descrizione |
|---|---|
| Privato | Solo tu puoi accedere |
| Pubblico | Chiunque può visualizzare la pagina Esplora |
Per modificare la visibilità:
- Apri menu azioni set di dati
- Clicca su Modifica
- Attiva/disattiva l'impostazione di visibilità
- Clicca su Salva
Modifica Set di Dati
Aggiorna nome, descrizione o visibilità del set di dati:
- Apri menu azioni set di dati
- Clicca su Modifica
- Apportare modifiche
- Clicca su Salva
Elimina dataset
Elimina un set di dati che non ti serve più:
- Apri menu azioni set di dati
- Clicca su Elimina
- Conferma eliminazione
Elimina e ripristina
I set di dati eliminati vengono spostati nel Cestino per 30 giorni. È possibile ripristinarli dalla pagina Cestino in Impostazioni.
Addestramento sul set di dati
Inizia l'addestramento direttamente dal tuo set di dati:
- Clicca su Modello di treno nella pagina del set di dati
- Seleziona un progetto o creane uno nuovo
- Configurare i parametri di allenamento
- Inizia l'allenamento
Per ulteriori dettagli, consultare la sezione Formazione sul cloud.
FAQ
Cosa succede ai miei dati dopo il caricamento?
I tuoi dati vengono elaborati e archiviati nella regione selezionata (Stati Uniti, Unione Europea o AP). Le immagini sono:
- Convalidato per formato e dimensioni
- Normalizzato se superiore a 4096px (mantenendo le proporzioni)
- Archiviato utilizzando Content-Addressable Storage (CAS) con hash SHA-256
- Miniature generate a 256px per una navigazione veloce
- Non condiviso mai senza il tuo permesso
Come funziona l'archiviazione?
Ultralytics utilizza lo storage indirizzabile per contenuto (CAS) per un'archiviazione efficiente:
- Deduplicazione: le immagini identiche caricate da utenti diversi vengono archiviate una sola volta.
- Integrità: l'hashing SHA-256 garantisce l'integrità dei dati
- Efficienza: riduce i costi di stoccaggio e velocizza l'elaborazione
- Regionale: i dati rimangono nella regione selezionata (Stati Uniti, Unione Europea o AP)
Posso aggiungere immagini a un set di dati esistente?
Sì, utilizza il pulsante Aggiungi immagini nella pagina del set di dati per caricare immagini aggiuntive. Le nuove statistiche verranno calcolate automaticamente.
Come posso spostare le immagini tra i set di dati?
Utilizza la funzione di selezione multipla:
- Seleziona le immagini nella galleria
- Fai clic su Sposta o Copia
- Seleziona il set di dati di destinazione
Quali formati di etichetta sono supportati?
Ultralytics supporta le etichette YOLO :
- Rileva:
class_id x_center y_center width height - Segmentazione:
class_id x1 y1 x2 y2 ...(punti poligonali) - Posa:
class_id x_center y_center width height kp1_x kp1_y kp1_v ... - OBB:
class_id x1 y1 x2 y2 x3 y3 x4 y4
Tutte le coordinate sono normalizzate (intervallo 0-1).