Preparazione dei dati
La preparazione dei dati è la base di modelli di computer vision di successo. Ultralytics Platform fornisce strumenti completi per gestire i tuoi dati di addestramento, dal caricamento all'annotazione, fino all'analisi.
Watch: Get Started with Ultralytics Platform - Data
Panoramica
La sezione Data di Ultralytics Platform ti aiuta a:
- Caricare immagini, video e file di dataset (ZIP, TAR inclusi
.tar.gz/.tgz, NDJSON) - Annotare con strumenti di disegno manuale ed etichettatura intelligente basata su SAM — scegli tra SAM 2.1 o il nuovo SAM 3
- Analizzare i tuoi dati con statistiche e visualizzazioni
- Esportare in formato NDJSON per l'addestramento locale

Flusso di lavoro
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| Fase | Descrizione |
|---|---|
| Carica | Importa immagini, video o archivi con elaborazione automatica |
| Annota | Etichetta i dati con strumenti manuali per tutti i 5 tipi di task, oppure usa l'annotazione SAM per rilevamento, segmentazione e OBB |
| Analizzare | Visualizza distribuzioni delle classi, mappe di calore spaziali e statistiche sulle dimensioni |
| Esporta | Scarica in formato NDJSON per l'uso offline |
Attività supportate
Ultralytics Platform supporta tutti i 5 tipi di task YOLO:
| Attività | Descrizione | Strumento di annotazione |
|---|---|---|
| Detect | Rilevamento di oggetti con riquadri di delimitazione | Strumento rettangolo |
| Segment | Segmentazione di istanze con maschere di pixel | Strumento poligono |
| Pose | Stima dei punti chiave con modelli di scheletro integrati e personalizzati | Strumento punti chiave |
| OBB | Riquadri di delimitazione orientati per oggetti ruotati | Strumento riquadro orientato |
| Classify | Classificazione a livello di immagine | Selettore di classe |
Il tipo di task viene impostato durante la creazione di un dataset e determina quali strumenti di annotazione sono disponibili. Puoi modificarlo in seguito dal selettore di task nell'intestazione del dataset, ma le annotazioni incompatibili non verranno visualizzate dopo il cambio.
Caratteristiche principali
Archiviazione intelligente
Ultralytics Platform utilizza l'archiviazione Content-Addressable Storage (CAS) per una gestione efficiente dei dati:
- Deduplicazione: Immagini identiche archiviate una sola volta tramite hashing XXH3-128
- Integrità: L'indirizzamento basato su hash garantisce l'integrità dei dati
- Efficienza: Archiviazione ottimizzata ed elaborazione rapida
URI del dataset
Fai riferimento ai dataset usando il formato URI ul:// (vedi Utilizzo dei dataset della piattaforma):
yolo train data=ul://username/datasets/my-datasetCiò consente di eseguire l'addestramento sui dataset della piattaforma da qualsiasi macchina con la tua chiave API configurata.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Versionamento del dataset
Crea snapshot NDJSON immutabili del tuo dataset per un addestramento riproducibile. Ogni versione acquisisce conteggi di immagini, classi e annotazioni al momento della creazione. Vedi Scheda Versioni per i dettagli.
Schede del dataset
Le pagine dei dataset possono mostrare fino a sei schede, a seconda dello stato del dataset e delle tue autorizzazioni:
| Scheda | Descrizione |
|---|---|
| Immagini | Sfoglia le immagini in visualizzazione griglia, compatta o tabella con sovrapposizioni di annotazioni |
| Classi | Visualizza e modifica nomi di classi, colori e conteggi di etichette per classe |
| Grafici | Statistiche automatiche: distribuzione dello split, conteggi delle classi, mappe di calore |
| Modelli | Modelli addestrati su questo dataset con metriche e stato |
| Versioni | Crea e scarica snapshot NDJSON immutabili per un addestramento riproducibile |
| Errori | Immagini che non sono state elaborate con dettagli sull'errore e indicazioni per la correzione |
Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.
Clustering
Esplora il tuo dataset come un grafico a dispersione 2D interattivo dove immagini visivamente simili si trovano vicine — utile per far emergere cluster, duplicati e outlier, e per ispezionare come gli split o le classi sono distribuiti nei tuoi dati. Seleziona un'area del grafico per filtrare la galleria su quelle immagini. Vedi Clustering per i dettagli.
Statistiche e visualizzazione
The Charts tab provides automatic analysis including:
- Distribuzione Split: Grafico a ciambella dei conteggi di immagini train/val/test
- Classi Top: Grafico a ciambella delle classi di annotazione più frequenti
- Larghezze Immagini: Istogramma della distribuzione della larghezza delle immagini
- Altezze Immagini: Istogramma della distribuzione dell'altezza delle immagini
- Punti per Istanza: Distribuzione del conteggio dei vertici del poligono o dei punti chiave (dataset segment/pose)
- Posizioni Annotazione: Mappa di calore 2D delle posizioni centrali dei riquadri di delimitazione
- Dimensioni Immagine: Mappa di calore 2D della larghezza rispetto all'altezza con linee guida del rapporto d'aspetto
Link rapidi
- Dataset: Carica, gestisci ed esporta i tuoi dati di addestramento
- Annotazione: Etichetta i dati con strumenti manuali e assistiti dall'IA
- Addestramento su Cloud: Addestra modelli sui tuoi dataset annotati
- URI Dataset: Usa gli URI
ul://per addestrare ovunque
FAQ
Quali formati di file sono supportati per il caricamento?
Ultralytics Platform supporta:
Immagini: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (max 50MB ciascuna)
Video: MP4, WebM, MOV, AVI, MKV, M4V (max 1GB, fotogrammi estratti a 1 FPS, max 100 fotogrammi)
File dataset: Archivi ZIP o TAR inclusi .tar.gz e .tgz (max 10GB su Free, 20GB su Pro, 50GB su Enterprise) contenenti immagini con etichette opzionali in formato YOLO, più esportazioni NDJSON
Qual è la dimensione massima del dataset?
I limiti di archiviazione dipendono dal tuo piano:
| Piano | Limite di archiviazione |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Enterprise | Illimitato |
Limiti file individuali: Immagini 50MB, Video 1GB, dataset 10GB su Free / 20GB su Pro / 50GB su Enterprise
Posso usare i miei dataset della piattaforma per l'addestramento locale?
Sì! Usa il formato URI del dataset per addestrare localmente:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Oppure esporta il tuo dataset in formato NDJSON per un addestramento completamente offline.