Preparazione dei Dati
La preparazione dei dati è la base per modelli di visione artificiale di successo. La Piattaforma Ultralytics fornisce strumenti completi per la gestione dei dati di training, dal caricamento all'annotazione, fino all'analisi.
Panoramica
La sezione Dati della Piattaforma Ultralytics ti aiuta a:
- Carica immagini, video e archivi (ZIP, TAR, GZ)
- Annotare con strumenti di disegno manuali e etichettatura intelligente SAM
- Analizzare i tuoi dati con statistiche e visualizzazioni
- Esportazione in formato NDJSON per la formazione locale

Flusso di Lavoro
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Fase | Descrizione |
|---|---|
| Caricamento | Importa immagini, video o archivi con elaborazione automatica |
| Annota | Etichetta i dati con bounding box, poligoni, keypoint o classificazioni |
| Analizza | Visualizza distribuzioni di classe, heatmap spaziali e statistiche dimensionali |
| Esportazione | Scarica in formato NDJSON per l'utilizzo offline |
Attività supportate
La Piattaforma Ultralytics supporta tutti i 5 tipi di task YOLO:
| Task | Descrizione | Strumento di Annotazione |
|---|---|---|
| Rileva | Object detection con bounding box | Strumento rettangolo |
| Segmentazione | Instance segmentation con maschere di pixel | Strumento poligono |
| Posa | Stima di keypoint (formato COCO a 17 punti) | Strumento keypoint |
| OBB | Bounding box orientate per oggetti ruotati | Strumento box orientato |
| Classificazione | Classificazione a livello di immagine | Selettore di classe |
Selezione del tipo di attività
Il tipo di attività viene impostato durante la creazione di un set di dati e determina quali strumenti di annotazione sono disponibili. È possibile modificarlo in un secondo momento dalle impostazioni del set di dati, ma le annotazioni incompatibili non verranno visualizzate dopo la modifica.
Caratteristiche principali
Archiviazione Intelligente
Ultralytics utilizza lo storage indirizzabile per contenuto (CAS) per una gestione efficiente dei dati:
- Deduplicazione: immagini identiche memorizzate una sola volta tramite hash XXH3-128
- Integrità: l'indirizzamento basato su hash garantisce l'integrità dei dati
- Efficienza: Archiviazione ottimizzata e elaborazione rapida
URI dei Dataset
Riferisci i dataset usando il ul:// Formato URI (vedi Utilizzo dei dataset della piattaforma):
yolo train data=ul://username/datasets/my-dataset
Ciò consente di eseguire la formazione sui set di dati della piattaforma da qualsiasi macchina con la chiave API configurata.
Utilizzare i dati della piattaforma da Python
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Schede del set di dati
Ogni pagina del set di dati presenta cinque schede:
| Scheda | Descrizione |
|---|---|
| Immagini | Sfoglia le immagini in visualizzazione griglia, compatta o tabella con sovrapposizioni di annotazioni |
| Lezioni | Visualizza e modifica i nomi delle classi, i colori e il numero di etichette per classe |
| Grafici | Statistiche automatiche: distribuzione frazionata, conteggi delle classi, mappe di calore |
| Modelli | Modelli addestrati su questo set di dati con metriche e stato |
| Errori | Immagini che non sono state elaborate con dettagli sull'errore e indicazioni per la risoluzione |
Statistiche e Visualizzazione
Il Charts La scheda fornisce un'analisi automatica che include:
- Distribuzione divisa: grafico ad anello del conteggio delle immagini train/val/test
- Classi principali: grafico ad anello delle classi di annotazione più frequenti
- Larghezze delle immagini: Istogramma della distribuzione delle larghezze delle immagini
- Altezze delle immagini: Istogramma della distribuzione delle altezze delle immagini
- Punti per istanza: distribuzione dei vertici dei poligoni o dei punti chiave (set di datisegment)
- Posizioni delle annotazioni: mappa termica 2D delle posizioni centrali dei riquadri di delimitazione
- Dimensioni immagine: mappa termica 2D di larghezza rispetto all'altezza con linee guida delle proporzioni
Link Rapidi
- Dataset: Carica e gestisci i tuoi dati di addestramento
- Annotazione: Dati di etichettatura con strumenti manuali e assistiti dall'IA
FAQ
Quali formati di file sono supportati per il caricamento?
La Piattaforma Ultralytics supporta:
Immagini: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (max 50 MB ciascuna)
Video: MP4, WebM, MOV, AVI, MKV, M4V (max 1 GB, fotogrammi estratti a 1 FPS, max 100 fotogrammi)
Archivi: ZIP, TAR, TAR.GZ, TGZ, GZ (max 10 GB) contenenti immagini con etichette opzionali YOLO
Qual è la dimensione massima del dataset?
I limiti di archiviazione dipendono dal tuo piano:
| Piano | Limite di Archiviazione |
|---|---|
| Gratuito | 100 GB |
| Pro | 500 GB |
| Enterprise | Personalizzato |
Limiti dei singoli file: immagini 50 MB, video 1 GB, archivi 10 GB
Posso usare i miei dataset della Piattaforma per il training locale?
Sì! Usa il formato URI del dataset per il training locale:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Oppure esporta il tuo set di dati in formato NDJSON per un addestramento completamente offline.