Preparazione dei dati

La preparazione dei dati è la base di modelli di computer vision di successo. Ultralytics Platform fornisce strumenti completi per gestire i tuoi dati di addestramento, dal caricamento all'annotazione, fino all'analisi.



Watch: Get Started with Ultralytics Platform - Data

Panoramica

La sezione Data di Ultralytics Platform ti aiuta a:

  • Caricare immagini, video e file di dataset (ZIP, TAR inclusi .tar.gz/.tgz, NDJSON)
  • Annotare con strumenti di disegno manuale ed etichettatura intelligente basata su SAM — scegli tra SAM 2.1 o il nuovo SAM 3
  • Analizzare i tuoi dati con statistiche e visualizzazioni
  • Esportare in formato NDJSON per l'addestramento locale

Panoramica della barra laterale dei dati di Ultralytics Platform

Flusso di lavoro

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
FaseDescrizione
CaricaImporta immagini, video o archivi con elaborazione automatica
AnnotaEtichetta i dati con strumenti manuali per tutti i 5 tipi di task, oppure usa l'annotazione SAM per rilevamento, segmentazione e OBB
AnalizzareVisualizza distribuzioni delle classi, mappe di calore spaziali e statistiche sulle dimensioni
EsportaScarica in formato NDJSON per l'uso offline

Attività supportate

Ultralytics Platform supporta tutti i 5 tipi di task YOLO:

AttivitàDescrizioneStrumento di annotazione
DetectRilevamento di oggetti con riquadri di delimitazioneStrumento rettangolo
SegmentSegmentazione di istanze con maschere di pixelStrumento poligono
PoseStima dei punti chiave con modelli di scheletro integrati e personalizzatiStrumento punti chiave
OBBRiquadri di delimitazione orientati per oggetti ruotatiStrumento riquadro orientato
ClassifyClassificazione a livello di immagineSelettore di classe
Selezione del tipo di task

Il tipo di task viene impostato durante la creazione di un dataset e determina quali strumenti di annotazione sono disponibili. Puoi modificarlo in seguito dal selettore di task nell'intestazione del dataset, ma le annotazioni incompatibili non verranno visualizzate dopo il cambio.

Caratteristiche principali

Archiviazione intelligente

Ultralytics Platform utilizza l'archiviazione Content-Addressable Storage (CAS) per una gestione efficiente dei dati:

  • Deduplicazione: Immagini identiche archiviate una sola volta tramite hashing XXH3-128
  • Integrità: L'indirizzamento basato su hash garantisce l'integrità dei dati
  • Efficienza: Archiviazione ottimizzata ed elaborazione rapida

URI del dataset

Fai riferimento ai dataset usando il formato URI ul:// (vedi Utilizzo dei dataset della piattaforma):

yolo train data=ul://username/datasets/my-dataset

Ciò consente di eseguire l'addestramento sui dataset della piattaforma da qualsiasi macchina con la tua chiave API configurata.

Usa i dati della piattaforma da Python
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Versionamento del dataset

Crea snapshot NDJSON immutabili del tuo dataset per un addestramento riproducibile. Ogni versione acquisisce conteggi di immagini, classi e annotazioni al momento della creazione. Vedi Scheda Versioni per i dettagli.

Schede del dataset

Le pagine dei dataset possono mostrare fino a sei schede, a seconda dello stato del dataset e delle tue autorizzazioni:

SchedaDescrizione
ImmaginiSfoglia le immagini in visualizzazione griglia, compatta o tabella con sovrapposizioni di annotazioni
ClassiVisualizza e modifica nomi di classi, colori e conteggi di etichette per classe
GraficiStatistiche automatiche: distribuzione dello split, conteggi delle classi, mappe di calore
ModelliModelli addestrati su questo dataset con metriche e stato
VersioniCrea e scarica snapshot NDJSON immutabili per un addestramento riproducibile
ErroriImmagini che non sono state elaborate con dettagli sull'errore e indicazioni per la correzione

Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.

Clustering

Esplora il tuo dataset come un grafico a dispersione 2D interattivo dove immagini visivamente simili si trovano vicine — utile per far emergere cluster, duplicati e outlier, e per ispezionare come gli split o le classi sono distribuiti nei tuoi dati. Seleziona un'area del grafico per filtrare la galleria su quelle immagini. Vedi Clustering per i dettagli.

Statistiche e visualizzazione

The Charts tab provides automatic analysis including:

  • Distribuzione Split: Grafico a ciambella dei conteggi di immagini train/val/test
  • Classi Top: Grafico a ciambella delle classi di annotazione più frequenti
  • Larghezze Immagini: Istogramma della distribuzione della larghezza delle immagini
  • Altezze Immagini: Istogramma della distribuzione dell'altezza delle immagini
  • Punti per Istanza: Distribuzione del conteggio dei vertici del poligono o dei punti chiave (dataset segment/pose)
  • Posizioni Annotazione: Mappa di calore 2D delle posizioni centrali dei riquadri di delimitazione
  • Dimensioni Immagine: Mappa di calore 2D della larghezza rispetto all'altezza con linee guida del rapporto d'aspetto
  • Dataset: Carica, gestisci ed esporta i tuoi dati di addestramento
  • Annotazione: Etichetta i dati con strumenti manuali e assistiti dall'IA
  • Addestramento su Cloud: Addestra modelli sui tuoi dataset annotati
  • URI Dataset: Usa gli URI ul:// per addestrare ovunque

FAQ

Quali formati di file sono supportati per il caricamento?

Ultralytics Platform supporta:

Immagini: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (max 50MB ciascuna)

Video: MP4, WebM, MOV, AVI, MKV, M4V (max 1GB, fotogrammi estratti a 1 FPS, max 100 fotogrammi)

File dataset: Archivi ZIP o TAR inclusi .tar.gz e .tgz (max 10GB su Free, 20GB su Pro, 50GB su Enterprise) contenenti immagini con etichette opzionali in formato YOLO, più esportazioni NDJSON

Qual è la dimensione massima del dataset?

I limiti di archiviazione dipendono dal tuo piano:

PianoLimite di archiviazione
Gratuito100 GB
Pro500 GB
EnterpriseIllimitato

Limiti file individuali: Immagini 50MB, Video 1GB, dataset 10GB su Free / 20GB su Pro / 50GB su Enterprise

Posso usare i miei dataset della piattaforma per l'addestramento locale?

Sì! Usa il formato URI del dataset per addestrare localmente:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Oppure esporta il tuo dataset in formato NDJSON per un addestramento completamente offline.

Commenti