Vai al contenuto

Preparazione dei Dati

La preparazione dei dati è la base per modelli di visione artificiale di successo. La Piattaforma Ultralytics fornisce strumenti completi per la gestione dei dati di training, dal caricamento all'annotazione, fino all'analisi.

Panoramica

La sezione Dati della Piattaforma Ultralytics ti aiuta a:

  • Carica immagini, video e archivi (ZIP, TAR, GZ)
  • Annotare con strumenti di disegno manuali e etichettatura intelligente SAM
  • Analizzare i tuoi dati con statistiche e visualizzazioni
  • Esportazione in formato NDJSON per la formazione locale

Panoramica dei dati Ultralytics Barra laterale Set di dati

Flusso di Lavoro

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
FaseDescrizione
CaricamentoImporta immagini, video o archivi con elaborazione automatica
AnnotaEtichetta i dati con bounding box, poligoni, keypoint o classificazioni
AnalizzaVisualizza distribuzioni di classe, heatmap spaziali e statistiche dimensionali
EsportazioneScarica in formato NDJSON per l'utilizzo offline

Attività supportate

La Piattaforma Ultralytics supporta tutti i 5 tipi di task YOLO:

TaskDescrizioneStrumento di Annotazione
RilevaObject detection con bounding boxStrumento rettangolo
SegmentazioneInstance segmentation con maschere di pixelStrumento poligono
PosaStima di keypoint (formato COCO a 17 punti)Strumento keypoint
OBBBounding box orientate per oggetti ruotatiStrumento box orientato
ClassificazioneClassificazione a livello di immagineSelettore di classe

Selezione del tipo di attività

Il tipo di attività viene impostato durante la creazione di un set di dati e determina quali strumenti di annotazione sono disponibili. È possibile modificarlo in un secondo momento dalle impostazioni del set di dati, ma le annotazioni incompatibili non verranno visualizzate dopo la modifica.

Caratteristiche principali

Archiviazione Intelligente

Ultralytics utilizza lo storage indirizzabile per contenuto (CAS) per una gestione efficiente dei dati:

  • Deduplicazione: immagini identiche memorizzate una sola volta tramite hash XXH3-128
  • Integrità: l'indirizzamento basato su hash garantisce l'integrità dei dati
  • Efficienza: Archiviazione ottimizzata e elaborazione rapida

URI dei Dataset

Riferisci i dataset usando il ul:// Formato URI (vedi Utilizzo dei dataset della piattaforma):

yolo train data=ul://username/datasets/my-dataset

Ciò consente di eseguire la formazione sui set di dati della piattaforma da qualsiasi macchina con la chiave API configurata.

Utilizzare i dati della piattaforma da Python

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Schede del set di dati

Ogni pagina del set di dati presenta cinque schede:

SchedaDescrizione
ImmaginiSfoglia le immagini in visualizzazione griglia, compatta o tabella con sovrapposizioni di annotazioni
LezioniVisualizza e modifica i nomi delle classi, i colori e il numero di etichette per classe
GraficiStatistiche automatiche: distribuzione frazionata, conteggi delle classi, mappe di calore
ModelliModelli addestrati su questo set di dati con metriche e stato
ErroriImmagini che non sono state elaborate con dettagli sull'errore e indicazioni per la risoluzione

Statistiche e Visualizzazione

Il Charts La scheda fornisce un'analisi automatica che include:

  • Distribuzione divisa: grafico ad anello del conteggio delle immagini train/val/test
  • Classi principali: grafico ad anello delle classi di annotazione più frequenti
  • Larghezze delle immagini: Istogramma della distribuzione delle larghezze delle immagini
  • Altezze delle immagini: Istogramma della distribuzione delle altezze delle immagini
  • Punti per istanza: distribuzione dei vertici dei poligoni o dei punti chiave (set di datisegment)
  • Posizioni delle annotazioni: mappa termica 2D delle posizioni centrali dei riquadri di delimitazione
  • Dimensioni immagine: mappa termica 2D di larghezza rispetto all'altezza con linee guida delle proporzioni
  • Dataset: Carica e gestisci i tuoi dati di addestramento
  • Annotazione: Dati di etichettatura con strumenti manuali e assistiti dall'IA

FAQ

Quali formati di file sono supportati per il caricamento?

La Piattaforma Ultralytics supporta:

Immagini: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (max 50 MB ciascuna)

Video: MP4, WebM, MOV, AVI, MKV, M4V (max 1 GB, fotogrammi estratti a 1 FPS, max 100 fotogrammi)

Archivi: ZIP, TAR, TAR.GZ, TGZ, GZ (max 10 GB) contenenti immagini con etichette opzionali YOLO

Qual è la dimensione massima del dataset?

I limiti di archiviazione dipendono dal tuo piano:

PianoLimite di Archiviazione
Gratuito100 GB
Pro500 GB
EnterprisePersonalizzato

Limiti dei singoli file: immagini 50 MB, video 1 GB, archivi 10 GB

Posso usare i miei dataset della Piattaforma per il training locale?

Sì! Usa il formato URI del dataset per il training locale:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Oppure esporta il tuo set di dati in formato NDJSON per un addestramento completamente offline.



📅 Creato 1 mese fa ✏️ Aggiornato 4 giorni fa
glenn-jochersergiuwaxmann

Commenti