Link to this sectionDataset Caltech-256#

Il dataset Caltech-256 è un classico benchmark di classificazione di immagini composto da 30.607 immagini distribuite su 256 categorie di oggetti più una classe di sfondo. Ogni categoria contiene almeno 80 immagini di oggetti del mondo reale (animali, veicoli, oggetti domestici e persone), rendendolo un successore più ampio e impegnativo di Caltech-101 per i modelli di riconoscimento degli oggetti.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

Suddivisione automatica dei dati

Caltech-256 viene fornito senza una suddivisione predefinita tra training e validation. I comandi di training riportati di seguito lo suddividono automaticamente in 80% per il training e 20% per la validation, quindi non è necessaria alcuna preparazione manuale.

Link to this sectionCaratteristiche principali#

Caltech-256 contiene 30.607 immagini a colori suddivise in 256 categorie di oggetti più una classe di sfondo 257.clutter (per un totale di 257 cartelle di classi).
Le categorie coprono un'ampia varietà di oggetti del mondo reale, inclusi animali, veicoli, oggetti domestici e persone.
Ogni categoria contiene almeno 80 immagini, con la più numerosa che arriva fino a circa 800, pertanto le dimensioni delle classi sono sbilanciate.
Le immagini hanno dimensioni e risoluzioni variabili.
Caltech-256 è ampiamente utilizzato per testare algoritmi di classificazione di immagini e di riconoscimento di oggetti.

Link to this sectionStruttura del dataset#

Caltech-256 è distribuito in 257 cartelle — una per classe, che coprono 256 categorie di oggetti più una classe di sfondo 257.clutter — senza una suddivisione predefinita per training/validation. Quando avvii l'addestramento, Ultralytics suddivide automaticamente le immagini in modo che i modelli vengano addestrati su tutte le 257 classi senza alcuna configurazione manuale:

Classi: 257 (256 categorie di oggetti + 1 sfondo)
Immagini totali: 30.607
Suddivisione training/validation: automatica 80% / 20% (≈24.385 training, ≈6.222 validation)
Immagini per classe: almeno 80 (sbilanciato, fino a circa 800)

Link to this sectionApplicazioni#

Il dataset Caltech-256 è ampiamente utilizzato per addestrare e valutare modelli di classificazione di immagini e riconoscimento di oggetti, tra cui le Convolutional Neural Networks (CNN) e le Support Vector Machines (SVM). Il suo elevato numero di categorie e le immagini di alta qualità lo rendono un benchmark popolare per la ricerca e la prototipazione nel machine learning e nella computer vision.

Link to this sectionUtilizzo#

Addestra un modello YOLO su Caltech-256 per 100 epoche con una dimensione dell'immagine di 416. Per l'elenco completo degli argomenti disponibili, consulta la pagina Training e la guida all'attività di classificazione delle immagini.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionEsempi di immagini e annotazioni#

Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, offrendo un set di dati ben strutturato per attività di classificazione di immagini. Ecco alcuni esempi di immagini dal dataset (crediti):

Campioni del dataset di classificazione di immagini Caltech-256

I campioni mostrano la diversità e la complessità degli oggetti nel dataset Caltech-256, sottolineando il valore di un set di dati variegato per l'addestramento di modelli robusti di riconoscimento degli oggetti.

Link to this sectionCitazioni e riconoscimenti#

Se utilizzi il dataset Caltech-256 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente articolo:

Citazione

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Desideriamo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come una risorsa preziosa per la comunità di ricerca nel machine learning e nella computer vision. Per ulteriori informazioni sul dataset Caltech-256 e sui suoi creatori, visita il sito web del dataset Caltech-256.

Link to this sectionFAQ#

Link to this sectionA cosa serve il dataset Caltech-256 nel machine learning?#

Il dataset Caltech-256 è ampiamente utilizzato per addestrare e testare modelli di classificazione di immagini e riconoscimento di oggetti. Contiene 30.607 immagini distribuite su 256 categorie di oggetti più una classe di sfondo, fornendo un benchmark più ampio e impegnativo rispetto a Caltech-101 per algoritmi come le Neural Networks convoluzionali (CNN) e le Support Vector Machines (SVM).

Link to this sectionCome posso addestrare un modello Ultralytics YOLO sul dataset Caltech-256?#

Per addestrare un modello Ultralytics YOLO su Caltech-256, utilizza i frammenti di codice riportati di seguito. Il dataset viene scaricato automaticamente al primo utilizzo. Per un elenco completo degli argomenti, consulta la pagina Training del modello.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionQuante classi contiene il dataset Caltech-256?#

Caltech-256 contiene 256 categorie di oggetti più una classe di sfondo 257.clutter, per un totale di 257 cartelle di classi e 30.607 immagini. Quando effettui l'addestramento con Ultralytics, il modello impara tutte le 257 classi. Ogni categoria contiene almeno 80 immagini, ma le dimensioni delle classi sono sbilanciate, con la più grande che contiene fino a circa 800 immagini.

Link to this sectionCome viene suddiviso il dataset Caltech-256 in set di training e di validation?#

Caltech-256 non ha una suddivisione predefinita. La prima volta che esegui l'addestramento, Ultralytics lo divide automaticamente in 80% training / 20% validation (circa 24.385 immagini di training e 6.222 di validation), quindi non è necessario creare le suddivisioni manualmente. Se desideri controllare tu stesso la suddivisione, organizza le immagini nelle cartelle train/ e val/ prima di iniziare l'addestramento.

Link to this sectionPosso utilizzare la Ultralytics Platform per addestrare modelli sul dataset Caltech-256?#

Sì. La Ultralytics Platform ti consente di gestire i dataset, addestrare modelli di classificazione di immagini e distribuirli senza dover scrivere codice complesso. È un modo pratico per eseguire esperimenti su Caltech-256 nel cloud, e puoi esplorare ulteriori opzioni nella nostra panoramica sui dataset di classificazione.

Collaboratori

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Creato 12 nov 2023Aggiornato l’altro ieri