Dataset Caltech-256

Il dataset Caltech-256 è una vasta raccolta di immagini utilizzata per attività di classificazione degli oggetti. Contiene circa 30.000 immagini suddivise in 257 categorie (256 categorie di oggetti e 1 categoria di sfondo). Le immagini sono accuratamente curate e annotate per fornire un benchmark stimolante e diversificato per gli algoritmi di riconoscimento degli oggetti.

Guarda: Come effettuare il training Classificazione delle immagini Modello basato sul dataset Caltech-256 con Ultralytics

Suddivisione automatica dei dati

Il dataset Caltech-256, così come fornito, non include suddivisioni predefinite per training/validazione. Tuttavia, quando si utilizzano i comandi di training forniti negli esempi di utilizzo seguenti, il framework Ultralytics suddividerà automaticamente il dataset. La suddivisione predefinita utilizzata è dell'80% per il set di training e del 20% per il set di validazione.

Caratteristiche principali

Il dataset Caltech-256 comprende circa 30.000 immagini a colori suddivise in 257 categorie.
Ogni categoria contiene un minimo di 80 immagini.
Le categorie comprendono un'ampia varietà di oggetti del mondo reale, tra cui animali, veicoli, articoli per la casa e persone.
Le immagini sono di dimensioni e risoluzioni variabili.
Caltech-256 è ampiamente utilizzato per il training e il testing nel campo del machine learning, in particolare per le attività di riconoscimento di oggetti.

Struttura del set di dati

Come Caltech-101, il dataset Caltech-256 non ha una suddivisione formale tra set di addestramento e test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Una pratica comune è utilizzare un sottoinsieme casuale di immagini per l'addestramento e le immagini rimanenti per il test.

Applicazioni

Il set di dati Caltech-256 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di riconoscimento degli oggetti, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. Il suo insieme diversificato di categorie e le immagini di alta qualità lo rendono un set di dati prezioso per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della computer vision.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.

Esempio di addestramento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset completo per le attività di riconoscimento di oggetti. Ecco alcuni esempi di immagini dal dataset (credit):

Campioni del set di dati di classificazione delle immagini Caltech-256

L'esempio mostra la diversità e la complessità degli oggetti nel dataset Caltech-256, sottolineando l'importanza di un dataset vario per l'addestramento di modelli di riconoscimento di oggetti robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-256 nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

BibTeX

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Vorremmo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come risorsa preziosa per la comunità della ricerca sull'apprendimento automatico e sulla computer vision. Per maggiori informazioni sul dataset Caltech-256 e sui suoi creatori, visita il sito web del dataset Caltech-256.

FAQ

Cos'è il dataset Caltech-256 e perché è importante per il machine learning?

Il dataset Caltech-256 è un ampio dataset di immagini utilizzato principalmente per attività di classificazione degli oggetti nel machine learning e nella computer vision. È composto da circa 30.000 immagini a colori suddivise in 257 categorie, che coprono una vasta gamma di oggetti del mondo reale. Le immagini diverse e di alta qualità del dataset lo rendono un eccellente benchmark per la valutazione degli algoritmi di riconoscimento degli oggetti, il che è fondamentale per lo sviluppo di modelli di machine learning robusti.

Come posso addestrare un modello YOLO sul dataset Caltech-256 utilizzando Python o la CLI?

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Consulta la pagina di Training del modello per ulteriori opzioni.

Esempio di addestramento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

Quali sono i casi d'uso più comuni per il dataset Caltech-256?

Il dataset Caltech-256 è ampiamente utilizzato per varie attività di riconoscimento degli oggetti come:

Addestramento di reti neurali convoluzionali (CNN)
Valutazione delle prestazioni delle Macchine a Vettori di Supporto (SVM)
Benchmarking di nuovi algoritmi di deep learning
Sviluppo di modelli di object detection utilizzando framework come Ultralytics YOLO

La sua diversità e le annotazioni complete lo rendono ideale per la ricerca e lo sviluppo nel machine learning e nella computer vision.

Come è strutturato e suddiviso il dataset Caltech-256 per l'addestramento e il test?

Il dataset Caltech-256 non viene fornito con una suddivisione predefinita per l'addestramento e il test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Un approccio comune è selezionare casualmente un sottoinsieme di immagini per l'addestramento e utilizzare le immagini rimanenti per il test. Questa flessibilità consente agli utenti di adattare il dataset ai requisiti specifici del loro progetto e alle configurazioni sperimentali.

Perché dovrei utilizzare Ultralytics YOLO per addestrare modelli sul dataset Caltech-256?

I modelli Ultralytics YOLO offrono diversi vantaggi per l'addestramento sul dataset Caltech-256:

Elevata Accuratezza: I modelli YOLO sono noti per le loro prestazioni all'avanguardia nelle attività di rilevamento di oggetti.
Velocità: Forniscono capacità di inferenza in tempo reale, rendendoli adatti per applicazioni che richiedono previsioni rapide.
Facilità d'Uso: Con la piattaforma Ultralytics, gli utenti possono addestrare, validare e deployare modelli senza la necessità di un'ampia programmazione.
Modelli Pre-addestrati: A partire da modelli pre-addestrati, come yolo26n-cls.pt, può ridurre significativamente i tempi di addestramento e migliorare il modello accuratezza.

Per maggiori dettagli, esplora la nostra guida completa all'addestramento e scopri di più sulla classificazione delle immagini con Ultralytics YOLO.

📅 Creato 2 anni fa ✏️ Aggiornato 27 giorni fa