Vai al contenuto

Dataset Caltech-256

Il dataset Caltech-256 è una vasta raccolta di immagini utilizzata per attività di classificazione degli oggetti. Contiene circa 30.000 immagini suddivise in 257 categorie (256 categorie di oggetti e 1 categoria di sfondo). Le immagini sono accuratamente curate e annotate per fornire un benchmark stimolante e diversificato per gli algoritmi di riconoscimento degli oggetti.



Guarda: Come effettuare il training Classificazione delle immagini Modello che utilizza il dataset Caltech-256 con Ultralytics HUB

Suddivisione automatica dei dati

Il dataset Caltech-256, così come fornito, non include suddivisioni predefinite per training/validazione. Tuttavia, quando si utilizzano i comandi di training forniti negli esempi di utilizzo seguenti, il framework Ultralytics suddividerà automaticamente il dataset. La suddivisione predefinita utilizzata è dell'80% per il set di training e del 20% per il set di validazione.

Caratteristiche principali

  • Il dataset Caltech-256 comprende circa 30.000 immagini a colori suddivise in 257 categorie.
  • Ogni categoria contiene un minimo di 80 immagini.
  • Le categorie comprendono un'ampia varietà di oggetti del mondo reale, tra cui animali, veicoli, articoli per la casa e persone.
  • Le immagini sono di dimensioni e risoluzioni variabili.
  • Caltech-256 è ampiamente utilizzato per il training e il testing nel campo del machine learning, in particolare per le attività di riconoscimento di oggetti.

Struttura del set di dati

Come Caltech-101, il dataset Caltech-256 non ha una suddivisione formale tra set di addestramento e test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Una pratica comune è utilizzare un sottoinsieme casuale di immagini per l'addestramento e le immagini rimanenti per il test.

Applicazioni

Il set di dati Caltech-256 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di riconoscimento degli oggetti, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. Il suo insieme diversificato di categorie e le immagini di alta qualità lo rendono un set di dati prezioso per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della computer vision.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset completo per le attività di riconoscimento di oggetti. Ecco alcuni esempi di immagini dal dataset (credit):

Immagine di esempio del set di dati

L'esempio mostra la diversità e la complessità degli oggetti nel dataset Caltech-256, sottolineando l'importanza di un dataset vario per l'addestramento di modelli di riconoscimento di oggetti robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-256 nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Vorremmo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come risorsa preziosa per la comunità della ricerca sull'apprendimento automatico e sulla computer vision. Per maggiori informazioni sul dataset Caltech-256 e sui suoi creatori, visita il sito web del dataset Caltech-256.

FAQ

Cos'è il dataset Caltech-256 e perché è importante per il machine learning?

Il dataset Caltech-256 è un ampio dataset di immagini utilizzato principalmente per attività di classificazione degli oggetti nel machine learning e nella computer vision. È composto da circa 30.000 immagini a colori suddivise in 257 categorie, che coprono una vasta gamma di oggetti del mondo reale. Le immagini diverse e di alta qualità del dataset lo rendono un eccellente benchmark per la valutazione degli algoritmi di riconoscimento degli oggetti, il che è fondamentale per lo sviluppo di modelli di machine learning robusti.

Come posso addestrare un modello YOLO sul dataset Caltech-256 utilizzando Python o la CLI?

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Consulta la pagina di Training del modello per ulteriori opzioni.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Quali sono i casi d'uso più comuni per il dataset Caltech-256?

Il dataset Caltech-256 è ampiamente utilizzato per varie attività di riconoscimento degli oggetti come:

  • Addestramento di reti neurali convoluzionali (CNN)
  • Valutazione delle prestazioni delle Macchine a Vettori di Supporto (SVM)
  • Benchmarking di nuovi algoritmi di deep learning
  • Sviluppo di modelli di object detection utilizzando framework come Ultralytics YOLO

La sua diversità e le annotazioni complete lo rendono ideale per la ricerca e lo sviluppo nel machine learning e nella computer vision.

Come è strutturato e suddiviso il dataset Caltech-256 per l'addestramento e il test?

Il dataset Caltech-256 non viene fornito con una suddivisione predefinita per l'addestramento e il test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Un approccio comune è selezionare casualmente un sottoinsieme di immagini per l'addestramento e utilizzare le immagini rimanenti per il test. Questa flessibilità consente agli utenti di adattare il dataset ai requisiti specifici del loro progetto e alle configurazioni sperimentali.

Perché dovrei utilizzare Ultralytics YOLO per addestrare modelli sul dataset Caltech-256?

I modelli Ultralytics YOLO offrono diversi vantaggi per l'addestramento sul dataset Caltech-256:

  • Elevata Accuratezza: I modelli YOLO sono noti per le loro prestazioni all'avanguardia nelle attività di rilevamento di oggetti.
  • Velocità: Forniscono capacità di inferenza in tempo reale, rendendoli adatti per applicazioni che richiedono previsioni rapide.
  • Facilità d'uso: Con Ultralytics HUB, gli utenti possono addestrare, convalidare e implementare modelli senza una programmazione complessa.
  • Modelli Pre-addestrati: A partire da modelli pre-addestrati, come yolo11n-cls.pt, può ridurre significativamente i tempi di addestramento e migliorare il modello accuratezza.

Per maggiori dettagli, esplora la nostra guida completa all'addestramento e scopri di più sulla classificazione delle immagini con Ultralytics YOLO.



📅 Creato 1 anno fa ✏️ Aggiornato 4 mesi fa

Commenti