Vai al contenuto

Set di dati Caltech-101

Il dataset Caltech-101 è un dataset ampiamente utilizzato per compiti di riconoscimento di oggetti, contenente circa 9.000 immagini di 101 categorie di oggetti. Le categorie sono state scelte per riflettere una varietà di oggetti del mondo reale e le immagini stesse sono state accuratamente selezionate e annotate per fornire un punto di riferimento impegnativo per gli algoritmi di riconoscimento degli oggetti.

Caratteristiche principali

  • Il dataset Caltech-101 comprende circa 9.000 immagini a colori suddivise in 101 categorie.
  • Le categorie comprendono un'ampia varietà di oggetti, tra cui animali, veicoli, oggetti domestici e persone.
  • Il numero di immagini per categoria varia, con circa 40-800 immagini per ogni categoria.
  • Le immagini sono di dimensioni variabili e la maggior parte di esse sono a media risoluzione.
  • Il Caltech-101 è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di riconoscimento degli oggetti.

Struttura del set di dati

A differenza di molti altri dataset, il dataset Caltech-101 non è formalmente suddiviso in set di allenamento e set di test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Tuttavia, una pratica comune è quella di utilizzare un sottoinsieme casuale di immagini per la formazione (ad esempio 30 immagini per categoria) e le restanti immagini per i test.

Applicazioni

Il dataset Caltech-101 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di riconoscimento di oggetti, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. L'ampia varietà di categorie e le immagini di alta qualità lo rendono un dataset eccellente per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-101 per 100 epoch, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech101', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-101 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset ben strutturato per compiti di riconoscimento di oggetti. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel dataset Caltech-101, sottolineando l'importanza di un dataset diversificato per l'addestramento di modelli robusti di riconoscimento degli oggetti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-101 nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Desideriamo ringraziare Li Fei-Fei, Rob Fergus e Pietro Perona per aver creato e mantenuto il dataset Caltech-101 come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset Caltech-101 e sui suoi creatori, visita il sito web del dataset Caltech-101.



Creato 2023-11-12, Aggiornato 2023-11-22
Autori: glenn-jocher (3)

Commenti