Dataset Caltech-101

Il dataset Caltech-101 è un set di dati ampiamente utilizzato per le attività di riconoscimento degli oggetti, contenente circa 9.000 immagini suddivise in 101 categorie di oggetti. Le categorie sono state scelte per riflettere una varietà di oggetti del mondo reale, e le immagini stesse sono state accuratamente selezionate e annotate per fornire un benchmark stimolante per gli algoritmi di riconoscimento degli oggetti.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics Platform
Suddivisione automatica dei dati

Il dataset Caltech-101, così come fornito, non include suddivisioni predefinite tra training e validation. Tuttavia, quando utilizzi i comandi di addestramento forniti negli esempi di utilizzo qui sotto, il framework Ultralytics suddividerà automaticamente il dataset per te. La suddivisione predefinita utilizzata è dell'80% per il set di addestramento e del 20% per il set di validazione.

Caratteristiche principali

  • Il dataset Caltech-101 comprende circa 9.000 immagini a colori divise in 101 categorie.
  • Le categorie comprendono un'ampia varietà di oggetti, tra cui animali, veicoli, articoli per la casa e persone.
  • Il numero di immagini per categoria varia, con circa 40-800 immagini in ogni categoria.
  • Le immagini hanno dimensioni variabili, con la maggior parte delle immagini a risoluzione media.
  • Caltech-101 è ampiamente utilizzato per l'addestramento e il test nel campo del machine learning, in particolare per le attività di riconoscimento degli oggetti.

Struttura del dataset

A differenza di molti altri dataset, il dataset Caltech-101 non è formalmente suddiviso in set di addestramento e test. Gli utenti solitamente creano le proprie suddivisioni in base alle proprie esigenze specifiche. Tuttavia, una pratica comune è utilizzare un sottoinsieme casuale di immagini per l'addestramento (ad esempio, 30 immagini per categoria) e le immagini rimanenti per il test.

Applicazioni

Il dataset Caltech-101 è ampiamente utilizzato per addestrare e valutare modelli di deep learning in attività di riconoscimento degli oggetti, come le Convolutional Neural Networks (CNN), le Support Vector Machines (SVM) e vari altri algoritmi di machine learning. La sua ampia varietà di categorie e le immagini di alta qualità lo rendono un eccellente dataset per la ricerca e lo sviluppo nel campo del machine learning e della computer vision.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-101 per 100 epochs, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di Training del modello.

Esempio di training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Immagini campione e annotazioni

Il dataset Caltech-101 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset ben strutturato per le attività di image classification. Ecco alcuni esempi di immagini dal dataset:

Esempi del dataset di image classification Caltech-101

L'esempio mostra la varietà e la complessità degli oggetti nel dataset Caltech-101, sottolineando l'importanza di un dataset diversificato per l'addestramento di modelli di riconoscimento degli oggetti robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-101 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente articolo:

Citazione
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Desideriamo ringraziare Li Fei-Fei, Rob Fergus e Pietro Perona per aver creato e mantenuto il dataset Caltech-101 come una risorsa preziosa per la comunità di ricerca sul machine learning e la computer vision. Per ulteriori informazioni sul dataset Caltech-101 e sui suoi creatori, visita il sito web del dataset Caltech-101.

FAQ

A cosa serve il dataset Caltech-101 nel machine learning?

Il dataset Caltech-101 è ampiamente utilizzato nel machine learning per le attività di riconoscimento degli oggetti. Contiene circa 9.000 immagini suddivise in 101 categorie, fornendo un benchmark stimolante per valutare gli algoritmi di riconoscimento degli oggetti. I ricercatori lo sfruttano per addestrare e testare modelli, specialmente Convolutional Neural Networks (CNN) e Support Vector Machines (SVM), nella computer vision.

Come posso addestrare un modello YOLO di Ultralytics sul dataset Caltech-101?

Per addestrare un modello YOLO di Ultralytics sul dataset Caltech-101, puoi utilizzare i frammenti di codice forniti. Ad esempio, per addestrare per 100 epoche:

Esempio di training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Per argomenti e opzioni più dettagliate, consulta la pagina di Training del modello.

Quali sono le caratteristiche principali del dataset Caltech-101?

Il dataset Caltech-101 include:

  • Circa 9.000 immagini a colori suddivise in 101 categorie.
  • Categorie che coprono una vasta gamma di oggetti, inclusi animali, veicoli e articoli per la casa.
  • Numero variabile di immagini per categoria, solitamente tra 40 e 800.
  • Dimensioni delle immagini variabili, con la maggior parte a risoluzione media.

Queste caratteristiche lo rendono una scelta eccellente per l'addestramento e la valutazione di modelli di riconoscimento degli oggetti nel machine learning e nella computer vision.

Perché dovrei citare il dataset Caltech-101 nella mia ricerca?

Citare il dataset Caltech-101 nella tua ricerca riconosce i contributi dei creatori e fornisce un riferimento per altri che potrebbero utilizzare il dataset. La citazione consigliata è:

Citazione
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citare aiuta a mantenere l'integrità del lavoro accademico e assiste i colleghi nel localizzare la risorsa originale.

Posso utilizzare la Ultralytics Platform per addestrare modelli sul dataset Caltech-101?

Sì, puoi utilizzare Ultralytics Platform per addestrare modelli sul dataset Caltech-101. La Ultralytics Platform fornisce una piattaforma intuitiva per gestire dataset, addestrare modelli e distribuirli senza un'ampia programmazione. Per una guida dettagliata, consulta il post del blog su come addestrare i tuoi modelli personalizzati con la Ultralytics Platform.

Commenti