Vai al contenuto

Set di dati Caltech-101

Il dataset Caltech-101 è un dataset ampiamente utilizzato per compiti di riconoscimento di oggetti, contenente circa 9.000 immagini di 101 categorie di oggetti. Le categorie sono state scelte per riflettere una varietà di oggetti del mondo reale e le immagini stesse sono state accuratamente selezionate e annotate per fornire un benchmark impegnativo per gli algoritmi di riconoscimento degli oggetti.

Caratteristiche principali

  • Il dataset Caltech-101 comprende circa 9.000 immagini a colori suddivise in 101 categorie.
  • Le categorie comprendono un'ampia varietà di oggetti, tra cui animali, veicoli, oggetti domestici e persone.
  • Il numero di immagini per categoria varia, con circa 40-800 immagini per ogni categoria.
  • Le immagini sono di dimensioni variabili e la maggior parte di esse sono a media risoluzione.
  • Caltech-101 è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per compiti di riconoscimento di oggetti.

Struttura del set di dati

A differenza di molti altri dataset, il dataset Caltech-101 non è formalmente suddiviso in training e testing set. Gli utenti di solito creano le proprie suddivisioni in base alle loro esigenze specifiche. Tuttavia, una pratica comune è quella di utilizzare un sottoinsieme casuale di immagini per l'addestramento (ad esempio, 30 immagini per categoria) e le restanti immagini per i test.

Applicazioni

Il dataset Caltech-101 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di riconoscimento di oggetti, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. L'ampia varietà di categorie e le immagini di alta qualità ne fanno un dataset eccellente per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-101 per 100 epoch, si possono usare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-101 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset ben strutturato per compiti di riconoscimento di oggetti. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel set di dati Caltech-101, sottolineando l'importanza di un set di dati diversificato per l'addestramento di modelli robusti di riconoscimento degli oggetti.

Citazioni e ringraziamenti

Se utilizzate il dataset Caltech-101 nel vostro lavoro di ricerca o sviluppo, siete pregati di citare il seguente documento:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Desideriamo ringraziare Li Fei-Fei, Rob Fergus e Pietro Perona per aver creato e mantenuto il dataset Caltech-101 come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per ulteriori informazioni sul dataset Caltech-101 e sui suoi creatori, visitare il sito web del dataset Caltech-101.

FAQ

A cosa serve il dataset Caltech-101 nell'apprendimento automatico?

Il dataset Caltech-101 è ampiamente utilizzato nell'apprendimento automatico per compiti di riconoscimento di oggetti. Contiene circa 9.000 immagini suddivise in 101 categorie, fornendo un punto di riferimento impegnativo per la valutazione degli algoritmi di riconoscimento degli oggetti. I ricercatori lo utilizzano per addestrare e testare i modelli, in particolare le reti neurali convoluzionali (CNN) e le macchine a vettori di supporto (SVM), nella visione artificiale.

Come si può addestrare un modello Ultralytics YOLO sul dataset Caltech-101?

Per addestrare un modello Ultralytics YOLO sul dataset Caltech-101, è possibile utilizzare i frammenti di codice forniti. Ad esempio, per addestrare per 100 epoche:

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Per argomenti e opzioni più dettagliate, consultare la pagina Formazione del modello.

Quali sono le caratteristiche principali del dataset Caltech-101?

Il set di dati Caltech-101 comprende:

  • Circa 9.000 immagini a colori suddivise in 101 categorie.
  • Categorie che coprono una vasta gamma di oggetti, tra cui animali, veicoli e oggetti per la casa.
  • Numero variabile di immagini per categoria, tipicamente tra 40 e 800.
  • Immagini di dimensioni variabili, la maggior parte delle quali a media risoluzione.

Queste caratteristiche lo rendono una scelta eccellente per l'addestramento e la valutazione dei modelli di riconoscimento degli oggetti nell'apprendimento automatico e nella visione artificiale.

Perché dovrei citare il dataset Caltech-101 nella mia ricerca?

La citazione del dataset Caltech-101 nelle vostre ricerche riconosce il contributo dei creatori e fornisce un riferimento per altri che potrebbero utilizzare il dataset. La citazione consigliata è:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

La citazione aiuta a mantenere l'integrità del lavoro accademico e aiuta i colleghi a individuare la risorsa originale.

Posso usare Ultralytics HUB per addestrare i modelli sul dataset Caltech-101?

Sì, è possibile utilizzare Ultralytics HUB per addestrare i modelli sul set di dati Caltech-101. Ultralytics HUB fornisce una piattaforma intuitiva per la gestione dei dataset, l'addestramento dei modelli e la loro distribuzione senza dover ricorrere a una codifica approfondita. Per una guida dettagliata, consultare il post del blog Come addestrare i modelli personalizzati con Ultralytics HUB.

📅C reato 1 anno fa ✏️ Aggiornato 2 mesi fa

Commenti