Vai al contenuto

Set di dati Caltech-101

Il dataset Caltech-101 è un dataset ampiamente utilizzato per compiti di riconoscimento di oggetti, contenente circa 9.000 immagini di 101 categorie di oggetti. Le categorie sono state scelte per riflettere una varietà di oggetti del mondo reale e le immagini stesse sono state accuratamente selezionate e annotate per fornire un punto di riferimento impegnativo per gli algoritmi di riconoscimento degli oggetti.

Caratteristiche principali

  • Il dataset Caltech-101 comprende circa 9.000 immagini a colori suddivise in 101 categorie.
  • Le categorie comprendono un'ampia varietà di oggetti, tra cui animali, veicoli, oggetti domestici e persone.
  • Il numero di immagini per categoria varia, con circa 40-800 immagini per ogni categoria.
  • Le immagini sono di dimensioni variabili e la maggior parte di esse sono a media risoluzione.
  • Il Caltech-101 è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di riconoscimento degli oggetti.

Struttura del set di dati

A differenza di molti altri dataset, il dataset Caltech-101 non è formalmente suddiviso in set di allenamento e set di test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Tuttavia, una pratica comune è quella di utilizzare un sottoinsieme casuale di immagini per la formazione (ad esempio 30 immagini per categoria) e le restanti immagini per i test.

Applicazioni

Il dataset Caltech-101 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di riconoscimento di oggetti, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. L'ampia varietà di categorie e le immagini di alta qualità lo rendono un dataset eccellente per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-101 per 100 epoch, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-101 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset ben strutturato per compiti di riconoscimento di oggetti. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel set di dati Caltech-101, sottolineando l'importanza di un set di dati diversificato per l'addestramento di modelli robusti di riconoscimento degli oggetti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-101 nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Desideriamo ringraziare Li Fei-Fei, Rob Fergus e Pietro Perona per aver creato e mantenuto il dataset Caltech-101 come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset Caltech-101 e sui suoi creatori, visita il sito web del dataset Caltech-101.

DOMANDE FREQUENTI

A cosa serve il dataset Caltech-101 nell'apprendimento automatico?

Il dataset Caltech-101 è ampiamente utilizzato nell'apprendimento automatico per compiti di riconoscimento degli oggetti. Contiene circa 9.000 immagini suddivise in 101 categorie e rappresenta un punto di riferimento impegnativo per la valutazione degli algoritmi di riconoscimento degli oggetti. I ricercatori lo utilizzano per addestrare e testare i modelli, in particolare le reti neurali convoluzionali (CNN) e le macchine a vettori di supporto (SVM), nella visione artificiale.

Come posso addestrare un modello Ultralytics YOLO sul dataset Caltech-101?

Per addestrare un modello Ultralytics YOLO sul dataset Caltech-101, puoi utilizzare i frammenti di codice forniti. Ad esempio, per allenarsi per 100 epoch:

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Per argomenti e opzioni più dettagliate, consulta la pagina di formazione del modello.

Quali sono le caratteristiche principali del set di dati Caltech-101?

Il set di dati Caltech-101 comprende: - Circa 9.000 immagini a colori suddivise in 101 categorie. - Categorie che coprono una vasta gamma di oggetti, tra cui animali, veicoli e oggetti domestici. - Numero variabile di immagini per categoria, in genere tra 40 e 800. - Dimensioni variabili delle immagini, la maggior parte delle quali a media risoluzione.

Queste caratteristiche lo rendono una scelta eccellente per l'addestramento e la valutazione dei modelli di riconoscimento degli oggetti nell'ambito dell'apprendimento automatico e della computer vision.

Perché dovrei citare il dataset Caltech-101 nella mia ricerca?

Citando il set di dati Caltech-101 nelle tue ricerche, riconosci il contributo dei creatori e fornisci un riferimento ad altri che potrebbero utilizzare il set di dati. La citazione consigliata è:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citare aiuta a mantenere l'integrità del lavoro accademico e aiuta i colleghi a trovare la risorsa originale.

Posso utilizzare Ultralytics HUB per addestrare i modelli sul dataset Caltech-101?

Sì, puoi utilizzare Ultralytics HUB per addestrare i modelli sul dataset Caltech-101. Ultralytics HUB offre una piattaforma intuitiva per la gestione dei dataset, l'addestramento dei modelli e la loro distribuzione senza dover ricorrere a un'intensa attività di codifica. Per una guida dettagliata, consulta il post del blog Come addestrare i tuoi modelli personalizzati con Ultralytics HUB.



Creato 2023-11-12, Aggiornato 2024-07-04
Autori: glenn-jocher (6)

Commenti