Vai al contenuto

Dataset Caltech-101

Il dataset Caltech-101 è un dataset ampiamente utilizzato per attività di riconoscimento di oggetti, contenente circa 9.000 immagini provenienti da 101 categorie di oggetti. Le categorie sono state scelte per riflettere una varietà di oggetti del mondo reale e le immagini stesse sono state accuratamente selezionate e annotate per fornire un benchmark stimolante per gli algoritmi di riconoscimento di oggetti.



Guarda: Come effettuare il training Classificazione delle immagini Modello che utilizza il dataset Caltech-256 con Ultralytics HUB

Suddivisione automatica dei dati

Il dataset Caltech-101, così come fornito, non include suddivisioni predefinite per training/validazione. Tuttavia, quando si utilizzano i comandi di training forniti negli esempi di utilizzo seguenti, il framework Ultralytics suddividerà automaticamente il dataset. La suddivisione predefinita utilizzata è dell'80% per il set di training e del 20% per il set di validazione.

Caratteristiche principali

  • Il dataset Caltech-101 comprende circa 9.000 immagini a colori suddivise in 101 categorie.
  • Le categorie comprendono un'ampia varietà di oggetti, tra cui animali, veicoli, articoli per la casa e persone.
  • Il numero di immagini per categoria varia, con circa 40-800 immagini in ciascuna categoria.
  • Le immagini sono di dimensioni variabili, con la maggior parte delle immagini a media risoluzione.
  • Caltech-101 è ampiamente utilizzato per il training e il testing nel campo del machine learning, in particolare per le attività di riconoscimento di oggetti.

Struttura del set di dati

A differenza di molti altri dataset, il dataset Caltech-101 non è formalmente suddiviso in set di training e di testing. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Tuttavia, una pratica comune è quella di utilizzare un sottoinsieme casuale di immagini per il training (ad esempio, 30 immagini per categoria) e le immagini rimanenti per il testing.

Applicazioni

Il set di dati Caltech-101 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di riconoscimento degli oggetti, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La sua ampia varietà di categorie e le immagini di alta qualità lo rendono un set di dati eccellente per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della computer vision.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-101 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il set di dati Caltech-101 contiene immagini a colori di alta qualità di vari oggetti, fornendo un set di dati ben strutturato per attività di classificazione delle immagini. Ecco alcuni esempi di immagini del set di dati:

Immagine di esempio del set di dati

L'esempio mostra la varietà e la complessità degli oggetti nel dataset Caltech-101, sottolineando il significato di un dataset diversificato per l'addestramento di modelli di riconoscimento di oggetti robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-101 nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Vorremmo ringraziare Li Fei-Fei, Rob Fergus e Pietro Perona per aver creato e mantenuto il dataset Caltech-101 come risorsa preziosa per la comunità di ricerca nel machine learning e nella computer vision. Per ulteriori informazioni sul dataset Caltech-101 e sui suoi creatori, visitare il sito web del dataset Caltech-101.

FAQ

Per cosa viene utilizzato il dataset Caltech-101 nel machine learning?

Il dataset Caltech-101 è ampiamente utilizzato nel machine learning per attività di riconoscimento degli oggetti. Contiene circa 9.000 immagini in 101 categorie, fornendo un benchmark impegnativo per la valutazione degli algoritmi di riconoscimento degli oggetti. I ricercatori lo sfruttano per addestrare e testare modelli, in particolare le reti neurali convoluzionali (CNN) e le macchine a vettori di supporto (SVM), nella computer vision.

Come posso addestrare un modello Ultralytics YOLO sul dataset Caltech-101?

Per addestrare un modello Ultralytics YOLO sul dataset Caltech-101, puoi utilizzare i frammenti di codice forniti. Ad esempio, per addestrare per 100 epoche:

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Per argomentazioni e opzioni più dettagliate, consulta la pagina di Training del modello.

Quali sono le caratteristiche principali del dataset Caltech-101?

Il dataset Caltech-101 include:

  • Circa 9.000 immagini a colori in 101 categorie.
  • Categorie che coprono una vasta gamma di oggetti, tra cui animali, veicoli e articoli per la casa.
  • Numero variabile di immagini per categoria, in genere tra 40 e 800.
  • Dimensioni variabili delle immagini, per lo più a media risoluzione.

Queste caratteristiche lo rendono una scelta eccellente per l'addestramento e la valutazione di modelli di riconoscimento di oggetti nel machine learning e nella computer vision.

Perché dovrei citare il dataset Caltech-101 nella mia ricerca?

Citare il dataset Caltech-101 nella tua ricerca riconosce il contributo dei creatori e fornisce un riferimento per altri che potrebbero utilizzare il dataset. La citazione raccomandata è:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citare aiuta a mantenere l'integrità del lavoro accademico e assiste i colleghi nella localizzazione della risorsa originale.

Posso utilizzare Ultralytics HUB per addestrare modelli sul dataset Caltech-101?

Sì, puoi usare Ultralytics HUB per addestrare modelli sul dataset Caltech-101. Ultralytics HUB fornisce una piattaforma intuitiva per la gestione dei dataset, l'addestramento dei modelli e la loro distribuzione senza una codifica estensiva. Per una guida dettagliata, consulta il post del blog come addestrare i tuoi modelli personalizzati con Ultralytics HUB.



📅 Creato 1 anno fa ✏️ Aggiornato 4 mesi fa

Commenti