Vai al contenuto

Set di dati Caltech-256

Il dataset Caltech-256 è un'ampia raccolta di immagini utilizzate per compiti di classificazione di oggetti. Contiene circa 30.000 immagini suddivise in 257 categorie (256 categorie di oggetti e 1 categoria di sfondo). Le immagini sono state accuratamente curate e annotate per fornire un benchmark impegnativo e diversificato per gli algoritmi di riconoscimento degli oggetti.



Guarda: Come allenarsi Classificazione delle immagini Modello utilizzando il dataset Caltech-256 con Ultralytics HUB

Caratteristiche principali

  • Il dataset Caltech-256 comprende circa 30.000 immagini a colori suddivise in 257 categorie.
  • Ogni categoria contiene un minimo di 80 immagini.
  • Le categorie comprendono un'ampia varietà di oggetti del mondo reale, tra cui animali, veicoli, oggetti domestici e persone.
  • Le immagini hanno dimensioni e risoluzioni variabili.
  • Caltech-256 è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di riconoscimento degli oggetti.

Struttura del set di dati

Come Caltech-101, il dataset Caltech-256 non prevede una suddivisione formale tra training e testing set. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Una pratica comune è quella di utilizzare un sottoinsieme casuale di immagini per l'addestramento e le restanti immagini per i test.

Applicazioni

Il dataset Caltech-256 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di riconoscimento di oggetti, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La varietà di categorie e le immagini di alta qualità ne fanno un dataset prezioso per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoch, si possono usare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, fornendo un set di dati completo per compiti di riconoscimento di oggetti. Ecco alcuni esempi di immagini tratte dal dataset(credito):

Immagine campione del set di dati

L'esempio mostra la diversità e la complessità degli oggetti presenti nel dataset Caltech-256, sottolineando l'importanza di un dataset vario per l'addestramento di modelli robusti di riconoscimento degli oggetti.

Citazioni e ringraziamenti

Se utilizzate il dataset Caltech-256 nel vostro lavoro di ricerca o sviluppo, siete pregati di citare il seguente documento:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Desideriamo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per ulteriori informazioni sul

Per conoscere il dataset Caltech-256 e i suoi creatori, visitare il sito web del dataset Caltech-256.

FAQ

Cos'è il dataset Caltech-256 e perché è importante per l'apprendimento automatico?

Il dataset Caltech-256 è un dataset di immagini di grandi dimensioni utilizzato principalmente per compiti di classificazione di oggetti nell'apprendimento automatico e nella computer vision. È composto da circa 30.000 immagini a colori suddivise in 257 categorie, che coprono un'ampia gamma di oggetti del mondo reale. La varietà e l'alta qualità delle immagini rendono il dataset un eccellente punto di riferimento per la valutazione degli algoritmi di riconoscimento degli oggetti, fondamentale per lo sviluppo di robusti modelli di apprendimento automatico.

Come posso addestrare un modello YOLO sul dataset Caltech-256 usando Python o CLI?

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoch, è possibile utilizzare i seguenti frammenti di codice. Per ulteriori opzioni, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Quali sono i casi d'uso più comuni del dataset Caltech-256?

Il dataset Caltech-256 è ampiamente utilizzato per vari compiti di riconoscimento di oggetti, come ad esempio:

La sua diversità e le annotazioni complete lo rendono ideale per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Come è strutturato e suddiviso il dataset Caltech-256 per l'addestramento e il test?

Il dataset Caltech-256 non viene fornito con una suddivisione predefinita per l'addestramento e il test. Gli utenti di solito creano le proprie suddivisioni in base alle loro esigenze specifiche. Un approccio comune è quello di selezionare in modo casuale un sottoinsieme di immagini per l'addestramento e utilizzare le immagini rimanenti per i test. Questa flessibilità consente agli utenti di adattare il set di dati ai requisiti specifici del progetto e alle impostazioni sperimentali.

Perché utilizzare Ultralytics YOLO per addestrare i modelli sul dataset Caltech-256?

Ultralytics YOLO offrono diversi vantaggi per l'addestramento sul set di dati Caltech-256:

  • Alta precisione: i modelli di YOLO sono noti per le loro prestazioni all'avanguardia nei compiti di rilevamento degli oggetti.
  • Velocità: offrono capacità di inferenza in tempo reale, rendendole adatte ad applicazioni che richiedono previsioni rapide.
  • Facilità d'uso: Con Ultralytics HUB, gli utenti possono addestrare, convalidare e distribuire i modelli senza dover ricorrere a una codifica approfondita.
  • Modelli pre-addestrati: Partendo da modelli preaddestrati, come yolo11n-cls.ptpuò ridurre significativamente il tempo di addestramento e migliorare il modello precisione.

Per maggiori dettagli, esplorate la nostra guida completa alla formazione.

📅C reato 1 anno fa ✏️ Aggiornato 3 mesi fa

Commenti