Vai al contenuto

Set di dati Caltech-256

Il dataset Caltech-256 è un'ampia raccolta di immagini utilizzate per compiti di classificazione di oggetti. Contiene circa 30.000 immagini suddivise in 257 categorie (256 categorie di oggetti e 1 categoria di sfondo). Le immagini sono curate e annotate con cura per fornire un benchmark impegnativo e diversificato per gli algoritmi di riconoscimento degli oggetti.



Guarda: Come addestrare il modello di classificazione delle immagini utilizzando il dataset Caltech-256 con Ultralytics HUB

Caratteristiche principali

  • Il dataset Caltech-256 comprende circa 30.000 immagini a colori suddivise in 257 categorie.
  • Ogni categoria contiene un minimo di 80 immagini.
  • Le categorie comprendono un'ampia varietà di oggetti del mondo reale, tra cui animali, veicoli, oggetti domestici e persone.
  • Le immagini hanno dimensioni e risoluzioni variabili.
  • Il Caltech-256 è ampiamente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico, in particolare per i compiti di riconoscimento degli oggetti.

Struttura del set di dati

Come Caltech-101, il dataset Caltech-256 non prevede una suddivisione formale tra set di allenamento e set di test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Una pratica comune è quella di utilizzare un sottoinsieme casuale di immagini per la formazione e le restanti immagini per i test.

Applicazioni

Il dataset Caltech-256 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di riconoscimento di oggetti, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La varietà di categorie e le immagini di alta qualità lo rendono un dataset prezioso per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoch, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Immagini di esempio e annotazioni

Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, fornendo un set di dati completo per i compiti di riconoscimento degli oggetti. Ecco alcuni esempi di immagini tratte dal dataset(credito):

Immagine campione del set di dati

L'esempio mostra la diversità e la complessità degli oggetti presenti nel dataset Caltech-256, sottolineando l'importanza di un dataset vario per l'addestramento di modelli robusti di riconoscimento degli oggetti.

Citazioni e ringraziamenti

Se utilizzi il dataset Caltech-256 nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Desideriamo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul

Per conoscere il dataset Caltech-256 e i suoi creatori, visita il sito web del dataset Caltech-256.

DOMANDE FREQUENTI

Cos'è il dataset Caltech-256 e perché è importante per l'apprendimento automatico?

Il dataset Caltech-256 è un dataset di immagini di grandi dimensioni utilizzato principalmente per compiti di classificazione di oggetti nell'apprendimento automatico e nella computer vision. Si tratta di circa 30.000 immagini a colori suddivise in 257 categorie, che coprono un'ampia gamma di oggetti del mondo reale. La varietà e l'alta qualità delle immagini rendono il dataset un eccellente punto di riferimento per la valutazione degli algoritmi di riconoscimento degli oggetti, fondamentale per lo sviluppo di modelli di apprendimento automatico robusti.

Come posso addestrare un modello YOLO sul dataset Caltech-256 utilizzando Python o CLI?

Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoch, puoi utilizzare i seguenti frammenti di codice. Per ulteriori opzioni, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Quali sono i casi d'uso più comuni del dataset Caltech-256?

Il dataset Caltech-256 è ampiamente utilizzato per diversi compiti di riconoscimento di oggetti, come ad esempio:

  • Addestramento delle reti neurali convoluzionali (CNN)
  • Valutazione delle prestazioni delle macchine a vettori di supporto (SVM)
  • Benchmarking di nuovi algoritmi di apprendimento profondo
  • Sviluppare modelli di rilevamento degli oggetti utilizzando framework come Ultralytics YOLO

La sua varietà e le sue annotazioni complete lo rendono ideale per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Come è strutturato e suddiviso il dataset Caltech-256 per la formazione e il test?

Il dataset Caltech-256 non viene fornito con una suddivisione predefinita per la formazione e il test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Un approccio comune è quello di selezionare in modo casuale un sottoinsieme di immagini per l'addestramento e utilizzare le immagini rimanenti per i test. Questa flessibilità consente agli utenti di adattare il set di dati alle esigenze specifiche dei loro progetti e alle loro configurazioni sperimentali.

Perché dovrei usare Ultralytics YOLO per addestrare i modelli sul dataset Caltech-256?

Ultralytics YOLO offrono diversi vantaggi per l'addestramento sul set di dati Caltech-256:

  • Alta precisione: i modelli di YOLO sono noti per le loro prestazioni all'avanguardia nei compiti di rilevamento degli oggetti.
  • Velocità: offrono capacità di inferenza in tempo reale, rendendole adatte ad applicazioni che richiedono previsioni rapide.
  • Facilità d'uso: Con Ultralytics HUB, gli utenti possono addestrare, convalidare e distribuire i modelli senza dover ricorrere a un'intensa attività di codifica.
  • Modelli pre-addestrati: Partendo da modelli preaddestrati, come yolov8n-cls.pt, può ridurre significativamente i tempi di formazione e migliorare l'accuratezza del modello.

Per maggiori dettagli, esplora la nostra guida completa alla formazione.



Creato 2023-11-12, Aggiornato 2024-07-18
Autori: RizwanMunawar (1), glenn-jocher (6)

Commenti