Dataset Caltech-256
Il dataset Caltech-256 è una vasta raccolta di immagini utilizzata per attività di classificazione degli oggetti. Contiene circa 30.000 immagini suddivise in 257 categorie (256 categorie di oggetti e 1 categoria di sfondo). Le immagini sono accuratamente curate e annotate per fornire un benchmark stimolante e diversificato per gli algoritmi di riconoscimento degli oggetti.
Guarda: Come effettuare il training Classificazione delle immagini Modello che utilizza il dataset Caltech-256 con Ultralytics HUB
Suddivisione automatica dei dati
Il dataset Caltech-256, così come fornito, non include suddivisioni predefinite per training/validazione. Tuttavia, quando si utilizzano i comandi di training forniti negli esempi di utilizzo seguenti, il framework Ultralytics suddividerà automaticamente il dataset. La suddivisione predefinita utilizzata è dell'80% per il set di training e del 20% per il set di validazione.
Caratteristiche principali
- Il dataset Caltech-256 comprende circa 30.000 immagini a colori suddivise in 257 categorie.
- Ogni categoria contiene un minimo di 80 immagini.
- Le categorie comprendono un'ampia varietà di oggetti del mondo reale, tra cui animali, veicoli, articoli per la casa e persone.
- Le immagini sono di dimensioni e risoluzioni variabili.
- Caltech-256 è ampiamente utilizzato per il training e il testing nel campo del machine learning, in particolare per le attività di riconoscimento di oggetti.
Struttura del set di dati
Come Caltech-101, il dataset Caltech-256 non ha una suddivisione formale tra set di addestramento e test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Una pratica comune è utilizzare un sottoinsieme casuale di immagini per l'addestramento e le immagini rimanenti per il test.
Applicazioni
Il set di dati Caltech-256 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di riconoscimento degli oggetti, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. Il suo insieme diversificato di categorie e le immagini di alta qualità lo rendono un set di dati prezioso per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della computer vision.
Utilizzo
Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Immagini di esempio e annotazioni
Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset completo per le attività di riconoscimento di oggetti. Ecco alcuni esempi di immagini dal dataset (credit):
L'esempio mostra la diversità e la complessità degli oggetti nel dataset Caltech-256, sottolineando l'importanza di un dataset vario per l'addestramento di modelli di riconoscimento di oggetti robusti.
Citazioni e ringraziamenti
Se utilizzi il dataset Caltech-256 nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}
Vorremmo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come risorsa preziosa per la comunità della ricerca sull'apprendimento automatico e sulla computer vision. Per maggiori informazioni sul dataset Caltech-256 e sui suoi creatori, visita il sito web del dataset Caltech-256.
FAQ
Cos'è il dataset Caltech-256 e perché è importante per il machine learning?
Il dataset Caltech-256 è un ampio dataset di immagini utilizzato principalmente per attività di classificazione degli oggetti nel machine learning e nella computer vision. È composto da circa 30.000 immagini a colori suddivise in 257 categorie, che coprono una vasta gamma di oggetti del mondo reale. Le immagini diverse e di alta qualità del dataset lo rendono un eccellente benchmark per la valutazione degli algoritmi di riconoscimento degli oggetti, il che è fondamentale per lo sviluppo di modelli di machine learning robusti.
Come posso addestrare un modello YOLO sul dataset Caltech-256 utilizzando Python o la CLI?
Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epoche, puoi utilizzare i seguenti frammenti di codice. Consulta la pagina di Training del modello per ulteriori opzioni.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416
Quali sono i casi d'uso più comuni per il dataset Caltech-256?
Il dataset Caltech-256 è ampiamente utilizzato per varie attività di riconoscimento degli oggetti come:
- Addestramento di reti neurali convoluzionali (CNN)
- Valutazione delle prestazioni delle Macchine a Vettori di Supporto (SVM)
- Benchmarking di nuovi algoritmi di deep learning
- Sviluppo di modelli di object detection utilizzando framework come Ultralytics YOLO
La sua diversità e le annotazioni complete lo rendono ideale per la ricerca e lo sviluppo nel machine learning e nella computer vision.
Come è strutturato e suddiviso il dataset Caltech-256 per l'addestramento e il test?
Il dataset Caltech-256 non viene fornito con una suddivisione predefinita per l'addestramento e il test. Gli utenti in genere creano le proprie suddivisioni in base alle loro esigenze specifiche. Un approccio comune è selezionare casualmente un sottoinsieme di immagini per l'addestramento e utilizzare le immagini rimanenti per il test. Questa flessibilità consente agli utenti di adattare il dataset ai requisiti specifici del loro progetto e alle configurazioni sperimentali.
Perché dovrei utilizzare Ultralytics YOLO per addestrare modelli sul dataset Caltech-256?
I modelli Ultralytics YOLO offrono diversi vantaggi per l'addestramento sul dataset Caltech-256:
- Elevata Accuratezza: I modelli YOLO sono noti per le loro prestazioni all'avanguardia nelle attività di rilevamento di oggetti.
- Velocità: Forniscono capacità di inferenza in tempo reale, rendendoli adatti per applicazioni che richiedono previsioni rapide.
- Facilità d'uso: Con Ultralytics HUB, gli utenti possono addestrare, convalidare e implementare modelli senza una programmazione complessa.
- Modelli Pre-addestrati: A partire da modelli pre-addestrati, come
yolo11n-cls.pt
, può ridurre significativamente i tempi di addestramento e migliorare il modello accuratezza.
Per maggiori dettagli, esplora la nostra guida completa all'addestramento e scopri di più sulla classificazione delle immagini con Ultralytics YOLO.