Dataset Caltech-256
Il dataset Caltech-256 è un'ampia raccolta di immagini utilizzate per attività di classificazione di oggetti. Contiene circa 30.000 immagini suddivise in 257 categorie (256 categorie di oggetti e 1 categoria di sfondo). Le immagini sono accuratamente selezionate e annotate per fornire un benchmark stimolante e diversificato per gli algoritmi di riconoscimento degli oggetti.
Il dataset Caltech-256, così come fornito, non include suddivisioni predefinite di training/validazione. Tuttavia, quando utilizzi i comandi di training forniti negli esempi d'uso qui sotto, il framework Ultralytics suddividerà automaticamente il dataset per te. La suddivisione predefinita utilizzata è l'80% per il set di training e il 20% per il set di validazione.
Caratteristiche principali
- Il dataset Caltech-256 comprende circa 30.000 immagini a colori suddivise in 257 categorie.
- Ogni categoria contiene un minimo di 80 immagini.
- Le categorie comprendono un'ampia varietà di oggetti del mondo reale, inclusi animali, veicoli, articoli per la casa e persone.
- Le immagini hanno dimensioni e risoluzioni variabili.
- Caltech-256 è ampiamente utilizzato per il training e il testing nel campo del machine learning, in particolare per le attività di riconoscimento degli oggetti.
Struttura del dataset
Come per Caltech-101, il dataset Caltech-256 non ha una suddivisione formale tra set di training e di testing. Gli utenti solitamente creano le proprie suddivisioni in base alle loro esigenze specifiche. Una pratica comune consiste nell'utilizzare un sottoinsieme casuale di immagini per il training e le immagini rimanenti per il testing.
Applicazioni
Il dataset Caltech-256 è ampiamente utilizzato per il training e la valutazione di modelli di deep learning in attività di riconoscimento oggetti, come Convolutional Neural Networks (CNN), Support Vector Machines (SVM) e vari altri algoritmi di machine learning. Il suo set diversificato di categorie e le immagini di alta qualità lo rendono un dataset inestimabile per la ricerca e lo sviluppo nel campo del machine learning e della computer vision.
Utilizzo
Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epochs, puoi utilizzare i seguenti snippet di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Immagini campione e annotazioni
Il dataset Caltech-256 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset completo per attività di riconoscimento oggetti. Ecco alcuni esempi di immagini dal dataset (credit):

L'esempio mostra la diversità e la complessità degli oggetti nel dataset Caltech-256, sottolineando l'importanza di un dataset vario per addestrare modelli di riconoscimento oggetti robusti.
Citazioni e ringraziamenti
Se utilizzi il dataset Caltech-256 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente articolo:
@article{griffin2007caltech,
title={Caltech-256 object category dataset},
author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
year={2007}
}Vorremmo ringraziare Gregory Griffin, Alex Holub e Pietro Perona per aver creato e mantenuto il dataset Caltech-256 come una risorsa preziosa per la comunità di ricerca sul machine learning e sulla computer vision. Per ulteriori informazioni sul dataset Caltech-256 e sui suoi creatori, visita il sito web del dataset Caltech-256.
FAQ
Cos'è il dataset Caltech-256 e perché è importante per il machine learning?
Il dataset Caltech-256 è un grande dataset di immagini utilizzato principalmente per attività di classificazione di oggetti nel machine learning e nella computer vision. Consiste in circa 30.000 immagini a colori suddivise in 257 categorie, che coprono una vasta gamma di oggetti del mondo reale. Le immagini diversificate e di alta qualità del dataset lo rendono un eccellente benchmark per la valutazione di algoritmi di riconoscimento oggetti, fondamentale per lo sviluppo di modelli di machine learning robusti.
Come posso addestrare un modello YOLO sul dataset Caltech-256 utilizzando Python o la CLI?
Per addestrare un modello YOLO sul dataset Caltech-256 per 100 epochs, puoi utilizzare i seguenti snippet di codice. Consulta la pagina Training del modello per opzioni aggiuntive.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-cls.pt") # load a pretrained model
# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)Quali sono i casi d'uso più comuni per il dataset Caltech-256?
Il dataset Caltech-256 è ampiamente utilizzato per varie attività di riconoscimento oggetti, come:
- Training di Convolutional Neural Networks (CNN)
- Valutazione delle prestazioni delle Support Vector Machines (SVM)
- Benchmarking di nuovi algoritmi di deep learning
- Sviluppo di modelli di object detection utilizzando framework come Ultralytics YOLO
La sua diversità e le annotazioni complete lo rendono ideale per la ricerca e lo sviluppo nel machine learning e nella computer vision.
Come è strutturato il dataset Caltech-256 e come viene suddiviso per training e testing?
Il dataset Caltech-256 non viene fornito con una suddivisione predefinita per training e testing. Gli utenti solitamente creano le proprie suddivisioni in base alle loro esigenze specifiche. Un approccio comune consiste nel selezionare casualmente un sottoinsieme di immagini per il training e utilizzare le immagini rimanenti per il testing. Questa flessibilità consente agli utenti di adattare il dataset ai requisiti specifici del proprio progetto e alle configurazioni sperimentali.
Perché dovrei utilizzare Ultralytics YOLO per addestrare modelli sul dataset Caltech-256?
I modelli Ultralytics YOLO offrono diversi vantaggi per il training sul dataset Caltech-256:
- Alta precisione: I modelli YOLO sono noti per le loro prestazioni all'avanguardia nelle attività di object detection.
- Velocità: Offrono capacità di inferenza in tempo reale, rendendoli adatti ad applicazioni che richiedono previsioni rapide.
- Facilità d'uso: Con Ultralytics Platform, gli utenti possono addestrare, validare e distribuire modelli senza una programmazione estesa.
- Modelli preaddestrati: Partire da modelli preaddestrati, come
yolo26n-cls.pt, può ridurre significativamente i tempi di training e migliorare l'accuracy del modello.
Per maggiori dettagli, esplora la nostra guida completa al training e scopri l'image classification con Ultralytics YOLO.