Link to this sectionDataset Caltech-101#

Il dataset Caltech-101 è un classico benchmark di image classification composto da 9.144 immagini suddivise in 101 categorie di oggetti più una classe di sfondo. Ogni categoria contiene circa da 40 a 800 immagini di oggetti del mondo reale (animali, veicoli, oggetti domestici e persone), il che lo rende un benchmark compatto ma impegnativo per i modelli di riconoscimento oggetti.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

Suddivisione automatica dei dati

Caltech-101 viene fornito senza una suddivisione predefinita train/validation. I comandi di training riportati di seguito lo suddividono automaticamente in 80% train / 20% validation, quindi non è necessaria alcuna preparazione manuale.

Link to this sectionCaratteristiche principali#

Caltech-101 contiene 9.144 immagini a colori suddivise in 101 categorie di oggetti più una classe BACKGROUND_Google (102 cartelle di classe in totale).
Le categorie coprono un'ampia varietà di oggetti del mondo reale, inclusi animali, veicoli, oggetti domestici e persone.
Ogni categoria contiene circa da 40 a 800 immagini, pertanto le dimensioni delle classi sono sbilanciate.
Le immagini sono di dimensioni variabili, per la maggior parte all'incirca 300x200 pixel (risoluzione media).
Caltech-101 è ampiamente utilizzato per il benchmarking di algoritmi di image classification e riconoscimento oggetti.

Link to this sectionStruttura del dataset#

Caltech-101 è distribuito in 102 cartelle (una per classe, che coprono 101 categorie di oggetti più una classe BACKGROUND_Google) senza una suddivisione predefinita train/validation. Quando avvii il training, Ultralytics partiziona automaticamente le immagini in modo che i modelli vengano addestrati su tutte le 102 classi senza alcuna configurazione manuale:

Classi: 102 (101 categorie di oggetti + 1 sfondo)
Immagini totali: 9.144
Suddivisione train/validation: automatica 80% / 20% (≈7.280 train, ≈1.864 validation)
Immagini per classe: circa da 40 a 800 (sbilanciate)

Link to this sectionApplicazioni#

Caltech-101 è ampiamente utilizzato per addestrare e valutare modelli di image classification e riconoscimento oggetti, inclusi Convolutional Neural Networks (CNN) e Support Vector Machines (SVM). La sua ampia copertura di categorie e le immagini pulite ed etichettate lo rendono un benchmark popolare per la ricerca e la prototipazione nel machine learning e nella computer vision.

Link to this sectionUtilizzo#

Addestra un modello YOLO su Caltech-101 per 100 epochs con una dimensione dell'immagine di 416. Per l'elenco completo degli argomenti disponibili, consulta la pagina Training e la guida al task image classification.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionEsempi di immagini e annotazioni#

Il dataset Caltech-101 contiene immagini a colori di alta qualità di vari oggetti, fornendo un dataset ben strutturato per attività di image classification. Ecco alcuni esempi di immagini tratte dal dataset:

Esempi del dataset di classificazione delle immagini Caltech-101

Gli esempi mostrano la varietà delle categorie e l'inquadratura naturale e centrata tipica di Caltech-101, il che lo rende un punto di partenza pulito per addestrare modelli di riconoscimento oggetti robusti.

Link to this sectionCitazioni e riconoscimenti#

Se utilizzi il dataset Caltech-101 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente articolo:

Citazione

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Desideriamo ringraziare Li Fei-Fei, Rob Fergus e Pietro Perona per aver creato e mantenuto il dataset Caltech-101 come una risorsa preziosa per la comunità di ricerca di machine learning e computer vision. Per ulteriori informazioni sul dataset Caltech-101 e sui suoi creatori, visita il sito web del dataset Caltech-101.

Link to this sectionFAQ#

Link to this sectionPer cosa viene utilizzato il dataset Caltech-101 nel machine learning?#

Il dataset Caltech-101 è ampiamente utilizzato per addestrare e confrontare modelli di image classification e riconoscimento oggetti. Contiene 9.144 immagini suddivise in 101 categorie di oggetti più una classe di sfondo, fornendo un benchmark impegnativo per valutare algoritmi come Convolutional Neural Networks (CNN) e Support Vector Machines (SVM).

Link to this sectionCome posso addestrare un modello YOLO di Ultralytics sul dataset Caltech-101?#

Per addestrare un modello Ultralytics YOLO su Caltech-101, usa i frammenti di codice riportati di seguito. Il dataset viene scaricato automaticamente al primo utilizzo. Per un elenco completo degli argomenti, consulta la pagina del modello Training.

Esempio di Addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionQuante classi ha il dataset Caltech-101?#

Caltech-101 contiene 101 categorie di oggetti più una classe BACKGROUND_Google, per un totale di 102 cartelle di classe e 9.144 immagini. Quando esegui il training con Ultralytics, il modello apprende tutte le 102 classi. Le dimensioni delle categorie sono sbilanciate e variano da circa 40 a 800 immagini ciascuna.

Link to this sectionCome viene suddiviso il dataset Caltech-101 in set di addestramento e validazione?#

Caltech-101 non ha una suddivisione predefinita. La prima volta che esegui il training, Ultralytics lo divide automaticamente in 80% training / 20% validazione (circa 7.280 immagini di training e 1.864 di validazione), quindi non è necessario creare le suddivisioni manualmente. Per controllare tu stesso la suddivisione, organizza le immagini nelle cartelle train/ e val/ prima del training.

Link to this sectionPosso utilizzare Ultralytics Platform per addestrare modelli sul dataset Caltech-101?#

Sì. Ultralytics Platform ti consente di gestire i dataset, addestrare modelli di image classification e implementarli senza dover scrivere molto codice. È un modo pratico per eseguire esperimenti su Caltech-101 nel cloud e puoi esplorare ulteriori opzioni nella nostra panoramica sui dataset di classificazione.

Collaboratori

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

Creato 12 nov 2023Aggiornato ieri