Dataset CIFAR-100

Il dataset CIFAR-100 (Canadian Institute For Advanced Research) è un'estensione significativa del dataset CIFAR-10, composto da 60.000 immagini a colori 32x32 in 100 classi diverse. È stato sviluppato dai ricercatori dell'istituto CIFAR, offrendo un dataset più stimolante per attività più complesse di machine learning e computer vision.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Caratteristiche principali

  • Il dataset CIFAR-100 consiste in 60.000 immagini, suddivise in 100 classi.
  • Ogni classe contiene 600 immagini, divise in 500 per l'addestramento e 100 per il test.
  • Le immagini sono a colori e hanno una dimensione di 32x32 pixel.
  • Le 100 classi diverse sono raggruppate in 20 categorie generali per una classificazione di livello superiore.
  • CIFAR-100 è comunemente utilizzato per l'addestramento e il test nel campo del machine learning e della computer vision.

Struttura del dataset

Il dataset CIFAR-100 è diviso in due sottoinsiemi:

  1. Training Set: Questo sottoinsieme contiene 50.000 immagini utilizzate per l'addestramento di modelli di machine learning.
  2. Testing Set: Questo sottoinsieme consiste in 10.000 immagini utilizzate per testare e valutare i modelli addestrati.

Applicazioni

Il dataset CIFAR-100 è ampiamente utilizzato per addestrare e valutare modelli di deep learning in attività di image classification, come Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) e vari altri algoritmi di machine learning. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset più completo e stimolante per la ricerca e lo sviluppo nel campo del machine learning e della computer vision.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-100 per 100 epochs con una dimensione dell'immagine di 32x32, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Training del modello.

Esempio di training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Immagini campione e annotazioni

Il dataset CIFAR-100 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per le attività di image classification. Ecco alcuni esempi di immagini dal dataset:

Esempi del dataset di image classification CIFAR-100

L'esempio mostra la varietà e la complessità degli oggetti nel dataset CIFAR-100, evidenziando l'importanza di un dataset diversificato per addestrare modelli di image classification robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset CIFAR-100 nel tuo lavoro di ricerca o sviluppo, ti preghiamo di citare il seguente articolo:

Citazione
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Vorremmo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-100 come una risorsa preziosa per la comunità di ricerca di machine learning e computer vision. Per ulteriori informazioni sul dataset CIFAR-100 e il suo creatore, visita il sito web del dataset CIFAR-100.

FAQ

Che cos'è il dataset CIFAR-100 e perché è significativo?

Il dataset CIFAR-100 è una vasta raccolta di 60.000 immagini a colori 32x32 classificate in 100 classi. Sviluppato dal Canadian Institute For Advanced Research (CIFAR), fornisce un dataset stimolante ideale per attività complesse di machine learning e computer vision. Il suo significato risiede nella diversità delle classi e nelle piccole dimensioni delle immagini, rendendolo una risorsa preziosa per l'addestramento e il test di modelli di deep learning, come Convolutional Neural Networks (CNNs), utilizzando framework come Ultralytics YOLO.

Come posso addestrare un modello YOLO sul dataset CIFAR-100?

Puoi addestrare un modello YOLO sul dataset CIFAR-100 utilizzando comandi Python o CLI. Ecco come fare:

Esempio di training
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Per un elenco completo degli argomenti disponibili, fai riferimento alla pagina di Training del modello.

Quali sono le principali applicazioni del dataset CIFAR-100?

Il dataset CIFAR-100 è ampiamente utilizzato nell'addestramento e nella valutazione di modelli di deep learning per l'image classification. Il suo insieme diversificato di 100 classi, raggruppate in 20 categorie generali, fornisce un ambiente stimolante per testare algoritmi come Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) e vari altri approcci di machine learning. Questo dataset è una risorsa chiave nella ricerca e sviluppo nei campi del machine learning e della computer vision, in particolare per attività di object recognition e classificazione.

Come è strutturato il dataset CIFAR-100?

Il dataset CIFAR-100 è diviso in due sottoinsiemi principali:

  1. Training Set: Contiene 50.000 immagini utilizzate per l'addestramento di modelli di machine learning.
  2. Set di test: Consiste in 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Ognuna delle 100 classi contiene 600 immagini, con 500 immagini per l'addestramento e 100 per il test, rendendolo particolarmente adatto alla ricerca accademica e industriale rigorosa.

Dove posso trovare immagini di esempio e annotazioni dal dataset CIFAR-100?

Il dataset CIFAR-100 include una varietà di immagini a colori di vari oggetti, rendendolo un dataset strutturato per le attività di image classification. Puoi fare riferimento alla pagina della documentazione per vedere immagini di esempio e annotazioni. Questi esempi evidenziano la diversità e la complessità del dataset, importanti per addestrare modelli di image classification robusti. Per altri dataset adatti ad attività di classificazione, consulta la panoramica sui dataset di classificazione di Ultralytics.

Commenti