Vai al contenuto

Set di dati CIFAR-100

Il dataset CIFAR-100 (Canadian Institute For Advanced Research) è un'estensione significativa del dataset CIFAR-10, composto da 60.000 immagini a colori 32x32 in 100 classi diverse. È stato sviluppato dai ricercatori dell'istituto CIFAR per offrire un set di dati più impegnativo per compiti di apprendimento automatico e di visione artificiale più complessi.

Caratteristiche principali

  • Il dataset CIFAR-100 è composto da 60.000 immagini, suddivise in 100 classi.
  • Ogni classe contiene 600 immagini, suddivise in 500 per l'addestramento e 100 per il test.
  • Le immagini sono colorate e di dimensioni 32x32 pixel.
  • Le 100 classi diverse vengono raggruppate in 20 categorie grossolane per una classificazione di livello superiore.
  • CIFAR-100 è comunemente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico e della visione artificiale.

Struttura del set di dati

Il set di dati CIFAR-100 è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 50.000 immagini utilizzate per l'addestramento dei modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Applicazioni

Il dataset CIFAR-100 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset più impegnativo e completo per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-100 per 100 epoche con un'immagine di dimensioni 32x32, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Immagini di esempio e annotazioni

Il dataset CIFAR-100 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel dataset CIFAR-100, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli di classificazione delle immagini robusti.

Citazioni e ringraziamenti

Se utilizzate il dataset CIFAR-100 nel vostro lavoro di ricerca o sviluppo, siete pregati di citare il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Desideriamo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-100 come risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per ulteriori informazioni sul dataset CIFAR-100 e sul suo creatore, visitare il sito web del dataset CIFAR-100.

FAQ

Che cos'è il dataset CIFAR-100 e perché è significativo?

Il dataset CIFAR-100 è una grande raccolta di 60.000 immagini a colori 32x32 classificate in 100 classi. Sviluppato dall'Istituto canadese per la ricerca avanzata (CIFAR), rappresenta un set di dati impegnativo, ideale per compiti complessi di apprendimento automatico e di visione artificiale. La sua importanza risiede nella diversità delle classi e nelle piccole dimensioni delle immagini, che lo rendono una risorsa preziosa per l'addestramento e il test di modelli di apprendimento profondo, come le reti neurali convoluzionali (CNN), utilizzando framework come Ultralytics YOLO .

Come si addestra un modello YOLO sul dataset CIFAR-100?

È possibile addestrare un modello YOLO sul set di dati CIFAR-100 utilizzando i comandi Python o CLI . Ecco come fare:

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Per un elenco completo degli argomenti disponibili, consultare la pagina Formazione dei modelli.

Quali sono le applicazioni principali del dataset CIFAR-100?

Il dataset CIFAR-100 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning per la classificazione delle immagini. Il suo insieme eterogeneo di 100 classi, raggruppate in 20 categorie grossolane, fornisce un ambiente stimolante per testare algoritmi come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri approcci di apprendimento automatico. Questo set di dati è una risorsa fondamentale per la ricerca e lo sviluppo nei campi dell'apprendimento automatico e della visione artificiale.

Come è strutturato il dataset CIFAR-100?

Il set di dati CIFAR-100 è suddiviso in due sottoinsiemi principali:

  1. Set di allenamento: Contiene 50.000 immagini utilizzate per l'addestramento dei modelli di apprendimento automatico.
  2. Set di test: Consiste in 10.000 immagini utilizzate per il test e il benchmarking dei modelli addestrati.

Ciascuna delle 100 classi contiene 600 immagini, di cui 500 per l'addestramento e 100 per il test, il che lo rende particolarmente adatto a una rigorosa ricerca accademica e industriale.

Dove posso trovare immagini di esempio e annotazioni dal dataset CIFAR-100?

Il dataset CIFAR-100 comprende una serie di immagini a colori di vari oggetti, che lo rendono un dataset strutturato per le attività di classificazione delle immagini. È possibile consultare la pagina della documentazione per vedere immagini di esempio e annotazioni. Questi esempi evidenziano la diversità e la complessità del dataset, importanti per l'addestramento di solidi modelli di classificazione delle immagini.

📅C reato 1 anno fa ✏️ Aggiornato 2 mesi fa

Commenti