Vai al contenuto

Set di dati CIFAR-100

Il dataset CIFAR-100 (Canadian Institute For Advanced Research) è un'estensione significativa del dataset CIFAR-10, composto da 60.000 immagini a colori 32x32 in 100 classi diverse. È stato sviluppato dai ricercatori dell'istituto CIFAR per offrire un set di dati più impegnativo per compiti di apprendimento automatico e di computer vision più complessi.

Caratteristiche principali

  • Il dataset CIFAR-100 è composto da 60.000 immagini, suddivise in 100 classi.
  • Ogni classe contiene 600 immagini, suddivise in 500 per la formazione e 100 per il test.
  • Le immagini sono colorate e di dimensioni 32x32 pixel.
  • Le 100 classi diverse vengono raggruppate in 20 categorie grossolane per una classificazione di livello superiore.
  • Il CIFAR-100 è comunemente utilizzato per la formazione e il test nel campo dell'apprendimento automatico e della visione artificiale.

Struttura del set di dati

Il set di dati CIFAR-100 è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 50.000 immagini utilizzate per addestrare i modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Applicazioni

Il dataset CIFAR-100 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset più impegnativo e completo per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-100 per 100 epoch con un'immagine di dimensioni 32x32, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Immagini di esempio e annotazioni

Il dataset CIFAR-100 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel set di dati CIFAR-100, evidenziando l'importanza di un set di dati diversificato per l'addestramento di solidi modelli di classificazione delle immagini.

Citazioni e ringraziamenti

Se utilizzi il dataset CIFAR-100 nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Desideriamo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-100 come una preziosa risorsa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset CIFAR-100 e sul suo creatore, visita il sito web del dataset CIFAR-100.

DOMANDE FREQUENTI

Che cos'è il dataset CIFAR-100 e perché è significativo?

Il dataset CIFAR-100 è una grande raccolta di 60.000 immagini a colori 32x32 classificate in 100 classi. Sviluppato dal Canadian Institute For Advanced Research (CIFAR), rappresenta un set di dati impegnativo, ideale per attività complesse di apprendimento automatico e di computer vision. La sua importanza risiede nella diversità delle classi e nelle dimensioni ridotte delle immagini, che lo rendono una risorsa preziosa per l'addestramento e il test di modelli di deep learning, come le reti neurali convoluzionali (CNN), utilizzando framework come Ultralytics YOLO .

Come si addestra un modello YOLO sul dataset CIFAR-100?

Puoi addestrare un modello YOLO sul dataset CIFAR-100 utilizzando i comandi Python o CLI . Ecco come fare:

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Per un elenco completo degli argomenti disponibili, consulta la pagina Formazione del modello.

Quali sono le applicazioni principali del dataset CIFAR-100?

Il dataset CIFAR-100 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning per la classificazione delle immagini. Il suo insieme eterogeneo di 100 classi, raggruppate in 20 categorie grossolane, fornisce un ambiente stimolante per testare algoritmi come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri approcci di apprendimento automatico. Questo set di dati è una risorsa fondamentale per la ricerca e lo sviluppo nei campi dell'apprendimento automatico e della visione artificiale.

Come è strutturato il dataset CIFAR-100?

Il set di dati CIFAR-100 è suddiviso in due sottoinsiemi principali:

  1. Set di allenamento: Contiene 50.000 immagini utilizzate per l'addestramento dei modelli di apprendimento automatico.
  2. Set di test: Consiste in 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Ognuna delle 100 classi contiene 600 immagini, di cui 500 per l'addestramento e 100 per il test, il che lo rende particolarmente adatto a una rigorosa ricerca accademica e industriale.

Dove posso trovare immagini di esempio e annotazioni del dataset CIFAR-100?

Il dataset CIFAR-100 comprende una serie di immagini a colori di vari oggetti, che lo rendono un dataset strutturato per le attività di classificazione delle immagini. Puoi consultare la pagina della documentazione per vedere immagini di esempio e annotazioni. Questi esempi evidenziano la diversità e la complessità del dataset, importanti per l'addestramento di solidi modelli di classificazione delle immagini.


📅 Created 10 months ago ✏️ Updated 13 days ago

Commenti