Vai al contenuto

Set di dati CIFAR-10

Il dataset CIFAR-10 (Canadian Institute For Advanced Research) è una raccolta di immagini molto utilizzata per gli algoritmi di machine learning e computer vision. È stato sviluppato dai ricercatori dell'istituto CIFAR e consiste in 60.000 immagini a colori 32x32 in 10 classi diverse.

Caratteristiche principali

  • Il dataset CIFAR-10 è composto da 60.000 immagini, suddivise in 10 classi.
  • Ogni classe contiene 6.000 immagini, suddivise in 5.000 per la formazione e 1.000 per il test.
  • Le immagini sono colorate e di dimensioni 32x32 pixel.
  • Le 10 diverse classi rappresentano aerei, automobili, uccelli, gatti, cervi, cani, rane, cavalli, navi e camion.
  • Il CIFAR-10 è comunemente utilizzato per la formazione e il test nel campo dell'apprendimento automatico e della visione artificiale.

Struttura del set di dati

Il set di dati CIFAR-10 è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 50.000 immagini utilizzate per addestrare i modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Applicazioni

Il dataset CIFAR-10 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset completo per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-10 per 100 epoch con un'immagine di dimensioni 32x32, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='cifar10', epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Immagini di esempio e annotazioni

Il dataset CIFAR-10 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel dataset CIFAR-10, evidenziando l'importanza di un dataset diversificato per l'addestramento di solidi modelli di classificazione delle immagini.

Citazioni e ringraziamenti

Se utilizzi il dataset CIFAR-10 nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Desideriamo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-10 come una risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset CIFAR-10 e sul suo creatore, visita il sito web del dataset CIFAR-10.



Creato 2023-11-12, Aggiornato 2023-11-22
Autori: glenn-jocher (3)

Commenti