Vai al contenuto

Set di dati CIFAR-10

Il dataset CIFAR-10 (Canadian Institute For Advanced Research) è una raccolta di immagini molto utilizzata per gli algoritmi di machine learning e computer vision. È stato sviluppato dai ricercatori dell'istituto CIFAR e consiste in 60.000 immagini a colori 32x32 in 10 classi diverse.



Guarda: Come addestrare un modello di classificazione delle immagini con il set di dati CIFAR-10 utilizzando Ultralytics YOLOv8

Caratteristiche principali

  • Il dataset CIFAR-10 è composto da 60.000 immagini, suddivise in 10 classi.
  • Ogni classe contiene 6.000 immagini, suddivise in 5.000 per la formazione e 1.000 per il test.
  • Le immagini sono colorate e di dimensioni 32x32 pixel.
  • Le 10 diverse classi rappresentano aerei, automobili, uccelli, gatti, cervi, cani, rane, cavalli, navi e camion.
  • Il CIFAR-10 è comunemente utilizzato per la formazione e il test nel campo dell'apprendimento automatico e della visione artificiale.

Struttura del set di dati

Il set di dati CIFAR-10 è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 50.000 immagini utilizzate per addestrare i modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Applicazioni

Il dataset CIFAR-10 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine vettoriali di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset completo per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-10 per 100 epoch con un'immagine di dimensioni 32x32, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Immagini di esempio e annotazioni

Il dataset CIFAR-10 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel dataset CIFAR-10, evidenziando l'importanza di un dataset diversificato per l'addestramento di solidi modelli di classificazione delle immagini.

Citazioni e ringraziamenti

Se utilizzi il dataset CIFAR-10 nel tuo lavoro di ricerca o sviluppo, cita il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Desideriamo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-10 come una risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la computer vision. Per maggiori informazioni sul dataset CIFAR-10 e sul suo creatore, visita il sito web del dataset CIFAR-10.

DOMANDE FREQUENTI

Come posso addestrare un modello YOLO sul dataset CIFAR-10?

Per addestrare un modello YOLO sul dataset CIFAR-10 utilizzando Ultralytics, puoi seguire gli esempi forniti per Python e CLI. Ecco un esempio di base per addestrare il tuo modello per 100 epoche con un'immagine di 32x32 pixel:

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Per maggiori dettagli, consulta la pagina di formazione del modello.

Quali sono le caratteristiche principali del set di dati CIFAR-10?

Il dataset CIFAR-10 è composto da 60.000 immagini a colori suddivise in 10 classi. Ogni classe contiene 6.000 immagini, di cui 5.000 per la formazione e 1.000 per il test. Le immagini hanno una dimensione di 32x32 pixel e variano nelle seguenti categorie:

  • Aerei
  • Auto
  • Uccelli
  • Gatti
  • Cervo
  • Cani
  • Rane
  • Cavalli
  • Navi
  • Camion

Questo set di dati diversificato è essenziale per l'addestramento di modelli di classificazione delle immagini in campi come l'apprendimento automatico e la visione artificiale. Per maggiori informazioni, visita le sezioni di CIFAR-10 dedicate alla struttura del dataset e alle applicazioni.

Perché utilizzare il dataset CIFAR-10 per la classificazione delle immagini?

Il dataset CIFAR-10 è un ottimo punto di riferimento per la classificazione delle immagini grazie alla sua diversità e struttura. Contiene un mix equilibrato di 60.000 immagini etichettate in 10 diverse categorie, che aiutano a formare modelli robusti e generalizzati. È ampiamente utilizzato per valutare i modelli di deep learning, tra cui le reti neurali convoluzionali (CNN) e altri algoritmi di apprendimento automatico. Il dataset è relativamente piccolo e quindi adatto a una rapida sperimentazione e allo sviluppo di algoritmi. Esplora le sue numerose applicazioni nella sezione applicazioni.

Come è strutturato il dataset CIFAR-10?

Il set di dati CIFAR-10 è strutturato in due sottoinsiemi principali:

  1. Set di allenamento: Contiene 50.000 immagini utilizzate per l'addestramento dei modelli di apprendimento automatico.
  2. Set di test: Consiste in 10.000 immagini per testare e confrontare i modelli addestrati.

Ogni sottoinsieme comprende immagini classificate in 10 classi, con le relative annotazioni prontamente disponibili per l'addestramento e la valutazione del modello. Per informazioni più dettagliate, consulta la sezione sulla struttura del set di dati.

Come posso citare il dataset CIFAR-10 nella mia ricerca?

Se utilizzi il dataset CIFAR-10 nei tuoi progetti di ricerca o sviluppo, assicurati di citare il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Il riconoscimento dei creatori del set di dati aiuta a sostenere la ricerca e lo sviluppo continui nel settore. Per maggiori dettagli, consulta la sezione citazioni e riconoscimenti.

Quali sono alcuni esempi pratici di utilizzo del dataset CIFAR-10?

Il dataset CIFAR-10 viene spesso utilizzato per l'addestramento di modelli di classificazione delle immagini, come le reti neurali convoluzionali (CNN) e le macchine vettoriali di supporto (SVM). Questi modelli possono essere impiegati in diverse attività di computer vision, tra cui il rilevamento di oggetti, il riconoscimento di immagini e l'etichettatura automatica. Per vedere alcuni esempi pratici, consulta gli snippet di codice nella sezione dedicata all'uso.



Creato 2023-11-12, Aggiornato 2024-07-12
Autori: RizwanMunawar (1), glenn-jocher (6)

Commenti