Vai al contenuto

Set di dati CIFAR-10

Il dataset CIFAR-10 (Canadian Institute For Advanced Research) è una raccolta di immagini ampiamente utilizzata per gli algoritmi di machine learning e computer vision. È stato sviluppato dai ricercatori dell'istituto CIFAR e consiste in 60.000 immagini a colori 32x32 in 10 classi diverse.



Guarda: Come addestrare un Classificazione delle immagini Modello con il set di dati CIFAR-10 utilizzando Ultralytics YOLO11

Caratteristiche principali

  • Il dataset CIFAR-10 è composto da 60.000 immagini, suddivise in 10 classi.
  • Ogni classe contiene 6.000 immagini, suddivise in 5.000 per l'addestramento e 1.000 per il test.
  • Le immagini sono colorate e di dimensioni 32x32 pixel.
  • Le 10 diverse classi rappresentano aerei, automobili, uccelli, gatti, cervi, cani, rane, cavalli, navi e camion.
  • CIFAR-10 è comunemente utilizzato per l'addestramento e il test nel campo dell'apprendimento automatico e della visione artificiale.

Struttura del set di dati

Il set di dati CIFAR-10 è suddiviso in due sottoinsiemi:

  1. Set di allenamento: Questo sottoinsieme contiene 50.000 immagini utilizzate per l'addestramento dei modelli di apprendimento automatico.
  2. Set di test: Questo sottoinsieme è composto da 10.000 immagini utilizzate per testare e confrontare i modelli addestrati.

Applicazioni

Il dataset CIFAR-10 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in compiti di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset completo per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della visione artificiale.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-10 per 100 epoche con un'immagine di dimensioni 32x32, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di addestramento del modello.

Esempio di treno

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Immagini di esempio e annotazioni

Il dataset CIFAR-10 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per le attività di classificazione delle immagini. Ecco alcuni esempi di immagini tratte dal dataset:

Immagine campione del set di dati

L'esempio mostra la varietà e la complessità degli oggetti presenti nel set di dati CIFAR-10, evidenziando l'importanza di un set di dati diversificato per l'addestramento di modelli di classificazione delle immagini robusti.

Citazioni e ringraziamenti

Se utilizzate il dataset CIFAR-10 nel vostro lavoro di ricerca o sviluppo, siete pregati di citare il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Desideriamo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-10 come risorsa preziosa per la comunità di ricerca sull'apprendimento automatico e la visione artificiale. Per ulteriori informazioni sul dataset CIFAR-10 e sul suo creatore, visitare il sito web del dataset CIFAR-10.

FAQ

Come si può addestrare un modello YOLO sul dataset CIFAR-10?

Per addestrare un modello YOLO sul dataset CIFAR-10 usando Ultralytics, si possono seguire gli esempi forniti per Python e CLI. Ecco un esempio di base per addestrare il modello per 100 epoche con un'immagine di 32x32 pixel:

Esempio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Per maggiori dettagli, consultare la pagina Formazione del modello.

Quali sono le caratteristiche principali del dataset CIFAR-10?

Il dataset CIFAR-10 è costituito da 60.000 immagini a colori suddivise in 10 classi. Ogni classe contiene 6.000 immagini, di cui 5.000 per l'addestramento e 1.000 per il test. Le immagini hanno una dimensione di 32x32 pixel e variano nelle seguenti categorie:

  • Aerei
  • Auto
  • Uccelli
  • Gatti
  • Cervo
  • Cani
  • Rane
  • Cavalli
  • Navi
  • Camion

Questo set di dati diversificato è essenziale per l'addestramento di modelli di classificazione delle immagini in campi quali l'apprendimento automatico e la visione artificiale. Per ulteriori informazioni, visitate le sezioni di CIFAR-10 dedicate alla struttura del set di dati e alle applicazioni.

Perché utilizzare il dataset CIFAR-10 per la classificazione delle immagini?

Il dataset CIFAR-10 è un eccellente punto di riferimento per la classificazione delle immagini grazie alla sua diversità e struttura. Contiene un mix equilibrato di 60.000 immagini etichettate in 10 diverse categorie, che aiutano a formare modelli robusti e generalizzati. È ampiamente utilizzato per valutare i modelli di deep learning, tra cui le reti neurali convoluzionali (CNN) e altri algoritmi di apprendimento automatico. Il set di dati è relativamente piccolo, il che lo rende adatto a una rapida sperimentazione e allo sviluppo di algoritmi. Esplorate le sue numerose applicazioni nella sezione applicazioni.

Come è strutturato il dataset CIFAR-10?

Il set di dati CIFAR-10 è strutturato in due sottoinsiemi principali:

  1. Set di allenamento: Contiene 50.000 immagini utilizzate per l'addestramento dei modelli di apprendimento automatico.
  2. Set di test: Consiste in 10.000 immagini per il test e il benchmarking dei modelli addestrati.

Ogni sottoinsieme comprende immagini classificate in 10 classi, le cui annotazioni sono prontamente disponibili per l'addestramento e la valutazione del modello. Per informazioni più dettagliate, consultare la sezione sulla struttura del set di dati.

Come posso citare il dataset CIFAR-10 nella mia ricerca?

Se utilizzate il dataset CIFAR-10 nei vostri progetti di ricerca o sviluppo, assicuratevi di citare il seguente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Il riconoscimento dei creatori del set di dati contribuisce a sostenere la ricerca e lo sviluppo continui nel settore. Per maggiori dettagli, consultare la sezione citazioni e riconoscimenti.

Quali sono alcuni esempi pratici di utilizzo del dataset CIFAR-10?

Il dataset CIFAR-10 viene spesso utilizzato per l'addestramento di modelli di classificazione delle immagini, come le reti neurali convoluzionali (CNN) e le macchine a vettori di supporto (SVM). Questi modelli possono essere impiegati in diverse attività di computer vision, tra cui il rilevamento di oggetti, il riconoscimento di immagini e l'etichettatura automatica. Per vedere alcuni esempi pratici, consultare gli snippet di codice nella sezione d'uso.

📅C reato 1 anno fa ✏️ Aggiornato 2 mesi fa

Commenti