Dataset CIFAR-10
Il CIFAR-10 (Canadian Institute For Advanced Research) dataset è una raccolta di immagini ampiamente utilizzata per algoritmi di machine learning e computer vision. È stato sviluppato da ricercatori del CIFAR institute e consiste in 60.000 immagini a colori 32x32 in 10 classi diverse.
Guarda: Come addestrare un Classificazione delle immagini Modello con dataset CIFAR-10 utilizzando Ultralytics YOLO11
Caratteristiche principali
- Il dataset CIFAR-10 è composto da 60.000 immagini, suddivise in 10 classi.
- Ogni classe contiene 6.000 immagini, suddivise in 5.000 per l'addestramento e 1.000 per il test.
- Le immagini sono a colori e di dimensioni 32x32 pixel.
- Le 10 classi diverse rappresentano aeroplani, auto, uccelli, gatti, cervi, cani, rane, cavalli, navi e camion.
- CIFAR-10 è comunemente utilizzato per l'addestramento e il testing nel campo dell'apprendimento automatico e della visione artificiale.
Struttura del set di dati
Il dataset CIFAR-10 è suddiviso in due sottoinsiemi:
- Set di addestramento: Questo sottoinsieme contiene 50.000 immagini utilizzate per l'addestramento di modelli di machine learning.
- Set di test: Questo sottoinsieme è costituito da 10.000 immagini utilizzate per testare e valutare i modelli addestrati.
Applicazioni
Il set di dati CIFAR-10 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di apprendimento automatico. La diversità del set di dati in termini di classi e la presenza di immagini a colori lo rendono un set di dati completo per la ricerca e lo sviluppo nel campo dell'apprendimento automatico e della computer vision.
Utilizzo
Per addestrare un modello YOLO sul dataset CIFAR-10 per 100 epoche con una dimensione dell'immagine di 32x32, puoi utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consulta la pagina Training del modello.
Esempio di addestramento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Immagini di esempio e annotazioni
Il dataset CIFAR-10 contiene immagini a colori di vari oggetti, fornendo un dataset ben strutturato per attività di classificazione delle immagini. Ecco alcuni esempi di immagini dal dataset:
L'esempio mostra la varietà e la complessità degli oggetti nel dataset CIFAR-10, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli di classificazione delle immagini robusti.
Citazioni e ringraziamenti
Se utilizzi il dataset CIFAR-10 nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Desideriamo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-10 come risorsa preziosa per la comunità di ricerca nel campo dell'apprendimento automatico e della computer vision. Per maggiori informazioni sul dataset CIFAR-10 e sul suo creatore, visitare il sito web del dataset CIFAR-10.
FAQ
Come posso addestrare un modello YOLO sul set di dati CIFAR-10?
Per addestrare un modello YOLO sul dataset CIFAR-10 utilizzando Ultralytics, puoi seguire gli esempi forniti sia per python che per la CLI. Ecco un esempio base per addestrare il tuo modello per 100 epoche con una dimensione dell'immagine di 32x32 pixel:
Esempio
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32
Per maggiori dettagli, consulta la pagina relativa al Training del modello.
Quali sono le caratteristiche principali del dataset CIFAR-10?
Il dataset CIFAR-10 è composto da 60.000 immagini a colori suddivise in 10 classi. Ogni classe contiene 6.000 immagini, di cui 5.000 per l'addestramento e 1.000 per il test. Le immagini hanno una dimensione di 32x32 pixel e variano nelle seguenti categorie:
- Aerei
- Auto
- Uccelli
- Gatti
- Cervo
- Cani
- Rane
- Cavalli
- Navi
- Camion
Questo dataset diversificato è essenziale per l'addestramento di modelli di classificazione delle immagini in settori come l'apprendimento automatico e la visione artificiale. Per ulteriori informazioni, visitare le sezioni CIFAR-10 su struttura del dataset e applicazioni.
Perché usare il dataset CIFAR-10 per attività di classificazione delle immagini?
Il dataset CIFAR-10 è un eccellente benchmark per la classificazione delle immagini grazie alla sua diversità e struttura. Contiene un mix bilanciato di 60.000 immagini etichettate in 10 diverse categorie, il che aiuta nell'addestramento di modelli robusti e generalizzati. È ampiamente utilizzato per valutare modelli di deep learning, incluse le Convolutional Neural Networks (CNN) e altri algoritmi di machine learning. Il dataset è relativamente piccolo, il che lo rende adatto per una rapida sperimentazione e sviluppo di algoritmi. Esplora le sue numerose applicazioni nella sezione applicazioni.
Come è strutturato il dataset CIFAR-10?
Il dataset CIFAR-10 è strutturato in due sottoinsiemi principali:
- Set di addestramento: Contiene 50.000 immagini utilizzate per l'addestramento di modelli di machine learning.
- Set di test: Consiste di 10.000 immagini per testare e valutare i modelli addestrati.
Ogni sottoinsieme comprende immagini classificate in 10 classi, con le relative annotazioni prontamente disponibili per l'addestramento e la valutazione del modello. Per informazioni più dettagliate, fare riferimento alla sezione struttura del dataset.
Come posso citare il dataset CIFAR-10 nella mia ricerca?
Se utilizzi il dataset CIFAR-10 nei tuoi progetti di ricerca o sviluppo, assicurati di citare il seguente articolo:
@TECHREPORT{Krizhevsky09learningmultiple,
author={Alex Krizhevsky},
title={Learning multiple layers of features from tiny images},
institution={},
year={2009}
}
Riconoscere i creatori del set di dati aiuta a sostenere la continua ricerca e sviluppo nel campo. Per maggiori dettagli, consulta la sezione citazioni e ringraziamenti.
Quali sono alcuni esempi pratici di utilizzo del dataset CIFAR-10?
Il set di dati CIFAR-10 viene spesso utilizzato per l'addestramento di modelli di classificazione delle immagini, come le reti neurali convoluzionali (CNN) e le macchine a vettori di supporto (SVM). Questi modelli possono essere impiegati in varie attività di computer vision, tra cui il rilevamento di oggetti, il riconoscimento delle immagini e il tagging automatizzato. Per vedere alcuni esempi pratici, consulta gli snippet di codice nella sezione utilizzo.