Vai al contenuto

Dataset CIFAR-100

Il CIFAR-100 (Canadian Institute For Advanced Research) dataset è un'estensione significativa del dataset CIFAR-10, composto da 60.000 immagini a colori 32x32 in 100 classi diverse. È stato sviluppato da ricercatori del CIFAR institute, offrendo un dataset più stimolante per compiti più complessi di machine learning e computer vision.



Guarda: Come addestrare Ultralytics YOLO11 su CIFAR-100 | Tutorial dettagliato sulla classificazione delle immagini 🚀

Caratteristiche principali

  • Il dataset CIFAR-100 è composto da 60.000 immagini, suddivise in 100 classi.
  • Ogni classe contiene 600 immagini, suddivise in 500 per l'addestramento e 100 per il test.
  • Le immagini sono a colori e di dimensioni 32x32 pixel.
  • Le 100 classi diverse sono raggruppate in 20 categorie principali per una classificazione di livello superiore.
  • CIFAR-100 è comunemente utilizzato per l'addestramento e il testing nel campo dell'apprendimento automatico e della visione artificiale.

Struttura del set di dati

Il dataset CIFAR-100 è suddiviso in due sottoinsiemi:

  1. Set di addestramento: Questo sottoinsieme contiene 50.000 immagini utilizzate per l'addestramento di modelli di machine learning.
  2. Set di test: Questo sottoinsieme è costituito da 10.000 immagini utilizzate per testare e valutare i modelli addestrati.

Applicazioni

Il dataset CIFAR-100 è ampiamente utilizzato per l'addestramento e la valutazione di modelli di deep learning in attività di classificazione delle immagini, come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri algoritmi di machine learning. La diversità del dataset in termini di classi e la presenza di immagini a colori lo rendono un dataset più impegnativo e completo per la ricerca e lo sviluppo nel campo del machine learning e della computer vision.

Utilizzo

Per addestrare un modello YOLO sul dataset CIFAR-100 per 100 epoche con una dimensione dell'immagine di 32x32, è possibile utilizzare i seguenti frammenti di codice. Per un elenco completo degli argomenti disponibili, consultare la pagina di Training del modello.

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Immagini di esempio e annotazioni

Il set di dati CIFAR-100 contiene immagini a colori di vari oggetti, fornendo un set di dati ben strutturato per attività di classificazione delle immagini. Ecco alcuni esempi di immagini del set di dati:

Immagine di esempio del set di dati

L'esempio mostra la varietà e la complessità degli oggetti nel dataset CIFAR-100, evidenziando l'importanza di un dataset diversificato per l'addestramento di modelli di classificazione delle immagini robusti.

Citazioni e ringraziamenti

Se utilizzi il dataset CIFAR-100 nel tuo lavoro di ricerca o sviluppo, cita il seguente articolo:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Vorremmo ringraziare Alex Krizhevsky per aver creato e mantenuto il dataset CIFAR-100 come risorsa preziosa per la comunità della ricerca sull'apprendimento automatico e sulla computer vision. Per maggiori informazioni sul dataset CIFAR-100 e sul suo creatore, visita il sito web del dataset CIFAR-100.

FAQ

Cos'è il dataset CIFAR-100 e perché è significativo?

Il dataset CIFAR-100 è una vasta raccolta di 60.000 immagini a colori 32x32 classificate in 100 classi. Sviluppato dal Canadian Institute For Advanced Research (CIFAR), fornisce un dataset impegnativo ideale per compiti complessi di machine learning e computer vision. La sua importanza risiede nella diversità delle classi e nelle dimensioni ridotte delle immagini, rendendolo una risorsa preziosa per l'addestramento e il test di modelli di deep learning, come le reti neurali convoluzionali (CNN), utilizzando framework come Ultralytics YOLO.

Come posso addestrare un modello YOLO sul dataset CIFAR-100?

Puoi addestrare un modello YOLO sul dataset CIFAR-100 utilizzando comandi Python o CLI. Ecco come:

Esempio di addestramento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Per un elenco completo degli argomenti disponibili, fare riferimento alla pagina Addestramento del modello.

Quali sono le principali applicazioni del dataset CIFAR-100?

Il dataset CIFAR-100 è ampiamente utilizzato nell'addestramento e nella valutazione di modelli di deep learning per la classificazione delle immagini. Il suo insieme diversificato di 100 classi, raggruppate in 20 categorie principali, fornisce un ambiente stimolante per testare algoritmi come le reti neurali convoluzionali (CNN), le macchine a vettori di supporto (SVM) e vari altri approcci di machine learning. Questo dataset è una risorsa chiave nella ricerca e nello sviluppo nei campi del machine learning e della computer vision, in particolare per le attività di riconoscimento degli oggetti e classificazione.

Come è strutturato il dataset CIFAR-100?

Il dataset CIFAR-100 è suddiviso in due sottoinsiemi principali:

  1. Set di addestramento: Contiene 50.000 immagini utilizzate per l'addestramento di modelli di machine learning.
  2. Set di test: Consiste di 10.000 immagini utilizzate per testare e valutare i modelli addestrati.

Ciascuna delle 100 classi contiene 600 immagini, con 500 immagini per l'addestramento e 100 per il test, rendendola particolarmente adatta per la ricerca accademica e industriale rigorosa.

Dove posso trovare sample_images e annotazioni dal dataset CIFAR-100?

Il dataset CIFAR-100 include una varietà di immagini a colori di vari oggetti, rendendolo un dataset strutturato per attività di classificazione delle immagini. Puoi consultare la pagina della documentazione per vedere sample_images e annotazioni. Questi esempi evidenziano la diversità e la complessità del dataset, importanti per l'addestramento di modelli di classificazione delle immagini robusti. Per ulteriori dataset adatti alle attività di classificazione, consulta la panoramica dei dataset di classificazione di Ultralytics.



📅 Creato 1 anno fa ✏️ Aggiornato 5 mesi fa

Commenti