Dataset CIFAR-100

El dataset CIFAR-100 (Canadian Institute For Advanced Research) es una extensión significativa del dataset CIFAR-10, compuesto por 60 000 imágenes en color de 32x32 píxeles en 100 clases diferentes. Fue desarrollado por investigadores del instituto CIFAR, ofreciendo un dataset más desafiante para tareas más complejas de aprendizaje automático y visión artificial.



Watch: How to Train Ultralytics YOLO26 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Características clave

  • El dataset CIFAR-100 consta de 60 000 imágenes, divididas en 100 clases.
  • Cada clase contiene 600 imágenes, divididas en 500 para entrenamiento y 100 para pruebas.
  • Las imágenes son en color y tienen un tamaño de 32x32 píxeles.
  • Las 100 clases diferentes se agrupan en 20 categorías generales para una clasificación de nivel superior.
  • CIFAR-100 se utiliza habitualmente para entrenamiento y pruebas en el campo del aprendizaje automático y la visión artificial.

Estructura del conjunto de datos

El dataset CIFAR-100 se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 50 000 imágenes utilizadas para entrenar modelos de machine learning.
  2. Conjunto de pruebas: Este subconjunto consta de 10 000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El dataset CIFAR-100 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como Redes Neuronales Convolucionales (CNN), Máquinas de Vectores de Soporte (SVM) y varios otros algoritmos de aprendizaje automático. La diversidad del dataset en términos de clases y la presencia de imágenes en color lo convierten en un dataset más desafiante y completo para la investigación y el desarrollo en el campo del aprendizaje automático y la visión artificial.

Uso

Para entrenar un modelo YOLO en el dataset CIFAR-100 durante 100 épocas con un tamaño de imagen de 32x32, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Imágenes y anotaciones de muestra

El dataset CIFAR-100 contiene imágenes en color de varios objetos, lo que proporciona un dataset bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del dataset:

Muestras del dataset de clasificación de imágenes CIFAR-100

El ejemplo muestra la variedad y complejidad de los objetos en el dataset CIFAR-100, destacando la importancia de contar con un dataset diverso para entrenar modelos robustos de clasificación de imágenes.

Citas y reconocimientos

Si utilizas el dataset CIFAR-100 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría agradecer a Alex Krizhevsky por crear y mantener el dataset CIFAR-100 como un recurso valioso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el dataset CIFAR-100 y su creador, visita el sitio web del dataset CIFAR-100.

Preguntas frecuentes

¿Qué es el dataset CIFAR-100 y por qué es importante?

El dataset CIFAR-100 es una gran colección de 60 000 imágenes en color de 32x32 píxeles clasificadas en 100 clases. Desarrollado por el Canadian Institute For Advanced Research (CIFAR), proporciona un dataset desafiante ideal para tareas complejas de aprendizaje automático y visión artificial. Su importancia radica en la diversidad de clases y el pequeño tamaño de las imágenes, lo que lo convierte en un recurso valioso para entrenar y probar modelos de aprendizaje profundo, como Redes Neuronales Convolucionales (CNN), utilizando frameworks como Ultralytics YOLO.

¿Cómo entreno un modelo YOLO en el dataset CIFAR-100?

Puedes entrenar un modelo YOLO en el dataset CIFAR-100 usando Python o comandos de la CLI. Aquí te explico cómo:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

¿Cuáles son las principales aplicaciones del dataset CIFAR-100?

El dataset CIFAR-100 se utiliza ampliamente en el entrenamiento y la evaluación de modelos de aprendizaje profundo para la clasificación de imágenes. Su conjunto diverso de 100 clases, agrupadas en 20 categorías generales, proporciona un entorno desafiante para probar algoritmos como Redes Neuronales Convolucionales (CNN), Máquinas de Vectores de Soporte (SVM) y varios otros enfoques de aprendizaje automático. Este dataset es un recurso clave en la investigación y el desarrollo dentro de los campos del aprendizaje automático y la visión artificial, especialmente para tareas de reconocimiento de objetos y clasificación.

¿Cómo está estructurado el dataset CIFAR-100?

El dataset CIFAR-100 se divide en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Contiene 50 000 imágenes utilizadas para entrenar modelos de machine learning.
  2. Conjunto de pruebas: Consta de 10 000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Cada una de las 100 clases contiene 600 imágenes, con 500 imágenes para entrenamiento y 100 para pruebas, lo que lo hace especialmente adecuado para investigaciones académicas e industriales rigurosas.

¿Dónde puedo encontrar imágenes de muestra y anotaciones del dataset CIFAR-100?

El dataset CIFAR-100 incluye una variedad de imágenes en color de diversos objetos, lo que lo convierte en un dataset estructurado para tareas de clasificación de imágenes. Puedes consultar la página de documentación para ver imágenes de muestra y anotaciones. Estos ejemplos destacan la diversidad y complejidad del dataset, factores importantes para entrenar modelos robustos de clasificación de imágenes. Para obtener más datasets adecuados para tareas de clasificación, consulta la descripción general de datasets de clasificación de Ultralytics.

Comentarios