Conjunto de datos CIFAR-100

El conjunto de datos CIFAR-100 (Canadian Institute For Advanced Research) es una extensión significativa del conjunto de datos CIFAR-10, compuesto por 60.000 imágenes a color de 32x32 en 100 clases diferentes. Fue desarrollado por investigadores del instituto CIFAR, ofreciendo un conjunto de datos más desafiante para tareas más complejas de aprendizaje automático y visión artificial.

Ver: Cómo entrenar Ultralytics YOLO26 en CIFAR-100 | Tutorial paso a paso de clasificación de imágenes 🚀

Características clave

El conjunto de datos CIFAR-100 consta de 60,000 imágenes, divididas en 100 clases.
Cada clase contiene 600 imágenes, divididas en 500 para entrenamiento y 100 para pruebas.
Las imágenes son a color y tienen un tamaño de 32x32 píxeles.
Las 100 clases diferentes se agrupan en 20 categorías generales para una clasificación de nivel superior.
CIFAR-100 se utiliza comúnmente para el entrenamiento y las pruebas en el campo del aprendizaje automático y la visión artificial.

Estructura del conjunto de datos

El conjunto de datos CIFAR-100 se divide en dos subconjuntos:

Conjunto de Entrenamiento: Este subconjunto contiene 50.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
Conjunto de Prueba: Este subconjunto consta de 10,000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El dataset CIFAR-100 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como las Redes Neuronales Convolucionales (CNNs), las Máquinas de Vectores de Soporte (SVMs) y varios otros algoritmos de aprendizaje automático. La diversidad del dataset en términos de clases y la presencia de imágenes a color lo convierten en un dataset más desafiante y completo para la investigación y el desarrollo en el campo del aprendizaje automático y la visión artificial.

Uso

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-100 durante 100 épocas con un tamaño de imagen de 32x32, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo26n-cls.pt epochs=100 imgsz=32

sample_images y anotaciones

El dataset CIFAR-100 contiene imágenes a color de varios objetos, proporcionando un dataset bien estructurado para tareas de clasificación de imágenes. Aquí hay algunos ejemplos de imágenes del dataset:

Muestras del conjunto de datos CIFAR-100 para clasificación de imágenes

El ejemplo muestra la variedad y complejidad de los objetos en el conjunto de datos CIFAR-100, destacando la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.

Citas y agradecimientos

Si utilizas el conjunto de datos CIFAR-100 en tu trabajo de investigación o desarrollo, por favor, cita el siguiente artículo:

BibTeX

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría agradecer a Alex Krizhevsky la creación y el mantenimiento del conjunto de datos CIFAR-100 como un valioso recurso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos CIFAR-100 y su creador, visite el sitio web del conjunto de datos CIFAR-100.

Preguntas frecuentes

¿Qué es el conjunto de datos CIFAR-100 y por qué es significativo?

El conjunto de datos CIFAR-100 es una gran colección de 60,000 imágenes a color de 32x32 clasificadas en 100 clases. Desarrollado por el Instituto Canadiense de Investigación Avanzada (CIFAR), proporciona un conjunto de datos desafiante ideal para tareas complejas de aprendizaje automático y visión artificial. Su importancia radica en la diversidad de clases y el pequeño tamaño de las imágenes, lo que lo convierte en un recurso valioso para entrenar y probar modelos de aprendizaje profundo, como las Redes Neuronales Convolucionales (CNN), utilizando frameworks como Ultralytics YOLO.

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos CIFAR-100?

Puedes entrenar un modelo YOLO en el conjunto de datos CIFAR-100 utilizando comandos de python o de la CLI. Aquí te mostramos cómo:

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo26n-cls.pt epochs=100 imgsz=32

Para obtener una lista completa de los argumentos disponibles, consulte la página de Entrenamiento del modelo.

¿Cuáles son las principales aplicaciones del conjunto de datos CIFAR-100?

El dataset CIFAR-100 se utiliza ampliamente en el entrenamiento y la evaluación de modelos de aprendizaje profundo para la clasificación de imágenes. Su diverso conjunto de 100 clases, agrupadas en 20 categorías generales, proporciona un entorno desafiante para probar algoritmos como las Redes Neuronales Convolucionales (CNNs), las Máquinas de Vectores de Soporte (SVMs) y varios otros enfoques de aprendizaje automático. Este dataset es un recurso clave en la investigación y el desarrollo dentro de los campos del aprendizaje automático y la visión artificial, particularmente para tareas de reconocimiento de objetos y clasificación.

¿Cómo está estructurado el conjunto de datos CIFAR-100?

El conjunto de datos CIFAR-100 se divide en dos subconjuntos principales:

Conjunto de entrenamiento: Contiene 50,000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
Conjunto de pruebas: Consta de 10.000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Cada una de las 100 clases contiene 600 imágenes, con 500 imágenes para entrenamiento y 100 para pruebas, lo que lo hace especialmente adecuado para la investigación académica e industrial rigurosa.

¿Dónde puedo encontrar sample_images y anotaciones del conjunto de datos CIFAR-100?

El dataset CIFAR-100 incluye una variedad de imágenes a color de varios objetos, lo que lo convierte en un dataset estructurado para tareas de clasificación de imágenes. Puede consultar la página de documentación para ver sample_images y anotaciones. Estos ejemplos resaltan la diversidad y complejidad del dataset, lo cual es importante para entrenar modelos robustos de clasificación de imágenes. Para obtener más datasets adecuados para tareas de clasificación, consulte la descripción general de los datasets de clasificación de Ultralytics.

📅 Creado hace 2 años ✏️ Actualizado hace 3 meses