Ir al contenido

Conjunto de datos CIFAR-100

El conjunto de datos CIFAR-100 (Canadian Institute For Advanced Research) es una ampliación significativa del conjunto de datos CIFAR-10, compuesto por 60.000 imágenes en color de 32x32 en 100 clases diferentes. Fue desarrollado por investigadores del instituto CIFAR y ofrece un conjunto de datos más exigente para tareas más complejas de aprendizaje automático y visión por ordenador.



Observa: How to Train Ultralytics YOLO11 on CIFAR-100 | Step-by-Step Image Classification Tutorial 🚀

Características principales

  • El conjunto de datos CIFAR-100 consta de 60.000 imágenes, divididas en 100 clases.
  • Cada clase contiene 600 imágenes, divididas en 500 para el entrenamiento y 100 para las pruebas.
  • Las imágenes están coloreadas y tienen un tamaño de 32x32 píxeles.
  • Las 100 clases diferentes se agrupan en 20 categorías gruesas para una clasificación de nivel superior.
  • CIFAR-100 se utiliza habitualmente para formación y pruebas en el campo del aprendizaje automático y la visión por ordenador.

Estructura del conjunto de datos

El conjunto de datos CIFAR-100 se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 50.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de pruebas: Este subconjunto consta de 10.000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El conjunto de datos CIFAR-100 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje automático. La diversidad del conjunto de datos en términos de clases y la presencia de imágenes en color lo convierten en un conjunto de datos más desafiante y completo para la investigación y el desarrollo en el campo del aprendizaje automático y la visión por ordenador.

Utilización

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-100 durante 100 épocas con un tamaño de imagen de 32x32, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Ejemplos de imágenes y anotaciones

El conjunto de datos CIFAR-100 contiene imágenes en color de diversos objetos, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. He aquí algunos ejemplos de imágenes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra la variedad y complejidad de los objetos del conjunto de datos CIFAR-100, lo que pone de relieve la importancia de contar con un conjunto de datos diverso para entrenar modelos sólidos de clasificación de imágenes.

Citas y agradecimientos

Si utiliza el conjunto de datos CIFAR-100 en su trabajo de investigación o desarrollo, cite el siguiente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría dar las gracias a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-100 como un valioso recurso para la comunidad investigadora del aprendizaje automático y la visión por ordenador. Para más información sobre el conjunto de datos CIFAR-100 y su creador, visite el sitio web del conjunto de datos CIFAR-100.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos CIFAR-100 y por qué es importante?

El conjunto de datos CIFAR-100 es una gran colección de 60.000 imágenes en color de 32x32 clasificadas en 100 clases. Desarrollado por el Instituto Canadiense de Investigación Avanzada (CIFAR), constituye un conjunto de datos complejo ideal para tareas complejas de aprendizaje automático y visión por ordenador. Su importancia radica en la diversidad de clases y el pequeño tamaño de las imágenes, lo que lo convierte en un recurso valioso para entrenar y probar modelos de aprendizaje profundo, como las redes neuronales convolucionales (CNN), utilizando marcos como Ultralytics YOLO .

¿Cómo se entrena un modelo YOLO en el conjunto de datos CIFAR-100?

Puede entrenar un modelo YOLO en el conjunto de datos CIFAR-100 utilizando los comandos Python o CLI . A continuación se explica cómo:

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar100 model=yolo11n-cls.pt epochs=100 imgsz=32

Para obtener una lista completa de los argumentos disponibles, consulte la página de Formación de modelos.

¿Cuáles son las principales aplicaciones del conjunto de datos CIFAR-100?

El conjunto de datos CIFAR-100 se utiliza ampliamente en el entrenamiento y la evaluación de modelos de aprendizaje profundo para la clasificación de imágenes. Su variado conjunto de 100 clases, agrupadas en 20 categorías generales, proporciona un entorno desafiante para probar algoritmos como las redes neuronales convolucionales (CNN), las máquinas de vectores de soporte (SVM) y otros enfoques de aprendizaje automático. Este conjunto de datos es un recurso clave para la investigación y el desarrollo en los campos del aprendizaje automático y la visión por ordenador.

¿Cómo está estructurado el conjunto de datos CIFAR-100?

El conjunto de datos CIFAR-100 se divide en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Contiene 50.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de pruebas: Consiste en 10.000 imágenes utilizadas para probar y comparar los modelos entrenados.

Cada una de las 100 clases contiene 600 imágenes, con 500 imágenes para el entrenamiento y 100 para las pruebas, lo que la hace especialmente adecuada para la investigación académica e industrial rigurosa.

¿Dónde puedo encontrar imágenes de muestra y anotaciones del conjunto de datos CIFAR-100?

El conjunto de datos CIFAR-100 incluye una variedad de imágenes en color de diversos objetos, lo que lo convierte en un conjunto de datos estructurado para tareas de clasificación de imágenes. Puede consultar la página de documentación para ver ejemplos de imágenes y anotaciones. Estos ejemplos ponen de relieve la diversidad y complejidad del conjunto de datos, que son importantes para entrenar modelos sólidos de clasificación de imágenes.

Creado hace 1 año ✏️ Actualizado hace 26 días

Comentarios