Saltar al contenido

Conjunto de datos CIFAR-100

El conjunto de datos CIFAR-100 (Instituto Canadiense de Investigaci贸n Avanzada) es una ampliaci贸n significativa del conjunto de datos CIFAR-10, compuesto por 60.000 im谩genes en color de 32x32 en 100 clases diferentes. Fue desarrollado por investigadores del instituto CIFAR, ofreciendo un conjunto de datos m谩s desafiante para tareas m谩s complejas de aprendizaje autom谩tico y visi贸n por ordenador.

Caracter铆sticas principales

  • El conjunto de datos CIFAR-100 consta de 60.000 im谩genes, divididas en 100 clases.
  • Cada clase contiene 600 im谩genes, divididas en 500 para el entrenamiento y 100 para la prueba.
  • Las im谩genes est谩n coloreadas y tienen un tama帽o de 32x32 p铆xeles.
  • Las 100 clases diferentes se agrupan en 20 categor铆as gruesas para una clasificaci贸n de nivel superior.
  • El CIFAR-100 se utiliza habitualmente para entrenamiento y pruebas en el campo del aprendizaje autom谩tico y la visi贸n por ordenador.

Estructura del conjunto de datos

El conjunto de datos CIFAR-100 se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 50.000 im谩genes utilizadas para entrenar modelos de aprendizaje autom谩tico.
  2. Conjunto de pruebas: Este subconjunto consta de 10.000 im谩genes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El conjunto de datos CIFAR-100 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificaci贸n de im谩genes, como redes neuronales convolucionales (CNN), m谩quinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje autom谩tico. La diversidad del conjunto de datos en t茅rminos de clases y la presencia de im谩genes en color lo convierten en un conjunto de datos m谩s desafiante y completo para la investigaci贸n y el desarrollo en el campo del aprendizaje autom谩tico y la visi贸n por ordenador.

Utilizaci贸n

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-100 durante 100 茅pocas con un tama帽o de imagen de 32x32, puedes utilizar los siguientes fragmentos de c贸digo. Para obtener una lista completa de los argumentos disponibles, consulta la p谩gina Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar100 model=yolov8n-cls.pt epochs=100 imgsz=32

Ejemplos de im谩genes y anotaciones

El conjunto de datos CIFAR-100 contiene im谩genes en color de diversos objetos, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificaci贸n de im谩genes. Aqu铆 tienes algunos ejemplos de im谩genes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra la variedad y complejidad de los objetos del conjunto de datos CIFAR-100, lo que pone de relieve la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificaci贸n de im谩genes.

Citas y agradecimientos

Si utilizas el conjunto de datos CIFAR-100 en tu trabajo de investigaci贸n o desarrollo, cita el siguiente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Queremos dar las gracias a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-100 como un valioso recurso para la comunidad investigadora del aprendizaje autom谩tico y la visi贸n por ordenador. Para m谩s informaci贸n sobre el conjunto de datos CIFAR-100 y su creador, visita el sitio web del conjunto de datos CIFAR-100.



Creado 2023-11-12, Actualizado 2024-05-18
Autores: glenn-jocher (4)

Comentarios