Saltar al contenido

Conjunto de datos CIFAR-10

El conjunto de datos CIFAR-10 (Canadian Institute For Advanced Research) es una colección de imágenes muy utilizada para algoritmos de aprendizaje automático y visión por ordenador. Fue desarrollado por investigadores del instituto CIFAR y consta de 60.000 imágenes en color de 32x32 en 10 clases diferentes.

Características principales

  • El conjunto de datos CIFAR-10 consta de 60.000 imágenes, divididas en 10 clases.
  • Cada clase contiene 6.000 imágenes, divididas en 5.000 para el entrenamiento y 1.000 para las pruebas.
  • Las imágenes están coloreadas y tienen un tamaño de 32x32 píxeles.
  • Las 10 clases diferentes representan aviones, coches, pájaros, gatos, ciervos, perros, ranas, caballos, barcos y camiones.
  • El CIFAR-10 se utiliza habitualmente para entrenar y probar en el campo del aprendizaje automático y la visión por ordenador.

Estructura del conjunto de datos

El conjunto de datos CIFAR-10 se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 50.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de pruebas: Este subconjunto consta de 10.000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El conjunto de datos CIFAR-10 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje automático. La diversidad del conjunto de datos en cuanto a clases y la presencia de imágenes en color lo convierten en un conjunto de datos muy completo para la investigación y el desarrollo en el campo del aprendizaje automático y la visión por ordenador.

Utilización

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-10 durante 100 épocas con un tamaño de imagen de 32x32, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo detect train data=cifar10 model=yolov8n-cls.pt epochs=100 imgsz=32

Ejemplos de imágenes y anotaciones

El conjunto de datos CIFAR-10 contiene imágenes en color de diversos objetos, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra la variedad y complejidad de los objetos del conjunto de datos CIFAR-10, lo que pone de relieve la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.

Citas y agradecimientos

Si utilizas el conjunto de datos CIFAR-10 en tu trabajo de investigación o desarrollo, cita el siguiente documento:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Queremos dar las gracias a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-10 como un valioso recurso para la comunidad investigadora del aprendizaje automático y la visión por ordenador. Para más información sobre el conjunto de datos CIFAR-10 y su creador, visita el sitio web del conjunto de datos CIFAR-10.



Creado 2023-11-12, Actualizado 2024-05-18
Autores: glenn-jocher (4)

Comentarios