Conjunto de datos CIFAR-10

El conjunto de datos CIFAR-10 (Instituto Canadiense de Investigación Avanzada) es una colección de imágenes muy utilizada para algoritmos de machine learning y visión artificial. Fue desarrollado por investigadores del instituto CIFAR y consta de 60 000 imágenes en color de 32x32 en 10 clases diferentes.



Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO26

Características clave

  • El conjunto de datos CIFAR-10 consta de 60 000 imágenes, divididas en 10 clases.
  • Cada clase contiene 6 000 imágenes, divididas en 5 000 para entrenamiento y 1 000 para pruebas.
  • Las imágenes son en color y tienen un tamaño de 32x32 píxeles.
  • Las 10 clases diferentes representan aviones, coches, pájaros, gatos, ciervos, perros, ranas, caballos, barcos y camiones.
  • CIFAR-10 se utiliza habitualmente para el entrenamiento y las pruebas en el campo del machine learning y la visión artificial.

Estructura del conjunto de datos

El conjunto de datos CIFAR-10 se divide en dos subconjuntos:

  1. Conjunto de entrenamiento: Este subconjunto contiene 50 000 imágenes utilizadas para entrenar modelos de machine learning.
  2. Conjunto de pruebas: Este subconjunto consta de 10 000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El conjunto de datos CIFAR-10 es ampliamente utilizado para entrenar y evaluar modelos de deep learning en tareas de clasificación de imágenes, tales como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y varios otros algoritmos de machine learning. La diversidad del conjunto de datos en términos de clases y la presencia de imágenes en color lo convierten en un conjunto de datos completo para la investigación y el desarrollo en el campo del machine learning y la visión artificial.

Uso

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-10 durante 100 epochs con un tamaño de imagen de 32x32, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Imágenes y anotaciones de muestra

El conjunto de datos CIFAR-10 contiene imágenes en color de diversos objetos, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

Muestras del conjunto de datos de clasificación de imágenes CIFAR-10

El ejemplo muestra la variedad y complejidad de los objetos en el conjunto de datos CIFAR-10, destacando la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.

Citas y reconocimientos

Si utilizas el conjunto de datos CIFAR-10 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría agradecer a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-10 como un recurso valioso para la comunidad de investigación de machine learning y visión artificial. Para más información sobre el conjunto de datos CIFAR-10 y su creador, visita el sitio web del conjunto de datos CIFAR-10.

Preguntas frecuentes

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos CIFAR-10?

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-10 utilizando Ultralytics, puedes seguir los ejemplos proporcionados tanto para Python como para la CLI. Aquí tienes un ejemplo básico para entrenar tu modelo durante 100 épocas con un tamaño de imagen de 32x32 píxeles:

Ejemplo
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Para más detalles, consulta la página de entrenamiento del modelo.

¿Cuáles son las características clave del conjunto de datos CIFAR-10?

El conjunto de datos CIFAR-10 consta de 60 000 imágenes en color divididas en 10 clases. Cada clase contiene 6 000 imágenes, con 5 000 para entrenamiento y 1 000 para pruebas. Las imágenes son de 32x32 píxeles de tamaño y varían según las siguientes categorías:

  • Aviones
  • Coches
  • Pájaros
  • Gatos
  • Ciervos
  • Perros
  • Ranas
  • Caballos
  • Barcos
  • Camiones

Este conjunto de datos diverso es esencial para entrenar modelos de clasificación de imágenes en campos como el machine learning y la visión artificial. Para más información, visita las secciones de CIFAR-10 sobre estructura del conjunto de datos y aplicaciones.

¿Por qué utilizar el conjunto de datos CIFAR-10 para tareas de clasificación de imágenes?

El conjunto de datos CIFAR-10 es un punto de referencia excelente para la clasificación de imágenes debido a su diversidad y estructura. Contiene una mezcla equilibrada de 60 000 imágenes etiquetadas en 10 categorías diferentes, lo que ayuda a entrenar modelos robustos y generalizados. Se utiliza ampliamente para evaluar modelos de deep learning, incluyendo redes neuronales (CNN) convolucionales y otros algoritmos de machine learning. El conjunto de datos es relativamente pequeño, lo que lo hace adecuado para la experimentación rápida y el desarrollo de algoritmos. Explora sus numerosas aplicaciones en la sección aplicaciones.

¿Cómo está estructurado el conjunto de datos CIFAR-10?

El conjunto de datos CIFAR-10 está estructurado en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Contiene 50 000 imágenes utilizadas para entrenar modelos de machine learning.
  2. Conjunto de pruebas: Consta de 10 000 imágenes para probar y evaluar los modelos entrenados.

Cada subconjunto comprende imágenes categorizadas en 10 clases, con sus anotaciones fácilmente disponibles para el entrenamiento y la evaluación del modelo. Para obtener información más detallada, consulta la sección de estructura del conjunto de datos.

¿Cómo puedo citar el conjunto de datos CIFAR-10 en mi investigación?

Si utilizas el conjunto de datos CIFAR-10 en tus proyectos de investigación o desarrollo, asegúrate de citar el siguiente artículo:

Cita
@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Reconocer a los creadores del conjunto de datos ayuda a respaldar la investigación y el desarrollo continuos en el campo. Para más detalles, consulta la sección de citas y reconocimientos.

¿Cuáles son algunos ejemplos prácticos de uso del conjunto de datos CIFAR-10?

El conjunto de datos CIFAR-10 se utiliza a menudo para entrenar modelos de clasificación de imágenes, tales como redes neuronales convolucionales (CNN) y máquinas de vectores de soporte (SVM). Estos modelos pueden emplearse en diversas tareas de visión artificial, incluyendo detección de objetos, reconocimiento de imágenes y etiquetado automatizado. Para ver algunos ejemplos prácticos, consulta los fragmentos de código en la sección de uso.

Comentarios