Ir al contenido

Conjunto de datos CIFAR-10

El conjunto de datos CIFAR-10 (Canadian Institute For Advanced Research) es una colección de imágenes utilizadas ampliamente para algoritmos de aprendizaje automático y visión artificial. Fue desarrollado por investigadores del instituto CIFAR y consta de 60,000 imágenes a color de 32x32 en 10 clases diferentes.



Ver: Cómo entrenar un Clasificación de imágenes Modelo con el conjunto de datos CIFAR-10 utilizando Ultralytics YOLO11

Características clave

  • El conjunto de datos CIFAR-10 consta de 60,000 imágenes, divididas en 10 clases.
  • Cada clase contiene 6,000 imágenes, divididas en 5,000 para entrenamiento y 1,000 para pruebas.
  • Las imágenes son a color y tienen un tamaño de 32x32 píxeles.
  • Las 10 clases diferentes representan aviones, coches, pájaros, gatos, ciervos, perros, ranas, caballos, barcos y camiones.
  • CIFAR-10 se utiliza comúnmente para el entrenamiento y las pruebas en el campo del aprendizaje automático y la visión artificial.

Estructura del conjunto de datos

El conjunto de datos CIFAR-10 se divide en dos subconjuntos:

  1. Conjunto de Entrenamiento: Este subconjunto contiene 50.000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de Prueba: Este subconjunto consta de 10,000 imágenes utilizadas para probar y evaluar los modelos entrenados.

Aplicaciones

El dataset CIFAR-10 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, como las Redes Neuronales Convolucionales (CNNs), las Máquinas de Vectores de Soporte (SVMs) y varios otros algoritmos de aprendizaje automático. La diversidad del dataset en términos de clases y la presencia de imágenes a color lo convierten en un dataset completo para la investigación y el desarrollo en el campo del aprendizaje automático y la visión artificial.

Uso

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-10 durante 100 epochs con un tamaño de imagen de 32x32, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

sample_images y anotaciones

El conjunto de datos CIFAR-10 contiene imágenes en color de varios objetos, lo que proporciona un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí hay algunos ejemplos de imágenes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra la variedad y la complejidad de los objetos en el conjunto de datos CIFAR-10, destacando la importancia de un conjunto de datos diverso para entrenar modelos robustos de clasificación de imágenes.

Citas y agradecimientos

Si utiliza el conjunto de datos CIFAR-10 en su trabajo de investigación o desarrollo, cite el siguiente artículo:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría agradecer a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-10 como un valioso recurso para la comunidad de investigación del aprendizaje automático y la visión artificial. Para obtener más información sobre el conjunto de datos CIFAR-10 y su creador, visite el sitio web del conjunto de datos CIFAR-10.

Preguntas frecuentes

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos CIFAR-10?

Para entrenar un modelo YOLO en el conjunto de datos CIFAR-10 utilizando Ultralytics, puedes seguir los ejemplos proporcionados tanto para python como para la CLI. Aquí tienes un ejemplo básico para entrenar tu modelo durante 100 epochs con un tamaño de imagen de 32x32 píxeles:

Ejemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)
# Start training from a pretrained *.pt model
yolo classify train data=cifar10 model=yolo11n-cls.pt epochs=100 imgsz=32

Para obtener más detalles, consulta la página de Entrenamiento del modelo.

¿Cuáles son las características clave del conjunto de datos CIFAR-10?

El conjunto de datos CIFAR-10 consta de 60.000 imágenes en color divididas en 10 clases. Cada clase contiene 6.000 imágenes, con 5.000 para entrenamiento y 1.000 para pruebas. Las imágenes tienen un tamaño de 32x32 píxeles y varían en las siguientes categorías:

  • Aviones
  • Coches
  • Pájaros
  • Gatos
  • Ciervo
  • Perros
  • Ranas
  • Caballos
  • Barcos
  • Camiones

Este diverso conjunto de datos es esencial para entrenar modelos de clasificación de imágenes en campos como el aprendizaje automático y la visión artificial. Para obtener más información, visite las secciones de CIFAR-10 sobre la estructura del conjunto de datos y las aplicaciones.

¿Por qué utilizar el conjunto de datos CIFAR-10 para tareas de clasificación de imágenes?

El conjunto de datos CIFAR-10 es un excelente punto de referencia para la clasificación de imágenes debido a su diversidad y estructura. Contiene una mezcla equilibrada de 60.000 imágenes etiquetadas en 10 categorías diferentes, lo que ayuda a entrenar modelos robustos y generalizados. Se utiliza ampliamente para evaluar modelos de aprendizaje profundo, incluidas las redes neuronales convolucionales (CNN) y otros algoritmos de aprendizaje automático. El conjunto de datos es relativamente pequeño, lo que lo hace adecuado para la experimentación rápida y el desarrollo de algoritmos. Explore sus numerosas aplicaciones en la sección de aplicaciones.

¿Cómo está estructurado el conjunto de datos CIFAR-10?

El conjunto de datos CIFAR-10 está estructurado en dos subconjuntos principales:

  1. Conjunto de entrenamiento: Contiene 50,000 imágenes utilizadas para entrenar modelos de aprendizaje automático.
  2. Conjunto de prueba: Consta de 10.000 imágenes para probar y evaluar los modelos entrenados.

Cada subconjunto comprende imágenes clasificadas en 10 clases, con sus anotaciones disponibles para el entrenamiento y la evaluación del modelo. Para obtener información más detallada, consulte la sección de estructura del conjunto de datos.

¿Cómo puedo citar el conjunto de datos CIFAR-10 en mi investigación?

Si utiliza el conjunto de datos CIFAR-10 en sus proyectos de investigación o desarrollo, asegúrese de citar el siguiente artículo:

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Reconocer a los creadores del conjunto de datos ayuda a apoyar la investigación y el desarrollo continuos en el campo. Para obtener más detalles, consulte la sección de citas y reconocimientos.

¿Cuáles son algunos ejemplos prácticos del uso del conjunto de datos CIFAR-10?

El dataset CIFAR-10 se utiliza a menudo para entrenar modelos de clasificación de imágenes, como las Redes Neuronales Convolucionales (CNNs) y las Máquinas de Vectores de Soporte (SVMs). Estos modelos se pueden emplear en diversas tareas de visión artificial, incluyendo la detección de objetos, el reconocimiento de imágenes y el etiquetado automatizado. Para ver algunos ejemplos prácticos, consulte los fragmentos de código en la sección de uso.



📅 Creado hace 1 año ✏️ Actualizado hace 5 meses

Comentarios