No license

Link to this sectionDataset CIFAR-10#

El conjunto de datos CIFAR-10 (Canadian Institute For Advanced Research) es un punto de referencia clásico de clasificación de imágenes de 60.000 imágenes en color de 32x32 píxeles divididas uniformemente en 10 clases: avión, automóvil, pájaro, gato, ciervo, perro, rana, caballo, barco y camión. Se entrega con una división predefinida de 50.000 imágenes de entrenamiento y 10.000 de prueba (6.000 por clase), lo que lo convierte en un punto de partida ligero y bien equilibrado para entrenar y evaluar modelos de clasificación. Para un reto más detallado, consulta el conjunto de datos CIFAR-100 relacionado.

Watch: How to Train an Image Classification Model with CIFAR-10 Dataset using Ultralytics YOLO

Link to this sectionCaracterísticas clave#

CIFAR-10 contiene 60.000 imágenes en color de 32x32 píxeles, divididas uniformemente en 10 clases.
Cada clase contiene exactamente 6.000 imágenes (5.000 para entrenamiento y 1.000 para pruebas), por lo que el conjunto de datos está perfectamente equilibrado.
Las 10 clases son avión, automóvil, pájaro, gato, ciervo, perro, rana, caballo, barco y camión.
El conjunto de datos se entrega con una división de entrenamiento/prueba predefinida, por lo que no es necesaria ninguna división manual o automática.
CIFAR-10 es un punto de referencia estándar para la investigación en clasificación de imágenes y reconocimiento de objetos.

Link to this sectionEstructura del dataset#

CIFAR-10 se entrega con una división oficial predefinida, por lo que no se necesita ninguna partición automática o manual:

Clases: 10 (avión, automóvil, pájaro, gato, ciervo, perro, rana, caballo, barco, camión)
Imágenes totales: 60.000 (32x32 en color)
Conjunto de entrenamiento: 50.000 imágenes (5.000 por clase)
Conjunto de prueba: 10.000 imágenes (1.000 por clase)

División de validación

CIFAR-10 no tiene una carpeta de validación separada, por lo que Ultralytics utiliza el conjunto de prueba de 10.000 imágenes como división de validación durante el entrenamiento de forma predeterminada.

Link to this sectionAplicaciones#

CIFAR-10 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes, desde redes neuronales convolucionales (CNNs) y máquinas de vectores de soporte (SVMs) clásicas hasta arquitecturas profundas modernas. Su pequeño tamaño de imagen y sus clases equilibradas lo hacen ideal para una experimentación rápida, la evaluación comparativa de nuevos algoritmos y la enseñanza de los fundamentos de la visión artificial.

Link to this sectionUso#

Entrena un modelo YOLO en CIFAR-10 durante 100 épocas con un tamaño de imagen de 32. Para ver la lista completa de argumentos disponibles, consulta la página de entrenamiento y la guía de la tarea de clasificación de imágenes.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this sectionMuestras de imágenes y anotaciones#

El conjunto de datos CIFAR-10 contiene imágenes en color de varios objetos, proporcionando un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

Muestras del dataset de clasificación de imágenes CIFAR-10

Las muestras muestran la diversidad de los objetos en el conjunto de datos CIFAR-10, lo que subraya el valor de un conjunto de datos variado para entrenar modelos robustos de clasificación de imágenes.

Link to this sectionCitas y agradecimientos#

Si utilizas el dataset CIFAR-10 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría dar las gracias a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-10 como un recurso valioso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos CIFAR-10 y su creador, visita el sitio web del conjunto de datos CIFAR-10.

Link to this sectionFAQ#

Link to this section¿Para qué se utiliza el conjunto de datos CIFAR-10 en el aprendizaje automático?#

El conjunto de datos CIFAR-10 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes y reconocimiento de objetos. Contiene 60.000 imágenes en color de 32x32 píxeles distribuidas uniformemente en 10 clases, y su pequeño tamaño y clases equilibradas lo convierten en un punto de referencia rápido y fiable para algoritmos como las redes neuronales convolucionales (CNNs) y las máquinas de vectores de soporte (SVMs).

Link to this section¿Cómo puedo entrenar un modelo Ultralytics YOLO en el conjunto de datos CIFAR-10?#

Para entrenar un modelo Ultralytics YOLO en CIFAR-10, utiliza los fragmentos de código que aparecen a continuación. El conjunto de datos se descarga automáticamente la primera vez que se utiliza. Para obtener una lista completa de argumentos, consulta la página de entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar10", epochs=100, imgsz=32)

Link to this section¿Cuántas clases tiene el conjunto de datos CIFAR-10?#

CIFAR-10 tiene 10 clases (avión, automóvil, pájaro, gato, ciervo, perro, rana, caballo, barco y camión), con exactamente 6.000 imágenes cada una, sumando un total de 60.000 imágenes. Las clases son mutuamente excluyentes y perfectamente equilibradas, sin superposición entre categorías.

Link to this section¿Cómo se divide el conjunto de datos CIFAR-10 en conjuntos de entrenamiento y de prueba?#

CIFAR-10 se entrega con una división predefinida de 50.000 imágenes de entrenamiento y 10.000 imágenes de prueba, con exactamente 5.000 imágenes de entrenamiento y 1.000 imágenes de prueba por clase. A diferencia de los conjuntos de datos de clasificación basados en carpetas que Ultralytics divide automáticamente, la partición oficial de CIFAR-10 se utiliza tal cual, y el conjunto de prueba sirve como división de validación durante el entrenamiento de forma predeterminada.

Link to this section¿Puedo utilizar la plataforma de Ultralytics para entrenar modelos en el conjunto de datos CIFAR-10?#

Sí. Ultralytics Platform te permite gestionar conjuntos de datos, entrenar modelos de clasificación de imágenes e implementarlos sin necesidad de programar mucho. Es una forma cómoda de ejecutar experimentos con CIFAR-10 en la nube, y puedes explorar más opciones en nuestra visión general de conjuntos de datos de clasificación.

Colaboradores

GLglenn-jocher¹³ RIRizwanMunawar² JKjk4e² RAraimbekovm¹ MAMatthewNoyce¹ AMambitious-octopus¹

Creado 12 nov 2023Actualizado anteayer