No license

Link to this sectionConjunto de datos CIFAR-100#

El conjunto de datos CIFAR-100 (Canadian Institute For Advanced Research) es un banco de pruebas de clasificación de imágenes de 60.000 imágenes en color de 32x32 distribuidas equitativamente en 100 clases detalladas (600 imágenes cada una), que a su vez se agrupan en 20 superclases generales. Creado por Alex Krizhevsky, se distribuye con una división predefinida de 50.000 imágenes de entrenamiento y 10.000 de prueba, lo que lo convierte en el hermano más difícil y detallado del conjunto de datos CIFAR-10.

Watch: How to Train an Image Classification Model on CIFAR-100 using Ultralytics YOLO

Link to this sectionCaracterísticas clave#

CIFAR-100 contiene 60.000 imágenes en color de 32x32 píxeles, divididas equitativamente en 100 clases.
Cada clase contiene exactamente 600 imágenes —500 para entrenamiento y 100 para pruebas—, por lo que el conjunto de datos está perfectamente equilibrado.
Las 100 clases detalladas se agrupan en 20 superclases generales para una clasificación de nivel superior.
El conjunto de datos se entrega con una división de entrenamiento/prueba predefinida, por lo que no es necesaria ninguna división manual o automática.
CIFAR-100 es un banco de pruebas estándar para la investigación en clasificación de imágenes detallada y reconocimiento de objetos.

Link to this sectionEstructura del dataset#

CIFAR-100 incluye una división oficial y predefinida, por lo que no es necesaria ninguna partición automática o manual:

Clases: 100 clases detalladas, agrupadas en 20 superclases generales
Imágenes totales: 60.000 (32x32 en color)
Conjunto de entrenamiento: 50.000 imágenes (500 por clase)
Conjunto de prueba: 10.000 imágenes (100 por clase)

División de validación

CIFAR-100 no tiene una carpeta de validación separada, por lo que Ultralytics utiliza el conjunto de prueba de 10.000 imágenes como división de validación durante el entrenamiento de forma predeterminada. El entrenamiento con data="cifar100" aprende las 100 clases detalladas.

Link to this sectionAplicaciones#

CIFAR-100 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes, desde las clásicas Redes Neuronales Convolucionales (CNN) y Máquinas de Vectores de Soporte (SVM) hasta arquitecturas profundas modernas. Sus 100 clases detalladas y el pequeño tamaño de las imágenes lo convierten en un banco de pruebas exigente para la investigación en aprendizaje automático, la comparación de algoritmos y la experimentación en visión artificial.

Link to this sectionUso#

Entrena un modelo YOLO en CIFAR-100 durante 100 épocas con un tamaño de imagen de 32. Para obtener la lista completa de argumentos disponibles, consulta la página de Entrenamiento y la guía de tareas de clasificación de imágenes.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this sectionMuestras de imágenes y anotaciones#

Imágenes de muestra del conjunto de datos CIFAR-100:

Muestras del conjunto de datos de clasificación de imágenes CIFAR-100

Las muestras muestran la diversidad de los objetos en el conjunto de datos CIFAR-100, subrayando el valor de un conjunto de datos variado para entrenar modelos de clasificación de imágenes robustos.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos CIFAR-100 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@TECHREPORT{Krizhevsky09learningmultiple,
            author={Alex Krizhevsky},
            title={Learning multiple layers of features from tiny images},
            institution={},
            year={2009}
}

Nos gustaría agradecer a Alex Krizhevsky por crear y mantener el conjunto de datos CIFAR-100 como un recurso valioso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos CIFAR-100 y su creador, visita el sitio web del conjunto de datos CIFAR-100.

Link to this sectionFAQ#

Link to this section¿Para qué se utiliza el conjunto de datos CIFAR-100 en el aprendizaje automático?#

El conjunto de datos CIFAR-100 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes y reconocimiento de objetos detallados. Contiene 60.000 imágenes en color de 32x32 distribuidas en 100 clases agrupadas en 20 superclases, lo que lo convierte en un banco de pruebas más desafiante que CIFAR-10 para algoritmos como las Redes Neuronales Convolucionales (CNN) y Máquinas de Vectores de Soporte (SVM), y para evaluar modelos de aprendizaje profundo creados con Ultralytics YOLO.

Link to this section¿Cómo puedo entrenar un modelo Ultralytics YOLO en el conjunto de datos CIFAR-100?#

Para entrenar un modelo Ultralytics YOLO en CIFAR-100, utiliza los fragmentos de código que aparecen a continuación. El conjunto de datos se descarga automáticamente la primera vez que se utiliza. Para obtener una lista completa de argumentos, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="cifar100", epochs=100, imgsz=32)

Link to this section¿Cuántas clases tiene el conjunto de datos CIFAR-100?#

CIFAR-100 tiene 100 clases detalladas (como manzana, delfín, arce, motocicleta y cohete), con exactamente 600 imágenes cada una, para un total de 60.000 imágenes. Estas 100 clases se agrupan adicionalmente en 20 superclases generales (por ejemplo, la superclase de árboles cubre arce, roble, palmera, pino y sauce). El entrenamiento con data="cifar100" utiliza las 100 clases detalladas.

Link to this section¿Cómo se divide el conjunto de datos CIFAR-100 en conjuntos de entrenamiento y de prueba?#

CIFAR-100 se distribuye con una división predefinida de 50.000 imágenes de entrenamiento y 10.000 de prueba, con exactamente 500 imágenes de entrenamiento y 100 de prueba por clase. A diferencia de los conjuntos de datos de clasificación basados en carpetas que Ultralytics divide automáticamente, la partición oficial de CIFAR-100 se utiliza tal cual, y el conjunto de prueba sirve como la división de validación durante el entrenamiento de forma predeterminada.

Link to this section¿Puedo usar la plataforma Ultralytics para entrenar modelos en el conjunto de datos CIFAR-100?#

Sí. Ultralytics Platform te permite gestionar conjuntos de datos, entrenar modelos de clasificación de imágenes e implementarlos sin necesidad de programar demasiado. Es una forma cómoda de realizar experimentos con CIFAR-100 en la nube, y puedes explorar más opciones en nuestra descripción general de conjuntos de datos de clasificación.

Colaboradores

GLglenn-jocher¹⁵ RAraimbekovm² RIRizwanMunawar² MAMatthewNoyce¹ JKjk4e¹

Creado 12 nov 2023Actualizado hace 3 días