Saltar al contenido

Conjunto de datos Caltech-256

El conjunto de datos Caltech-256 es una amplia colección de imágenes utilizadas para tareas de clasificación de objetos. Contiene unas 30.000 imágenes divididas en 257 categorías (256 categorías de objetos y 1 categoría de fondo). Las imágenes están cuidadosamente seleccionadas y anotadas para proporcionar un punto de referencia desafiante y diverso para los algoritmos de reconocimiento de objetos.

Características principales

  • El conjunto de datos Caltech-256 comprende unas 30.000 imágenes en color divididas en 257 categorías.
  • Cada categoría contiene un mínimo de 80 imágenes.
  • Las categorías abarcan una amplia variedad de objetos del mundo real, como animales, vehículos, artículos domésticos y personas.
  • Las imágenes son de tamaño y resolución variables.
  • Caltech-256 se utiliza ampliamente para entrenamiento y pruebas en el campo del aprendizaje automático, en particular para tareas de reconocimiento de objetos.

Estructura del conjunto de datos

Al igual que Caltech-101, el conjunto de datos Caltech-256 no tiene una división formal entre conjuntos de entrenamiento y de prueba. Los usuarios suelen crear sus propias divisiones según sus necesidades específicas. Una práctica habitual es utilizar un subconjunto aleatorio de imágenes para el entrenamiento y el resto de imágenes para las pruebas.

Aplicaciones

El conjunto de datos Caltech-256 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de reconocimiento de objetos, como redes neuronales convolucionales (CNN), máquinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje automático. Su variado conjunto de categorías y sus imágenes de alta calidad lo convierten en un conjunto de datos inestimable para la investigación y el desarrollo en el campo del aprendizaje automático y la visión por ordenador.

Utilización

Para entrenar un modelo YOLO en el conjunto de datos Caltech-256 durante 100 épocas, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech256 model=yolov8n-cls.pt epochs=100 imgsz=416

Ejemplos de imágenes y anotaciones

El conjunto de datos Caltech-256 contiene imágenes en color de alta calidad de diversos objetos, lo que proporciona un amplio conjunto de datos para tareas de reconocimiento de objetos. He aquí algunos ejemplos de imágenes del conjunto de datos(crédito):

Imagen de muestra del conjunto de datos

El ejemplo muestra la diversidad y complejidad de los objetos del conjunto de datos Caltech-256, lo que subraya la importancia de un conjunto de datos variado para entrenar modelos robustos de reconocimiento de objetos.

Citas y agradecimientos

Si utilizas el conjunto de datos Caltech-256 en tu trabajo de investigación o desarrollo, cita el siguiente documento:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Queremos dar las gracias a Gregory Griffin, Alex Holub y Pietro Perona por crear y mantener el conjunto de datos Caltech-256 como valioso recurso para la comunidad investigadora del aprendizaje automático y la visión por ordenador. Para más información sobre el

conjunto de datos Caltech-256 y sus creadores, visita el sitio web del conjunto de datos Caltech-256.



Creado 2023-11-12, Actualizado 2024-05-18
Autores: glenn-jocher (4)

Comentarios