Conjunto de datos Caltech-256

El conjunto de datos Caltech-256 es una extensa colección de imágenes utilizada para tareas de clasificación de objetos. Contiene cerca de 30.000 imágenes divididas en 257 categorías (256 categorías de objetos y 1 categoría de fondo). Las imágenes están cuidadosamente seleccionadas y anotadas para proporcionar un punto de referencia desafiante y diverso para algoritmos de reconocimiento de objetos.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
División automática de datos

El conjunto de datos Caltech-256, tal como se proporciona, no incluye divisiones predefinidas de entrenamiento/validación. Sin embargo, cuando utilizas los comandos de entrenamiento proporcionados en los ejemplos de uso a continuación, el framework Ultralytics dividirá automáticamente el conjunto de datos por ti. La división predeterminada utilizada es del 80% para el conjunto de entrenamiento y del 20% para el conjunto de validación.

Características clave

  • El conjunto de datos Caltech-256 comprende cerca de 30.000 imágenes en color divididas en 257 categorías.
  • Cada categoría contiene un mínimo de 80 imágenes.
  • Las categorías abarcan una amplia variedad de objetos del mundo real, incluidos animales, vehículos, artículos para el hogar y personas.
  • Las imágenes tienen tamaños y resoluciones variables.
  • Caltech-256 se utiliza ampliamente para entrenamiento y pruebas en el campo del aprendizaje automático, particularmente para tareas de reconocimiento de objetos.

Estructura del conjunto de datos

Al igual que Caltech-101, el conjunto de datos Caltech-256 no tiene una división formal entre conjuntos de entrenamiento y prueba. Los usuarios suelen crear sus propias divisiones de acuerdo con sus necesidades específicas. Una práctica común es utilizar un subconjunto aleatorio de imágenes para el entrenamiento y las imágenes restantes para la prueba.

Aplicaciones

El conjunto de datos Caltech-256 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de reconocimiento de objetos, como Redes Neuronales Convolucionales (CNN), Máquinas de Vectores de Soporte (SVM) y varios otros algoritmos de aprendizaje automático. Su conjunto diverso de categorías e imágenes de alta calidad lo convierten en un conjunto de datos invaluable para la investigación y el desarrollo en el campo del aprendizaje automático y la visión artificial.

Uso

Para entrenar un modelo YOLO en el conjunto de datos Caltech-256 durante 100 épocas, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Imágenes y anotaciones de muestra

El conjunto de datos Caltech-256 contiene imágenes en color de alta calidad de varios objetos, proporcionando un conjunto de datos completo para tareas de reconocimiento de objetos. Aquí tienes algunos ejemplos de imágenes del conjunto de datos (crédito):

Muestras del conjunto de datos de clasificación de imágenes Caltech-256

El ejemplo muestra la diversidad y complejidad de los objetos en el conjunto de datos Caltech-256, enfatizando la importancia de un conjunto de datos variado para entrenar modelos de reconocimiento de objetos robustos.

Citas y reconocimientos

Si utilizas el conjunto de datos Caltech-256 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Queremos agradecer a Gregory Griffin, Alex Holub y Pietro Perona por crear y mantener el conjunto de datos Caltech-256 como un recurso valioso para la comunidad de investigación de aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos Caltech-256 y sus creadores, visita el sitio web del conjunto de datos Caltech-256.

Preguntas frecuentes

¿Qué es el conjunto de datos Caltech-256 y por qué es importante para el aprendizaje automático?

El conjunto de datos Caltech-256 es un conjunto de datos de imágenes grande utilizado principalmente para tareas de clasificación de objetos en aprendizaje automático y visión artificial. Consiste en alrededor de 30.000 imágenes en color divididas en 257 categorías, que cubren una amplia gama de objetos del mundo real. Las imágenes diversas y de alta calidad del conjunto de datos lo convierten en un excelente punto de referencia para evaluar algoritmos de reconocimiento de objetos, lo cual es crucial para desarrollar modelos de aprendizaje automático robustos.

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos Caltech-256 usando Python o CLI?

Para entrenar un modelo YOLO en el conjunto de datos Caltech-256 durante 100 épocas, puedes usar los siguientes fragmentos de código. Consulta la página de Entrenamiento del modelo para obtener opciones adicionales.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

¿Cuáles son los casos de uso más comunes para el conjunto de datos Caltech-256?

El conjunto de datos Caltech-256 se utiliza ampliamente para varias tareas de reconocimiento de objetos como:

  • Entrenamiento de Redes Neuronales Convolucionales (CNN)
  • Evaluación del rendimiento de Máquinas de Vectores de Soporte (SVM)
  • Evaluación comparativa de nuevos algoritmos de aprendizaje profundo
  • Desarrollo de modelos de detección de objetos utilizando frameworks como Ultralytics YOLO

Su diversidad y anotaciones completas lo hacen ideal para la investigación y el desarrollo en aprendizaje automático y visión artificial.

¿Cómo está estructurado y dividido el conjunto de datos Caltech-256 para entrenamiento y prueba?

El conjunto de datos Caltech-256 no viene con una división predefinida para entrenamiento y prueba. Los usuarios suelen crear sus propias divisiones de acuerdo con sus necesidades específicas. Un enfoque común es seleccionar aleatoriamente un subconjunto de imágenes para el entrenamiento y usar las imágenes restantes para la prueba. Esta flexibilidad permite a los usuarios adaptar el conjunto de datos a los requisitos específicos de su proyecto y configuraciones experimentales.

¿Por qué debería usar Ultralytics YOLO para entrenar modelos en el conjunto de datos Caltech-256?

Los modelos Ultralytics YOLO ofrecen varias ventajas para el entrenamiento en el conjunto de datos Caltech-256:

  • Alta precisión: los modelos YOLO son conocidos por su rendimiento de vanguardia en tareas de detección de objetos.
  • Velocidad: ofrecen capacidades de inferencia en tiempo real, lo que los hace adecuados para aplicaciones que requieren predicciones rápidas.
  • Facilidad de uso: con la Plataforma Ultralytics, los usuarios pueden entrenar, validar e implementar modelos sin una programación extensa.
  • Modelos preentrenados: empezar con modelos preentrenados, como yolo26n-cls.pt, puede reducir significativamente el tiempo de entrenamiento y mejorar la precisión del modelo.

Para más detalles, explora nuestra guía completa de entrenamiento y aprende sobre la clasificación de imágenes con Ultralytics YOLO.

Comentarios