Conjunto de datos Caltech-256

Q: What is the Caltech-256 dataset and why is it important for machine learning?

El conjunto de datos Caltech-256 es un gran conjunto de datos de imágenes que se utiliza principalmente para tareas de clasificación de objetos en el aprendizaje automático y la visión artificial. Consta de unas 30 000 imágenes en color divididas en 257 categorías, que abarcan una amplia gama de objetos del mundo real. Las imágenes diversas y de alta calidad del conjunto de datos lo convierten en un excelente punto de referencia para evaluar los algoritmos de reconocimiento de objetos, lo cual es crucial para desarrollar modelos de aprendizaje automático robustos.

El conjunto de datos Caltech-256 es una extensa colección de imágenes utilizada para tareas de clasificación de objetos. Contiene alrededor de 30,000 imágenes divididas en 257 categorías (256 categorías de objetos y 1 categoría de fondo). Las imágenes están cuidadosamente seleccionadas y anotadas para proporcionar un punto de referencia desafiante y diverso para los algoritmos de reconocimiento de objetos.

Ver: Cómo entrenar Clasificación de imágenes Entrenamiento del modelo utilizando el conjunto de datos Caltech-256 con Ultralytics

División automática de datos

El conjunto de datos Caltech-256, tal como se proporciona, no viene con divisiones predefinidas de entrenamiento/validación. Sin embargo, cuando utiliza los comandos de entrenamiento proporcionados en los ejemplos de uso a continuación, el marco de Ultralytics dividirá automáticamente el conjunto de datos por usted. La división predeterminada utilizada es del 80% para el conjunto de entrenamiento y del 20% para el conjunto de validación.

Características clave

El conjunto de datos Caltech-256 comprende alrededor de 30,000 imágenes a color divididas en 257 categorías.
Cada categoría contiene un mínimo de 80 imágenes.
Las categorías abarcan una amplia variedad de objetos del mundo real, incluidos animales, vehículos, artículos para el hogar y personas.
Las imágenes son de tamaños y resoluciones variables.
Caltech-256 se utiliza ampliamente para el entrenamiento y las pruebas en el campo del aprendizaje automático, particularmente para las tareas de reconocimiento de objetos.

Estructura del conjunto de datos

Al igual que Caltech-101, el conjunto de datos Caltech-256 no tiene una división formal entre los conjuntos de entrenamiento y prueba. Los usuarios suelen crear sus propias divisiones de acuerdo con sus necesidades específicas. Una práctica común es utilizar un subconjunto aleatorio de imágenes para el entrenamiento y las imágenes restantes para las pruebas.

Aplicaciones

El conjunto de datos Caltech-256 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de reconocimiento de objetos, como las redes neuronales convolucionales (CNN), las máquinas de vectores de soporte (SVM) y otros algoritmos de aprendizaje automático. Su diverso conjunto de categorías e imágenes de alta calidad lo convierten en un conjunto de datos inestimable para la investigación y el desarrollo en el campo del aprendizaje automático y la visión artificial.

Uso

Para entrenar un modelo YOLO en el conjunto de datos Caltech-256 durante 100 epochs, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

sample_images y anotaciones

El conjunto de datos Caltech-256 contiene imágenes a color de alta calidad de varios objetos, lo que proporciona un conjunto de datos completo para tareas de reconocimiento de objetos. Aquí hay algunos ejemplos de imágenes del conjunto de datos (crédito):

Muestras del conjunto de datos de clasificación de imágenes Caltech-256

El ejemplo muestra la diversidad y complejidad de los objetos en el conjunto de datos Caltech-256, enfatizando la importancia de un conjunto de datos variado para entrenar modelos robustos de reconocimiento de objetos.

Citas y agradecimientos

Si utilizas el conjunto de datos Caltech-256 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

BibTeX

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Nos gustaría agradecer a Gregory Griffin, Alex Holub y Pietro Perona la creación y el mantenimiento del conjunto de datos Caltech-256 como un valioso recurso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos Caltech-256 y sus creadores, visite el sitio web del conjunto de datos Caltech-256.

Preguntas frecuentes

¿Qué es el conjunto de datos Caltech-256 y por qué es importante para el aprendizaje automático?

El conjunto de datos Caltech-256 es un extenso conjunto de imágenes utilizado principalmente para tareas de clasificación de objetos en aprendizaje automático y visión artificial. Consta de alrededor de 30.000 imágenes a color divididas en 257 categorías, que abarcan una amplia gama de objetos del mundo real. La diversidad y la alta calidad de las imágenes del conjunto de datos lo convierten en un excelente punto de referencia para evaluar algoritmos de reconocimiento de objetos, lo cual es crucial para desarrollar modelos robustos de aprendizaje automático.

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos Caltech-256 usando python o la CLI?

Para entrenar un modelo YOLO en el conjunto de datos Caltech-256 durante 100 épocas, puede utilizar los siguientes fragmentos de código. Consulte la página de Entrenamiento del modelo para obtener opciones adicionales.

Ejemplo de entrenamiento

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo26n-cls.pt epochs=100 imgsz=416

¿Cuáles son los casos de uso más comunes para el conjunto de datos Caltech-256?

El conjunto de datos Caltech-256 se utiliza ampliamente para diversas tareas de reconocimiento de objetos, tales como:

Entrenamiento de Redes Neuronales Convolucionales (CNNs)
Evaluación del rendimiento de las máquinas de vectores de soporte (SVM)
Evaluación comparativa de nuevos algoritmos de aprendizaje profundo
Desarrollo de modelos de detección de objetos utilizando frameworks como Ultralytics YOLO

Su diversidad y sus completas anotaciones lo hacen ideal para la investigación y el desarrollo en el aprendizaje automático y la visión artificial.

¿Cómo se estructura y divide el conjunto de datos Caltech-256 para el entrenamiento y las pruebas?

El conjunto de datos Caltech-256 no viene con una división predefinida para entrenamiento y pruebas. Los usuarios suelen crear sus propias divisiones según sus necesidades específicas. Un enfoque común es seleccionar aleatoriamente un subconjunto de imágenes para el entrenamiento y utilizar las imágenes restantes para las pruebas. Esta flexibilidad permite a los usuarios adaptar el conjunto de datos a los requisitos específicos de su proyecto y a las configuraciones experimentales.

¿Por qué debería usar Ultralytics YOLO para entrenar modelos en el conjunto de datos Caltech-256?

Los modelos YOLO de Ultralytics ofrecen varias ventajas para el entrenamiento en el conjunto de datos Caltech-256:

Alta precisión: Los modelos YOLO son conocidos por su rendimiento de última generación en tareas de detección de objetos.
Velocidad: Proporcionan capacidades de inferencia en tiempo real, lo que los hace adecuados para aplicaciones que requieren predicciones rápidas.
Facilidad de Uso: Con Ultralytics Platform, los usuarios pueden entrenar, validar y desplegar modelos sin necesidad de una codificación extensa.
Modelos preentrenados: Comenzando con modelos preentrenados, como yolo26n-cls.pt, puede reducir significativamente el tiempo de entrenamiento y mejorar el modelo precisión.

Para obtener más detalles, explore nuestra guía de entrenamiento completa y aprenda sobre la clasificación de imágenes con Ultralytics YOLO.

📅 Creado hace 2 años ✏️ Actualizado hace 28 días