Link to this sectionConjunto de datos Caltech-256#

El conjunto de datos Caltech-256 es un punto de referencia clásico de clasificación de imágenes de 30.607 imágenes que abarcan 256 categorías de objetos más una clase de fondo. Cada categoría contiene al menos 80 imágenes de objetos del mundo real (animales, vehículos, artículos para el hogar y personas), lo que lo convierte en un sucesor más grande y desafiante de Caltech-101 para modelos de reconocimiento de objetos.

Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26

División automática de datos

Caltech-256 se entrega sin una división predefinida de entrenamiento/validación. Los comandos de entrenamiento a continuación lo dividen automáticamente en 80% entrenamiento / 20% validación, por lo que no se necesita preparación manual.

Link to this sectionCaracterísticas clave#

Caltech-256 contiene 30.607 imágenes en color a través de 256 categorías de objetos más una clase de fondo 257.clutter (257 carpetas de clase en total).
Las categorías abarcan una gran variedad de objetos del mundo real, incluyendo animales, vehículos, artículos domésticos y personas.
Cada categoría contiene al menos 80 imágenes, con la más grande conteniendo hasta unas 800, por lo que los tamaños de clase están desequilibrados.
Las imágenes son de tamaños y resoluciones variables.
Caltech-256 se utiliza ampliamente para evaluar algoritmos de clasificación de imágenes y reconocimiento de objetos.

Link to this sectionEstructura del dataset#

Caltech-256 se distribuye en 257 carpetas —una por clase, que cubre 256 categorías de objetos más una clase de fondo 257.clutter— sin una división de entrenamiento/validación predefinida. Cuando inicias el entrenamiento, Ultralytics divide automáticamente las imágenes para que los modelos entrenen en las 257 clases sin ninguna configuración manual:

Clases: 257 (256 categorías de objetos + 1 fondo)
Imágenes totales: 30.607
División de entrenamiento/validación: automática 80% / 20% (≈24.385 entrenamiento, ≈6.222 validación)
Imágenes por clase: al menos 80 (desequilibrado, hasta unas 800)

Link to this sectionAplicaciones#

El conjunto de datos Caltech-256 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes y reconocimiento de objetos, incluyendo Redes Neuronales Convolucionales (CNNs) y Máquinas de Vectores de Soporte (SVMs). Su gran cantidad de categorías e imágenes de alta calidad lo convierten en un punto de referencia popular para la investigación y creación de prototipos en aprendizaje automático y visión artificial.

Link to this sectionUso#

Entrena un modelo YOLO en Caltech-256 durante 100 épocas con un tamaño de imagen de 416. Para ver la lista completa de argumentos disponibles, consulta la página de Entrenamiento y la guía de tareas de clasificación de imágenes.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this sectionMuestras de imágenes y anotaciones#

El conjunto de datos Caltech-256 contiene imágenes en color de alta calidad de varios objetos, proporcionando un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí hay algunos ejemplos de imágenes del conjunto de datos (crédito):

Muestras del conjunto de datos de clasificación de imágenes Caltech-256

Las muestras muestran la diversidad y complejidad de los objetos en el conjunto de datos Caltech-256, subrayando el valor de un conjunto de datos variado para entrenar modelos robustos de reconocimiento de objetos.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos Caltech-256 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Nos gustaría agradecer a Gregory Griffin, Alex Holub y Pietro Perona por crear y mantener el conjunto de datos Caltech-256 como un recurso valioso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos Caltech-256 y sus creadores, visita el sitio web del conjunto de datos Caltech-256.

Link to this sectionFAQ#

Link to this section¿Para qué se utiliza el conjunto de datos Caltech-256 en el aprendizaje automático?#

El conjunto de datos Caltech-256 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes y reconocimiento de objetos. Contiene 30.607 imágenes en 256 categorías de objetos más una clase de fondo, proporcionando un punto de referencia más grande y desafiante que Caltech-101 para algoritmos como las Redes Neuronales Convolucionales (CNNs) y las Máquinas de Vectores de Soporte (SVMs).

Link to this section¿Cómo puedo entrenar un modelo Ultralytics YOLO en el conjunto de datos Caltech-256?#

Para entrenar un modelo Ultralytics YOLO en Caltech-256, utiliza los fragmentos de código a continuación. El conjunto de datos se descarga automáticamente en el primer uso. Para obtener una lista completa de argumentos, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Link to this section¿Cuántas clases tiene el conjunto de datos Caltech-256?#

Caltech-256 contiene 256 categorías de objetos más una clase de fondo 257.clutter, para un total de 257 carpetas de clase y 30.607 imágenes. Cuando entrenas con Ultralytics, el modelo aprende todas las 257 clases. Cada categoría contiene al menos 80 imágenes, pero los tamaños de clase están desequilibrados, con la más grande conteniendo hasta unas 800 imágenes.

Link to this section¿Cómo se divide el conjunto de datos Caltech-256 en conjuntos de entrenamiento y validación?#

Caltech-256 no tiene una división predefinida. La primera vez que entrenas, Ultralytics lo divide automáticamente en 80% entrenamiento / 20% validación —alrededor de 24.385 imágenes de entrenamiento y 6.222 de validación— por lo que no necesitas crear divisiones manualmente. Para controlar la división tú mismo, organiza las imágenes en carpetas train/ y val/ antes de entrenar.

Link to this section¿Puedo utilizar la plataforma Ultralytics para entrenar modelos en el conjunto de datos Caltech-256?#

Sí. Ultralytics Platform te permite gestionar conjuntos de datos, entrenar modelos de clasificación de imágenes e implementarlos sin necesidad de programar extensamente. Es una forma conveniente de ejecutar experimentos con Caltech-256 en la nube, y puedes explorar más opciones en nuestra visión general de conjuntos de datos de clasificación.

Colaboradores

GLglenn-jocher¹³ RIRizwanMunawar³ RAraimbekovm² MAMatthewNoyce¹ JKjk4e¹

Creado 12 nov 2023Actualizado anteayer