Link to this sectionConjunto de datos Caltech-101#

El conjunto de datos Caltech-101 es un referente clásico de clasificación de imágenes de 9.144 imágenes que abarcan 101 categorías de objetos más una clase de fondo. Cada categoría contiene entre 40 y 800 imágenes de objetos del mundo real (animales, vehículos, artículos domésticos y personas), lo que lo convierte en un punto de referencia compacto pero desafiante para modelos de reconocimiento de objetos.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

División automática de datos

Caltech-101 se distribuye sin una división predefinida de entrenamiento/validación. Los comandos de entrenamiento a continuación lo dividen automáticamente en un 80% para entrenamiento y un 20% para validación, por lo que no se requiere preparación manual.

Link to this sectionCaracterísticas clave#

Caltech-101 contiene 9.144 imágenes en color repartidas en 101 categorías de objetos más una clase BACKGROUND_Google (102 carpetas de clase en total).
Las categorías abarcan una gran variedad de objetos del mundo real, incluyendo animales, vehículos, artículos domésticos y personas.
Cada categoría contiene entre 40 y 800 imágenes, por lo que el tamaño de las clases está desequilibrado.
Las imágenes tienen tamaños variables, la mayoría de aproximadamente 300x200 píxeles (resolución media).
Caltech-101 se utiliza ampliamente para evaluar algoritmos de clasificación de imágenes y reconocimiento de objetos.

Link to this sectionEstructura del dataset#

Caltech-101 se distribuye en 102 carpetas (una por clase, que abarca 101 categorías de objetos más una clase BACKGROUND_Google) sin una división predefinida de entrenamiento/validación. Cuando inicias el entrenamiento, Ultralytics divide automáticamente las imágenes para que los modelos se entrenen en las 102 clases sin necesidad de configuración manual:

Clases: 102 (101 categorías de objetos + 1 de fondo)
Imágenes totales: 9.144
División entrenamiento/validación: automática 80% / 20% (≈7.280 para entrenamiento, ≈1.864 para validación)
Imágenes por clase: entre 40 y 800 (desequilibrado)

Link to this sectionAplicaciones#

Caltech-101 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes y reconocimiento de objetos, incluyendo Redes Neuronales Convolucionales (CNNs) y Máquinas de Vectores de Soporte (SVMs). Su amplia cobertura de categorías y sus imágenes limpias y etiquetadas lo convierten en un punto de referencia popular para la investigación y la creación de prototipos en aprendizaje automático y visión artificial.

Link to this sectionUso#

Entrena un modelo YOLO en Caltech-101 durante 100 épocas con un tamaño de imagen de 416. Para obtener la lista completa de argumentos disponibles, consulta la página de Entrenamiento y la guía de la tarea de clasificación de imágenes.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionMuestras de imágenes y anotaciones#

El conjunto de datos Caltech-101 contiene imágenes en color de alta calidad de varios objetos, proporcionando un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

Muestras del conjunto de datos de clasificación de imágenes Caltech-101

Las muestras muestran la variedad de categorías y el encuadre natural y centrado típico de Caltech-101, lo que lo convierte en un punto de partida limpio para entrenar modelos robustos de reconocimiento de objetos.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos Caltech-101 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Nos gustaría agradecer a Li Fei-Fei, Rob Fergus y Pietro Perona por crear y mantener el conjunto de datos Caltech-101 como un recurso valioso para la comunidad de investigación de aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos Caltech-101 y sus creadores, visita el sitio web del conjunto de datos Caltech-101.

Link to this sectionFAQ#

Link to this section¿Para qué se utiliza el conjunto de datos Caltech-101 en el aprendizaje automático?#

El conjunto de datos Caltech-101 se utiliza ampliamente para entrenar y evaluar modelos de clasificación de imágenes y reconocimiento de objetos. Contiene 9.144 imágenes repartidas en 101 categorías de objetos más una clase de fondo, lo que proporciona un punto de referencia desafiante para evaluar algoritmos como las Redes Neuronales Convolucionales (CNNs) y las Máquinas de Vectores de Soporte (SVMs).

Link to this section¿Cómo puedo entrenar un modelo YOLO de Ultralytics con el conjunto de datos Caltech-101?#

Para entrenar un modelo Ultralytics YOLO en Caltech-101, utiliza los fragmentos de código que aparecen a continuación. El conjunto de datos se descarga automáticamente la primera vez que se usa. Para obtener una lista completa de argumentos, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this section¿Cuántas clases tiene el conjunto de datos Caltech-101?#

Caltech-101 contiene 101 categorías de objetos más una clase BACKGROUND_Google, para un total de 102 carpetas de clase y 9.144 imágenes. Cuando entrenas con Ultralytics, el modelo aprende las 102 clases. Los tamaños de las categorías están desequilibrados, variando entre unas 40 y 800 imágenes cada una.

Link to this section¿Cómo se divide el conjunto de datos Caltech-101 en conjuntos de entrenamiento y validación?#

Caltech-101 no tiene una división predefinida. La primera vez que entrenas, Ultralytics lo divide automáticamente en 80% para entrenamiento y 20% para validación (unas 7.280 imágenes de entrenamiento y 1.864 de validación), por lo que no necesitas crear las divisiones manualmente. Para controlar la división tú mismo, organiza las imágenes en carpetas train/ y val/ antes de entrenar.

Link to this section¿Puedo utilizar la plataforma de Ultralytics para entrenar modelos con el conjunto de datos Caltech-101?#

Sí. Ultralytics Platform te permite gestionar conjuntos de datos, entrenar modelos de clasificación de imágenes y desplegarlos sin necesidad de programar mucho. Es una forma cómoda de realizar experimentos con Caltech-101 en la nube, y puedes explorar más opciones en nuestra descripción general de conjuntos de datos de clasificación.

Colaboradores

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

Creado 12 nov 2023Actualizado anteayer