Meet YOLO26: next-gen vision AI.

Link to this sectionConjunto de datos Caltech-101#

El conjunto de datos Caltech-101 es un conjunto de datos muy utilizado para tareas de reconocimiento de objetos que contiene alrededor de 9,000 imágenes de 101 categorías de objetos. Las categorías se eligieron para reflejar una variedad de objetos del mundo real, y las imágenes se seleccionaron y anotaron cuidadosamente para proporcionar un punto de referencia desafiante para los algoritmos de reconocimiento de objetos.



Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform
División automática de datos

El conjunto de datos Caltech-101, tal como se proporciona, no viene con divisiones de entrenamiento/validación predefinidas. Sin embargo, al utilizar los comandos de entrenamiento que se proporcionan en los ejemplos de uso a continuación, el framework de Ultralytics dividirá automáticamente el conjunto de datos por ti. La división predeterminada utilizada es del 80% para el conjunto de entrenamiento y del 20% para el conjunto de validación.

Link to this sectionCaracterísticas clave#

  • El conjunto de datos Caltech-101 comprende alrededor de 9,000 imágenes en color divididas en 101 categorías.
  • Las categorías abarcan una amplia variedad de objetos, incluyendo animales, vehículos, artículos para el hogar y personas.
  • El número de imágenes por categoría varía, con entre unas 40 y 800 imágenes en cada una.
  • Las imágenes tienen tamaños variables, siendo la mayoría de resolución media.
  • Caltech-101 se utiliza ampliamente para el entrenamiento y las pruebas en el campo del aprendizaje automático, especialmente para tareas de reconocimiento de objetos.

Link to this sectionEstructura del dataset#

A diferencia de muchos otros conjuntos de datos, el conjunto de datos Caltech-101 no está dividido formalmente en conjuntos de entrenamiento y prueba. Los usuarios suelen crear sus propias divisiones según sus necesidades específicas. Sin embargo, una práctica común es utilizar un subconjunto aleatorio de imágenes para el entrenamiento (por ejemplo, 30 imágenes por categoría) y las imágenes restantes para las pruebas.

Link to this sectionAplicaciones#

El conjunto de datos Caltech-101 se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de reconocimiento de objetos, como Redes Neuronales Convolucionales (CNNs), Máquinas de Vectores de Soporte (SVMs) y otros algoritmos de aprendizaje automático. Su gran variedad de categorías y sus imágenes de alta calidad lo convierten en un excelente conjunto de datos para la investigación y el desarrollo en el campo del aprendizaje automático y la visión artificial.

Link to this sectionUso#

Para entrenar un modelo YOLO en el conjunto de datos Caltech-101 durante 100 épocas, puedes usar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionMuestras de imágenes y anotaciones#

El conjunto de datos Caltech-101 contiene imágenes en color de alta calidad de varios objetos, proporcionando un conjunto de datos bien estructurado para tareas de clasificación de imágenes. Aquí tienes algunos ejemplos de imágenes del conjunto de datos:

Muestras del conjunto de datos de clasificación de imágenes Caltech-101

El ejemplo muestra la variedad y complejidad de los objetos en el conjunto de datos Caltech-101, destacando la importancia de contar con un conjunto de datos diverso para entrenar modelos de reconocimiento de objetos robustos.

Link to this sectionCitas y agradecimientos#

Si utilizas el conjunto de datos Caltech-101 en tu trabajo de investigación o desarrollo, por favor cita el siguiente artículo:

Cita
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Nos gustaría agradecer a Li Fei-Fei, Rob Fergus y Pietro Perona por crear y mantener el conjunto de datos Caltech-101 como un recurso valioso para la comunidad de investigación de aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos Caltech-101 y sus creadores, visita el sitio web del conjunto de datos Caltech-101.

Link to this sectionFAQ#

Link to this section¿Para qué se utiliza el conjunto de datos Caltech-101 en el aprendizaje automático?#

El conjunto de datos Caltech-101 es ampliamente utilizado en aprendizaje automático para tareas de reconocimiento de objetos. Contiene alrededor de 9,000 imágenes en 101 categorías, proporcionando un punto de referencia desafiante para evaluar algoritmos de reconocimiento de objetos. Los investigadores lo aprovechan para entrenar y probar modelos, especialmente Redes Neuronales Convolucionales (CNNs) y Máquinas de Vectores de Soporte (SVMs), en visión artificial.

Link to this section¿Cómo puedo entrenar un modelo YOLO de Ultralytics con el conjunto de datos Caltech-101?#

Para entrenar un modelo YOLO de Ultralytics con el conjunto de datos Caltech-101, puedes utilizar los fragmentos de código proporcionados. Por ejemplo, para entrenar durante 100 épocas:

Ejemplo de entrenamiento
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Para obtener argumentos y opciones más detallados, consulta la página de Entrenamiento del modelo.

Link to this section¿Cuáles son las características clave del conjunto de datos Caltech-101?#

El conjunto de datos Caltech-101 incluye:

  • Alrededor de 9,000 imágenes en color en 101 categorías.
  • Categorías que abarcan una gama diversa de objetos, incluyendo animales, vehículos y artículos para el hogar.
  • Número variable de imágenes por categoría, típicamente entre 40 y 800.
  • Tamaños de imagen variables, siendo la mayoría de resolución media.

Estas características lo convierten en una excelente elección para entrenar y evaluar modelos de reconocimiento de objetos en aprendizaje automático y visión artificial.

Link to this section¿Por qué debería citar el conjunto de datos Caltech-101 en mi investigación?#

Citar el conjunto de datos Caltech-101 en tu investigación reconoce las contribuciones de sus creadores y proporciona una referencia para otros que puedan utilizar el conjunto de datos. La cita recomendada es:

Cita
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citar ayuda a mantener la integridad del trabajo académico y ayuda a otros colegas a localizar el recurso original.

Link to this section¿Puedo utilizar la plataforma de Ultralytics para entrenar modelos con el conjunto de datos Caltech-101?#

Sí, puedes utilizar Ultralytics Platform para entrenar modelos con el conjunto de datos Caltech-101. Ultralytics Platform proporciona una plataforma intuitiva para gestionar conjuntos de datos, entrenar modelos e implementarlos sin necesidad de programar demasiado. Para obtener una guía detallada, consulta la entrada del blog sobre cómo entrenar tus modelos personalizados con Ultralytics Platform.

Comentarios