Saltar al contenido

Conjunto de datos Caltech-256

El conjunto de datos Caltech-256 es una amplia colección de imágenes utilizadas para tareas de clasificación de objetos. Contiene unas 30.000 imágenes divididas en 257 categorías (256 categorías de objetos y 1 categoría de fondo). Las imágenes están cuidadosamente seleccionadas y anotadas para proporcionar un punto de referencia desafiante y diverso para los algoritmos de reconocimiento de objetos.



Observa: How to Train Clasificación de imágenes Model using Caltech-256 Dataset with Ultralytics HUB

Características principales

  • El conjunto de datos Caltech-256 comprende unas 30.000 imágenes en color divididas en 257 categorías.
  • Cada categoría contiene un mínimo de 80 imágenes.
  • Las categorías abarcan una amplia variedad de objetos del mundo real, como animales, vehículos, artículos domésticos y personas.
  • Las imágenes son de tamaño y resolución variables.
  • Caltech-256 se utiliza ampliamente para entrenamiento y pruebas en el campo del aprendizaje automático, en particular para tareas de reconocimiento de objetos.

Estructura del conjunto de datos

Al igual que Caltech-101, el conjunto de datos Caltech-256 no tiene una división formal entre conjuntos de entrenamiento y de prueba. Los usuarios suelen crear sus propias divisiones según sus necesidades específicas. Una práctica habitual es utilizar un subconjunto aleatorio de imágenes para el entrenamiento y el resto de imágenes para las pruebas.

Aplicaciones

The Caltech-256 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its diverse set of categories and high-quality images make it an invaluable dataset for research and development in the field of machine learning and computer vision.

Utilización

Para entrenar un modelo YOLO en el conjunto de datos Caltech-256 durante 100 épocas, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

Ejemplos de imágenes y anotaciones

El conjunto de datos Caltech-256 contiene imágenes en color de alta calidad de diversos objetos, lo que proporciona un amplio conjunto de datos para tareas de reconocimiento de objetos. He aquí algunos ejemplos de imágenes del conjunto de datos(crédito):

Imagen de muestra del conjunto de datos

El ejemplo muestra la diversidad y complejidad de los objetos del conjunto de datos Caltech-256, lo que subraya la importancia de un conjunto de datos variado para entrenar modelos robustos de reconocimiento de objetos.

Citas y agradecimientos

Si utilizas el conjunto de datos Caltech-256 en tu trabajo de investigación o desarrollo, cita el siguiente documento:

@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

We would like to acknowledge Gregory Griffin, Alex Holub, and Pietro Perona for creating and maintaining the Caltech-256 dataset as a valuable resource for the machine learning and computer vision research community. For more information about the

conjunto de datos Caltech-256 y sus creadores, visita el sitio web del conjunto de datos Caltech-256.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos Caltech-256 y por qué es importante para el aprendizaje automático?

El conjunto de datos Caltech-256 es un gran conjunto de datos de imágenes utilizado principalmente para tareas de clasificación de objetos en aprendizaje automático y visión por ordenador. Consta de unas 30.000 imágenes en color divididas en 257 categorías, que abarcan una amplia gama de objetos del mundo real. Las imágenes diversas y de alta calidad del conjunto de datos lo convierten en un punto de referencia excelente para evaluar algoritmos de reconocimiento de objetos, lo que es crucial para desarrollar modelos sólidos de aprendizaje automático.

¿Cómo puedo entrenar un modelo YOLO en el conjunto de datos Caltech-256 utilizando Python o CLI?

To train a YOLO model on the Caltech-256 dataset for 100 epochs, you can use the following code snippets. Refer to the model Training page for additional options.

Ejemplo de tren

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech256 model=yolo11n-cls.pt epochs=100 imgsz=416

¿Cuáles son los casos de uso más comunes del conjunto de datos Caltech-256?

El conjunto de datos Caltech-256 se utiliza ampliamente para diversas tareas de reconocimiento de objetos, como:

Su diversidad y sus completas anotaciones lo hacen ideal para la investigación y el desarrollo en aprendizaje automático y visión por ordenador.

¿Cómo está estructurado y dividido el conjunto de datos Caltech-256 para el entrenamiento y la prueba?

El conjunto de datos Caltech-256 no viene con una división predefinida para entrenamiento y prueba. Los usuarios suelen crear sus propias divisiones según sus necesidades específicas. Un enfoque habitual es seleccionar aleatoriamente un subconjunto de imágenes para el entrenamiento y utilizar el resto de imágenes para las pruebas. Esta flexibilidad permite a los usuarios adaptar el conjunto de datos a los requisitos específicos de sus proyectos y configuraciones experimentales.

¿Por qué debería utilizar Ultralytics YOLO para entrenar modelos en el conjunto de datos Caltech-256?

Ultralytics YOLO ofrecen varias ventajas para el entrenamiento en el conjunto de datos Caltech-256:

  • Alta precisión: los modelos YOLO son conocidos por su rendimiento puntero en tareas de detección de objetos.
  • Velocidad: Proporcionan capacidades de inferencia en tiempo real, lo que las hace adecuadas para aplicaciones que requieren predicciones rápidas.
  • Facilidad de uso: Con Ultralytics HUB, los usuarios pueden entrenar, validar y desplegar modelos sin necesidad de una codificación exhaustiva.
  • Modelos preentrenados: Partiendo de modelos preentrenados, como yolo11n-cls.pt, can significantly reduce training time and improve model accuracy.

Para más detalles, explora nuestra completa guía de formación.


📅 Created 11 months ago ✏️ Updated 11 days ago

Comentarios