Saltar al contenido

Conjunto de datos ImageNet10

El conjunto de datos ImageNet10 es un subconjunto a pequeña escala de la base de datos ImageNet, desarrollado por Ultralytics y está diseñado para pruebas de CI, comprobaciones de sanidad y pruebas rápidas de tuberías de entrenamiento. Este conjunto de datos está compuesto por la primera imagen del conjunto de entrenamiento y la primera imagen del conjunto de validación de las 10 primeras clases de ImageNet. Aunque es significativamente más pequeño, conserva la estructura y la diversidad del conjunto de datos ImageNet original.

Características principales

  • ImageNet10 es una versión compacta de ImageNet, con 20 imágenes que representan las 10 primeras clases del conjunto de datos original.
  • El conjunto de datos está organizado según la jerarquía WordNet, reflejando la estructura del conjunto de datos ImageNet completo.
  • Es ideal para pruebas CI, comprobaciones de sanidad y pruebas rápidas de canalizaciones de entrenamiento en tareas de visión por ordenador.
  • Aunque no está diseñado para la evaluación comparativa de modelos, puede proporcionar una indicación rápida de la funcionalidad básica y la corrección de un modelo.

Estructura del conjunto de datos

El conjunto de datos ImageNet10, al igual que el ImageNet original, se organiza utilizando la jerarquía WordNet. Cada una de las 10 clases de ImageNet10 se describe mediante un synset (una colección de términos sinónimos). Las imágenes de ImageNet10 están anotadas con uno o más synsets, lo que proporciona un recurso compacto para probar modelos de reconocimiento de diversos objetos y sus relaciones.

Aplicaciones

El conjunto de datos ImageNet10 es útil para probar y depurar rápidamente modelos y pipelines de visión por ordenador. Su pequeño tamaño permite una iteración rápida, por lo que es ideal para pruebas de integración continua y comprobaciones de cordura. También puede utilizarse para pruebas preliminares rápidas de nuevos modelos o cambios en modelos existentes antes de pasar a pruebas a gran escala con el conjunto de datos ImageNet completo.

Utilización

Para probar un modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de prueba

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagenet10', epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Ejemplos de imágenes y anotaciones

El conjunto de datos ImageNet10 contiene un subconjunto de imágenes del conjunto de datos ImageNet original. Estas imágenes se eligen para representar las 10 primeras clases del conjunto de datos, proporcionando un conjunto de datos diverso pero compacto para pruebas y evaluaciones rápidas.

Imágenes de muestra del conjunto de datos El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos ImageNet10, destacando su utilidad para realizar comprobaciones de sanidad y pruebas rápidas de modelos de visión por ordenador.

Citas y agradecimientos

Si utilizas el conjunto de datos ImageNet10 en tu trabajo de investigación o desarrollo, cita el documento original de ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Queremos dar las gracias al equipo ImageNet, dirigido por Olga Russakovsky, Jia Deng y Li Fei-Fei, por crear y mantener el conjunto de datos ImageNet. El conjunto de datos ImageNet10, aunque es un subconjunto compacto, es un recurso valioso para realizar pruebas y depuraciones rápidas en la comunidad investigadora del aprendizaje automático y la visión por ordenador. Para más información sobre el conjunto de datos ImageNet y sus creadores, visita el sitio web de ImageNet.



Creado 2023-11-12, Actualizado 2024-01-07
Autores: glenn-jocher (4)

Comentarios