Ir al contenido

Conjunto de datos ImageNet10

El conjunto de datos ImageNet10 es un subconjunto a pequeña escala de la base de datos ImageNet, desarrollado por Ultralytics y está diseñado para realizar pruebas de CI, comprobaciones de sanidad y pruebas rápidas de las canalizaciones de formación. Este conjunto de datos está compuesto por la primera imagen del conjunto de entrenamiento y la primera imagen del conjunto de validación de las 10 primeras clases de ImageNet. Aunque es significativamente más pequeño, conserva la estructura y la diversidad del conjunto de datos ImageNet original.

Características principales

  • ImageNet10 es una versión compacta de ImageNet, con 20 imágenes que representan las 10 primeras clases del conjunto de datos original.
  • El conjunto de datos está organizado según la jerarquía de WordNet, reflejando la estructura del conjunto de datos ImageNet completo.
  • Es ideal para pruebas CI, comprobaciones de sanidad y pruebas rápidas de canalizaciones de formación en tareas de visión por ordenador.
  • Aunque no está diseñado para la evaluación comparativa de modelos, puede proporcionar una indicación rápida de la funcionalidad básica y la corrección de un modelo.

Estructura del conjunto de datos

El conjunto de datos ImageNet10, al igual que el ImageNet original, se organiza utilizando la jerarquía WordNet. Cada una de las 10 clases de ImageNet10 se describe mediante un synset (una colección de términos sinónimos). Las imágenes de ImageNet10 están anotadas con uno o más synsets, lo que proporciona un recurso compacto para probar modelos de reconocimiento de diversos objetos y sus relaciones.

Aplicaciones

El conjunto de datos ImageNet10 es útil para probar y depurar rápidamente modelos y procesos de visión por ordenador. Su pequeño tamaño permite una iteración rápida, por lo que es ideal para pruebas de integración continua y comprobaciones de cordura. También puede utilizarse para pruebas preliminares rápidas de nuevos modelos o cambios en modelos existentes antes de pasar a pruebas a gran escala con el conjunto de datos ImageNet completo.

Utilización

Para probar un modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de prueba

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Ejemplos de imágenes y anotaciones

El conjunto de datos ImageNet10 contiene un subconjunto de imágenes del conjunto de datos ImageNet original. Estas imágenes se eligen para representar las 10 primeras clases del conjunto de datos, lo que proporciona un conjunto de datos diverso pero compacto para pruebas y evaluaciones rápidas.

Imágenes de muestra del conjunto de datos El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos ImageNet10, lo que pone de relieve su utilidad para realizar comprobaciones de sanidad y pruebas rápidas de modelos de visión por ordenador.

Citas y agradecimientos

Si utiliza el conjunto de datos ImageNet10 en su trabajo de investigación o desarrollo, cite el documento original de ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Queremos agradecer al equipo de ImageNet, dirigido por Olga Russakovsky, Jia Deng y Li Fei-Fei, la creación y el mantenimiento del conjunto de datos ImageNet. El conjunto de datos ImageNet10, aunque es un subconjunto compacto, es un recurso valioso para realizar pruebas y depuraciones rápidas en la comunidad de investigación del aprendizaje automático y la visión por ordenador. Para más información sobre el conjunto de datos ImageNet y sus creadores, visite el sitio web de ImageNet.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos ImageNet10 y en qué se diferencia del conjunto de datos ImageNet completo?

El conjunto de datos ImageNet10 es un subconjunto compacto de la base de datos ImageNet original, creado por Ultralytics para pruebas rápidas de CI, comprobaciones de sanidad y evaluaciones de canal de formación. ImageNet10 consta de sólo 20 imágenes, que representan la primera imagen de los conjuntos de entrenamiento y validación de las 10 primeras clases de ImageNet. A pesar de su pequeño tamaño, mantiene la estructura y diversidad del conjunto de datos completo, lo que lo hace ideal para pruebas rápidas pero no para modelos de evaluación comparativa.

¿Cómo puedo utilizar el conjunto de datos ImageNet10 para probar mi modelo de aprendizaje profundo?

Para probar su modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, utilice los siguientes fragmentos de código.

Ejemplo de prueba

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224

Consulte la página de Formación para obtener una lista completa de los argumentos disponibles.

¿Por qué debería utilizar el conjunto de datos ImageNet10 para pruebas de CI y comprobaciones de sanidad?

El conjunto de datos ImageNet10 está diseñado específicamente para pruebas de integración continua, comprobaciones de sanidad y evaluaciones rápidas en canalizaciones de aprendizaje profundo. Su pequeño tamaño permite iteraciones y pruebas rápidas, lo que lo hace perfecto para procesos de integración continua en los que la velocidad es crucial. Al mantener la complejidad estructural y la diversidad del conjunto de datos ImageNet original, ImageNet10 proporciona una indicación fiable de la funcionalidad básica y la corrección de un modelo sin la sobrecarga de procesar un gran conjunto de datos.

¿Cuáles son las principales características del conjunto de datos ImageNet10?

El conjunto de datos ImageNet10 tiene varias características clave:

  • Tamaño compacto: Con sólo 20 imágenes, permite realizar pruebas y depuraciones con rapidez.
  • Organización estructurada: Sigue la jerarquía de WordNet, similar al conjunto de datos completo de ImageNet.
  • CI y Sanity Checks: Ideal para pruebas de integración continua y comprobaciones de sanidad.
  • No es una herramienta de evaluación comparativa: Aunque es útil para evaluaciones rápidas de modelos, no está diseñado para una evaluación comparativa exhaustiva.

¿Dónde puedo descargar el conjunto de datos ImageNet10?

Puede descargar el conjunto de datos ImageNet10 desde la página de versiones de GitHub deUltralytics . Para obtener información más detallada sobre su estructura y aplicaciones, consulte la página del conjunto de datos ImageNet10.

Creado hace 1 año ✏️ Actualizado hace 3 meses

Comentarios