Saltar al contenido

Conjunto de datos ImageNet10

El conjunto de datos ImageNet10 es un subconjunto a pequeña escala de la base de datos ImageNet, desarrollado por Ultralytics y está diseñado para pruebas de CI, comprobaciones de sanidad y pruebas rápidas de tuberías de entrenamiento. Este conjunto de datos está compuesto por la primera imagen del conjunto de entrenamiento y la primera imagen del conjunto de validación de las 10 primeras clases de ImageNet. Aunque es significativamente más pequeño, conserva la estructura y la diversidad del conjunto de datos ImageNet original.

Características principales

  • ImageNet10 es una versión compacta de ImageNet, con 20 imágenes que representan las 10 primeras clases del conjunto de datos original.
  • El conjunto de datos está organizado según la jerarquía WordNet, reflejando la estructura del conjunto de datos ImageNet completo.
  • Es ideal para pruebas CI, comprobaciones de sanidad y pruebas rápidas de canalizaciones de entrenamiento en tareas de visión por ordenador.
  • Aunque no está diseñado para la evaluación comparativa de modelos, puede proporcionar una indicación rápida de la funcionalidad básica y la corrección de un modelo.

Estructura del conjunto de datos

El conjunto de datos ImageNet10, al igual que el ImageNet original, se organiza utilizando la jerarquía WordNet. Cada una de las 10 clases de ImageNet10 se describe mediante un synset (una colección de términos sinónimos). Las imágenes de ImageNet10 están anotadas con uno o más synsets, lo que proporciona un recurso compacto para probar modelos de reconocimiento de diversos objetos y sus relaciones.

Aplicaciones

El conjunto de datos ImageNet10 es útil para probar y depurar rápidamente modelos y pipelines de visión por ordenador. Su pequeño tamaño permite una iteración rápida, por lo que es ideal para pruebas de integración continua y comprobaciones de cordura. También puede utilizarse para pruebas preliminares rápidas de nuevos modelos o cambios en modelos existentes antes de pasar a pruebas a gran escala con el conjunto de datos ImageNet completo.

Utilización

Para probar un modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página Entrenamiento del modelo.

Ejemplo de prueba

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Ejemplos de imágenes y anotaciones

El conjunto de datos ImageNet10 contiene un subconjunto de imágenes del conjunto de datos ImageNet original. Estas imágenes se eligen para representar las 10 primeras clases del conjunto de datos, proporcionando un conjunto de datos diverso pero compacto para pruebas y evaluaciones rápidas.

Imágenes de muestra del conjunto de datos El ejemplo muestra la variedad y complejidad de las imágenes del conjunto de datos ImageNet10, destacando su utilidad para realizar comprobaciones de sanidad y pruebas rápidas de modelos de visión por ordenador.

Citas y agradecimientos

Si utilizas el conjunto de datos ImageNet10 en tu trabajo de investigación o desarrollo, cita el documento original de ImageNet:

@article{ILSVRC15,
         author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
         title={ImageNet Large Scale Visual Recognition Challenge},
         year={2015},
         journal={International Journal of Computer Vision (IJCV)},
         volume={115},
         number={3},
         pages={211-252}
}

Queremos dar las gracias al equipo ImageNet, dirigido por Olga Russakovsky, Jia Deng y Li Fei-Fei, por crear y mantener el conjunto de datos ImageNet. El conjunto de datos ImageNet10, aunque es un subconjunto compacto, es un recurso valioso para realizar pruebas y depuraciones rápidas en la comunidad investigadora del aprendizaje automático y la visión por ordenador. Para más información sobre el conjunto de datos ImageNet y sus creadores, visita el sitio web de ImageNet.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos ImageNet10 y en qué se diferencia del conjunto de datos ImageNet completo?

El conjunto de datos ImageNet10 es un subconjunto compacto de la base de datos ImageNet original, creado por Ultralytics para pruebas rápidas de CI, comprobaciones de sanidad y evaluaciones de la canalización de entrenamiento. ImageNet10 consta sólo de 20 imágenes, que representan la primera imagen de los conjuntos de entrenamiento y validación de las 10 primeras clases de ImageNet. A pesar de su pequeño tamaño, mantiene la estructura y diversidad del conjunto de datos completo, por lo que es ideal para pruebas rápidas, pero no para modelos de evaluación comparativa.

¿Cómo puedo utilizar el conjunto de datos ImageNet10 para probar mi modelo de aprendizaje profundo?

Para probar tu modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, utiliza los siguientes fragmentos de código.

Ejemplo de prueba

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo train data=imagenet10 model=yolov8n-cls.pt epochs=5 imgsz=224

Consulta la página de Formación para obtener una lista completa de los argumentos disponibles.

¿Por qué debería utilizar el conjunto de datos ImageNet10 para pruebas de CI y comprobaciones de sanidad?

El conjunto de datos ImageNet10 está diseñado específicamente para pruebas de integración continua, comprobaciones de sanidad y evaluaciones rápidas en canalizaciones de aprendizaje profundo. Su pequeño tamaño permite iteraciones y pruebas rápidas, lo que lo hace perfecto para procesos de integración continua en los que la velocidad es crucial. Al mantener la complejidad estructural y la diversidad del conjunto de datos ImageNet original, ImageNet10 proporciona una indicación fiable de la funcionalidad básica y la corrección de un modelo sin la sobrecarga de procesar un gran conjunto de datos.

¿Cuáles son las principales características del conjunto de datos ImageNet10?

El conjunto de datos ImageNet10 tiene varias características clave:

  • Tamaño compacto: Con sólo 20 imágenes, permite realizar pruebas y depuraciones rápidamente.
  • Organización estructurada: Sigue la jerarquía de WordNet, similar al conjunto de datos completo de ImageNet.
  • CI y comprobaciones de sanidad: Ideal para pruebas de integración continua y comprobaciones de sanidad.
  • No sirve para la evaluación comparativa: Aunque es útil para evaluaciones rápidas de modelos, no está diseñado para una evaluación comparativa exhaustiva.

¿Dónde puedo descargar el conjunto de datos ImageNet10?

Puedes descargar el conjunto de datos ImageNet10 de la página de versiones de GitHub de Ultralytics . Para obtener información más detallada sobre su estructura y aplicaciones, consulta la página del conjunto de datos ImageNet10.



Creado 2023-11-12, Actualizado 2024-07-10
Autores: glenn-jocher (8)

Comentarios