Conjunto de datos ImageNet10
El conjunto de datos ImageNet10 es un subconjunto a pequeña escala de la base de datos ImageNet, desarrollado por Ultralytics y diseñado para pruebas de CI, comprobaciones de cordura y pruebas rápidas de canalizaciones de entrenamiento. Este conjunto de datos se compone de la primera imagen en el conjunto de entrenamiento y la primera imagen del conjunto de validación de las primeras 10 clases en ImageNet. Aunque significativamente más pequeño, conserva la estructura y diversidad del conjunto de datos ImageNet original.
Características clave
- ImageNet10 es una versión compacta de ImageNet, con 20 imágenes que representan las 10 primeras clases del conjunto de datos original.
- El conjunto de datos está organizado según la jerarquía de WordNet, reflejando la estructura del conjunto de datos ImageNet completo.
- Es ideal para pruebas de integración continua (CI), comprobaciones de validez y pruebas rápidas de flujos de trabajo de entrenamiento en tareas de visión artificial.
- Aunque no está diseñado para la evaluación comparativa de modelos, puede proporcionar una indicación rápida de la funcionalidad básica y la corrección de un modelo.
Estructura del conjunto de datos
El conjunto de datos ImageNet10, al igual que el ImageNet original, está organizado utilizando la jerarquía WordNet. Cada una de las 10 clases en ImageNet10 se describe mediante un synset (una colección de términos sinónimos). Las imágenes en ImageNet10 están anotadas con uno o más synsets, lo que proporciona un recurso compacto para probar modelos para reconocer varios objetos y sus relaciones.
Aplicaciones
El conjunto de datos ImageNet10 es útil para probar y depurar rápidamente modelos y pipelines de visión artificial. Su pequeño tamaño permite una iteración rápida, lo que lo hace ideal para pruebas de integración continua y comprobaciones de integridad. También se puede utilizar para pruebas preliminares rápidas de nuevos modelos o cambios en los modelos existentes antes de pasar a pruebas a gran escala con el conjunto de datos ImageNet completo.
Uso
Para probar un modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, puedes utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulta la página de Entrenamiento del modelo.
Ejemplo de prueba
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
sample_images y anotaciones
El conjunto de datos ImageNet10 contiene un subconjunto de imágenes del conjunto de datos ImageNet original. Estas imágenes se eligen para representar las 10 primeras clases del conjunto de datos, lo que proporciona un conjunto de datos diverso pero compacto para pruebas y evaluaciones rápidas.
El ejemplo muestra la variedad y complejidad de las imágenes en el conjunto de datos ImageNet10, destacando su utilidad para comprobaciones de integridad y pruebas rápidas de modelos de visión artificial.
Citas y agradecimientos
Si utiliza el conjunto de datos ImageNet10 en su trabajo de investigación o desarrollo, cite el artículo original de ImageNet:
@article{ILSVRC15,
author = {Olga Russakovsky and Jia Deng and Hao Su and Jonathan Krause and Sanjeev Satheesh and Sean Ma and Zhiheng Huang and Andrej Karpathy and Aditya Khosla and Michael Bernstein and Alexander C. Berg and Li Fei-Fei},
title={ImageNet Large Scale Visual Recognition Challenge},
year={2015},
journal={International Journal of Computer Vision (IJCV)},
volume={115},
number={3},
pages={211-252}
}
Nos gustaría reconocer al equipo de ImageNet, liderado por Olga Russakovsky, Jia Deng y Li Fei-Fei, por crear y mantener el conjunto de datos ImageNet. El conjunto de datos ImageNet10, aunque es un subconjunto compacto, es un recurso valioso para pruebas rápidas y depuración en la comunidad de investigación de aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos ImageNet y sus creadores, visite el sitio web de ImageNet.
Preguntas frecuentes
¿Qué es el conjunto de datos ImageNet10 y en qué se diferencia del conjunto de datos ImageNet completo?
El conjunto de datos ImageNet10 es un subconjunto compacto de la base de datos original ImageNet, creado por Ultralytics para pruebas rápidas de CI, comprobaciones de cordura y evaluaciones de canalizaciones de entrenamiento. ImageNet10 comprende solo 20 imágenes, que representan la primera imagen en los conjuntos de entrenamiento y validación de las primeras 10 clases en ImageNet. A pesar de su pequeño tamaño, mantiene la estructura y diversidad del conjunto de datos completo, lo que lo hace ideal para pruebas rápidas, pero no para evaluar modelos.
¿Cómo puedo utilizar el conjunto de datos ImageNet10 para probar mi modelo de aprendizaje profundo?
Para probar tu modelo de aprendizaje profundo en el conjunto de datos ImageNet10 con un tamaño de imagen de 224x224, utiliza los siguientes fragmentos de código.
Ejemplo de prueba
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagenet10", epochs=5, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagenet10 model=yolo11n-cls.pt epochs=5 imgsz=224
Consulte la página de Entrenamiento para obtener una lista completa de los argumentos disponibles.
¿Por qué debería usar el conjunto de datos ImageNet10 para pruebas de integración continua y comprobaciones de integridad?
El conjunto de datos ImageNet10 está diseñado específicamente para pruebas de CI, comprobaciones de integridad y evaluaciones rápidas en canalizaciones de aprendizaje profundo. Su pequeño tamaño permite una iteración y pruebas rápidas, lo que lo hace perfecto para procesos de integración continua donde la velocidad es crucial. Al mantener la complejidad estructural y la diversidad del conjunto de datos ImageNet original, ImageNet10 proporciona una indicación fiable de la funcionalidad básica y la corrección de un modelo sin la sobrecarga de procesar un conjunto de datos grande.
¿Cuáles son las principales características del conjunto de datos ImageNet10?
El conjunto de datos ImageNet10 tiene varias características clave:
- Tamaño compacto: Con solo 20 imágenes, permite pruebas y depuraciones rápidas.
- Organización estructurada: Sigue la jerarquía de WordNet, similar al conjunto de datos completo de ImageNet.
- CI y pruebas de validez: Ideal para pruebas de integración continua y pruebas de validez.
- No para la evaluación comparativa: Si bien es útil para evaluaciones rápidas de modelos, no está diseñado para una evaluación comparativa exhaustiva.
¿Cómo se compara ImageNet10 con otros conjuntos de datos pequeños como ImageNette?
Si bien tanto ImageNet10 como ImageNette son subconjuntos de ImageNet, tienen diferentes propósitos. ImageNet10 contiene solo 20 imágenes (2 por clase) de las primeras 10 clases de ImageNet, lo que lo hace extremadamente ligero para las pruebas de CI y las comprobaciones rápidas de integridad. Por el contrario, ImageNette contiene miles de imágenes en 10 clases fácilmente distinguibles, lo que lo hace más adecuado para el entrenamiento y desarrollo real del modelo. ImageNet10 está diseñado para la verificación de la funcionalidad de la canalización, mientras que ImageNette es mejor para experimentos de entrenamiento significativos pero más rápidos que ImageNet completo.