Conjunto de datos ImageWoof
El conjunto de datos ImageWoof es un subconjunto de ImageNet que consta de 10 clases que son difíciles de clasificar, ya que todas son razas de perros. Se creó como una tarea más difícil de resolver para los algoritmos de clasificación de imágenes, con el objetivo de fomentar el desarrollo de modelos más avanzados.
Características clave
- ImageWoof contiene imágenes de 10 razas de perros diferentes: Terrier australiano, Border terrier, Samoyedo, Beagle, Shih-Tzu, Foxhound English, Rhodesian ridgeback, Dingo, Golden retriever y Antiguo perro pastor English.
- El conjunto de datos proporciona imágenes a varias resoluciones (tamaño completo, 320px, 160px), adaptándose a diferentes capacidades computacionales y necesidades de investigación.
- También incluye una versión con etiquetas ruidosas, proporcionando un escenario más realista donde las etiquetas no siempre son fiables.
Estructura del conjunto de datos
La estructura del conjunto de datos ImageWoof se basa en las clases de razas de perros, y cada raza tiene su propio directorio de imágenes. Al igual que otros conjuntos de datos de clasificación, sigue un formato de directorio dividido con carpetas separadas para los conjuntos de entrenamiento y validación.
Aplicaciones
El conjunto de datos ImageWoof se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, especialmente cuando se trata de clases más complejas y similares. El desafío del conjunto de datos radica en las sutiles diferencias entre las razas de perros, lo que lleva al límite el rendimiento y la generalización del modelo. Es particularmente valioso para:
- Evaluación comparativa del rendimiento del modelo de clasificación en categorías de grano fino
- Prueba de la robustez del modelo frente a clases de aspecto similar
- Desarrollo de algoritmos que puedan distinguir sutiles diferencias visuales
- Evaluación de las capacidades de aprendizaje por transferencia desde dominios generales a específicos
Uso
Para entrenar un modelo CNN en el conjunto de datos ImageWoof durante 100 épocas con un tamaño de imagen de 224x224, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de Entrenamiento del modelo.
Ejemplo de entrenamiento
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224
Variantes del conjunto de datos
El conjunto de datos ImageWoof viene en tres tamaños diferentes para adaptarse a diversas necesidades de investigación y capacidades computacionales:
-
Tamaño completo (imagewoof): Esta es la versión original del conjunto de datos ImageWoof. Contiene imágenes de tamaño completo y es ideal para el entrenamiento final y la evaluación comparativa del rendimiento.
-
Tamaño Mediano (imagewoof320): Esta versión contiene imágenes redimensionadas para tener una longitud máxima de borde de 320 píxeles. Es adecuada para un entrenamiento más rápido sin sacrificar significativamente el rendimiento del modelo.
-
Tamaño pequeño (imagewoof160): Esta versión contiene imágenes redimensionadas para tener una longitud máxima de borde de 160 píxeles. Está diseñada para la creación rápida de prototipos y la experimentación donde la velocidad de entrenamiento es una prioridad.
Para usar estas variantes en su entrenamiento, simplemente reemplace 'imagewoof' en el argumento del conjunto de datos con 'imagewoof320' o 'imagewoof160'. Por ejemplo:
Ejemplo
from ultralytics import YOLO
# Load a model
model = YOLO("yolo11n-cls.pt") # load a pretrained model (recommended for training)
# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)
# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)
# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224
Es importante tener en cuenta que el uso de imágenes más pequeñas probablemente producirá un rendimiento inferior en términos de precisión de la clasificación. Sin embargo, es una excelente manera de iterar rápidamente en las primeras etapas del desarrollo y la creación de prototipos del modelo.
sample_images y anotaciones
El conjunto de datos ImageWoof contiene imágenes coloridas de varias razas de perros, lo que proporciona un conjunto de datos desafiante para las tareas de clasificación de imágenes. Aquí hay algunos ejemplos de imágenes del conjunto de datos:
El ejemplo muestra las sutiles diferencias y similitudes entre las diferentes razas de perros en el conjunto de datos ImageWoof, lo que destaca la complejidad y la dificultad de la tarea de clasificación.
Citas y agradecimientos
Si utiliza el conjunto de datos ImageWoof en su trabajo de investigación o desarrollo, asegúrese de reconocer a los creadores del conjunto de datos enlazando al repositorio oficial del conjunto de datos.
Nos gustaría agradecer al equipo de FastAI la creación y el mantenimiento del conjunto de datos ImageWoof como un valioso recurso para la comunidad de investigación en aprendizaje automático y visión artificial. Para obtener más información sobre el conjunto de datos ImageWoof, visite el repositorio del conjunto de datos ImageWoof.
Preguntas frecuentes
¿Qué es el conjunto de datos ImageWoof en Ultralytics?
El conjunto de datos ImageWoof es un subconjunto desafiante de ImageNet que se centra en 10 razas de perros específicas. Creado para superar los límites de los modelos de clasificación de imágenes, presenta razas como Beagle, Shih-Tzu y Golden Retriever. El conjunto de datos incluye imágenes en varias resoluciones (tamaño completo, 320px, 160px) e incluso etiquetas ruidosas para escenarios de entrenamiento más realistas. Esta complejidad hace que ImageWoof sea ideal para desarrollar modelos de aprendizaje profundo más avanzados.
¿Cómo puedo entrenar un modelo usando el conjunto de datos ImageWoof con Ultralytics YOLO?
Para entrenar un modelo de Red Neuronal Convolucional (CNN) en el conjunto de datos ImageWoof utilizando Ultralytics YOLO durante 100 épocas con un tamaño de imagen de 224x224, puedes utilizar el siguiente código:
Ejemplo de entrenamiento
from ultralytics import YOLO
model = YOLO("yolo11n-cls.pt") # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224
Para obtener más detalles sobre los argumentos de entrenamiento disponibles, consulta la página de Entrenamiento.
¿Qué versiones del conjunto de datos ImageWoof están disponibles?
El conjunto de datos ImageWoof está disponible en tres tamaños:
- Tamaño completo (imagewoof): Ideal para el entrenamiento final y la evaluación comparativa, ya que contiene imágenes de tamaño completo.
- Tamaño Mediano (imagewoof320): Imágenes redimensionadas con una longitud máxima de borde de 320 píxeles, adecuadas para un entrenamiento más rápido.
- Tamaño pequeño (imagewoof160): Imágenes redimensionadas con una longitud máxima de borde de 160 píxeles, perfectas para la creación rápida de prototipos.
Utiliza estas versiones sustituyendo 'imagewoof' en el argumento del conjunto de datos según corresponda. Sin embargo, ten en cuenta que las imágenes más pequeñas pueden producir una menor precisión de clasificación, pero pueden ser útiles para iteraciones más rápidas.
¿Cómo benefician las etiquetas ruidosas en el conjunto de datos ImageWoof al entrenamiento?
Las etiquetas ruidosas en el conjunto de datos ImageWoof simulan condiciones del mundo real donde las etiquetas no siempre son precisas. Entrenar modelos con estos datos ayuda a desarrollar robustez y generalización en las tareas de clasificación de imágenes. Esto prepara a los modelos para manejar datos ambiguos o mal etiquetados de manera efectiva, lo que a menudo se encuentra en aplicaciones prácticas.
¿Cuáles son los principales desafíos al usar el conjunto de datos ImageWoof?
El principal desafío del conjunto de datos ImageWoof radica en las sutiles diferencias entre las razas de perros que incluye. Dado que se centra en 10 razas estrechamente relacionadas, distinguirlas requiere modelos de clasificación de imágenes más avanzados y ajustados. Esto convierte a ImageWoof en un excelente punto de referencia para probar las capacidades y mejoras de los modelos de aprendizaje profundo.