Conjunto de datos ImageWoof

El conjunto de datos ImageWoof es un subconjunto de ImageNet compuesto por 10 clases difíciles de clasificar, ya que todas son razas de perros. Se creó como una tarea más difícil de resolver para los algoritmos de clasificación de imágenes, con el objetivo de fomentar el desarrollo de modelos más avanzados.

Características principales

ImageWoof contiene imágenes de 10 razas de perro diferentes: Australian terrier, Border terrier, Samoyedo, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever y Old English sheepdog.
El conjunto de datos proporciona imágenes a varias resoluciones (tamaño completo, 320px, 160px), adaptadas a diferentes capacidades informáticas y necesidades de investigación.
También incluye una versión con etiquetas ruidosas, que ofrece un escenario más realista en el que las etiquetas pueden no ser siempre fiables.

Estructura del conjunto de datos

La estructura del conjunto de datos ImageWoof se basa en las clases de razas caninas, y cada raza tiene su propio directorio de imágenes. Al igual que otros conjuntos de datos de clasificación, sigue un formato de directorios divididos con carpetas separadas para los conjuntos de entrenamiento y validación.

Aplicaciones

El conjunto de datos ImageWoof se utiliza ampliamente para entrenar y evaluar modelos de aprendizaje profundo en tareas de clasificación de imágenes, especialmente cuando se trata de clases más complejas y similares. El desafío del conjunto de datos radica en las sutiles diferencias entre las razas de perros, que empujan los límites del rendimiento y la generalización del modelo. Es particularmente valioso para:

Evaluación comparativa del rendimiento de los modelos de clasificación en categorías finas
Comprobación de la solidez del modelo frente a clases similares
Desarrollar algoritmos capaces de distinguir sutiles diferencias visuales
Evaluación de las capacidades de aprendizaje por transferencia de ámbitos generales a específicos

Utilización

Para entrenar un modelo CNN en el conjunto de datos ImageWoof durante 100 épocas con un tamaño de imagen de 224x224, puede utilizar los siguientes fragmentos de código. Para obtener una lista completa de los argumentos disponibles, consulte la página de entrenamiento del modelo.

Ejemplo de tren

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

# Start training from a pretrained *.pt model
yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Variantes del conjunto de datos

El conjunto de datos ImageWoof se presenta en tres tamaños diferentes para adaptarse a diversas necesidades de investigación y capacidades computacionales:

Tamaño completo (imagewoof): Esta es la versión original del conjunto de datos ImageWoof. Contiene imágenes a tamaño completo y es ideal para el entrenamiento final y la evaluación comparativa del rendimiento.
Tamaño medio (imagewoof320): Esta versión contiene imágenes redimensionadas para tener una longitud de borde máxima de 320 píxeles. Es adecuada para un entrenamiento más rápido sin sacrificar significativamente el rendimiento del modelo.
Tamaño pequeño (imagewoof160): Esta versión contiene imágenes redimensionadas para tener una longitud de borde máxima de 160 píxeles. Está diseñada para la creación rápida de prototipos y la experimentación, donde la velocidad de entrenamiento es una prioridad.

Para utilizar estas variantes en el entrenamiento, basta con sustituir "imagewoof" en el argumento del conjunto de datos por "imagewoof320" o "imagewoof160". Por ejemplo:

Ejemplo

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

# Load a pretrained model and train on the medium-sized dataset
yolo classify train model=yolo11n-cls.pt data=imagewoof320 epochs=100 imgsz=224

Es importante señalar que el uso de imágenes más pequeñas probablemente producirá un menor rendimiento en términos de precisión de la clasificación. Sin embargo, es una forma excelente de iterar rápidamente en las primeras fases de desarrollo y creación de prototipos de modelos.

Ejemplos de imágenes y anotaciones

El conjunto de datos ImageWoof contiene imágenes en color de varias razas de perros, lo que supone un reto para las tareas de clasificación de imágenes. Estos son algunos ejemplos de imágenes del conjunto de datos:

Imagen de muestra del conjunto de datos

El ejemplo muestra las sutiles diferencias y similitudes entre las distintas razas de perros del conjunto de datos ImageWoof, lo que pone de relieve la complejidad y dificultad de la tarea de clasificación.

Citas y agradecimientos

Si utiliza el conjunto de datos ImageWoof en su trabajo de investigación o desarrollo, asegúrese de reconocer a los creadores del conjunto de datos mediante un enlace al repositorio oficial del conjunto de datos.

Nos gustaría agradecer al equipo de FastAI la creación y el mantenimiento del conjunto de datos ImageWoof como un valioso recurso para la comunidad de investigación en aprendizaje automático y visión por ordenador. Para obtener más información sobre el conjunto de datos ImageWoof, visite el repositorio de conjuntos de datos ImageWoof.

PREGUNTAS FRECUENTES

¿Qué es el conjunto de datos ImageWoof en Ultralytics?

El conjunto de datos ImageWoof es un desafiante subconjunto de ImageNet centrado en 10 razas de perro concretas. Creado para superar los límites de los modelos de clasificación de imágenes, incluye razas como Beagle, Shih-Tzu y Golden Retriever. El conjunto de datos incluye imágenes a distintas resoluciones (tamaño completo, 320px, 160px) e incluso etiquetas con ruido para que los escenarios de entrenamiento sean más realistas. Esta complejidad hace que ImageWoof sea ideal para desarrollar modelos de aprendizaje profundo más avanzados.

¿Cómo puedo entrenar un modelo utilizando el conjunto de datos ImageWoof con Ultralytics YOLO ?

Para entrenar un modelo de red neuronal convolucional (CNN) en el conjunto de datos ImageWoof utilizando Ultralytics YOLO durante 100 épocas con un tamaño de imagen de 224x224, puede utilizar el siguiente código:

Ejemplo de tren

PythonCLI

from ultralytics import YOLO

model = YOLO("yolo11n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

yolo classify train data=imagewoof model=yolo11n-cls.pt epochs=100 imgsz=224

Para más detalles sobre los argumentos de formación disponibles, consulte la página Formación.

¿Qué versiones del conjunto de datos ImageWoof están disponibles?

El conjunto de datos ImageWoof está disponible en tres tamaños:

Tamaño completo (imagewoof): Ideal para la formación final y la evaluación comparativa, contiene imágenes a tamaño completo.
Tamaño medio (imagewoof320): Imágenes redimensionadas con una longitud de borde máxima de 320 píxeles, adecuadas para un entrenamiento más rápido.
Tamaño pequeño (imagewoof160): Imágenes redimensionadas con una longitud de borde máxima de 160 píxeles, perfectas para la creación rápida de prototipos.

Utilice estas versiones sustituyendo "imagewoof" en el argumento del conjunto de datos. Tenga en cuenta, sin embargo, que las imágenes más pequeñas pueden dar lugar a una menor precisión de clasificación, pero pueden ser útiles para iteraciones más rápidas.

¿Cómo benefician al entrenamiento las etiquetas ruidosas del conjunto de datos ImageWoof?

Las etiquetas ruidosas del conjunto de datos ImageWoof simulan condiciones reales en las que las etiquetas no siempre son precisas. Entrenar modelos con estos datos ayuda a desarrollar la robustez y la generalización en tareas de clasificación de imágenes. Esto prepara a los modelos para manejar con eficacia datos ambiguos o mal etiquetados, que suelen encontrarse en aplicaciones prácticas.

¿Cuáles son los principales retos que plantea el uso del conjunto de datos ImageWoof?

El principal reto del conjunto de datos ImageWoof radica en las sutiles diferencias entre las razas caninas que incluye. Dado que se centra en 10 razas estrechamente relacionadas, distinguir entre ellas requiere modelos de clasificación de imágenes más avanzados y afinados. Esto convierte a ImageWoof en una referencia excelente para poner a prueba las capacidades y mejoras de los modelos de aprendizaje profundo.

Creado hace 1 año ✏️ Actualizado hace 11 días