Salta para o conte√ļdo

Conjunto de dados ImageWoof

O conjunto de dados ImageWoof é um subconjunto do ImageNet constituído por 10 classes que são difíceis de classificar, uma vez que são todas raças de cães. Foi criado como uma tarefa mais difícil para os algoritmos de classificação de imagens resolverem, com o objetivo de incentivar o desenvolvimento de modelos mais avançados.

Características principais

  • ImageWoof cont√©m imagens de 10 ra√ßas de c√£es diferentes: Terrier australiano, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
  • O conjunto de dados fornece imagens com v√°rias resolu√ß√Ķes (tamanho real, 320 px, 160 px), adaptando-se a diferentes capacidades computacionais e necessidades de investiga√ß√£o.
  • Inclui tamb√©m uma vers√£o com etiquetas com ru√≠do, proporcionando um cen√°rio mais realista em que as etiquetas podem nem sempre ser fi√°veis.

Estrutura do conjunto de dados

A estrutura do conjunto de dados ImageWoof baseia-se nas classes de raças de cães, tendo cada raça o seu próprio diretório de imagens.

Aplica√ß√Ķes

O conjunto de dados ImageWoof é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de classificação de imagens, especialmente quando se trata de classes mais complexas e semelhantes. O desafio do conjunto de dados reside nas diferenças subtis entre as raças de cães, o que leva aos limites do desempenho e generalização do modelo.

Utilização

Para treinar um modelo CNN no conjunto de dados ImageWoof para 100 épocas com um tamanho de imagem de 224x224, podes utilizar os seguintes snippets de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treino do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='imagewoof', epochs=100, imgsz=224)
# Start training from a pretrained *.pt model
yolo detect train data=imagewoof model=yolov8n-cls.pt epochs=100 imgsz=224

Variantes do conjunto de dados

O conjunto de dados ImageWoof está disponível em três tamanhos diferentes para se adaptar a várias necessidades de investigação e capacidades computacionais:

  1. Tamanho completo (imagewoof): Esta é a versão original do conjunto de dados ImageWoof. Contém imagens em tamanho real e é ideal para treino final e avaliação de desempenho.

  2. Tamanho m√©dio (imagewoof320): Esta vers√£o cont√©m imagens redimensionadas para ter um comprimento m√°ximo de borda de 320 pixels. √Č adequada para um treino mais r√°pido sem sacrificar significativamente o desempenho do modelo.

  3. Tamanho pequeno (imagewoof160): Esta versão contém imagens redimensionadas para terem um comprimento máximo de borda de 160 pixels. Foi concebida para prototipagem rápida e experimentação onde a velocidade de treino é uma prioridade.

Para utilizar estas variantes no teu treino, basta substituir "imagewoof" no argumento do conjunto de dados por "imagewoof320" ou "imagewoof160". Por exemplo:

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data='imagewoof320', epochs=100, imgsz=224)

# For small-sized dataset
model.train(data='imagewoof160', epochs=100, imgsz=224)

√Č importante observar que o uso de imagens menores provavelmente produzir√° um desempenho inferior em termos de precis√£o de classifica√ß√£o. No entanto, √© uma excelente maneira de iterar rapidamente nos est√°gios iniciais de desenvolvimento e prototipagem de modelos.

Exemplos de imagens e anota√ß√Ķes

O conjunto de dados ImageWoof contém imagens coloridas de várias raças de cães, proporcionando um conjunto de dados desafiante para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra as diferenças subtis e as semelhanças entre as diferentes raças de cães no conjunto de dados ImageWoof, realçando a complexidade e a dificuldade da tarefa de classificação.

Cita√ß√Ķes e agradecimentos

Se utilizares o conjunto de dados ImageWoof no teu trabalho de investigação ou desenvolvimento, certifica-te de que reconheces os criadores do conjunto de dados, ligando-os ao repositório oficial do conjunto de dados.

Gostar√≠amos de agradecer √† equipa FastAI por criar e manter o conjunto de dados ImageWoof como um recurso valioso para a comunidade de investiga√ß√£o em aprendizagem autom√°tica e vis√£o computacional. Para mais informa√ß√Ķes sobre o conjunto de dados ImageWoof, visita o reposit√≥rio do conjunto de dados ImageWoof.



Criado em 2023-11-12, Atualizado em 2023-12-03
Autores: glenn-jocher (3)

Coment√°rios