Link to this sectionConjunto de dados ImageWoof#

Name: Conjunto de Dados de Classificação de Imagens ImageWoof
Creator: fast.ai
License: https://www.image-net.org/download.php
Keywords: Conjunto de dados ImageWoof, Subconjunto ImageNet, raças de cães, classificação de imagens, classificação de granulação fina, deep learning, aprendizado de máquina, Ultralytics, rótulos ruidosos

O conjunto de dados ImageWoof é um subconjunto do ImageNet que consiste em 10 raças de cães deliberadamente difíceis de distinguir, criado pela fast.ai como um desafio mais difícil para algoritmos de classificação de imagens. Ele contém 12.954 imagens coloridas — 9.025 para treino e 3.929 para validação — de raças como Beagle, Shih-Tzu e Golden retriever, forçando os modelos a distinguir diferenças sutis e detalhadas, em vez de categorias óbvias de objetos.

Link to this sectionPrincipais recursos#

O ImageWoof contém 12.954 imagens de 10 raças de cães: Australian terrier, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog.
Ele é disponibilizado com uma divisão predefinida de 9.025 imagens de treino e 3.929 de validação, disponíveis em várias resoluções (tamanho original, 320px, 160px) para se adequar a diferentes orçamentos computacionais.
Também inclui uma versão com rótulos ruidosos, proporcionando um cenário mais realista onde os rótulos nem sempre são confiáveis.

Link to this sectionEstrutura do Dataset#

O ImageWoof é disponibilizado com uma divisão predefinida de treino/validação, com cada raça de cão armazenada em sua própria pasta:

Divisão	Imagens	Classes
Treinar	9.025	10
Validação	3.929	10

Como todas as 10 classes são raças de cães, a divisão foi projetada para testar a classificação de granulação fina — distinguir categorias visualmente semelhantes — em vez do reconhecimento amplo de objetos do conjunto de dados ImageNet completo.

Link to this sectionAplicações#

O conjunto de dados ImageWoof é amplamente utilizado para treinar e avaliar modelos de deep learning em classes mais complexas e semelhantes. Seu desafio reside nas diferenças sutis entre as raças de cães, levando ao limite o desempenho e a generalização do modelo. É particularmente valioso para:

Avaliar o desempenho de classificação em categorias de granulação fina
Testar a robustez do modelo contra classes visualmente semelhantes
Desenvolver algoritmos que consigam distinguir diferenças visuais sutis
Avaliar o transfer learning de domínios gerais para específicos

Link to this sectionUso#

Para treinar um modelo de classificação no conjunto de dados ImageWoof por 100 epochs com um tamanho de imagem de 224x224, usa os trechos de código abaixo. Para obter uma lista completa de argumentos disponíveis, consulta a página de Treino do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

Link to this sectionVariantes do Conjunto de Dados#

O ImageWoof está disponível em três tamanhos para acomodar diferentes necessidades de pesquisa e orçamentos computacionais:

Tamanho Completo (imagewoof): A versão original com imagens de tamanho completo, ideal para o treino final e avaliação de desempenho.
Tamanho Médio (imagewoof320): Imagens redimensionadas para um comprimento de borda máximo de 320 pixels, adequadas para um treino mais rápido sem sacrificar significativamente o desempenho do modelo.
Tamanho Pequeno (imagewoof160): Imagens redimensionadas para um comprimento de borda máximo de 160 pixels, projetadas para prototipagem rápida e experimentação onde a velocidade de treino é uma prioridade.

Para usar estas variantes, basta substituir imagewoof no argumento do conjunto de dados por imagewoof320 ou imagewoof160. Por exemplo:

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# For medium-sized dataset
model.train(data="imagewoof320", epochs=100, imgsz=224)

# For small-sized dataset
model.train(data="imagewoof160", epochs=100, imgsz=224)

Tem em atenção que imagens menores provavelmente resultarão numa precisão de classificação menor, mas são uma excelente forma de iterar rapidamente nas fases iniciais do desenvolvimento do modelo. Também podes gerir conjuntos de dados de classificação e executar treinos na nuvem com a Plataforma Ultralytics.

Link to this sectionExemplos de Imagens e Anotações#

O conjunto de dados ImageWoof contém imagens coloridas de várias raças de cães, fornecendo um conjunto de dados desafiante para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Exemplos do conjunto de dados de classificação de raças de cães ImageWoof

O exemplo mostra as diferenças e semelhanças subtis entre as diferentes raças de cães, destacando a complexidade e a dificuldade da tarefa de classificação.

Link to this sectionCitações e Agradecimentos#

Se usares o conjunto de dados ImageWoof no teu trabalho de pesquisa ou desenvolvimento, por favor reconhece os criadores do conjunto de dados vinculando ao repositório oficial do conjunto de dados.

Gostaríamos de agradecer à equipa da fast.ai por criar e manter o ImageWoof como um recurso valioso para a comunidade de pesquisa de machine learning e computer vision. Para mais informações sobre o ImageWoof, visita o repositório do conjunto de dados ImageWoof.

Link to this sectionFAQ#

Link to this sectionO que é o conjunto de dados ImageWoof na Ultralytics?#

O conjunto de dados ImageWoof é um subconjunto desafiante do ImageNet focado em 10 raças de cães, contendo 12.954 imagens (9.025 para treino e 3.929 para validação). Criado pela fast.ai para levar ao limite os modelos de classificação de imagens, inclui raças como Beagle, Shih-Tzu e Golden retriever. O conjunto de dados está disponível em várias resoluções (tamanho completo, 320px, 160px) e até inclui rótulos ruidosos para cenários de treino mais realistas, tornando-o ideal para desenvolver modelos avançados de deep learning.

Link to this sectionQuantas imagens e raças de cães tem o ImageWoof?#

O ImageWoof contém 12.954 imagens no total — 9.025 para treino e 3.929 para validação — em 10 raças de cães: Australian terrier, Border terrier, Samoyed, Beagle, Shih-Tzu, English foxhound, Rhodesian ridgeback, Dingo, Golden retriever e Old English sheepdog. Cada raça é armazenada na sua própria pasta, seguindo o layout de classificação padrão que a Ultralytics espera.

Link to this sectionComo posso treinar um modelo usando o conjunto de dados ImageWoof com a Ultralytics YOLO?#

Para treinar um modelo de classificação no conjunto de dados ImageWoof usando a Ultralytics YOLO por 100 épocas com um tamanho de imagem de 224x224, usa o seguinte código:

Exemplo de Treinamento

from ultralytics import YOLO

model = YOLO("yolo26n-cls.pt")  # Load a pretrained model
results = model.train(data="imagewoof", epochs=100, imgsz=224)

Para mais detalhes sobre os argumentos de treino disponíveis, consulta a página de Treino.

Link to this sectionQue versões do conjunto de dados ImageWoof estão disponíveis?#

O conjunto de dados ImageWoof vem em três tamanhos:

Tamanho Completo (imagewoof): Ideal para treino final e avaliação, contendo imagens de tamanho completo.
Tamanho Médio (imagewoof320): Imagens redimensionadas com um comprimento de borda máximo de 320 pixels, adequadas para um treino mais rápido.
Tamanho Pequeno (imagewoof160): Imagens redimensionadas com um comprimento de borda máximo de 160 pixels, perfeitas para prototipagem rápida.

Usa estas versões substituindo imagewoof no argumento do conjunto de dados adequadamente. Tem em atenção que imagens menores podem resultar numa precisão de classificação menor, mas são úteis para iterações mais rápidas.

Link to this sectionComo é que os rótulos ruidosos no conjunto de dados ImageWoof beneficiam o treino?#

Os rótulos ruidosos no conjunto de dados ImageWoof simulam condições do mundo real onde os rótulos nem sempre são precisos. Treinar modelos com estes dados ajuda a desenvolver robustez e generalização em tarefas de classificação de imagens. Isso prepara os modelos para lidar eficazmente com dados ambíguos ou com rótulos incorretos, o que é frequentemente encontrado em aplicações práticas.

Link to this sectionQuais são os principais desafios de usar o conjunto de dados ImageWoof?#

O principal desafio do ImageWoof reside nas diferenças subtis entre as raças de cães que inclui. Como se concentra em 10 raças estreitamente relacionadas, distinguir entre elas requer modelos de classificação de imagens mais avançados e ajustados. Isso torna o ImageWoof uma excelente referência para testar as capacidades e melhorias de modelos de deep learning.

Contribuidores

GLglenn-jocher¹³ JKjk4e³ RAraimbekovm¹ HIhim2him2¹ MAMatthewNoyce¹ RIRizwanMunawar¹

Criado 12 de nov. de 2023Atualizado anteontem