Salta para o conteúdo

Conjunto de dados Caltech-101

O conjunto de dados Caltech-101 é um conjunto de dados amplamente utilizado para tarefas de reconhecimento de objectos, contendo cerca de 9.000 imagens de 101 categorias de objectos. As categorias foram escolhidas para refletir uma variedade de objectos do mundo real, e as próprias imagens foram cuidadosamente seleccionadas e anotadas para fornecer uma referência desafiante para os algoritmos de reconhecimento de objectos.

Características principais

  • O conjunto de dados Caltech-101 inclui cerca de 9.000 imagens a cores divididas em 101 categorias.
  • As categorias abrangem uma grande variedade de objectos, incluindo animais, veículos, artigos domésticos e pessoas.
  • O número de imagens por categoria varia, com cerca de 40 a 800 imagens em cada categoria.
  • As imagens são de tamanhos variáveis, sendo a maioria de resolução média.
  • O Caltech-101 é amplamente utilizado para treino e teste no domínio da aprendizagem automática, em particular para tarefas de reconhecimento de objectos.

Estrutura do conjunto de dados

Ao contrário de muitos outros conjuntos de dados, o conjunto de dados Caltech-101 não está formalmente dividido em conjuntos de treino e de teste. Normalmente, os utilizadores criam as suas próprias divisões com base nas suas necessidades específicas. No entanto, uma prática comum é utilizar um subconjunto aleatório de imagens para treino (por exemplo, 30 imagens por categoria) e as restantes imagens para teste.

Aplicações

O conjunto de dados Caltech-101 é amplamente utilizado para treinar e avaliar modelos de aprendizagem profunda em tarefas de reconhecimento de objectos, tais como Redes Neuronais Convolucionais (CNNs), Máquinas de Vectores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. A sua grande variedade de categorias e imagens de alta qualidade fazem dele um excelente conjunto de dados para investigação e desenvolvimento no domínio da aprendizagem automática e da visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados Caltech-101 para 100 épocas, podes usar os seguintes trechos de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n-cls.pt')  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data='caltech101', epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo detect train data=caltech101 model=yolov8n-cls.pt epochs=100 imgsz=416

Exemplos de imagens e anotações

O conjunto de dados Caltech-101 contém imagens a cores de alta qualidade de vários objectos, fornecendo um conjunto de dados bem estruturado para tarefas de reconhecimento de objectos. Aqui tens alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados Caltech-101, realçando a importância de um conjunto de dados diversificado para treinar modelos robustos de reconhecimento de objectos.

Citações e agradecimentos

Se utilizares o conjunto de dados Caltech-101 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Gostaríamos de agradecer a Li Fei-Fei, Rob Fergus e Pietro Perona por criarem e manterem o conjunto de dados Caltech-101 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados Caltech-101 e os seus criadores, visita o sítio Web do conjunto de dados Caltech-101.



Criado em 2023-11-12, Atualizado em 2023-11-22
Autores: glenn-jocher (3)

Comentários