Conjunto de dados Caltech-101

O conjunto de dados Caltech-101 é amplamente utilizado em tarefas de reconhecimento de objetos, contendo cerca de 9.000 imagens de 101 categorias de objetos. As categorias foram escolhidas para refletir uma variedade de objetos do mundo real, e as próprias imagens foram cuidadosamente selecionadas e anotadas para fornecer um benchmark desafiador para algoritmos de reconhecimento de objetos.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics Platform
Divisão automática de dados

O conjunto de dados Caltech-101, da forma como é disponibilizado, não vem com divisões de treino/validação predefinidas. No entanto, ao usar os comandos de treinamento fornecidos nos exemplos de uso abaixo, o framework Ultralytics dividirá automaticamente o conjunto de dados para você. A divisão padrão utilizada é de 80% para o conjunto de treinamento e 20% para o conjunto de validação.

Principais recursos

  • O conjunto de dados Caltech-101 compreende cerca de 9.000 imagens coloridas divididas em 101 categorias.
  • As categorias abrangem uma ampla variedade de objetos, incluindo animais, veículos, itens domésticos e pessoas.
  • O número de imagens por categoria varia, com cerca de 40 a 800 imagens em cada categoria.
  • As imagens possuem tamanhos variáveis, sendo a maioria de resolução média.
  • O Caltech-101 é amplamente utilizado para treinamento e testes no campo do aprendizado de máquina, particularmente em tarefas de reconhecimento de objetos.

Estrutura do Dataset

Diferente de muitos outros conjuntos de dados, o Caltech-101 não é formalmente dividido em conjuntos de treinamento e teste. Os usuários geralmente criam suas próprias divisões com base em suas necessidades específicas. No entanto, uma prática comum é usar um subconjunto aleatório de imagens para treinamento (por exemplo, 30 imagens por categoria) e as imagens restantes para teste.

Aplicações

O conjunto de dados Caltech-101 é amplamente utilizado para treinar e avaliar modelos de deep learning em tarefas de reconhecimento de objetos, como Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs) e vários outros algoritmos de aprendizado de máquina. Sua grande variedade de categorias e imagens de alta qualidade o tornam um excelente conjunto de dados para pesquisa e desenvolvimento no campo do machine learning e computer vision.

Utilização

Para treinar um modelo YOLO no conjunto de dados Caltech-101 por 100 epochs, você pode usar os trechos de código abaixo. Para uma lista abrangente de argumentos disponíveis, consulte a página de Training do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Amostra de Imagens e Anotações

O conjunto de dados Caltech-101 contém imagens coloridas de alta qualidade de vários objetos, fornecendo um conjunto de dados bem estruturado para tarefas de image classification. Aqui estão alguns exemplos de imagens do conjunto de dados:

Caltech-101 image classification dataset samples

O exemplo mostra a variedade e a complexidade dos objetos no conjunto de dados Caltech-101, enfatizando a importância de um conjunto de dados diversificado para o treinamento de modelos robustos de reconhecimento de objetos.

Citações e Agradecimentos

Se você utilizar o conjunto de dados Caltech-101 em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:

Citação
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Gostaríamos de agradecer a Li Fei-Fei, Rob Fergus e Pietro Perona por criarem e manterem o conjunto de dados Caltech-101 como um recurso valioso para a comunidade de pesquisa de aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados Caltech-101 e seus criadores, visite o site do conjunto de dados Caltech-101.

FAQ

Para que o conjunto de dados Caltech-101 é usado no aprendizado de máquina?

O conjunto de dados Caltech-101 é amplamente utilizado em aprendizado de máquina para tarefas de reconhecimento de objetos. Ele contém cerca de 9.000 imagens em 101 categorias, fornecendo um benchmark desafiador para avaliar algoritmos de reconhecimento de objetos. Pesquisadores o utilizam para treinar e testar modelos, especialmente Neural Networks (CNNs) convolucionais e Support Vector Machines (SVMs), em visão computacional.

Como posso treinar um modelo Ultralytics YOLO no conjunto de dados Caltech-101?

Para treinar um modelo Ultralytics YOLO no conjunto de dados Caltech-101, você pode usar os trechos de código fornecidos. Por exemplo, para treinar por 100 épocas:

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Para argumentos e opções mais detalhados, consulte a página de Training do modelo.

Quais são as principais características do conjunto de dados Caltech-101?

O conjunto de dados Caltech-101 inclui:

  • Cerca de 9.000 imagens coloridas em 101 categorias.
  • Categorias que cobrem uma gama diversificada de objetos, incluindo animais, veículos e itens domésticos.
  • Número variável de imagens por categoria, geralmente entre 40 e 800.
  • Tamanhos de imagem variáveis, sendo a maioria de resolução média.

Essas características o tornam uma excelente escolha para treinar e avaliar modelos de reconhecimento de objetos em aprendizado de máquina e visão computacional.

Por que devo citar o conjunto de dados Caltech-101 em minha pesquisa?

Citar o conjunto de dados Caltech-101 em sua pesquisa reconhece as contribuições dos criadores e fornece uma referência para outros que possam usar o conjunto de dados. A citação recomendada é:

Citação
@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Citar ajuda a manter a integridade do trabalho acadêmico e auxilia colegas na localização do recurso original.

Posso usar a Ultralytics Platform para treinar modelos no conjunto de dados Caltech-101?

Sim, você pode usar a Ultralytics Platform para treinar modelos no conjunto de dados Caltech-101. A Ultralytics Platform fornece uma plataforma intuitiva para gerenciar conjuntos de dados, treinar modelos e implantá-los sem necessidade de codificação extensiva. Para um guia detalhado, consulte a postagem do blog sobre como treinar seus modelos personalizados com a Ultralytics Platform.

Comentários