Link to this sectionConjunto de dados Caltech-101#

O dataset Caltech-101 é um benchmark clássico de classificação de imagens composto por 9.144 imagens distribuídas em 101 categorias de objetos, além de uma classe de fundo. Cada categoria contém cerca de 40 a 800 imagens de objetos do mundo real — animais, veículos, itens domésticos e pessoas —, tornando-o um benchmark compacto, porém desafiador, para modelos de reconhecimento de objetos.

Watch: How to Train Image Classification Model using Caltech-101 Dataset with Ultralytics Platform

Divisão Automática de Dados

O Caltech-101 é fornecido sem uma divisão predefinida de treino/validação. Os comandos de treinamento abaixo realizam automaticamente uma divisão de 80% para treino e 20% para validação, portanto, não é necessária preparação manual.

Link to this sectionPrincipais recursos#

O Caltech-101 contém 9.144 imagens coloridas em 101 categorias de objetos, além de uma classe BACKGROUND_Google (102 pastas de classes no total).
As categorias abrangem uma grande variedade de objetos do mundo real, incluindo animais, veículos, itens domésticos e pessoas.
Cada categoria contém cerca de 40 a 800 imagens, portanto, os tamanhos das classes são desbalanceados.
As imagens possuem tamanhos variados, sendo a maioria aproximadamente 300x200 pixels (resolução média).
O Caltech-101 é amplamente utilizado para avaliar algoritmos de classificação de imagens e reconhecimento de objetos.

Link to this sectionEstrutura do Dataset#

O Caltech-101 é distribuído em 102 pastas — uma por classe, cobrindo 101 categorias de objetos mais uma classe BACKGROUND_Google — sem uma divisão predefinida de treino/validação. Quando você inicia o treinamento, o Ultralytics particiona automaticamente as imagens para que os modelos sejam treinados em todas as 102 classes, sem necessidade de configuração manual:

Classes: 102 (101 categorias de objetos + 1 de fundo)
Total de imagens: 9.144
Divisão treino/validação: automática 80% / 20% (≈7.280 para treino, ≈1.864 para validação)
Imagens por classe: cerca de 40 a 800 (desbalanceado)

Link to this sectionAplicações#

O Caltech-101 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens e reconhecimento de objetos, incluindo Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs). Sua ampla cobertura de categorias e imagens limpas e rotuladas o tornam um benchmark popular para pesquisa e prototipagem de aprendizado de máquina e visão computacional.

Link to this sectionUso#

Treine um modelo YOLO no Caltech-101 por 100 épocas com um tamanho de imagem de 416. Para a lista completa de argumentos disponíveis, consulte a página de Treinamento e o guia de tarefas de classificação de imagens.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionExemplos de Imagens e Anotações#

O conjunto de dados Caltech-101 contém imagens coloridas de alta qualidade de vários objetos, fornecendo um conjunto de dados bem estruturado para tarefas de classificação de imagens. Aqui estão alguns exemplos de imagens do conjunto de dados:

Exemplos do conjunto de dados de classificação de imagens Caltech-101

As amostras mostram a variedade de categorias e o enquadramento natural e centralizado típico do Caltech-101, o que o torna um ponto de partida limpo para o treinamento de modelos robustos de reconhecimento de objetos.

Link to this sectionCitações e Agradecimentos#

Se você usar o conjunto de dados Caltech-101 em seu trabalho de pesquisa ou desenvolvimento, cite o seguinte artigo:

Citação

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Gostaríamos de agradecer a Li Fei-Fei, Rob Fergus e Pietro Perona por criarem e manterem o conjunto de dados Caltech-101 como um recurso valioso para a comunidade de pesquisa de aprendizado de máquina e visão computacional. Para mais informações sobre o conjunto de dados Caltech-101 e seus criadores, visite o site do conjunto de dados Caltech-101.

Link to this sectionFAQ#

Link to this sectionPara que o conjunto de dados Caltech-101 é usado no aprendizado de máquina?#

O dataset Caltech-101 é amplamente utilizado para treinar e avaliar modelos de classificação de imagens e reconhecimento de objetos. Ele contém 9.144 imagens em 101 categorias de objetos mais uma classe de fundo, fornecendo um benchmark desafiador para avaliar algoritmos como Redes Neurais Convolucionais (CNNs) e Máquinas de Vetores de Suporte (SVMs).

Link to this sectionComo posso treinar um modelo Ultralytics YOLO no conjunto de dados Caltech-101?#

Para treinar um modelo YOLO da Ultralytics no Caltech-101, use os trechos de código abaixo. O dataset é baixado automaticamente no primeiro uso. Para uma lista completa de argumentos, consulte a página de Treinamento do modelo.

Exemplo de Treinamento

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)

Link to this sectionQuantas classes o dataset Caltech-101 possui?#

O Caltech-101 contém 101 categorias de objetos mais uma classe BACKGROUND_Google, totalizando 102 pastas de classes e 9.144 imagens. Quando você treina com Ultralytics, o modelo aprende todas as 102 classes. Os tamanhos das categorias são desbalanceados, variando de cerca de 40 a 800 imagens cada.

Link to this sectionComo o dataset Caltech-101 é dividido em conjuntos de treinamento e validação?#

O Caltech-101 não tem divisão predefinida. Na primeira vez que você treina, o Ultralytics o divide automaticamente em 80% de treinamento / 20% de validação — cerca de 7.280 imagens de treinamento e 1.864 de validação — para que você não precise criar divisões manualmente. Para controlar a divisão por conta própria, organize as imagens em pastas train/ e val/ antes do treinamento.

Link to this sectionPosso usar a Ultralytics Platform para treinar modelos no conjunto de dados Caltech-101?#

Sim. A Ultralytics Platform permite que você gerencie datasets, treine modelos de classificação de imagens e os implemente sem a necessidade de codificação extensiva. É uma maneira conveniente de executar experimentos com o Caltech-101 na nuvem, e você pode explorar mais opções em nossa visão geral de datasets de classificação.

Contribuidores

GLglenn-jocher¹⁵ RAraimbekovm² MAMatthewNoyce¹ RIRizwanMunawar¹ JKjk4e¹

Criado 12 de nov. de 2023Atualizado anteontem