Salta para o conteúdo

Conjunto de dados Caltech-101

O conjunto de dados Caltech-101 é um conjunto de dados amplamente utilizado para tarefas de reconhecimento de objectos, contendo cerca de 9.000 imagens de 101 categorias de objectos. As categorias foram escolhidas para refletir uma variedade de objectos do mundo real, e as próprias imagens foram cuidadosamente seleccionadas e anotadas para fornecer uma referência desafiante para os algoritmos de reconhecimento de objectos.

Características principais

  • O conjunto de dados Caltech-101 inclui cerca de 9.000 imagens a cores divididas em 101 categorias.
  • As categorias abrangem uma grande variedade de objectos, incluindo animais, veículos, artigos domésticos e pessoas.
  • O número de imagens por categoria varia, com cerca de 40 a 800 imagens em cada categoria.
  • As imagens são de tamanhos variáveis, sendo a maioria de resolução média.
  • O Caltech-101 é amplamente utilizado para treino e teste no domínio da aprendizagem automática, em particular para tarefas de reconhecimento de objectos.

Estrutura do conjunto de dados

Ao contrário de muitos outros conjuntos de dados, o conjunto de dados Caltech-101 não está formalmente dividido em conjuntos de treino e de teste. Normalmente, os utilizadores criam as suas próprias divisões com base nas suas necessidades específicas. No entanto, uma prática comum é utilizar um subconjunto aleatório de imagens para treino (por exemplo, 30 imagens por categoria) e as restantes imagens para teste.

Aplicações

The Caltech-101 dataset is extensively used for training and evaluating deep learning models in object recognition tasks, such as Convolutional Neural Networks (CNNs), Support Vector Machines (SVMs), and various other machine learning algorithms. Its wide variety of categories and high-quality images make it an excellent dataset for research and development in the field of machine learning and computer vision.

Utilização

Para treinar um modelo YOLO no conjunto de dados Caltech-101 para 100 épocas, podes usar os seguintes trechos de código. Para obter uma lista abrangente dos argumentos disponíveis, consulta a página Treinamento do modelo.

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Exemplos de imagens e anotações

O conjunto de dados Caltech-101 contém imagens a cores de alta qualidade de vários objectos, fornecendo um conjunto de dados bem estruturado para tarefas de reconhecimento de objectos. Aqui tens alguns exemplos de imagens do conjunto de dados:

Imagem de amostra do conjunto de dados

O exemplo mostra a variedade e complexidade dos objectos no conjunto de dados Caltech-101, realçando a importância de um conjunto de dados diversificado para treinar modelos robustos de reconhecimento de objectos.

Citações e agradecimentos

Se utilizares o conjunto de dados Caltech-101 no teu trabalho de investigação ou desenvolvimento, cita o seguinte documento:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

Gostaríamos de agradecer a Li Fei-Fei, Rob Fergus e Pietro Perona por criarem e manterem o conjunto de dados Caltech-101 como um recurso valioso para a comunidade de investigação em aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados Caltech-101 e os seus criadores, visita o sítio Web do conjunto de dados Caltech-101.

FAQ

Para que é que o conjunto de dados Caltech-101 é utilizado na aprendizagem automática?

The Caltech-101 dataset is widely used in machine learning for object recognition tasks. It contains around 9,000 images across 101 categories, providing a challenging benchmark for evaluating object recognition algorithms. Researchers leverage it to train and test models, especially Convolutional Neural Networks (CNNs) and Support Vector Machines (SVMs), in computer vision.

Como posso treinar um modelo Ultralytics YOLO no conjunto de dados Caltech-101?

To train an Ultralytics YOLO model on the Caltech-101 dataset, you can use the provided code snippets. For example, to train for 100 epochs:

Exemplo de comboio

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech101", epochs=100, imgsz=416)
# Start training from a pretrained *.pt model
yolo classify train data=caltech101 model=yolo11n-cls.pt epochs=100 imgsz=416

Para argumentos e opções mais detalhados, consulta a página de formação do modelo.

Quais são as principais características do conjunto de dados Caltech-101?

The Caltech-101 dataset includes:

  • Around 9,000 color images across 101 categories.
  • Categories covering a diverse range of objects, including animals, vehicles, and household items.
  • Variable number of images per category, typically between 40 and 800.
  • Variable image sizes, with most being medium resolution.

These features make it an excellent choice for training and evaluating object recognition models in machine learning and computer vision.

Por que razão devo citar o conjunto de dados Caltech-101 na minha investigação?

Citar o conjunto de dados Caltech-101 na tua investigação reconhece as contribuições dos criadores e fornece uma referência para outros que possam utilizar o conjunto de dados. A citação recomendada é:

@article{fei2007learning,
  title={Learning generative visual models from few training examples: An incremental Bayesian approach tested on 101 object categories},
  author={Fei-Fei, Li and Fergus, Rob and Perona, Pietro},
  journal={Computer vision and Image understanding},
  volume={106},
  number={1},
  pages={59--70},
  year={2007},
  publisher={Elsevier}
}

A citação ajuda a manter a integridade do trabalho académico e ajuda os colegas a localizar o recurso original.

Posso utilizar o Ultralytics HUB para treinar modelos no conjunto de dados Caltech-101?

Sim, podes utilizar o Ultralytics HUB para treinar modelos no conjunto de dados Caltech-101. Ultralytics O HUB fornece uma plataforma intuitiva para gerenciar conjuntos de dados, treinar modelos e implantá-los sem codificação extensa. Para obter um guia detalhado, consulta a publicação do blogue Como treinar os teus modelos personalizados com o Ultralytics HUB.


📅 Created 11 months ago ✏️ Updated 12 days ago

Comentários