Conjunto de dados Caltech-256

O conjunto de dados Caltech-256 é uma vasta coleção de imagens usada para tarefas de classificação de objetos. Contém cerca de 30.000 imagens divididas em 257 categorias (256 categorias de objetos e 1 categoria de fundo). As imagens são cuidadosamente selecionadas e anotadas para fornecer uma referência desafiadora e diversificada para algoritmos de reconhecimento de objetos.



Watch: How to Train Image Classification Model using Caltech-256 Dataset with Ultralytics YOLO26
Divisão automática de dados

O conjunto de dados Caltech-256, como fornecido, não vem com divisões de treino/validação pré-definidas. No entanto, quando utilizas os comandos de treino fornecidos nos exemplos de utilização abaixo, a estrutura Ultralytics dividirá automaticamente o conjunto de dados para ti. A divisão padrão utilizada é 80% para o conjunto de treino e 20% para o conjunto de validação.

Principais recursos

  • O conjunto de dados Caltech-256 compreende cerca de 30.000 imagens a cores divididas em 257 categorias.
  • Cada categoria contém um mínimo de 80 imagens.
  • As categorias abrangem uma grande variedade de objetos do mundo real, incluindo animais, veículos, artigos domésticos e pessoas.
  • As imagens são de tamanhos e resoluções variáveis.
  • O Caltech-256 é amplamente utilizado para treino e teste no campo da aprendizagem automática, particularmente para tarefas de reconhecimento de objetos.

Estrutura do Dataset

Tal como o Caltech-101, o conjunto de dados Caltech-256 não tem uma divisão formal entre conjuntos de treino e teste. Os utilizadores criam tipicamente as suas próprias divisões de acordo com as suas necessidades específicas. Uma prática comum é usar um subconjunto aleatório de imagens para treino e as imagens restantes para teste.

Aplicações

O conjunto de dados Caltech-256 é extensivamente usado para treinar e avaliar modelos de deep learning em tarefas de reconhecimento de objetos, tais como Redes Neuronais Convolucionais (CNNs), Máquinas de Vetores de Suporte (SVMs) e vários outros algoritmos de aprendizagem automática. O seu conjunto diversificado de categorias e imagens de alta qualidade tornam-no um conjunto de dados inestimável para investigação e desenvolvimento no campo da aprendizagem automática e visão computacional.

Utilização

Para treinar um modelo YOLO no conjunto de dados Caltech-256 durante 100 épocas, podes usar os seguintes fragmentos de código. Para uma lista abrangente de argumentos disponíveis, consulta a página de Treino do modelo.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Amostra de Imagens e Anotações

O conjunto de dados Caltech-256 contém imagens a cores de alta qualidade de vários objetos, fornecendo um conjunto de dados abrangente para tarefas de reconhecimento de objetos. Aqui estão alguns exemplos de imagens do conjunto de dados (créditos):

Amostras do conjunto de dados de classificação de imagens Caltech-256

O exemplo demonstra a diversidade e a complexidade dos objetos no conjunto de dados Caltech-256, enfatizando a importância de um conjunto de dados variado para treinar modelos de reconhecimento de objetos robustos.

Citações e Agradecimentos

Se utilizares o conjunto de dados Caltech-256 no teu trabalho de investigação ou desenvolvimento, por favor cita o seguinte artigo:

Citação
@article{griffin2007caltech,
         title={Caltech-256 object category dataset},
         author={Griffin, Gregory and Holub, Alex and Perona, Pietro},
         year={2007}
}

Gostaríamos de agradecer a Gregory Griffin, Alex Holub e Pietro Perona por criarem e manterem o conjunto de dados Caltech-256 como um recurso valioso para a comunidade de investigação de aprendizagem automática e visão computacional. Para mais informações sobre o conjunto de dados Caltech-256 e os seus criadores, visita o site do conjunto de dados Caltech-256.

FAQ

O que é o conjunto de dados Caltech-256 e porque é importante para a aprendizagem automática?

O conjunto de dados Caltech-256 é um grande conjunto de dados de imagens usado principalmente para tarefas de classificação de objetos em aprendizagem automática e visão computacional. Consiste em cerca de 30.000 imagens a cores divididas em 257 categorias, cobrindo uma vasta gama de objetos do mundo real. As imagens diversificadas e de alta qualidade do conjunto de dados tornam-no uma excelente referência para avaliar algoritmos de reconhecimento de objetos, o que é crucial para desenvolver modelos de aprendizagem automática robustos.

Como posso treinar um modelo YOLO no conjunto de dados Caltech-256 usando Python ou CLI?

Para treinar um modelo YOLO no conjunto de dados Caltech-256 durante 100 épocas, podes usar os seguintes fragmentos de código. Consulta a página de Treino do modelo para opções adicionais.

Exemplo de Treino
from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-cls.pt")  # load a pretrained model

# Train the model
results = model.train(data="caltech256", epochs=100, imgsz=416)

Quais são os casos de uso mais comuns para o conjunto de dados Caltech-256?

O conjunto de dados Caltech-256 é amplamente usado para várias tarefas de reconhecimento de objetos, tais como:

  • Treinar Redes Neuronais Convolucionais (CNNs)
  • Avaliar o desempenho de Máquinas de Vetores de Suporte (SVMs)
  • Avaliar novos algoritmos de deep learning
  • Desenvolver modelos de detecção de objetos usando estruturas como o Ultralytics YOLO

A sua diversidade e anotações abrangentes tornam-no ideal para investigação e desenvolvimento em aprendizagem automática e visão computacional.

Como é que o conjunto de dados Caltech-256 está estruturado e dividido para treino e teste?

O conjunto de dados Caltech-256 não vem com uma divisão predefinida para treino e teste. Os utilizadores criam tipicamente as suas próprias divisões de acordo com as suas necessidades específicas. Uma abordagem comum é selecionar aleatoriamente um subconjunto de imagens para treino e usar as imagens restantes para teste. Esta flexibilidade permite aos utilizadores adaptar o conjunto de dados aos requisitos específicos do seu projeto e às configurações experimentais.

Porque devo usar o Ultralytics YOLO para treinar modelos no conjunto de dados Caltech-256?

Os modelos Ultralytics YOLO oferecem várias vantagens para treino no conjunto de dados Caltech-256:

  • Alta Precisão: Os modelos YOLO são conhecidos pelo seu desempenho de ponta em tarefas de detecção de objetos.
  • Velocidade: Fornecem capacidades de inferência em tempo real, tornando-os adequados para aplicações que requerem previsões rápidas.
  • Facilidade de Uso: Com a Ultralytics Platform, podes treinar, validar e implementar modelos sem necessidade de muita codificação.
  • Modelos Pré-treinados: Começar com modelos pré-treinados, como yolo26n-cls.pt, pode reduzir significativamente o tempo de treino e melhorar a precisão do modelo.

Para mais detalhes, explora o nosso guia de treino abrangente e aprende sobre classificação de imagens com o Ultralytics YOLO.

Comentários