Salta para o conte√ļdo

Vis√£o geral dos conjuntos de dados

Ultralytics fornece suporte para v√°rios conjuntos de dados para facilitar as tarefas de vis√£o computacional, como dete√ß√£o, segmenta√ß√£o de inst√Ęncia, estimativa de pose, classifica√ß√£o e rastreamento de v√°rios objetos. Segue-se uma lista dos principais conjuntos de dados Ultralytics , seguida de um resumo de cada tarefa de vis√£o computacional e dos respectivos conjuntos de dados.



Observa: Ultralytics Vis√£o geral dos conjuntos de dados

NOVO ūüöÄ Ultralytics Explorer

Cria embeddings para o teu conjunto de dados, procura imagens semelhantes, executa consultas SQL, efectua pesquisas sem√Ęnticas e at√© pesquisa utilizando linguagem natural! Podes come√ßar com a nossa aplica√ß√£o GUI ou criar a tua pr√≥pria aplica√ß√£o utilizando a API. Sabe mais aqui.

Ultralytics Captura de ecr√£ do Explorer

Deteção de objectos

A deteção de objectos com caixa delimitadora é uma técnica de visão por computador que envolve a deteção e localização de objectos numa imagem, desenhando uma caixa delimitadora à volta de cada objeto.

  • Argoverse: Um conjunto de dados que cont√©m dados de localiza√ß√£o 3D e de previs√£o de movimento de ambientes urbanos com anota√ß√Ķes ricas.
  • COCO: Common Objects in Context (COCO) √© um conjunto de dados de dete√ß√£o, segmenta√ß√£o e legendagem de objectos em grande escala com 80 categorias de objectos.
  • LVIS: Um conjunto de dados de dete√ß√£o, segmenta√ß√£o e legendagem de objectos em grande escala com 1203 categorias de objectos.
  • COCO8: Um subconjunto mais pequeno das primeiras 4 imagens de COCO train e COCO val, adequado para testes r√°pidos.
  • Global Wheat 2020: Um conjunto de dados com imagens de cabe√ßas de trigo para o Global Wheat Challenge 2020.
  • Objects365: Um conjunto de dados de alta qualidade e em grande escala para dete√ß√£o de objectos com 365 categorias de objectos e mais de 600 mil imagens anotadas.
  • OpenImagesV7: Um conjunto de dados abrangente da Google com 1,7 milh√Ķes de imagens de treino e 42 mil imagens de valida√ß√£o.
  • SKU-110K: Um conjunto de dados com dete√ß√£o de objectos densos em ambientes de retalho com mais de 11 mil imagens e 1,7 milh√Ķes de caixas delimitadoras.
  • VisDrone: Um conjunto de dados que cont√©m dados de dete√ß√£o de objectos e de seguimento de m√ļltiplos objectos a partir de imagens captadas por drones, com mais de 10 mil imagens e sequ√™ncias de v√≠deo.
  • VOC: O conjunto de dados Pascal Visual Object Classes (VOC) para dete√ß√£o e segmenta√ß√£o de objectos com 20 classes de objectos e mais de 11 mil imagens.
  • xView: Um conjunto de dados para dete√ß√£o de objectos em imagens a√©reas com 60 categorias de objectos e mais de 1 milh√£o de objectos anotados.
  • Roboflow 100: Uma refer√™ncia de dete√ß√£o de objectos diversificada com 100 conjuntos de dados que abrangem sete dom√≠nios de imagens para uma avalia√ß√£o abrangente do modelo.
  • Tumor cerebral: Um conjunto de dados para detetar tumores cerebrais inclui imagens de resson√Ęncia magn√©tica ou tomografia computadorizada com detalhes sobre a presen√ßa, localiza√ß√£o e caracter√≠sticas do tumor.
  • Vida selvagem africana: Um conjunto de dados com imagens da vida selvagem africana, incluindo b√ļfalos, elefantes, rinocerontes e zebras.
  • Assinatura: Um conjunto de dados que apresenta imagens de v√°rios documentos com assinaturas anotadas, apoiando a verifica√ß√£o de documentos e a investiga√ß√£o sobre dete√ß√£o de fraudes.

Segmenta√ß√£o de inst√Ęncias

A segmenta√ß√£o de inst√Ęncias √© uma t√©cnica de vis√£o por computador que envolve a identifica√ß√£o e localiza√ß√£o de objectos numa imagem ao n√≠vel do pixel.

  • COCO: Um conjunto de dados em grande escala concebido para tarefas de dete√ß√£o, segmenta√ß√£o e legendagem de objectos com mais de 200 mil imagens etiquetadas.
  • COCO8-seg: Um conjunto de dados mais pequeno para tarefas de segmenta√ß√£o de exemplos, contendo um subconjunto de 8 imagens COCO com anota√ß√Ķes de segmenta√ß√£o.
  • Crack-seg: Conjunto de dados especificamente criado para a dete√ß√£o de fissuras em estradas e paredes, aplic√°vel tanto a tarefas de dete√ß√£o de objectos como de segmenta√ß√£o.
  • Package-seg: Conjunto de dados personalizado para identificar embalagens em armaz√©ns ou ambientes industriais, adequado para aplica√ß√Ķes de dete√ß√£o e segmenta√ß√£o de objectos.
  • Carparts-seg: Conjunto de dados criado com o objetivo de identificar pe√ßas de ve√≠culos, atendendo √†s necessidades de design, fabrico e investiga√ß√£o. Serve tanto para tarefas de dete√ß√£o de objectos como de segmenta√ß√£o.

Estimativa de pose

A estimativa da pose √© uma t√©cnica utilizada para determinar a pose do objeto em rela√ß√£o √† c√Ęmara ou ao sistema de coordenadas do mundo.

  • COCO: Um conjunto de dados em grande escala com anota√ß√Ķes de pose humana concebido para tarefas de estimativa de pose.
  • COCO8-pose: Um conjunto de dados mais pequeno para tarefas de estimativa de pose, contendo um subconjunto de 8 imagens COCO com anota√ß√Ķes de pose humana.
  • Tiger-pose: Um conjunto de dados compacto que consiste em 263 imagens centradas em tigres, anotadas com 12 pontos-chave por tigre para tarefas de estimativa de pose.

Classificação

A classifica√ß√£o de imagens √© uma tarefa de vis√£o por computador que envolve a categoriza√ß√£o de uma imagem numa ou mais classes ou categorias predefinidas com base no seu conte√ļdo visual.

  • Caltech 101: Um conjunto de dados que cont√©m imagens de 101 categorias de objectos para tarefas de classifica√ß√£o de imagens.
  • Caltech 256: Uma vers√£o alargada do Caltech 101 com 256 categorias de objectos e imagens mais desafiantes.
  • CIFAR-10: Um conjunto de dados de 60K imagens a cores 32x32 em 10 classes, com 6K imagens por classe.
  • CIFAR-100: Uma vers√£o alargada do CIFAR-10 com 100 categorias de objectos e 600 imagens por classe.
  • Moda-MNIST: Um conjunto de dados constitu√≠do por 70.000 imagens em escala de cinzentos de 10 categorias de moda para tarefas de classifica√ß√£o de imagens.
  • ImageNet: Um conjunto de dados em grande escala para dete√ß√£o de objectos e classifica√ß√£o de imagens com mais de 14 milh√Ķes de imagens e 20.000 categorias.
  • ImageNet-10: Um subconjunto mais pequeno do ImageNet com 10 categorias para uma experimenta√ß√£o e testes mais r√°pidos.
  • Imagenette: Um subconjunto mais pequeno do ImageNet que cont√©m 10 classes facilmente distingu√≠veis para um treino e teste mais r√°pidos.
  • Imagewoof: Um subconjunto mais exigente do ImageNet que cont√©m 10 categorias de ra√ßas de c√£es para tarefas de classifica√ß√£o de imagens.
  • MNIST: Um conjunto de dados de 70.000 imagens em tons de cinzento de d√≠gitos manuscritos para tarefas de classifica√ß√£o de imagens.

Caixas delimitadoras orientadas (OBB)

Oriented Bounding Boxes (OBB) é um método de visão por computador para detetar objectos angulares em imagens utilizando caixas delimitadoras rodadas, frequentemente aplicado a imagens aéreas e de satélite.

  • DOTA-v2: Um popular conjunto de dados de imagens a√©reas OBB com 1,7 milh√Ķes de inst√Ęncias e 11.268 imagens.

Seguimento de v√°rios objectos

O seguimento de m√ļltiplos objectos √© uma t√©cnica de vis√£o por computador que envolve a dete√ß√£o e o seguimento de m√ļltiplos objectos ao longo do tempo numa sequ√™ncia de v√≠deo.

  • Argoverse: Um conjunto de dados que cont√©m dados de rastreio 3D e previs√£o de movimento de ambientes urbanos com anota√ß√Ķes ricas para tarefas de rastreio de v√°rios objectos.
  • VisDrone: Um conjunto de dados que cont√©m dados de dete√ß√£o de objectos e de seguimento de m√ļltiplos objectos a partir de imagens captadas por drones, com mais de 10 mil imagens e sequ√™ncias de v√≠deo.

Contribui com novos conjuntos de dados

A contribuição de um novo conjunto de dados envolve vários passos para garantir que se alinha bem com a infraestrutura existente. Apresentamos de seguida os passos necessários:

Passos para contribuir com um novo conjunto de dados

  1. Recolhe imagens: Re√ļne as imagens que pertencem ao conjunto de dados. Estas podem ser recolhidas de v√°rias fontes, como bases de dados p√ļblicas ou a tua pr√≥pria cole√ß√£o.
  2. Anota imagens: Anota estas imagens com caixas delimitadoras, segmentos ou pontos-chave, dependendo da tarefa.
  3. Exportar Anota√ß√Ķes: Converte estas anota√ß√Ķes no YOLO *.txt formato de ficheiro que o Ultralytics suporta.
  4. Organiza o conjunto de dados: Organiza o teu conjunto de dados na estrutura de pastas correcta. Deves ter train/ e val/ directórios de nível superior, e dentro de cada um, um images/ e labels/ subdiretório.

    dataset/
    ‚Ēú‚ĒÄ‚ĒÄ train/
    ‚Ēā   ‚Ēú‚ĒÄ‚ĒÄ images/
    ‚Ēā   ‚ĒĒ‚ĒÄ‚ĒÄ labels/
    ‚ĒĒ‚ĒÄ‚ĒÄ val/
        ‚Ēú‚ĒÄ‚ĒÄ images/
        ‚ĒĒ‚ĒÄ‚ĒÄ labels/
    
  5. Cria um data.yaml Ficheiro: No diret√≥rio raiz do teu conjunto de dados, cria um ficheiro data.yaml que descreve o conjunto de dados, as classes e outras informa√ß√Ķes necess√°rias.

  6. Otimiza as imagens (opcional): Se quiseres reduzir o tamanho do conjunto de dados para um processamento mais eficiente, podes otimizar as imagens utilizando o código abaixo. Isso não é obrigatório, mas recomendado para tamanhos menores de conjuntos de dados e velocidades de download mais rápidas.
  7. Compacta o conjunto de dados: Comprime toda a pasta do conjunto de dados em um arquivo zip.
  8. Documenta e faz rela√ß√Ķes p√ļblicas: Cria uma p√°gina de documenta√ß√£o descrevendo o teu conjunto de dados e como ele se encaixa na estrutura existente. Depois disso, submete um Pull Request (PR). Consulta Ultralytics Contribution Guidelines para obteres mais detalhes sobre como submeter um PR.

Código de exemplo para otimizar e compactar um conjunto de dados

Optimiza e comprime um conjunto de dados

from pathlib import Path

from ultralytics.data.utils import compress_one_image
from ultralytics.utils.downloads import zip_directory

# Define dataset directory
path = Path("path/to/dataset")

# Optimize images in dataset (optional)
for f in path.rglob("*.jpg"):
    compress_one_image(f)

# Zip dataset into 'path/to/dataset.zip'
zip_directory(path)

Seguindo estes passos, podes contribuir com um novo conjunto de dados que se integra bem na estrutura existente do Ultralytics.



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (9), RizwanMunawar (2), Burhan-Q (1), Laughing-q (1), abirami-vina (1), AyushExel (2)

Coment√°rios