Ir para o conteúdo

Conjuntos de dados

Os conjuntos de dados Ultralytics oferecem uma solução simplificada para gerir os seus dados de treino. Depois de carregados, os conjuntos de dados podem ser usados imediatamente para o treino de modelos, com processamento automático e geração de estatísticas.


Assista: Carregar conjuntos de dados para Ultralytics

Fazer Upload do Conjunto de Dados

Ultralytics aceita vários formatos de upload para maior flexibilidade:

FormatoDescrição
ImagensFicheiros de imagem individuais (JPG, PNG, WebP, TIFF, RAW)
Arquivo ZIPPasta compactada com imagens e etiquetas opcionais
VídeoArquivos MP4, AVI - fotogramas extraídos a ~1 fps
YOLOEstrutura YOLO padrão com rótulos

Extração de quadros de vídeo

Ao carregar vídeos, os fotogramas são extraídos automaticamente:

  • Taxa de fotogramas: ~1 fotograma por segundo
  • Número máximo de fotogramas: 100 fotogramas por vídeo
  • Processamento: extração no lado do cliente antes do upload
  • Formato: Quadros convertidos para o formato de imagem padrão

Isto é ideal para criar conjuntos de dados de treino a partir de imagens de vigilância, gravações de ação ou qualquer fonte de vídeo.

Preparando o seu conjunto de dados

Para conjuntos de dados rotulados, use o YOLO padrão:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

O ficheiro YAML define a configuração do seu conjunto de dados:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Processo de upload

  1. Navegue até Conjuntos de dados na barra lateral
  2. Clique em Carregar conjunto de dados ou arraste os ficheiros para a zona de carregamento
  3. Selecione o tipo de tarefa (detect, segment, pose, OBB, classify)
  4. Adicione um nome e uma descrição opcional
  5. Clique em Carregar

Após o upload, a Plataforma processa os seus dados:

  1. Normalização: imagens grandes redimensionadas (máximo 4096 px)
  2. Miniaturas: pré-visualizações de 256 px geradas
  3. Análise de rótulos: rótulos YOLO extraídos
  4. Estatísticas: Distribuições de classes calculadas
Validar antes de carregar

Pode validar o seu conjunto de dados localmente antes de fazer o upload:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Navegar pelas imagens

Visualize as imagens do seu conjunto de dados em vários layouts:

VisualizarDescrição
GrelhaGrelha de miniaturas com sobreposições de anotações
CompactoMiniaturas menores para uma visualização rápida
TabelaLista com nome do ficheiro, dimensões e contagem de etiquetas

Visualizador em ecrã inteiro

Clique em qualquer imagem para abrir o visualizador em ecrã inteiro com:

  • Navegação: Teclas de seta ou clique para navegar
  • Metadados: Nome do ficheiro, dimensões, divisão, contagem de etiquetas
  • Anotações: Alternar visibilidade das anotações
  • Discriminação por classe: contagem de rótulos por classe

Filtrar por divisão

Filtrar imagens pela divisão do conjunto de dados:

DivisãoPropósito
TreinarUsado para treinar modelos
ValidarUtilizado para validação durante o treino
TesteUtilizado para avaliação final
DesconhecidoSem divisão atribuída

Estatísticas do conjunto de dados

A guia Estatísticas fornece uma análise automática do seu conjunto de dados:

Distribuição de classes

Gráfico de barras mostrando o número de anotações por classe:

Mapa de calor de localização

Visualização de onde as anotações aparecem nas imagens:

Análise dimensional

Gráfico de dispersão das dimensões da imagem (largura vs. altura):

Cache de estatísticas

As estatísticas são armazenadas em cache por 5 minutos. As alterações nas anotações serão refletidas após o cache expirar.

Exportar conjunto de dados

Exporte o seu conjunto de dados no formato NDJSON para utilização offline:

  1. Abra o menu de ações do conjunto de dados
  2. Clique em Exportar
  3. Descarregue o ficheiro NDJSON

O formato NDJSON armazena um objeto JSON por linha:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

Consulte a documentação do formatoUltralytics para obter as especificações completas.

URI do conjunto de dados

Conjuntos de dados da plataforma de referência utilizando o ul:// Formato URI:

ul://username/datasets/dataset-slug

Use este URI para treinar modelos em qualquer lugar:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100

Treine em qualquer lugar com os dados da plataforma

O ul:// O URI funciona em qualquer ambiente:

  • Máquina local: Treine no seu hardware, os dados são descarregados automaticamente
  • Google : Aceda aos seus conjuntos de dados da Plataforma em cadernos
  • Servidores remotos: treine em máquinas virtuais na nuvem com acesso total ao conjunto de dados

Definições de visibilidade

Controle quem pode ver o seu conjunto de dados:

ConfigurandoDescrição
PrivadoSó você pode aceder
PúblicoQualquer pessoa pode visualizar na página Explorar

Para alterar a visibilidade:

  1. Abrir menu de ações do conjunto de dados
  2. Clique em Editar
  3. Alternar configuração de visibilidade
  4. Clique em Guardar

Editar Conjunto de Dados

Atualizar nome, descrição ou visibilidade do conjunto de dados:

  1. Abrir menu de ações do conjunto de dados
  2. Clique em Editar
  3. Fazer alterações
  4. Clique em Guardar

Excluir Conjunto de Dados

Elimine um conjunto de dados que já não precisa:

  1. Abrir menu de ações do conjunto de dados
  2. Clique em Excluir
  3. Confirmar eliminação

Lixeira e Restaurar

Os conjuntos de dados eliminados são movidos para a Lixeira por 30 dias. Pode restaurá-los a partir da página Lixeira em Definições.

Treinar no conjunto de dados

Comece a treinar diretamente a partir do seu conjunto de dados:

  1. Clique em Modelo de comboio na página do conjunto de dados
  2. Selecione um projeto ou crie um novo
  3. Configurar os parâmetros de treino
  4. Comece a treinar

Consulte Formação em nuvem para obter mais detalhes.

FAQ

O que acontece aos meus dados após o upload?

Os seus dados são processados e armazenados na região selecionada (EUA, UE ou AP). As imagens são:

  1. Validado quanto ao formato e tamanho
  2. Normalizado se maior que 4096px (preservando a proporção da imagem)
  3. Armazenado usando armazenamento endereçável por conteúdo (CAS) com hash SHA-256
  4. Miniaturas geradas a 256 px para uma navegação rápida
  5. Nunca partilhado sem a sua permissão

Como funciona o armazenamento?

Ultralytics utiliza armazenamento endereçável por conteúdo (CAS) para um armazenamento eficiente:

  • Desduplicação: imagens idênticas carregadas por diferentes utilizadores são armazenadas apenas uma vez.
  • Integridade: o hash SHA-256 garante a integridade dos dados
  • Eficiência: Reduz os custos de armazenamento e acelera o processamento
  • Regional: os dados permanecem na região selecionada (EUA, UE ou AP)

Posso adicionar imagens a um conjunto de dados existente?

Sim, utilize o botão Adicionar imagens na página do conjunto de dados para carregar imagens adicionais. Novas estatísticas serão calculadas automaticamente.

Como posso mover imagens entre conjuntos de dados?

Use o recurso de seleção em massa:

  1. Selecione imagens na galeria
  2. Clique em Mover ou Copiar
  3. Selecione o conjunto de dados de destino

Que formatos de etiquetas são suportados?

Ultralytics suporta rótulos YOLO :

  • Detectar: class_id x_center y_center width height
  • Segmentar: class_id x1 y1 x2 y2 ... (pontos poligonais)
  • Pose: class_id x_center y_center width height kp1_x kp1_y kp1_v ...
  • OBB: class_id x1 y1 x2 y2 x3 y3 x4 y4

Todas as coordenadas são normalizadas (intervalo 0-1).



📅 Criado há 0 dias ✏️ Atualizado há 0 dias
glenn-jocher

Comentários