Ir para o conteúdo

Preparação de Dados

A preparação de dados é a base para modelos de visão computacional bem-sucedidos. A Ultralytics Platform oferece ferramentas abrangentes para gerir os seus dados de treino, desde o carregamento e anotação até à análise.

Visão geral

A secção de Dados da Ultralytics Platform ajuda-o a:

  • Carregue imagens, vídeos e arquivos (ZIP, TAR, GZ)
  • Anote com ferramentas de desenho manuais e etiquetagem inteligente SAM
  • Analisar os seus dados com estatísticas e visualizações
  • Exportar no formato NDJSON para formação local

Visão geral dos dados Ultralytics Barra lateral Conjuntos de dados

Fluxo de Trabalho

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
EtapaDescrição
CarregarImporte imagens, vídeos ou arquivos com processamento automático
AnotarRotule dados com caixas delimitadoras, polígonos, pontos-chave ou classificações
AnalisarVisualize distribuições de classes, mapas de calor espaciais e estatísticas de dimensão
ExportarDescarregar no formato NDJSON para utilização offline

Tarefas Suportadas

A Plataforma Ultralytics suporta todos os 5 tipos de tarefas YOLO:

TarefaDescriçãoFerramenta de Anotação
DetectarDetecção de objetos com caixas delimitadorasFerramenta de Retângulo
SegmentarSegmentação de instâncias com máscaras de pixelFerramenta de Polígono
PoseEstimativa de pontos-chave (formato COCO de 17 pontos)Ferramenta de Pontos-chave
OBBCaixas delimitadoras orientadas para objetos rotacionadosFerramenta de Caixa Orientada
ClassificarClassificação ao nível da imagemSeletor de Classe

Seleção do tipo de tarefa

O tipo de tarefa é definido ao criar um conjunto de dados e determina quais ferramentas de anotação estão disponíveis. Pode alterá-lo posteriormente nas definições do conjunto de dados, mas as anotações incompatíveis não serão exibidas após a alteração.

Principais Características

Armazenamento Inteligente

Ultralytics utiliza armazenamento endereçável por conteúdo (CAS) para uma gestão eficiente dos dados:

  • Desduplicação: imagens idênticas armazenadas apenas uma vez através do hash XXH3-128
  • Integridade: o endereçamento baseado em hash garante a integridade dos dados
  • Eficiência: Armazenamento otimizado e processamento rápido

URIs de Conjuntos de Dados

Conjuntos de dados de referência utilizando o ul:// Formato URI (ver Utilizar Conjuntos de Dados da Plataforma):

yolo train data=ul://username/datasets/my-dataset

Isso permite o treinamento nos conjuntos de dados da plataforma a partir de qualquer máquina com a sua chave API configurada.

Utilizar dados da plataforma a partir do Python

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Guias do conjunto de dados

Cada página de conjunto de dados apresenta cinco separadores:

TabDescrição
ImagensNavegue pelas imagens em visualização em grelha, compacta ou tabela com sobreposições de anotações
AulasVisualizar e editar nomes de classes, cores e contagens de rótulos por classe
GráficosEstatísticas automáticas: distribuição dividida, contagem de classes, mapas de calor
ModelosModelos treinados neste conjunto de dados com métricas e status
ErrosImagens cujo processamento falhou, com detalhes do erro e orientações para correção

Estatísticas e Visualização

O Charts A guia fornece análise automática, incluindo:

  • Distribuição dividida: gráfico de rosca com contagem de imagens de treino/validação/teste
  • Classes principais: gráfico circular das classes de anotação mais frequentes
  • Larguras das imagens: Histograma da distribuição da largura das imagens
  • Alturas da imagem: Histograma da distribuição da altura da imagem
  • Pontos por instância: Distribuição do número de vértices poligonais ou pontos-chave (conjuntos de dadossegment)
  • Localizações das anotações: mapa de calor 2D das posições centrais das caixas delimitadoras
  • Dimensões da imagem: mapa de calor 2D de largura vs. altura com linhas-guia de proporção

FAQ

Que formatos de ficheiro são suportados para carregamento?

A Ultralytics Platform suporta:

Imagens: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (máximo de 50 MB cada)

Vídeos: MP4, WebM, MOV, AVI, MKV, M4V (máximo de 1 GB, fotogramas extraídos a 1 FPS, máximo de 100 fotogramas)

Arquivos: ZIP, TAR, TAR.GZ, TGZ, GZ (máximo de 10 GB) contendo imagens com rótulos opcionais YOLO

Qual é o tamanho máximo do conjunto de dados?

Os limites de armazenamento dependem do seu plano:

PlanoLimite de Armazenamento
Gratuito100 GB
Pro500 GB
EmpresarialPersonalizado

Limites individuais de ficheiros: Imagens 50 MB, Vídeos 1 GB, Arquivos 10 GB

Posso usar meus conjuntos de dados da Plataforma para treinamento local?

Sim! Use o formato URI do conjunto de dados para treinar localmente:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Ou exporte o seu conjunto de dados no formato NDJSON para um treino totalmente offline.



📅 Criado há 1 mês ✏️ Atualizado há 4 dias
glenn-jochersergiuwaxmann

Comentários