Conjuntos de dados
Os conjuntos de dados da Ultralytics Platform fornecem uma solução simplificada para gerir os teus dados de treino. Após o carregamento, a plataforma processa automaticamente imagens, etiquetas e estatísticas. Um conjunto de dados está pronto a ser utilizado para treino assim que o processamento estiver concluído e este contiver, pelo menos, uma imagem na divisão train, pelo menos uma imagem na divisão val ou test, pelo menos uma imagem com etiquetas e um total de, pelo menos, duas imagens.
Carregar conjunto de dados
A Ultralytics Platform aceita múltiplos formatos de carregamento para maior flexibilidade.
Formatos Suportados
| Formato | Extensões | Notas | Tamanho máximo |
|---|---|---|---|
| JPEG | .jpg, .jpeg | Mais comum, recomendado | 50 MB |
| PNG | .png | Suporta transparência | 50 MB |
| WebP | .webp | Moderno, boa compressão | 50 MB |
| BMP | .bmp | Sem compressão | 50 MB |
| TIFF | .tiff, .tif | Alta qualidade | 50 MB |
| HEIC | .heic | Fotos de iPhone | 50 MB |
| AVIF | .avif | Formato de próxima geração | 50 MB |
| JP2 | .jp2 | JPEG 2000 | 50 MB |
| DNG | .dng | Raw de câmara | 50 MB |
| MPO | .mpo | Objeto multi-imagem | 50 MB |
Preparar o teu conjunto de dados
A plataforma suporta Ultralytics YOLO, COCO, Ultralytics NDJSON e carregamentos raw (sem anotações):
Usa a estrutura de diretório padrão do YOLO com um ficheiro data.yaml:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yamlO ficheiro YAML define a configuração do teu conjunto de dados:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dogRaw: Carrega imagens sem anotações (sem etiquetas). Útil quando planeias anotar diretamente na plataforma usando o editor de anotações.
Também podes carregar imagens sem pastas de divisão explícitas. A plataforma respeita o destino de divisão ativo durante o carregamento e, para conjuntos de dados que não sejam de classificação, poderá criar automaticamente uma divisão de validação a partir de parte do conjunto de treino quando não for fornecida informação de divisão. Podes sempre reatribuir imagens mais tarde com a movimentação em massa para divisões ou redistribuição de divisões.
O formato é detetado automaticamente: conjuntos de dados com um data.yaml contendo chaves names, train ou val são tratados como YOLO. Conjuntos de dados com ficheiros JSON COCO (contendo matrizes de images, annotations e categories) são tratados como COCO. As exportações .ndjson são importadas como Ultralytics NDJSON. Conjuntos de dados apenas com imagens e sem anotações são tratados como raw.
Para detalhes de formatos específicos de tarefas, consulta as tarefas suportadas e a Visão geral dos conjuntos de dados.
Processo de carregamento
- Navega até
Datasetsna barra lateral - Clica em
New Datasetou arrasta ficheiros para a zona de carregamento - Seleciona o tipo de tarefa (consulta as tarefas suportadas)
- Adiciona um nome e uma descrição opcional
- Define a visibilidade (pública ou privada) e uma licença opcional (consulta as licenças disponíveis)
- Clica em
Create

Após o carregamento, a plataforma processa os teus dados através de um pipeline de várias fases:
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff- Validação: Verificações de formato e tamanho
- Normalização: Imagens grandes redimensionadas (máx. 4096px, dimensão mínima 28px)
- Miniaturas: Pré-visualizações WebP de 256px geradas
- Análise de etiquetas: Etiquetas em formato YOLO e COCO extraídas
- Estatísticas: Distribuições de classes e dimensões das imagens calculadas

Validar antes de carregar
Podes validar o teu conjunto de dados localmente antes de o carregares:
from ultralytics.data.utils import check_det_dataset
check_det_dataset("path/to/data.yaml")As imagens devem ter pelo menos 28px no seu lado mais curto. Imagens menores do que isto são rejeitadas durante o processamento. Imagens maiores do que 4096px no seu lado mais longo são automaticamente redimensionadas, mantendo o rácio de aspeto.
Explorar imagens
Visualiza as imagens do teu conjunto de dados em múltiplos layouts.
Abre o painel Clustering a partir da barra de ferramentas da galeria para explorar o teu conjunto de dados como um gráfico de dispersão 2D interativo.
| Visualizar | Descrição |
|---|---|
| Grelha | Grelha de miniaturas com sobreposições de anotações (padrão) |
| Compacto | Miniaturas menores para uma visualização rápida |
| Tabela | Lista com miniatura, nome do ficheiro, dimensões, tamanho, divisão, classes e contagens de etiquetas |

Ordenação e filtragem
As imagens podem ser ordenadas e filtradas para uma exploração eficiente:
| Ordenar | Descrição |
|---|---|
| Mais recentes / Mais antigas | Ordem de carregamento / criação |
| Nome A-Z / Z-A | Ordem alfabética do nome do ficheiro |
| Altura ↑/↓ | Altura da imagem em pixels |
| Largura ↑/↓ | Largura da imagem em pixels |
| Tamanho ↑/↓ | Tamanho do arquivo em disco |
| Anotações ↑/↓ | Contagem de anotações por imagem |
Para conjuntos de dados com mais de 100.000 imagens, as classificações por nome / tamanho / largura / altura são desativadas para manter a galeria responsiva. As classificações por mais novos, mais antigos e contagem de anotações permanecem disponíveis.
Use o filtro de rótulo definido como Unlabeled para encontrar rapidamente imagens que ainda precisam de anotação. Isso é especialmente útil para conjuntos de dados grandes onde você deseja acompanhar o progresso da rotulagem.
Visualizador em tela cheia
Clique em qualquer imagem para abrir o visualizador em tela cheia com:
- Navegação: Teclas de seta ou pré-visualizações em miniatura para navegar
- Metadados: Nome do arquivo, dimensões, selo de divisão, contagem de anotações
- Anotações: Alternar a visibilidade da camada de anotação
- Divisão por classe: Contagens de rótulos por classe com indicadores de cor
- Editar: Entre no modo de anotação para adicionar ou modificar rótulos
- Download: Baixe o arquivo de imagem original
- Excluir: Exclua a imagem do conjunto de dados
- Zoom:
Cmd/Ctrl+Scroll,Cmd/Ctrl++ouCmd/Ctrl+=para aumentar o zoom, eCmd/Ctrl+-para diminuir - Redefinir visualização:
Cmd/Ctrl + 0ou o botão de redefinir para ajustar a imagem ao visualizador - Panorâmica: Mantenha pressionado
Spacee arraste para mover a tela quando estiver com zoom - Visualização de pixel: Alternar renderização pixelada para inspeção detalhada

Filtrar por divisão
Filtre imagens pela divisão do conjunto de dados:
| Divisão | Objetivo |
|---|---|
| Train | Usado para treinamento de modelo |
| Val | Usado para validação durante o treinamento |
| Test | Usado para avaliação final |
Clustering
O painel Clustering projeta seu conjunto de dados em um gráfico de dispersão 2D interativo onde imagens visualmente semelhantes ficam próximas. Use-o para descobrir clusters, detectar duplicatas e valores atípicos, e inspecionar como as divisões ou classes estão distribuídas em seus dados — sem sair da galeria. Abra-o a partir do ícone de gráfico de dispersão na barra de ferramentas da galeria em qualquer página de conjunto de dados.

Executando análise
Inicie uma análise:
- Abra um conjunto de dados e clique no ícone de gráfico de dispersão na barra de ferramentas da galeria
- Clique em
Analyze Dataset - Aguarde a barra de progresso terminar — os resultados aparecem no mesmo painel
A análise é executada em segundo plano e pode levar alguns minutos, dependendo do tamanho do seu conjunto de dados. Você pode fechar o painel ou sair da página e voltar mais tarde.
Visualização
Assim que a análise for concluída, o painel mostra um gráfico de dispersão 2D de todas as imagens analisadas. Os filtros da galeria (divisão, classe, rotulado/não rotulado) escurecem pontos fora do filtro para que você possa se concentrar no subconjunto que lhe interessa.

Colorir por
Altere como os pontos de dados são sombreados com o menu suspenso Color by na barra de ferramentas do painel. Alterne os modos de visualização a qualquer momento — o gráfico é recolorido instantaneamente para que você possa ver como as divisões, classes ou propriedades da imagem estão distribuídas entre seus clusters:
| Opção | Sombreamento |
|---|---|
| Divisões | Treino / Val / Teste |
| Classes | Primeira classe de anotação em cada imagem |
| Largura | Largura da imagem |
| Altura | Altura da imagem |
| Tamanho | Tamanho do arquivo |
| Anotações | Número de anotações por imagem |

Seleção por laço
Desenhe uma seleção de forma livre ao redor de uma região para destacar pontos no gráfico. A galeria filtra as imagens correspondentes, para que você possa inspecionar, renomear, mover ou excluí-las usando as operações de imagem usuais.
Um chip acima do gráfico mostra quantos pontos estão selecionados — clique no × para limpar o laço e retornar à visualização completa da galeria.
Panorâmica e zoom
Navegue por grandes gráficos de dispersão diretamente do seu mouse e teclado:
| Entrada | Ação |
|---|---|
| Scroll | Mova o gráfico em 2D |
| Cmd/Ctrl+Scroll | Aumente ou diminua o zoom, ancorado no cursor |
| Segurar Space | Mudar para o modo arrastar para mover |
Reanalisando
Se o seu conjunto de dados mudar após a análise, um botão Re-analyze aparece na parte superior do painel para proprietários e editores.
Clique em Re-analyze para recalcular os embeddings e a projeção 2D do zero.
Abas do conjunto de dados
Cada página de conjunto de dados pode mostrar até seis guias, dependendo do estado do conjunto de dados e de suas permissões:
Guia Imagens
A visualização padrão que mostra a galeria de imagens com sobreposições de anotação. Suporta modos de visualização em grade, compacto e tabela. Arraste e solte arquivos aqui para adicionar mais imagens.
Guia Classes
Esta guia aparece quando o conjunto de dados possui imagens.
Gerencie as classes de anotação para o seu conjunto de dados:
- Histograma de classe: Gráfico de barras mostrando a contagem de anotações por classe com alternância de escala linear/logarítmica
- Tabela de classe: Tabela classificável e pesquisável com nome da classe, contagem de rótulos e contagem de imagens
- Editar nomes de classe: Clique em qualquer nome de classe para renomeá-lo inline
- Editar cores de classe: Clique em uma amostra de cor para alterar a cor da classe
- Adicionar nova classe: Use a entrada na parte inferior para adicionar classes

Se o seu conjunto de dados tiver desequilíbrio de classes (por exemplo, 10.000 anotações de "pessoa", mas apenas 50 de "bicicleta"), use a alternância Log Scale no histograma de classe para visualizar todas as classes claramente.
Guia Gráficos
Esta guia aparece quando o conjunto de dados possui imagens.
Estatísticas automáticas calculadas a partir do seu conjunto de dados:
| Gráfico | Descrição |
|---|---|
| Distribuição das Divisões | Gráfico de rosca com as contagens de imagens de treino/val/teste e a porcentagem rotulada |
| Principais Classes | Gráfico de rosca das 10 classes de anotação mais frequentes |
| Larguras das Imagens | Histograma da distribuição da largura das imagens com a média |
| Alturas das Imagens | Histograma da distribuição da altura das imagens com a média |
| Pontos por Instância | Contagem de vértices de polígono ou keypoints por anotação (segment/pose) |
| Locais das Anotações | Mapa de calor 2D das posições centrais das bbox |
| Dimensões das Imagens | Mapa de calor 2D de largura vs. altura com linhas guia de proporção |

As estatísticas são armazenadas em cache por 5 minutos. Alterações nas anotações serão refletidas após a expiração do cache.
Clique no botão de expandir em qualquer mapa de calor para vê-lo em modo de tela cheia. Isso oferece uma visualização maior e mais detalhada — útil para entender padrões espaciais em grandes conjuntos de dados.
Guia Modelos
Veja todos os modelos treinados neste conjunto de dados em uma tabela pesquisável:
| Coluna | Descrição |
|---|---|
| Nome | Nome do modelo com link |
| Projeto | Projeto pai com ícone |
| Status | Status do treinamento (badge) |
| Tarefa | Tipo de tarefa YOLO |
| Épocas | Melhor época / total de épocas |
| mAP50-95 | Precisão média (mean average precision) |
| mAP50 | mAP com IoU 0.50 |
| Criado | Data de criação |

Guia Erros
Esta guia aparece apenas quando um ou mais arquivos falham no processamento.
Imagens que falharam no processamento são listadas aqui com:
- Banner de erro: Contagem total de imagens com falha e orientações
- Tabela de erros: Nome do arquivo, descrição de erro amigável, dicas de correção e miniatura de pré-visualização
- Erros comuns incluem arquivos corrompidos, formatos não suportados, imagens muito pequenas (mínimo 28px) e modos de cor não suportados

Erros de Processamento Comuns
| Erro | Causa | Correção |
|---|---|---|
| Não foi possível ler o arquivo de imagem | Formato corrompido ou não suportado | Exporte novamente a partir do editor de imagens |
| Incompleto ou corrompido | O arquivo foi truncado durante a transferência | Baixe novamente o arquivo original |
| Imagem muito pequena | Dimensão mínima abaixo de 28px | Use imagens de origem com resolução maior |
| Modo de cor não suportado | CMYK ou modo de cor indexado | Converta para o modo RGB |
Guia Versões
Crie snapshots NDJSON imutáveis do seu conjunto de dados para um treinamento reprodutível. Cada versão captura contagens de imagens, classes, anotações e tamanho do arquivo no momento da criação.
| Coluna | Descrição |
|---|---|
| Versão | Número da versão (v1, v2, ...) |
| Descrição | Descrição fornecida pelo usuário (editável) |
| Imagens | Contagem de imagens no momento do snapshot |
| Classes | Contagem de classes no momento do snapshot |
| Anotações | Contagem de anotações no momento do snapshot |
| Tamanho | Tamanho do arquivo de exportação NDJSON |
| Criado | Quando a versão foi criada |
Para criar uma versão:
- Abra a guia Versões
- Opcionalmente, insira uma descrição (por exemplo, "Adicionado 500 imagens de treino" ou "Corrigido classes com rótulos errados")
- Clique em + Nova Versão
- A nova versão aparece na tabela
- Baixe a versão separadamente da tabela quando necessário
Cada versão é numerada sequencialmente (v1, v2, v3...) e armazenada permanentemente. Você pode baixar qualquer versão anterior a qualquer momento a partir da tabela de versões.
A criação de versões está disponível após o conjunto de dados atingir o status ready.
Crie uma versão antes e depois de grandes alterações no seu conjunto de dados — adicionar imagens, corrigir anotações ou rebalancear divisões. Isso permite comparar o desempenho do modelo entre diferentes estados do conjunto de dados.
O tamanho mostrado é o do arquivo de exportação NDJSON, que contém URLs de imagens e anotações — não as imagens em si. Os dados reais das imagens são armazenados separadamente e acessados via URLs assinadas.
Exportar Conjunto de Dados
Exporte seu conjunto de dados para uso offline com um download NDJSON a partir do cabeçalho do conjunto de dados ou da guia Versões.
Para exportar:
- Clique no botão Exportar no cabeçalho do conjunto de dados
- Baixe o snapshot NDJSON atual diretamente
- Use a guia Versões quando quiser um snapshot numerado imutável que você possa baixar novamente mais tarde

O formato NDJSON armazena um objeto JSON por linha. A primeira linha contém metadados do conjunto de dados, seguida por uma linha por imagem:
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}As URLs das imagens no NDJSON exportado são assinadas e válidas por 7 dias. Se precisar de URLs novas, exporte o conjunto de dados novamente ou crie uma nova versão.
Consulte a documentação do formato Ultralytics NDJSON para a especificação completa.
Operações de Imagem
Ações Rápidas
Clique com o botão direito em qualquer imagem na visualização Grade ou Compacta para acessar ações rápidas:
| Ação | Descrição |
|---|---|
| Mover para Divisão | Reatribua a imagem para a divisão de Treino, Validação ou Teste |
| Download | Baixe o arquivo de imagem original |
| Excluir | Exclua a imagem do conjunto de dados |

O menu de contexto da imagem opera em uma única imagem. Para operações em massa em várias imagens, use a visualização de Tabela com seleção por caixa de seleção.
Mover divisão em massa
Reatribua as imagens selecionadas para uma divisão diferente dentro do mesmo conjunto de dados:
- Mude para a visualização de Tabela
- Selecione as imagens usando as caixas de seleção
- Clique com o botão direito para abrir o menu de contexto
- Escolha
Move to split> Treino, Validação ou Teste
Você também pode arrastar e soltar imagens nas abas de filtro de divisão na visualização de grade.
Faça o upload de todas as imagens para um conjunto de dados e, em seguida, use a movimentação de divisão em massa para organizar subconjuntos em divisões de treino, validação e teste.
Redistribuição de divisão
Redistribua todas as imagens entre as divisões de treino, validação e teste usando proporções personalizadas:
- Clique na barra de divisão na barra de ferramentas do conjunto de dados para abrir a caixa de diálogo Redistribuir Divisões
- Ajuste as porcentagens de divisão usando qualquer um dos métodos abaixo
- Revise a prévia da contagem de imagens ao vivo para confirmar a distribuição
- Clique em Aplicar para reatribuir aleatoriamente todas as imagens de acordo com suas porcentagens

A caixa de diálogo oferece três maneiras de definir suas proporções de divisão de destino:
| Método | Descrição |
|---|---|
| Arrastar | Arraste as alças entre os segmentos coloridos para ajustar visualmente os limites das divisões |
| Digitar | Edite a entrada de porcentagem para qualquer divisão (as outras duas divisões são reequilibradas proporcionalmente) |
| Auto | Um clique para definir instantaneamente uma divisão 80/20 de treino/validação com a divisão de teste definida como 0% |
Uma prévia ao vivo mostra exatamente quantas imagens terminarão em cada divisão antes de você aplicar.
Clique no botão Auto para definir instantaneamente a divisão de treino/validação de 80/20 recomendada. Esta é a proporção mais comum para treinamento.
Excluir em massa
Exclua várias imagens de uma vez:
- Selecione imagens na visualização de tabela
- Clique com o botão direito e escolha
Delete - Confirme a exclusão
URI do conjunto de dados
Faça referência aos conjuntos de dados da Plataforma usando o formato de URI ul:// (veja Usando Conjuntos de Dados da Plataforma):
ul://username/datasets/dataset-slug
Use este URI para treinar modelos de qualquer lugar:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100O URI ul:// funciona a partir de qualquer ambiente:
- Máquina local: Treine no seu hardware, dados baixados automaticamente
- Google Colab: Acesse seus conjuntos de dados da Plataforma em notebooks
- Servidores remotos: Treine em máquinas virtuais na nuvem com acesso total ao conjunto de dados
Licenças Disponíveis
A Plataforma suporta as seguintes licenças para conjuntos de dados:
| Licença | Tipo |
|---|---|
| Nenhuma | Nenhuma licença selecionada |
| CC0-1.0 | Domínio público |
| CC-BY-2.5 | Permissiva |
| CC-BY-4.0 | Permissiva |
| CC-BY-SA-4.0 | Copyleft |
| CC-BY-NC-4.0 | Não comercial |
| CC-BY-NC-SA-4.0 | Copyleft |
| CC-BY-ND-4.0 | Sem derivativos |
| CC-BY-NC-ND-4.0 | Não comercial |
| Apache-2.0 | Permissiva |
| MIT | Permissiva |
| AGPL-3.0 | Copyleft |
| GPL-3.0 | Copyleft |
| Somente pesquisa | Restrita |
| Outra | Personalizado |
Ao clonar um conjunto de dados com uma licença copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0), o clone herda a licença e o seletor de licença é bloqueado.
Configurações de visibilidade
Controle quem pode ver seu conjunto de dados:
| Configuração | Descrição |
|---|---|
| Privado | Apenas você pode acessar |
| Público | Qualquer pessoa pode visualizar na página Explorar |
A visibilidade é definida ao criar um conjunto de dados na caixa de diálogo New Dataset usando um botão de alternância. Conjuntos de dados públicos são visíveis na página Explorar.
Editar conjunto de dados
Os metadados do conjunto de dados são editados inline diretamente na página do conjunto de dados — nenhuma caixa de diálogo necessária:
- Nome: Clique no nome do conjunto de dados para editá-lo. As alterações são salvas automaticamente ao desfocar ou pressionar
Enter. - Descrição: Clique na descrição (ou no espaço reservado "Add a description...") para editar. As alterações são salvas automaticamente.
- Tipo de tarefa: Clique no selo da tarefa para selecionar um tipo de tarefa diferente.
- Licença: Clique no seletor de licença para alterar a licença do conjunto de dados.
Cada imagem armazena anotações para todos os tipos de tarefa juntos. Alterar o tipo de tarefa do conjunto de dados controla quais anotações são visíveis no editor e incluídas em exportações e treinamentos. As anotações para outros tipos de tarefa são preservadas no banco de dados e reaparecem quando você alterna de volta.
Clonar conjunto de dados
Ao visualizar um conjunto de dados público que você não possui, clique em Clone Dataset para criar uma cópia no seu espaço de trabalho. O clone inclui todas as imagens, anotações e definições de classe. Se o conjunto de dados original tiver uma licença copyleft, o clone a herda e o seletor de licença é bloqueado.
Favoritar e compartilhar
- Favoritar: Clique no botão de estrela para marcar um conjunto de dados. A contagem de estrelas é visível para todos os usuários.
- Compartilhar: Para conjuntos de dados públicos, clique no botão de compartilhar para copiar um link ou compartilhar em plataformas sociais.
Excluir conjunto de dados
Exclua um conjunto de dados que você não precisa mais:
- Abra o menu de ações do conjunto de dados
- Clique em
Delete - Confirme na caixa de diálogo: "Isso moverá [name] para a lixeira. Você pode restaurá-lo em até 30 dias."
Conjuntos de dados excluídos são movidos para a Lixeira — não são excluídos permanentemente. Você pode restaurá-los em até 30 dias em Settings > Trash.
Treinar no conjunto de dados
Comece o treinamento diretamente do seu conjunto de dados:
- Clique em
New Modelna página do conjunto de dados - Selecione um projeto ou crie um novo
- Configure os parâmetros de treinamento
- Iniciar treinamento
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fffVeja Treinamento em nuvem para detalhes.
FAQ
O que acontece com meus dados após o upload?
Seus dados são processados e armazenados na região selecionada (EUA, UE ou AP). As imagens são:
- Validadas quanto ao formato e tamanho
- Rejeitadas se a dimensão mínima for inferior a 28px
- Normalizadas se forem maiores que 4096px (preservando a proporção; codificadas para armazenamento otimizado)
- Armazenadas usando Content-Addressable Storage (CAS) com hash XXH3-128
- Miniaturas geradas em WebP de 256px para navegação rápida
Como o armazenamento funciona?
A Ultralytics Platform usa Content-Addressable Storage (CAS) para armazenamento eficiente:
- Deduplicação: Imagens idênticas enviadas por usuários diferentes são armazenadas apenas uma vez
- Integridade: O hash XXH3-128 garante a integridade dos dados
- Eficiência: Reduz custos de armazenamento e acelera o processamento
- Regional: Os dados permanecem na região selecionada (EUA, UE ou AP)
Posso adicionar imagens a um conjunto de dados existente?
Sim, arraste e solte arquivos na página do conjunto de dados ou use o botão de upload para adicionar imagens extras. Novas estatísticas serão calculadas automaticamente.
Como movo imagens entre divisões (splits)?
Use o recurso de mover em massa para divisão:
- Selecione imagens na visualização de tabela
- Clique com o botão direito e escolha
Move to split - Selecione a divisão de destino (Train, Validation ou Test)
Quais formatos de rótulo são suportados?
A Ultralytics Platform suporta rótulos YOLO, COCO JSON, Ultralytics NDJSON e uploads de imagens brutas:
Um arquivo .txt por imagem com coordenadas normalizadas (intervalo de 0-1):
| Tarefa | Formato | Exemplo |
|---|---|---|
| Detectar | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| Segmentar | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| Pose | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| Classificar | Estrutura de diretórios | train/cats/, train/dogs/ |
Flags de visibilidade de pose: 0=não rotulado, 1=rotulado mas ocluído, 2=rotulado e visível.
Posso anotar o mesmo conjunto de dados para vários tipos de tarefa?
Sim. Cada imagem armazena anotações para todos os 5 tipos de tarefa (detect, segment, pose, OBB, classify) juntas. Você pode alternar o tipo de tarefa ativa do conjunto de dados a qualquer momento sem perder as anotações existentes. Apenas as anotações que correspondem ao tipo de tarefa ativa são mostradas no editor e incluídas nas exportações e no treinamento — as anotações para outras tarefas são preservadas e reaparecem quando você volta a alternar.