Link to this sectionEstratégias de Coleta e Anotação de Dados para Visão Computacional#

A coleta e a anotação de dados são as duas etapas fundamentais de qualquer projeto de visão computacional: você reúne imagens ou vídeos representativos e, em seguida, os rotula para que um modelo possa aprender com eles. A qualidade desses dados determina diretamente o desempenho do modelo, e é por isso que a definição de classes, o fornecimento imparcial e a anotação consistente são importantes antes mesmo de qualquer treinamento começar.

Watch: How to Build Effective Data Collection and Annotation Strategies for Computer Vision 🚀

Este guia aborda a configuração de classes e a coleta de dados, o que é anotação de dados, juntamente com os tipos e formatos de anotação a serem escolhidos, e estratégias de rotulagem eficientes — cada decisão alinhada aos objetivos do seu projeto.

Link to this sectionConfigurando Classes e Coletando Dados#

A coleta de imagens e vídeos para um projeto de visão computacional se resume a três decisões: quantas classes definir, onde obter os dados e como manter o conjunto de dados livre de vieses.

Link to this sectionEscolhendo as Classes Certas para o Seu Projeto#

Uma das primeiras perguntas ao iniciar um projeto de visão computacional é quantas classes incluir. Você precisa determinar a filiação à classe, o que envolve as diferentes categorias ou rótulos que você deseja que seu modelo reconheça e diferencie. O número de classes deve ser determinado pelos objetivos específicos do seu projeto.

Por exemplo, se você quiser monitorar o tráfego, suas classes podem incluir "carro", "caminhão", "ônibus", "motocicleta" e "bicicleta". Por outro lado, para rastrear itens em uma loja, suas classes poderiam ser "frutas", "vegetais", "bebidas" e "lanches". Definir classes com base nos objetivos do seu projeto ajuda a manter seu conjunto de dados relevante e focado.

Ao definir suas classes, outra distinção importante a fazer é escolher entre contagens de classes amplas ou granulares. 'Contagem' refere-se ao número de classes distintas nas quais você está interessado. Essa decisão influencia a granularidade dos seus dados e a complexidade do seu modelo. Aqui estão as considerações para cada abordagem:

Contagem de Classes Ampla: Estas são categorias mais abrangentes e inclusivas, como "veículo" e "não-veículo". Elas simplificam a anotação e exigem menos recursos computacionais, mas fornecem informações menos detalhadas, podendo limitar a eficácia do modelo em cenários complexos.
Contagem de Classes Granular: Mais categorias com distinções mais refinadas, como "sedã", "SUV", "caminhonete" e "motocicleta". Elas capturam informações mais detalhadas, melhorando a precisão e o desempenho do modelo. No entanto, elas são mais demoradas e trabalhosas para anotar e exigem mais recursos computacionais.

Começar com classes mais específicas pode ser muito útil, especialmente em projetos complexos onde os detalhes são importantes. Classes mais específicas permitem que você colete dados mais detalhados, obtenha insights mais profundos e estabeleça distinções mais claras entre as categorias. Isso não só melhora a precisão do modelo, mas também torna mais fácil ajustar o modelo posteriormente, se necessário, economizando tempo e recursos.

Link to this sectionFontes de Dados#

Você pode usar conjuntos de dados públicos ou reunir seus próprios dados personalizados. Conjuntos de dados públicos, como os do Kaggle e do Google Dataset Search Engine, oferecem dados bem anotados e padronizados, tornando-os ótimos pontos de partida para treinar e validar modelos.

A coleta de dados personalizados, por outro lado, permite que você adapte seu conjunto de dados às suas necessidades específicas. Você pode capturar imagens e vídeos com câmeras ou drones, coletar imagens da web ou usar dados internos existentes da sua organização. Dados personalizados dão a você mais controle sobre sua qualidade e relevância. Combinar fontes de dados públicas e personalizadas ajuda a criar um conjunto de dados diversificado e abrangente.

Link to this sectionEvitando Vieses na Coleta de Dados#

O viés ocorre quando certos grupos ou cenários são sub-representados ou super-representados no seu conjunto de dados. Isso leva a um modelo que tem um bom desempenho em alguns dados, mas um desempenho ruim em outros. É crucial evitar vieses em IA para que seu modelo de visão computacional possa ter um bom desempenho em uma variedade de cenários.

Veja como você pode evitar vieses durante a coleta de dados:

Fontes Diversificadas: Colete dados de muitas fontes para capturar diferentes perspectivas e cenários.
Representação Equilibrada: Inclua uma representação equilibrada de todos os grupos relevantes. Por exemplo, considere diferentes idades, gêneros e etnias.
Monitoramento Contínuo: Revise e atualize regularmente seu conjunto de dados para identificar e tratar quaisquer vieses emergentes.
Técnicas de Mitigação de Viés: Use métodos como superamostragem de classes sub-representadas, aumento de dados e algoritmos conscientes de justiça.

Seguir essas práticas ajuda a criar um modelo mais robusto e justo que pode ser bem generalizado em aplicações do mundo real.

Link to this sectionO que é Anotação de Dados?#

A anotação de dados é o processo de rotular dados para torná-los utilizáveis para o treinamento de modelos de aprendizado de máquina. Em visão computacional, isso significa rotular imagens ou vídeos com as informações que um modelo precisa para aprender. Sem dados adequadamente anotados, os modelos não conseguem aprender com precisão as relações entre entradas e saídas.

Link to this sectionTipos de Anotação de Dados#

Dependendo dos requisitos específicos de uma tarefa de visão computacional, existem diferentes tipos de anotação de dados. Aqui estão alguns exemplos:

Caixas Delimitadoras (Bounding Boxes): Caixas retangulares desenhadas ao redor de objetos em uma imagem, usadas principalmente para tarefas de detecção de objetos. Essas caixas são definidas pelas suas coordenadas superior esquerda e inferior direita.
Polígonos: Contornos detalhados para objetos, permitindo uma anotação mais precisa do que as caixas delimitadoras. Os polígonos são usados em tarefas como segmentação de instância, onde a forma do objeto é importante.
Máscaras: Máscaras binárias onde cada pixel é parte de um objeto ou do fundo. As máscaras são usadas em tarefas de segmentação semântica para fornecer detalhes em nível de pixel.
Pontos-Chave (Keypoints): Pontos específicos marcados dentro de uma imagem para identificar locais de interesse. Os pontos-chave são usados em tarefas como estimativa de pose e detecção de pontos de referência faciais.

Data annotation types including bounding boxes, polygons, and masks

Link to this sectionFormatos Comuns de Anotação#

Após selecionar um tipo de anotação, é importante escolher o formato apropriado para armazenar e compartilhar as anotações. Os formatos mais comuns são:

Formato	Estrutura de arquivo	Comumente usado para
COCO	Arquivo JSON único	Detecção de objetos, segmentação de instâncias, detecção de pontos-chave, segmentação de objetos e segmentação panóptica, legendagem de imagens
Pascal VOC	Um arquivo XML por imagem	Detecção de objetos
YOLO	Um arquivo `.txt` por imagem	Detecção de objetos, segmentação e pose

O formato YOLO armazena uma linha por objeto com índices de classe começando em 0. Para detecção de objetos, a linha é class x_center y_center width height com coordenadas normalizadas de 0 a 1, enquanto a segmentação acrescenta pontos de polígono normalizados e a pose acrescenta coordenadas de pontos-chave mais valores de visibilidade opcionais após a caixa.

Link to this sectionDefinindo diretrizes de anotação#

Com um tipo de anotação e formato escolhidos, o próximo passo é estabelecer regras de rotulagem claras e objetivas. Essas regras funcionam como um roteiro para consistência e precisão durante todo o processo de anotação. Aspectos importantes dessas regras incluem:

Clareza e Detalhe: Certifique-se de que suas instruções sejam claras. Use exemplos e ilustrações para mostrar o que é esperado.
Consistência: Mantenha suas anotações uniformes. Defina critérios padrão para anotar diferentes tipos de dados, para que todas as anotações sigam as mesmas regras.
Redução de Viés: Mantenha-se neutro. Treine a si mesmo para ser objetivo e minimizar vieses pessoais para garantir anotações justas.
Eficiência: Trabalhe de forma mais inteligente, não mais árdua. Use ferramentas e fluxos de trabalho que automatizem tarefas repetitivas, tornando o processo de anotação mais rápido e eficiente.

Revisar e atualizar regularmente suas regras de rotulagem ajudará a manter suas anotações precisas, consistentes e alinhadas com os objetivos do seu projeto.

Link to this sectionFerramentas de Anotação#

Uma boa ferramenta de anotação permite rotular cada tipo que sua tarefa precisa, aplica diretrizes consistentes e exporta rótulos em um formato pronto para treinamento. A Plataforma Ultralytics fornece um editor de anotação integrado que cobre detecção, segmentação de instâncias, pose, OBB e classificação, com anotação inteligente baseada em SAM que transforma um único clique em uma máscara para tarefas de detecção, segmentação e OBB. Como cada anotação é salva no formato YOLO, seu conjunto de dados rotulado vai direto para o treinamento sem etapas de conversão.

Link to this sectionQualidade da anotação: acurácia, precisão e outliers#

Antes de anotar em grande escala, ajuda entender a acurácia, a precisão, os outliers e o controle de qualidade, para que você não rotule seus dados de uma forma contraproducente.

Link to this sectionCompreendendo a Precisão e a Exatidão#

É importante entender a diferença entre precisão e exatidão e como isso se relaciona com a anotação. A precisão (accuracy) refere-se a quão próximos os dados anotados estão dos valores reais. Ela nos ajuda a medir o quanto os rótulos refletem os cenários do mundo real. A exatidão (precision) indica a consistência das anotações. Ela verifica se você está atribuindo o mesmo rótulo ao mesmo objeto ou recurso em todo o conjunto de dados. Alta precisão e exatidão levam a modelos melhor treinados, reduzindo o ruído e melhorando a capacidade do modelo de generalizar a partir dos dados de treinamento.

Accuracy vs precision comparison for data annotation

Link to this sectionIdentificando Valores Atípicos#

Valores atípicos são pontos de dados que divergem significativamente de outras observações no conjunto de dados. Com relação às anotações, um valor atípico pode ser uma imagem rotulada incorretamente ou uma anotação que não se encaixa no resto do conjunto de dados. Valores atípicos são preocupantes porque podem distorcer o processo de aprendizado do modelo, levando a previsões imprecisas e má generalização.

Você pode usar vários métodos para detectar e corrigir valores atípicos:

Técnicas Estatísticas: Para detectar valores atípicos em recursos numéricos, como valores de pixel, coordenadas de caixa delimitadora ou tamanhos de objeto, você pode usar métodos como diagramas de caixa (box plots), histogramas ou pontuações z.
Técnicas Visuais: Para detectar anomalias em recursos categóricos, como classes de objetos, cores ou formas, use métodos visuais como plotagem de imagens, rótulos ou mapas de calor.
Métodos Algorítmicos: Use ferramentas como agrupamento (ex: agrupamento K-means, DBSCAN) e algoritmos de detecção de anomalias para identificar valores atípicos com base em padrões de distribuição de dados.

Link to this sectionControle de Qualidade de Dados Anotados#

Assim como em outros projetos técnicos, o controle de qualidade é obrigatório para dados anotados. É uma boa prática verificar regularmente as anotações para garantir que elas sejam precisas e consistentes. Isso pode ser feito de algumas maneiras diferentes:

Revisando amostras de dados anotados
Usando ferramentas automatizadas para detectar erros comuns
Pedindo para outra pessoa verificar as anotações

Se você estiver trabalhando com várias pessoas, a consistência entre diferentes anotadores é importante. Um bom acordo entre anotadores significa que as diretrizes são claras e todos as estão seguindo da mesma maneira. Isso mantém todos na mesma página e as anotações consistentes.

Ao revisar, se você encontrar erros, corrija-os e atualize as diretrizes para evitar erros futuros. Forneça feedback aos anotadores e ofereça treinamento regular para ajudar a reduzir erros. Ter um processo sólido para lidar com erros mantém seu conjunto de dados preciso e confiável.

Link to this sectionEstratégias Eficientes de Rotulagem de Dados#

Para tornar o processo de rotulagem de dados mais suave e eficaz, considere implementar estas estratégias:

Diretrizes Claras de Anotação: Forneça instruções detalhadas com exemplos para garantir que todos os anotadores interpretem as tarefas de forma consistente. Por exemplo, ao rotular pássaros, especifique se deve incluir o pássaro inteiro ou apenas partes específicas.
Verificações Regulares de Qualidade: Estabeleça benchmarks e use métricas específicas para revisar o trabalho, mantendo altos padrões por meio de feedback contínuo.
Use Ferramentas de Pré-anotação: Muitas plataformas modernas de anotação oferecem recursos de pré-anotação assistidos por IA que podem acelerar significativamente o processo, gerando automaticamente anotações iniciais que os humanos podem refinar.
Implemente Aprendizado Ativo (Active Learning): Essa abordagem prioriza a rotulagem das amostras mais informativas primeiro, o que pode reduzir o número total de anotações necessárias, mantendo o desempenho do modelo.
Processamento em Lote: Agrupe imagens semelhantes para anotação para manter a consistência e melhorar a eficiência.

Essas estratégias podem ajudar a manter anotações de alta qualidade enquanto reduzem o tempo e os recursos necessários para o processo de rotulagem.

Link to this sectionCompartilhe suas ideias com a comunidade#

Discutir suas ideias e dúvidas com outros entusiastas de visão computacional pode ajudar a acelerar seus projetos. Aqui estão ótimas maneiras de aprender, solucionar problemas e fazer contatos:

Link to this sectionOnde encontrar ajuda e suporte#

GitHub Issues: Visite o repositório GitHub do YOLO26 e use a aba Issues para levantar questões, relatar bugs e sugerir recursos. A comunidade e os mantenedores estão lá para ajudar com quaisquer problemas que você encontrar.
Servidor Discord da Ultralytics: Junte-se ao servidor Discord da Ultralytics para conectar-se com outros usuários e desenvolvedores, obter suporte, compartilhar conhecimento e trocar ideias.

Link to this sectionDocumentação Oficial#

Documentação Ultralytics YOLO26: Consulte a documentação oficial do YOLO26 para guias completos e insights valiosos sobre inúmeras tarefas e projetos de visão computacional.

Link to this sectionConclusão#

Coletar dados diversos e imparciais e anotá-los de forma consistente com as ferramentas certas é a base de um modelo de visão computacional confiável. Com seu conjunto de dados coletado e rotulado, continue para o guia de etapas de um projeto de visão computacional para avançar para o treinamento e a avaliação.

Link to this sectionFAQ#

Link to this sectionQual é a melhor maneira de evitar vieses na coleta de dados para projetos de visão computacional?#

Para minimizar vieses, colete dados de fontes diversas, garanta uma representação equilibrada entre todos os grupos relevantes (como diferentes idades, gêneros e etnias), revise e atualize regularmente seu conjunto de dados para detectar vieses emergentes e aplique técnicas de mitigação como sobreamostragem de classes sub-representadas, aumento de dados e algoritmos conscientes de justiça. Evitar vieses dessa forma mantém o bom desempenho do seu modelo de visão computacional em cenários variados do mundo real e melhora sua capacidade de generalização.

Link to this sectionComo posso garantir alta consistência e precisão na anotação de dados?#

Estabeleça diretrizes de rotulagem claras e objetivas com instruções, exemplos e ilustrações detalhados, e depois aplique-as uniformemente em todos os tipos de dados para que cada anotação siga as mesmas regras. Treine os anotadores para permanecerem neutros a fim de reduzir o viés pessoal, revise e atualize as diretrizes regularmente e use verificações automáticas de consistência, além de feedback entre anotadores, para manter a precisão alta e alinhada com os objetivos do seu projeto.

Link to this sectionQuantas imagens preciso para treinar modelos YOLO da Ultralytics?#

Algumas centenas de objetos anotados por classe são suficientes para começar a experimentar com transfer learning, mas para um desempenho confiável no mundo real, a Ultralytics recomenda pelo menos 1.500 imagens e 10.000 instâncias rotuladas por classe. Combine um conjunto de dados suficientemente grande com um cronograma de treinamento razoável — cerca de 300 épocas é um ponto de partida comum, reduzido se o modelo apresentar sobreajuste (overfitting) precocemente — e mantenha suas anotações rigorosas e alinhadas aos objetivos específicos do seu projeto. Explore estratégias de treinamento detalhadas no guia de treinamento YOLO26.

Link to this sectionA Ultralytics fornece uma ferramenta de anotação de dados?#

Sim. A Plataforma Ultralytics inclui um editor de anotação integrado que suporta caixas delimitadoras, polígonos, pontos-chave, caixas orientadas e rótulos de classificação em um único espaço de trabalho. A anotação inteligente baseada em SAM acelera a rotulagem para tarefas de detecção, segmentação e OBB ao gerar máscaras com um único clique, e cada anotação é armazenada no formato YOLO, pronta para treinamento.

Link to this sectionQuais tipos de anotação de dados são comumente usados em visão computacional?#

Os tipos de anotação de dados mais comuns em visão computacional são caixas delimitadoras, polígonos, máscaras e pontos-chave, cada um adequado a uma tarefa diferente:

Caixas Delimitadoras (Bounding Boxes): Usadas principalmente para detecção de objetos, são caixas retangulares ao redor de objetos em uma imagem.
Polígonos: Fornecem contornos de objeto mais precisos, adequados para tarefas de segmentação de instância.
Máscaras: Oferecem detalhes em nível de pixel, usadas em segmentação semântica para diferenciar objetos do fundo.
Pontos-Chave (Keypoints): Identificam pontos específicos de interesse dentro de uma imagem, úteis para tarefas como estimativa de pose e detecção de pontos de referência faciais.

Selecionar o tipo de anotação apropriado depende dos requisitos do seu projeto. Saiba mais sobre como implementar essas anotações e seus formatos em nosso guia de anotação de dados.

Contribuidores

GLglenn-jocher¹¹ RAraimbekovm³ RIRizwanMunawar² ABabirami-vina¹

Criado 31 de mai. de 2024Atualizado há 3 semanas