Link to this sectionComo testar modelos de visão computacional#

Q: Como posso testar meu modelo Ultralytics YOLO26 em várias imagens?

Use o modo de predição e passe um caminho de pasta como source — o YOLO26 é executado em cada imagem da pasta e pode salvar os resultados anotados para revisão. O modo de predição não calcula métricas; para quantificar o desempenho em um conjunto rotulado, use o modo de validação. Ambos os fluxos de trabalho são mostrados em Como testar um modelo YOLO26.

Link to this sectionIntrodução#

O teste de modelos verifica como um modelo treinado se comporta em dados do mundo real nunca vistos antes — objetos em movimento, mal iluminados ou parcialmente ocultos, em vez de um benchmark curado. Enquanto a avaliação de modelo mede métricas em um conjunto de dados rotulado, o teste verifica se o comportamento aprendido pelo modelo corresponde aos objetivos da sua aplicação antes da implantação. Este guia aborda a preparação de dados de teste, o teste de modelos Ultralytics YOLO26 e a detecção de overfitting, underfitting e vazamento de dados.

Watch: How to Test Machine Learning Models | Avoid Data Leakage in Computer Vision 🚀

Link to this sectionTeste de modelo vs. Avaliação de modelo#

O teste de modelo e a avaliação de modelo são duas etapas distintas em um projeto de visão computacional. A avaliação mede o desempenho com métricas em um conjunto de dados rotulado; o teste verifica se o comportamento aprendido do modelo se mantém em condições que se assemelham à implantação.

Suponha que você tenha treinado um modelo de visão computacional para reconhecer cães e gatos, e queira implantar este modelo em um pet shop para monitorar os animais. Durante a fase de avaliação do modelo, você usa um conjunto de dados rotulado para calcular métricas como precisão, precisão e recall. Por exemplo, o modelo pode ter 98% de precisão ao distinguir entre gatos e cães em um determinado conjunto de dados.

Após a avaliação, você testa o modelo usando imagens de um pet shop para ver quão bem ele identifica gatos e cães em condições mais variadas e realistas. Você verifica se ele consegue rotular corretamente gatos e cães quando eles estão se movendo, em diferentes condições de iluminação ou parcialmente obscurecidos por objetos como brinquedos ou móveis. O teste de modelo verifica se o modelo se comporta como esperado fora do ambiente de avaliação controlado.

Link to this sectionPreparação para o teste de modelo#

Os datasets de visão computacional são geralmente divididos em conjuntos de treino e teste para simular condições do mundo real: os training data ensinam o modelo, enquanto os dados de teste verificam o seu comportamento em exemplos que nunca viu antes. A Ultralytics Platform mantém a organização e a anotação dos datasets num só lugar, o que ajuda na criação de um set de teste rotulado.

Antes de testar

Representação realista: Os dados de teste nunca vistos devem ser semelhantes aos dados que o modelo manipulará quando implantado. Isso fornece uma imagem realista das capacidades do modelo.
Tamanho suficiente: O conjunto de dados de teste precisa ser grande o suficiente para fornecer insights confiáveis sobre o desempenho do modelo.

Link to this sectionComo testar um modelo YOLO26#

Testar um modelo YOLO26 treinado envolve dois fluxos de trabalho complementares: validar em uma divisão de teste rotulada para obter métricas quantitativas e prever em novas imagens para inspecionar o comportamento qualitativamente.

Link to this sectionValidar em uma divisão de teste rotulada#

O modo de validação compara as previsões do modelo com os rótulos de referência (ground-truth) e reporta precisão, recall, mAP50 e mAP50-95 para modelos de detecção. Ele também salva auxiliares visuais como uma matriz de confusão e uma curva de precisão-recall, que ajudam você a identificar áreas específicas onde o modelo pode não estar performando bem.

Uso

from ultralytics import YOLO

# Load a pretrained model or your own trained checkpoint, e.g. "path/to/best.pt"
model = YOLO("yolo26n.pt")

# Validate; add split="test" if your dataset YAML defines a test split
metrics = model.val(data="coco8.yaml")
print(metrics.box.map)  # mAP50-95

Por padrão, a validação é executada na divisão val do conjunto de dados. Para medir o desempenho em um conjunto de teste separado (held-out), defina uma divisão test: no seu YAML de conjunto de dados e passe split="test".

Link to this sectionPrever em novas imagens#

O modo de predição executa o modelo em dados novos e não vistos sem exigir rótulos. Ele não produz métricas de desempenho, mas salvar as saídas anotadas permite que você revise como o modelo se comporta em imagens do mundo real — por exemplo, uma pasta inteira de imagens de teste de uma só vez.

Uso

from ultralytics import YOLO

# Load a pretrained model or your own trained checkpoint, e.g. "path/to/best.pt"
model = YOLO("yolo26n.pt")

# Run predictions on a folder of test images and save annotated results
results = model.predict(source="path/to/test_images", save=True)

Testar um modelo pré-treinado antes do treinamento personalizado

Para verificar se o YOLO26 atende à sua aplicação antes de investir em treinamento personalizado, execute o modo de predição com um checkpoint pré-treinado em suas próprias imagens. Os modelos são pré-treinados em conjuntos de dados como COCO, portanto, os resultados dão uma noção rápida de quão bem o modelo pode performar em seu contexto específico.

Link to this sectionModo de Validação vs. Predição#

Modo	Objetivo	Requer rótulos	Saída
Validação	Quantificar o desempenho em relação ao ground truth	Sim	Precisão, recall, mAP50, mAP50-95, matriz de confusão, curvas PR
Predição	Inspecionar o comportamento do modelo em dados novos e não rotulados	Não	Imagens anotadas e resultados de predição, sem métricas

Link to this sectionComo analisar os resultados do teste#

Uma vez que as previsões e métricas estiverem em mãos, analise onde e por que o modelo falha:

Imagens classificadas incorretamente: Identifique e revise as imagens que o modelo classificou incorretamente para entender onde ele está errando.
Análise de erros: Realize uma análise de erros completa para entender os tipos de erros (por exemplo, falsos positivos vs. falsos negativos) e suas possíveis causas.
Viés e justiça: Verifique se há algum viés nas previsões do modelo. Certifique-se de que o modelo tenha um desempenho igualmente bom em diferentes subconjuntos de dados, especialmente se incluir atributos sensíveis como raça, gênero ou idade.

Link to this sectionOverfitting e Underfitting em Machine Learning#

Ao testar um modelo de machine learning, especialmente em visão computacional, é importante estar atento ao overfitting e underfitting. Esses problemas podem afetar significativamente quão bem seu modelo funciona com novos dados.

Problema	Sinais comuns	Como lidar com isso
Overfitting	Alta precisão de treinamento, mas baixa precisão de validação; hipersensibilidade a pequenas mudanças ou detalhes irrelevantes nas imagens	Aplique regularização como dropout, aumente o tamanho do conjunto de dados de treinamento, simplifique a arquitetura do modelo
Underfitting	Baixa precisão mesmo no conjunto de treinamento; falha consistente em reconhecer características ou objetos óbvios	Use um modelo mais complexo, forneça recursos mais relevantes, aumente as épocas de treinamento

O segredo é encontrar um equilíbrio para que o modelo performe bem em ambos os conjuntos de dados, de treinamento e de validação. Monitorar regularmente as métricas e inspecionar visualmente as previsões durante os testes ajuda você a evitar um desvio para qualquer um dos extremos.

Comparison of underfitting, appropriate fitting, and overfitting on the same dataset

Link to this sectionVazamento de dados em visão computacional e como evitá-lo#

O vazamento de dados acontece quando informações de fora do conjunto de dados de treinamento são usadas acidentalmente para treinar o modelo. O modelo pode parecer muito preciso durante o treinamento, mas não funcionará bem em dados novos e não vistos quando ocorrer vazamento de dados.

O vazamento pode ser difícil de detectar e geralmente vem de vieses ocultos nos dados de treinamento:

Tipo de viés	O que parece
Viés de câmera	Diferentes ângulos, iluminação, sombras e movimentos da câmera introduzem padrões indesejados
Viés de sobreposição	Logotipos, carimbos de data/hora ou outras sobreposições nas imagens enganam o modelo
Viés de fonte e objeto	Fontes ou objetos específicos que aparecem frequentemente em certas classes distorcem o aprendizado do modelo
Viés espacial	Desequilíbrios entre primeiro plano e fundo, distribuições de bounding box e locais dos objetos afetam o treinamento
Viés de rótulo e domínio	Rótulos incorretos ou mudanças nos tipos de dados levam ao vazamento

Link to this sectionComo detectar e evitar o vazamento de dados#

Para encontrar o vazamento de dados, verifique se os resultados do modelo são surpreendentemente bons, analise se um recurso é muito mais importante que outros, verifique se as decisões do modelo fazem sentido intuitivamente e confirme se os dados foram divididos corretamente antes de qualquer processamento.

Para evitá-lo, use um conjunto de dados diversificado com imagens ou vídeos de diferentes câmeras e ambientes, e analise cuidadosamente seus dados em busca de vieses ocultos — como todas as amostras positivas sendo tiradas em um horário específico do dia. Evitar o vazamento de dados torna seus modelos de visão computacional mais confiáveis em situações do mundo real.

Link to this sectionO que vem depois do teste de modelo#

Após testar seu modelo, as próximas etapas dependem dos resultados. Se o seu modelo tiver um bom desempenho, você pode implantá-lo em um ambiente do mundo real. Se os resultados não forem satisfatórios, você precisará fazer melhorias. Isso pode envolver analisar erros, coletar mais dados, melhorar a qualidade dos dados, ajustar hiperparâmetros e treinar o modelo novamente.

Link to this sectionConclusão#

O teste de modelo rigoroso — validando em uma divisão de teste separada, prevendo em imagens do mundo real e verificando overfitting e vazamento de dados — é o que transforma um modelo bem avaliado em um confiável. Resolva os problemas que o teste revela antes da implantação, e seu modelo terá muito mais chances de performar como pretendido em produção. Se surgirem dúvidas ao longo do caminho, pergunte à comunidade no repositório Ultralytics GitHub ou no servidor Discord da Ultralytics.

Link to this sectionFAQ#

Link to this sectionQuais são as principais diferenças entre avaliação de modelo e teste de modelo em visão computacional?#

A avaliação de modelo mede o desempenho com métricas em um conjunto de dados rotulado, enquanto o teste de modelo verifica como o modelo se comporta em novos dados, não vistos, que se assemelham às condições de implantação. A avaliação produz números como precisão e mAP a partir de um conjunto de dados controlado; o teste revela se o comportamento aprendido se sustenta com iluminação variada, movimento ou oclusão. Veja Teste de modelo vs. Avaliação de modelo para um exemplo prático.

Link to this sectionComo posso testar meu modelo Ultralytics YOLO26 em várias imagens?#

Use o modo de predição e passe um caminho de pasta como source — o YOLO26 é executado em cada imagem da pasta e pode salvar os resultados anotados para revisão. O modo de predição não calcula métricas; para quantificar o desempenho em um conjunto rotulado, use o modo de validação. Ambos os fluxos de trabalho são mostrados em Como testar um modelo YOLO26.

Link to this sectionQuais métricas a validação YOLO26 reporta em um conjunto de teste?#

Para modelos de detecção, a validação reporta precisão, recall, mAP50 e mAP50-95, e salva gráficos, incluindo uma matriz de confusão e uma curva de precisão-recall. Para validar em uma divisão de teste dedicada em vez da divisão val padrão, defina test: no seu YAML de conjunto de dados e passe split="test". Veja o guia de métricas de desempenho para saber como interpretar cada métrica.

Link to this sectionO que devo fazer se meu modelo de visão computacional mostrar sinais de overfitting ou underfitting?#

Para overfitting, aplique técnicas de regularização como dropout, aumente o tamanho do conjunto de dados de treinamento ou simplifique a arquitetura do modelo. Para underfitting, use um modelo mais complexo, forneça recursos mais relevantes ou treine por mais épocas. Os sinais de cada problema e as correções correspondentes estão resumidos em Overfitting e Underfitting em Machine Learning.

Link to this sectionComo posso detectar e evitar vazamento de dados em visão computacional?#

Suspeite de vazamento de dados quando o desempenho do teste parecer surpreendentemente bom, um único recurso dominar as previsões ou as decisões do modelo não fizerem sentido intuitivo. Evite-o usando conjuntos de dados diversos de diferentes câmeras e ambientes, revisando dados em busca de vieses ocultos e verificando se a divisão de treino/teste ocorreu antes de qualquer processamento. Veja Vazamento de dados em visão computacional para os tipos comuns de viés.

Link to this sectionQuais etapas devo seguir após testar meu modelo de visão computacional?#

Se os resultados atingirem seus objetivos de projeto, implante o modelo; caso contrário, melhore-o antes da implantação. Isso pode significar analisar erros, coletar dados mais diversos, melhorar a qualidade dos dados, ajustar hiperparâmetros e treinar novamente. Repita o teste após cada rodada de alterações para confirmar se as correções funcionaram.

Contribuidores

GLglenn-jocher⁸ RIRizwanMunawar² RAraimbekovm¹ PDpderrenger¹ ABabirami-vina¹

Criado 3 de jul. de 2024Atualizado mês passado