Link to this sectionSegmentação Semântica#

A segmentação semântica atribui um rótulo de classe a cada pixel em uma imagem, produzindo um mapa de classes denso que cobre toda a cena. Diferentemente da segmentação de instâncias, que separa objetos individuais, a segmentação semântica agrupa todos os pixels da mesma classe, independentemente de quantos objetos distintos estejam presentes.

Watch: Semantic Segmentation with Ultralytics YOLO26 | Quickstart Tutorial

A saída de um modelo de segmentação semântica é um mapa de classes de altura por largura, onde cada valor de pixel corresponde a um ID de classe previsto. Isso torna a segmentação semântica ideal para tarefas de análise de cena, como condução autônoma, imagens médicas e mapeamento de cobertura da terra.

Dica

Use task=semantic ou a tarefa CLI yolo semantic para segmentação semântica. Os arquivos de modelo de segmentação semântica do YOLO26 usam o sufixo -sem, como yolo26n-sem.pt.

Link to this section Modelos #

Modelos de segmentação semântica YOLO26 pré-treinados no conjunto de dados Cityscapes são mostrados abaixo.

Os Modelos são baixados automaticamente da versão mais recente do Ultralytics no primeiro uso.

Modelo	tamanho ^(pixels)	mIoU^val	Velocidade ^{RTX3090 PyTorch (ms)}	params ^(M)	FLOPs ^(B)
YOLO26n-sem	1024 × 2048	78.3	4.4 ± 0.0	1.6	22.7
YOLO26s-sem	1024 × 2048	80.8	8.4 ± 0.0	6.5	88.8
YOLO26m-sem	1024 × 2048	82.0	19.9 ± 0.1	14.3	304.5
YOLO26l-sem	1024 × 2048	82.9	26.5 ± 0.1	17.9	384.7
YOLO26x-sem	1024 × 2048	83.6	48.9 ± 0.2	40.2	861.7

Os valores de mIoU^val são para modelo único e escala única no conjunto de validação do Cityscapes.
Reproduza com yolo semantic val data=cityscapes.yaml device=0 imgsz=2048
As métricas de Velocidade são calculadas com base em imagens de validação do Cityscapes usando uma instância RTX3090.
Reproduza com yolo semantic val data=cityscapes.yaml batch=1 device=0|cpu imgsz=2048
Os valores de Params e FLOPs são para o modelo fundido após model.fuse(), que mescla camadas Conv e BatchNorm. Checkpoints pré-treinados mantêm a arquitetura de treinamento completa e podem mostrar contagens mais altas.

Modelos de segmentação semântica YOLO26 pré-treinados no conjunto de dados ADE20K são exibidos abaixo.

Os Modelos são baixados automaticamente da versão mais recente do Ultralytics no primeiro uso.

Modelo	tamanho ^(pixels)	mIoU^val	Velocidade ^{RTX3090 PyTorch (ms)}	params ^(M)	FLOPs ^(B)
YOLO26n-sem-ade20k	640	38.8	3.9 ± 0.2	1.6	4.4
YOLO26s-sem-ade20k	640	45.6	4.2 ± 0.3	6.5	17.4
YOLO26m-sem-ade20k	640	47.4	4.7 ± 0.3	14.3	59.5
YOLO26l-sem-ade20k	640	49.7	8.3 ± 0.2	17.9	75.0
YOLO26x-sem-ade20k	640	51.5	9.9 ± 0.3	40.2	168.1

Os valores de mIoU^val são para modelo único e escala única no conjunto de validação ADE20K.
Reproduza com yolo semantic val model=yolo26n-sem-ade20k.pt data=ade20k.yaml device=0 imgsz=640, substituindo yolo26n-sem-ade20k.pt pelo checkpoint yolo26*-sem-ade20k.pt desejado.
As métricas de Speed são calculadas com base na média das imagens de validação do ADE20K usando uma instância RTX3090.
Reproduza com yolo semantic val model=yolo26n-sem-ade20k.pt data=ade20k.yaml batch=1 device=0|cpu imgsz=640, substituindo yolo26n-sem-ade20k.pt pelo checkpoint yolo26*-sem-ade20k.pt desejado.
Os valores de Params e FLOPs são para o modelo fundido após model.fuse(), que mescla camadas Conv e BatchNorm. Checkpoints pré-treinados mantêm a arquitetura de treinamento completa e podem mostrar contagens mais altas.

Link to this sectionTreinar#

Treine o YOLO26n-sem no conjunto de dados Cityscapes8 por 100 épocas com tamanho de imagem 1024. Para uma lista completa de argumentos disponíveis, veja a página Configuração.

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.yaml")  # build a new model from YAML
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-sem.yaml").load("yolo26n-sem.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

Consulta todos os detalhes do modo train na página Train. Modelos de segmentação semântica também podem ser treinados com o Ultralytics Platform cloud training.

Link to this sectionFormato do conjunto de dados#

Datasets de segmentação semântica usam imagens de máscara de canal único, tipicamente PNG, onde cada valor de pixel representa um ID de classe. Pixels com valor 255 são tratados como "ignorar" e excluídos do cálculo de perda. O YAML do dataset deve especificar os caminhos para as imagens e seus diretórios de máscara correspondentes. Consulta o Semantic Segmentation Dataset Guide para detalhes sobre o formato. Datasets suportados incluem Cityscapes e ADE20K. Podes gerir e anotar datasets semânticos com a Ultralytics Platform annotation.

Link to this sectionValidar#

Valide a precisão do modelo YOLO26n-sem treinado em um conjunto de dados de segmentação semântica. Passe data explicitamente para que a validação use o YAML do conjunto de dados pretendido.

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val(data="cityscapes.yaml")
metrics.miou  # mean Intersection over Union
metrics.pixel_accuracy  # overall pixel accuracy

Link to this sectionPrever#

Use um modelo YOLO26n-sem treinado para realizar predições em imagens.

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg")  # predict on an image

# Access the results
for result in results:
    semantic_mask = result.semantic_mask.data  # class map, shape (H,W), integer dtype selected by class count

Veja os detalhes completos do modo predict na página Previsão.

Link to this sectionSaída de Resultados#

A segmentação semântica do YOLO retorna um objeto Results por imagem. Cada resultado armazena um mapa de classes denso para a imagem completa, em vez de uma lista de máscaras de objetos. Pixels com a mesma classe prevista compartilham o mesmo ID de classe, mesmo quando pertencem a objetos separados.

Atributo	Tipo	Forma	Descrição
`result.semantic_mask`	`SemanticMask`	`(H,W)`	Mapa de classes denso.
`result.semantic_mask.data`	`torch.uint8` `torch.int16` `torch.int32`	`(H,W)`	IDs de classe; dtype selecionado pela contagem de classes.
`result.masks`	-	-	Sem máscaras de instância.
`result.boxes`	-	-	Sem caixas/confianças de instância.
`result.masks.xy`	-	-	Sem polígonos padrão.

Para campos de Results específicos de cada tarefa em todas as tarefas, veja a seção Resultados de Previsão por Tarefa.

Qualidade do contorno da máscara

A segmentação semântica prevê um mapa de classes denso, que depois é redimensionado para o formato da imagem para visualização e uso posterior. Estruturas muito finas, como marcações de faixa, linhas de quadras, postes ou fios, podem, portanto, parecer escalonadas quando a inferência é executada com um imgsz muito menor do que a resolução original da imagem. Se os limites parecerem serrilhados, teste primeiro o modelo nativo PyTorch .pt com um imgsz maior, como 1024, 1280 ou o valor mais próximo possível do tamanho da imagem original. Utilize modelos exportados apenas após confirmar que a saída .pt é aceitável, uma vez que entradas de baixa resolução não conseguem recuperar detalhes finos que não estavam presentes no mapa de classes previsto.

Link to this sectionSegmentação de Instância vs. Semântica#

Aspecto	Segmentação de Instância (`task="segment"`)	Segmentação Semântica (`task="semantic"`)
Objetivo da predição	Segmentar cada objeto detectado separadamente	Atribuir um ID de classe a cada pixel
Campo de saída	`result.masks`	`result.semantic_mask`
Dados principais	`result.masks.data`	`result.semantic_mask.data`
Forma	`(N,H,W)`	`(H,W)`
Valores de pixel	Valores de máscara binária: `0` ou `1`	IDs de classe: `0`, `1`, `2`, ...
Dtype	`torch.uint8`	`torch.uint8` `torch.int16` `torch.int32`
Objetos da mesma classe	Mantidos como instâncias separadas	Mesclados na mesma região de classe
Polígonos	Sim, através de `result.masks.xy` e `result.masks.xyn`	Sem saída de polígono por padrão
Caixas e confiança	Sim, através de `result.boxes`	Sem caixas por instância ou pontuações de confiança
Uso típico	Contagem, rastreamento, recorte, medição em nível de objeto	Rotulagem densa de cena, área dirigível, cobertura da terra, regiões médicas

Link to this sectionExportar#

Exporte um modelo YOLO26n-sem para um formato diferente como ONNX, CoreML, etc.

Exemplo

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Export the model
model.export(format="onnx")

Os formatos de exportação de segmentação semântica disponíveis para YOLO26 estão na tabela abaixo. Você pode exportar para qualquer formato usando o argumento format, i.e., format='onnx' ou format='engine'. Você pode prever ou validar diretamente em modelos exportados, i.e., yolo predict model=yolo26n-sem.onnx. Exemplos de uso são mostrados para o seu modelo após a conclusão da exportação.

Formato	Argumento `format`	Modelo	Metadados	Argumentos
PyTorch	-	`yolo26n-sem.pt`	✅	-
TorchScript	`torchscript`	`yolo26n-sem.torchscript`	✅	`imgsz`, `quantize`, `dynamic`, `nms`, `batch`, `device`
ONNX	`onnx`	`yolo26n-sem.onnx`	✅	`imgsz`, `quantize`, `dynamic`, `simplify`, `opset`, `nms`, `batch`, `data`, `fraction`, `device`
OpenVINO	`openvino`	`yolo26n-sem_openvino_model/`	✅	`imgsz`, `quantize`, `dynamic`, `nms`, `batch`, `data`, `fraction`, `device`
TensorRT	`engine`	`yolo26n-sem.engine`	✅	`imgsz`, `quantize`, `dynamic`, `simplify`, `workspace`, `nms`, `batch`, `data`, `fraction`, `device`
CoreML	`coreml`	`yolo26n-sem.mlpackage`	✅	`imgsz`, `dynamic`, `quantize`, `nms`, `batch`, `device`
TF SavedModel	`saved_model`	`yolo26n-sem_saved_model/`	✅	`imgsz`, `keras`, `quantize`, `nms`, `batch`, `data`, `fraction`, `device`
TF GraphDef	`pb`	`yolo26n-sem.pb`	❌	`imgsz`, `batch`, `device`
TF Edge TPU	`edgetpu`	`yolo26n-sem_edgetpu.tflite`	✅	`imgsz`, `quantize`, `data`, `fraction`, `device`
PaddlePaddle	`paddle`	`yolo26n-sem_paddle_model/`	✅	`imgsz`, `batch`, `device`
MNN	`mnn`	`yolo26n-sem.mnn`	✅	`imgsz`, `batch`, `dynamic`, `quantize`, `nms`, `device`
NCNN	`ncnn`	`yolo26n-sem_ncnn_model/`	✅	`imgsz`, `quantize`, `batch`, `device`
IMX500	`imx`	`yolo26n-sem_imx_model/`	✅	`imgsz`, `quantize`, `data`, `fraction`, `nms`, `device`
RKNN	`rknn`	`yolo26n-sem_rknn_model/`	✅	`imgsz`, `batch`, `name`, `quantize`, `data`, `fraction`, `device`
ExecuTorch	`executorch`	`yolo26n-sem_executorch_model/`	✅	`imgsz`, `batch`, `device`
Axelera	`axelera`	`yolo26n-sem_axelera_model/`	✅	`imgsz`, `batch`, `quantize`, `data`, `fraction`, `device`
DEEPX	`deepx`	`yolo26n-sem_deepx_model/`	✅	`imgsz`, `quantize`, `data`, `optimize`, `device`
Qualcomm QNN	`qnn`	`yolo26n-sem_qnn.onnx`	✅	`imgsz`, `batch`, `name`, `quantize`, `data`, `fraction`, `device`
LiteRT	`litert`	`yolo26n-sem.tflite`	✅	`imgsz`, `quantize`, `batch`, `data`, `fraction`, `device`
Hailo	`hailo`	`yolo26n-sem_hailo_model/`	✅	`imgsz`, `name`, `quantize`, `data`, `fraction`, `opset`, `simplify`, `conf`, `iou`

Veja detalhes completos de export na página Export.

Link to this sectionFAQ#

Link to this sectionComo treino um modelo de segmentação semântica YOLO26 em um conjunto de dados personalizado?#

Para treinar um modelo de segmentação semântica YOLO26 em um conjunto de dados personalizado, você precisa preparar imagens de máscara PNG onde cada valor de pixel representa um ID de classe (0, 1, 2, ...) e pixels com valor 255 são ignorados durante o treinamento. Crie um arquivo YAML de conjunto de dados apontando para seus diretórios de imagens e máscaras, então treine o modelo:

Exemplo

from ultralytics import YOLO

# Load a pretrained YOLO26 semantic segmentation model
model = YOLO("yolo26n-sem.pt")

# Train the model
results = model.train(data="path/to/your_dataset.yaml", epochs=100, imgsz=512)

Verifique a página de Configuração para mais argumentos disponíveis.

Link to this sectionQual é a diferença entre segmentação de instância e segmentação semântica?#

Segmentação de instância e segmentação semântica são tarefas de nível de pixel, mas diferem de forma fundamental:

Segmentação semântica atribui um rótulo de classe a cada pixel, mas não distingue entre objetos individuais da mesma classe. Por exemplo, todos os carros em uma cena compartilham o mesmo rótulo de classe.
Segmentação de instância identifica cada objeto individual separadamente, produzindo máscaras distintas para cada objeto, mesmo que pertençam à mesma classe.

A segmentação semântica é mais adequada para tarefas de compreensão de cena, como condução autônoma e mapeamento de cobertura da terra, enquanto a segmentação de instância é preferida quando contar ou rastrear objetos individuais é importante.

Link to this sectionPosso usar dados de segmentação de instância para treinar segmentação semântica?#

Sim. Se o teu dataset utiliza etiquetas de polígono Ultralytics YOLO (um .txt por imagem), omite masks_dir do YAML do dataset e certifica-te de que nenhuma pasta masks/ existe junto às tuas imagens na raiz do dataset (a sua presença por si só ativa o modo de máscara PNG, mesmo sem masks_dir definido). O carregador converte então os polígonos em máscaras semânticas por imagem em tempo real. Para datasets multi-classe (N > 1), uma classe background extra é acrescentada automaticamente aos names. Para datasets de classe única (N == 1), o treino mantém-se com 1 classe — a tua classe declarada torna-se 1 na máscara e os pixels não cobertos tornam-se 0. Consulta o Guia de Dataset de Segmentação Semântica para mais detalhes.

Link to this sectionQuais conjuntos de dados são suportados para segmentação semântica?#

O Ultralytics YOLO26 fornece configurações integradas para vários conjuntos de dados de segmentação semântica:

Cityscapes: Cenas de rua urbanas com 19 classes, amplamente utilizadas para pesquisa em condução autônoma.
ADE20K: Um conjunto de dados de análise de cena em grande escala com 150 classes.

Você também pode usar qualquer conjunto de dados personalizado que forneça anotações de máscara PNG, onde valores de pixel correspondem a IDs de classe.

Link to this sectionComo valido um modelo de segmentação semântica YOLO26 pré-treinado?#

Valide um modelo de segmentação semântica YOLO26 pré-treinado com o YAML do conjunto de dados usado para avaliação:

Exemplo

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-sem.pt")

# Validate the model
metrics = model.val(data="cityscapes.yaml")
print("Mean IoU:", metrics.miou)
print("Pixel Accuracy:", metrics.pixel_accuracy)

Esses passos fornecerão métricas de validação como mIoU (mean Intersection over Union) e precisão de pixel, que são medidas padrão para avaliar o desempenho da segmentação semântica.

Link to this sectionComo posso exportar um modelo de segmentação semântica YOLO26 para o formato ONNX?#

Exporte um modelo de segmentação semântica YOLO26 para o formato ONNX com Python ou comandos CLI:

Exemplo

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-sem.pt")

# Export the model to ONNX format
model.export(format="onnx")

Para mais detalhes sobre exportação para vários formatos, consulte a página de Exportação.

Contribuidores

GLglenn-jocher² RAraimbekovm² LALaughing-q² OAoaslananka¹ LMlmycross¹ RIRizwanMunawar¹

Criado há 2 mesesAtualizado há 22 horas

Link to this sectionSegmentação Semântica#

Link to this sectionModelos#

Link to this sectionTreinar#

Link to this sectionFormato do conjunto de dados#

Link to this sectionValidar#

Link to this sectionPrever#

Link to this sectionSaída de Resultados#

Link to this sectionSegmentação de Instância vs. Semântica#

Link to this sectionExportar#

Link to this sectionFAQ#

Link to this sectionComo treino um modelo de segmentação semântica YOLO26 em um conjunto de dados personalizado?#

Link to this sectionQual é a diferença entre segmentação de instância e segmentação semântica?#

Link to this sectionPosso usar dados de segmentação de instância para treinar segmentação semântica?#

Link to this sectionQuais conjuntos de dados são suportados para segmentação semântica?#

Link to this sectionComo valido um modelo de segmentação semântica YOLO26 pré-treinado?#

Link to this sectionComo posso exportar um modelo de segmentação semântica YOLO26 para o formato ONNX?#

Comentários

Link to this section Modelos #