Meet YOLO26: next-gen vision AI.

Link to this sectionセマンティックセグメンテーション#

Semantic segmentation examples

セマンティックセグメンテーションは、画像内のすべてのピクセルにクラスラベルを割り当て、シーン全体を網羅する詳細なクラスマップを作成します。個々のオブジェクトを分離するインスタンスセグメンテーションとは異なり、セマンティックセグメンテーションは、いくつの個別のオブジェクトが存在するかに関係なく、同じクラスのすべてのピクセルをグループ化します。



Watch: How to Train Ultralytics YOLO26 Semantic Segmentation Model on Custom Dataset | Ultralytics Platform

セマンティックセグメンテーションモデルの出力は、各ピクセルの値が予測されたクラスIDに対応する、単一の高さ×幅のクラスマップです。このため、セマンティックセグメンテーションは、自動運転、医療画像解析、土地被覆マッピングなどのシーン解析タスクに最適です。

ヒント

Use task=semantic or the yolo semantic CLI task for semantic segmentation. YOLO26 semantic segmentation model files use the -sem suffix, such as yolo26n-sem.pt.

Link to this sectionモデル#

Cityscapesデータセットで事前学習されたYOLO26セマンティックセグメンテーションモデルを以下に示します。

モデル は、初回使用時に最新の Ultralytics リリース から自動的にダウンロードされます。

モデルサイズ
(ピクセル)
mIoUval速度
RTX3090 PyTorch
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n-sem1024 × 204878.34.4 ± 0.01.622.7
YOLO26s-sem1024 × 204880.88.4 ± 0.06.588.8
YOLO26m-sem1024 × 204882.019.9 ± 0.114.3304.5
YOLO26l-sem1024 × 204882.926.5 ± 0.117.9384.7
YOLO26x-sem1024 × 204883.648.9 ± 0.240.2861.7
  • **mIoUval**値は、Cityscapes検証セットにおけるシングルモデル・シングルスケールの値です。
    再現するにはyolo semantic val data=cityscapes.yaml device=0 imgsz=2048を使用してください。
  • 速度メトリクスは、RTX3090インスタンスを使用してCityscapes検証画像で平均化されています。
    再現するにはyolo semantic val data=cityscapes.yaml batch=1 device=0|cpu imgsz=2048を使用してください。
  • Params(パラメータ)およびFLOPsの値は、Conv層とBatchNorm層を結合するmodel.fuse()実行後のフューズ済みモデルに対するものです。事前学習済みチェックポイントは、学習時の全アーキテクチャを保持しており、より高い数値を示す場合があります。

ADE20Kデータセットで事前学習されたYOLO26セマンティックセグメンテーションモデルを以下に示します。

モデル は、初回使用時に最新の Ultralytics リリース から自動的にダウンロードされます。

モデルサイズ
(ピクセル)
mIoUval速度
RTX3090 PyTorch
(ms)
パラメータ
(M)
FLOPs
(B)
YOLO26n-sem-ade20k64038.83.9 ± 0.21.64.4
YOLO26s-sem-ade20k64045.64.2 ± 0.36.517.4
YOLO26m-sem-ade20k64047.44.7 ± 0.314.359.5
YOLO26l-sem-ade20k64049.78.3 ± 0.217.975.0
YOLO26x-sem-ade20k64051.59.9 ± 0.340.2168.1
  • **mIoUval**値は、ADE20K検証セットにおけるシングルモデル・シングルスケールの値です。
    再現するにはyolo semantic val model=yolo26n-sem-ade20k.pt data=ade20k.yaml device=0 imgsz=640を使用し、yolo26n-sem-ade20k.ptを目的のyolo26*-sem-ade20k.ptチェックポイントに置き換えてください。
  • 速度メトリクスは、RTX3090インスタンスを使用してADE20K検証画像で平均化されています。
    再現するにはyolo semantic val model=yolo26n-sem-ade20k.pt data=ade20k.yaml batch=1 device=0|cpu imgsz=640を使用し、yolo26n-sem-ade20k.ptを目的のyolo26*-sem-ade20k.ptチェックポイントに置き換えてください。
  • Params(パラメータ)およびFLOPsの値は、Conv層とBatchNorm層を結合するmodel.fuse()実行後のフューズ済みモデルに対するものです。事前学習済みチェックポイントは、学習時の全アーキテクチャを保持しており、より高い数値を示す場合があります。

Link to this sectionトレーニング#

YOLO26n-semをCityscapes8データセットで、画像サイズ1024、100エポックでトレーニングします。利用可能な引数の完全なリストについては、設定ページを参照してください。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.yaml")  # build a new model from YAML
model = YOLO("yolo26n-sem.pt")  # load a pretrained model (recommended for training)
model = YOLO("yolo26n-sem.yaml").load("yolo26n-sem.pt")  # build from YAML and transfer weights

# Train the model
results = model.train(data="cityscapes8.yaml", epochs=100, imgsz=1024)

trainモードの詳細については、トレーニングページを参照してください。

Link to this sectionデータセット形式#

セマンティックセグメンテーションデータセットは、通常PNG形式のシングルチャンネルマスク画像を使用し、各ピクセルの値がクラスIDを表します。値が255のピクセルは「無視」として扱われ、損失計算から除外されます。データセットのYAMLには、画像および対応するマスクディレクトリへのパスを指定する必要があります。フォーマットの詳細については、セマンティックセグメンテーションデータセットガイドを参照してください。サポートされているデータセットには、CityscapesおよびADE20Kがあります。

Link to this section検証#

トレーニング済みのYOLO26n-semモデルの精度をセマンティックセグメンテーションデータセットで検証します。検証で目的のデータセットYAMLが使用されるよう、dataを明示的に渡してください。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Validate the model
metrics = model.val(data="cityscapes.yaml")
metrics.miou  # mean Intersection over Union
metrics.pixel_accuracy  # overall pixel accuracy

Link to this section予測#

トレーニング済みのYOLO26n-semモデルを使用して画像に対する予測を実行します。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Predict with the model
results = model("https://ultralytics.com/images/bus.jpg")  # predict on an image

# Access the results
for result in results:
    semantic_mask = result.semantic_mask.data  # class map, shape (H,W), integer dtype selected by class count

predictモードの詳細については、予測(Predict)ページを参照してください。

Link to this section結果の出力#

YOLOセマンティックセグメンテーションは、画像ごとに1つのResultsオブジェクトを返します。各結果には、オブジェクトマスクのリストの代わりに、画像全体に対する1つの詳細なクラスマップが格納されます。同じクラスに属するピクセルは、たとえ個別のオブジェクトに属している場合でも、同じクラスIDを共有します。

属性タイプ形状説明
result.semantic_maskSemanticMask(H,W)密なクラスマップ。
result.semantic_mask.datatorch.uint8
torch.int16
torch.int32
(H,W)クラスID。クラス数に応じてdtypeが選択されます。
result.masks--インスタンスマスクなし。
result.boxes--インスタンスボックス/信頼度なし。
result.masks.xy--デフォルトのポリゴンはありません。

すべてのタスクにわたるタスク固有のResultsフィールドについては、タスク別予測結果(Predict Results by Task)セクションを参照してください。

Link to this sectionインスタンスセグメンテーションとセマンティックセグメンテーションの比較#

側面インスタンスセグメンテーション (task="segment")セマンティックセグメンテーション (task="semantic")
予測の目的検出された各オブジェクトを個別にセグメント化するすべてのピクセルに1つのクラスIDを割り当てる
出力フィールドresult.masksresult.semantic_mask
メインデータresult.masks.dataresult.semantic_mask.data
形状(N,H,W)(H,W)
ピクセル値バイナリマスク値: 0 または 1クラスID: 0, 1, 2, ...
Dtypetorch.uint8torch.uint8
torch.int16
torch.int32
同クラスのオブジェクト個別のインスタンスとして保持同じクラス領域に統合
ポリゴンあり (result.masks.xy および result.masks.xyn を通じて)デフォルトではポリゴン出力なし
ボックスと信頼度あり (result.boxes を通じて)インスタンスごとのボックスや信頼度スコアなし
一般的な用途カウント、トラッキング、クロッピング、オブジェクトレベルの測定詳細なシーンラベリング、走行可能領域、土地被覆、医療領域

Link to this sectionエクスポート#

YOLO26n-semモデルをONNXやCoreMLなどの異なる形式にエクスポートします。

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-sem.pt")  # load an official model
model = YOLO("path/to/best.pt")  # load a custom model

# Export the model
model.export(format="onnx")

利用可能なYOLO26セマンティックセグメンテーションのエクスポート形式を下表に示します。format引数(例:format='onnx'format='engine')を使用して任意の形式にエクスポートできます。エクスポートされたモデルで直接予測や検証を行うことも可能です(例:yolo predict model=yolo26n-sem.onnx)。エクスポート完了後、モデルの使用例が表示されます。

形式format引数モデルメタデータ引数
PyTorch-yolo26n-sem.pt-
TorchScripttorchscriptyolo26n-sem.torchscriptimgsz, quantize, dynamic, optimize, nms, batch, device
ONNXonnxyolo26n-sem.onnximgsz, quantize, dynamic, simplify, opset, nms, batch, data, fraction, device
OpenVINOopenvinoyolo26n-sem_openvino_model/imgsz, quantize, dynamic, nms, batch, data, fraction, device
TensorRTengineyolo26n-sem.engineimgsz, quantize, dynamic, simplify, workspace, nms, batch, data, fraction, device
CoreMLcoremlyolo26n-sem.mlpackageimgsz, dynamic, quantize, nms, batch, device
TF SavedModelsaved_modelyolo26n-sem_saved_model/imgsz, keras, quantize, nms, batch, data, fraction, device
TF GraphDefpbyolo26n-sem.pbimgsz, batch, device
TF Edge TPUedgetpuyolo26n-sem_edgetpu.tfliteimgsz, quantize, data, fraction, device
PaddlePaddlepaddleyolo26n-sem_paddle_model/imgsz, batch, device
MNNmnnyolo26n-sem.mnnimgsz, batch, quantize, device
NCNNncnnyolo26n-sem_ncnn_model/imgsz, quantize, batch, device
IMX500imxyolo26n-sem_imx_model/imgsz, quantize, data, fraction, nms, device
RKNNrknnyolo26n-sem_rknn_model/imgsz, batch, name, quantize, data, fraction, device
ExecuTorchexecutorchyolo26n-sem_executorch_model/imgsz, batch, device
Axeleraaxelerayolo26n-sem_axelera_model/imgsz, batch, quantize, data, fraction, device
DEEPXdeepxyolo26n-sem_deepx_model/imgsz, quantize, data, optimize, device
Qualcomm QNNqnnyolo26n-sem_qnn.onnximgsz, batch, name, quantize, data, fraction, device
LiteRTlitertyolo26n-sem.tfliteimgszquantizebatchdatafractiondevice

exportの詳細については、Exportページを参照してください。

Link to this sectionよくある質問 (FAQ)#

Link to this sectionカスタムデータセットでYOLO26セマンティックセグメンテーションモデルをトレーニングするにはどうすればよいですか?#

カスタムデータセットでYOLO26セマンティックセグメンテーションモデルをトレーニングするには、各ピクセル値がクラスID(0, 1, 2, ...)を表し、値が255のピクセルがトレーニング中に無視されるPNGマスク画像を用意する必要があります。画像とマスクのディレクトリを指定したデータセットYAMLファイルを作成し、モデルをトレーニングします:

from ultralytics import YOLO

# Load a pretrained YOLO26 semantic segmentation model
model = YOLO("yolo26n-sem.pt")

# Train the model
results = model.train(data="path/to/your_dataset.yaml", epochs=100, imgsz=512)

利用可能なその他の引数については、Configurationページを確認してください。

Link to this sectionインスタンスセグメンテーションとセマンティックセグメンテーションの違いは何ですか?#

インスタンスセグメンテーションとセマンティックセグメンテーションは、どちらもピクセルレベルのタスクですが、重要な違いがあります:

  • **セマンティックセグメンテーション**は、すべてのピクセルにクラスラベルを割り当てますが、同じクラスの個々のオブジェクトを区別しません。例えば、シーン内のすべての車は同じクラスラベルを共有します。
  • **インスタンスセグメンテーション**は、各オブジェクトを個別に識別し、同じクラスに属していても各オブジェクトに対して異なるマスクを作成します。

セマンティックセグメンテーションは、自動運転や土地被覆マッピングのようなシーン理解タスクに最適ですが、個々のオブジェクトのカウントやトラッキングが重要な場合にはインスタンスセグメンテーションが推奨されます。

Link to this sectionインスタンスセグメンテーションデータを使用してセマンティックセグメンテーションをトレーニングできますか?#

はい。データセットがUltralytics YOLOポリゴンラベル(画像ごとに1つの.txt)を使用している場合は、データセットYAMLからmasks_dir省略すると、ローダーがオンザフライでポリゴンを画像ごとのセマンティックマスクに変換します。マルチクラスデータセット(N > 1)では、追加のbackgroundクラスが自動的にnamesに追加されます。シングルクラスデータセット(N == 1)の場合、トレーニングは1クラスのままとなり、宣言したクラスがマスク内で1になり、未カバーのピクセルが0になります。詳細はセマンティックセグメンテーションデータセットガイドを参照してください。

Link to this sectionセマンティックセグメンテーションでは、どのデータセットがサポートされていますか?#

Ultralytics YOLO26は、いくつかのセマンティックセグメンテーションデータセットに対して組み込みの設定を提供しています:

  • Cityscapes: 19のクラスを持つ都市の道路シーンで、自動運転の研究で広く使用されています。
  • ADE20K: 150のクラスを持つ大規模なシーン解析データセットです。

また、ピクセル値がクラスIDに対応するPNGマスクアノテーションを提供する任意のカスタムデータセットを使用することもできます。

Link to this section事前学習済みのYOLO26セマンティックセグメンテーションモデルを検証するにはどうすればよいですか?#

評価に使用したデータセットYAMLを使用して、事前学習済みのYOLO26セマンティックセグメンテーションモデルを検証します:

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-sem.pt")

# Validate the model
metrics = model.val(data="cityscapes.yaml")
print("Mean IoU:", metrics.miou)
print("Pixel Accuracy:", metrics.pixel_accuracy)

これらの手順により、セマンティックセグメンテーションの性能を評価するための標準的な尺度である平均Intersection over Union (mIoU)やピクセル精度などの検証メトリクスを得ることができます。

Link to this sectionYOLO26セマンティックセグメンテーションモデルをONNX形式にエクスポートするにはどうすればよいですか?#

PythonまたはCLIコマンドを使用して、YOLO26セマンティックセグメンテーションモデルをONNX形式にエクスポートします:

from ultralytics import YOLO

# Load a pretrained model
model = YOLO("yolo26n-sem.pt")

# Export the model to ONNX format
model.export(format="onnx")

さまざまなフォーマットへのエクスポートに関する詳細については、Exportページを参照してください。

コメント