インスタンスセグメンテーションデータセットの概要
インスタンスセグメンテーションは、画像内の個々のオブジェクトを識別して輪郭を描画するコンピュータビジョンのタスクです。このガイドでは、インスタンスセグメンテーションタスク向けにUltralytics YOLOでサポートされているデータセット形式の概要と、モデルのトレーニングに向けてこれらのデータセットを準備、変換、使用する方法を説明します。
サポートされているデータセットフォーマット
Ultralytics YOLOフォーマット
YOLOセグメンテーションモデルのトレーニングに使用されるデータセットのラベル形式は以下の通りです。
- 画像ごとに1つのテキストファイル:データセット内の各画像には、画像ファイルと同じ名前で「.txt」拡張子を持つ対応するテキストファイルがあります。
- オブジェクトごとに1行:テキストファイルの各行は、画像内の1つのオブジェクトインスタンスに対応します。
- 行ごとのオブジェクト情報:各行には、そのオブジェクトインスタンスに関する以下の情報が含まれます。
- オブジェクトクラスインデックス:オブジェクトのクラスを表す整数(例:0は人物、1は車など)。
- オブジェクトのバウンディング座標:マスク領域を囲むバウンディング座標で、0から1の範囲に正規化されています。
セグメンテーションデータセットファイルの1行の形式は以下の通りです。
<class-index> <x1> <y1> <x2> <y2> ... <xn> <yn>
この形式において、<class-index>はオブジェクトのクラスインデックスであり、<x1> <y1> <x2> <y2> ... <xn> <yn>はオブジェクトのセグメンテーションマスクの正規化されたポリゴン座標です(値は画像幅と高さに対して[0, 1]の範囲内です)。座標はスペースで区切られています。
3点セグメントと5点セグメントからなる2つのオブジェクトを持つ画像の、YOLOデータセット形式の例を以下に示します。
0 0.681 0.485 0.670 0.487 0.676 0.487
1 0.504 0.000 0.501 0.004 0.498 0.004 0.493 0.010 0.492 0.0104- 各行の長さは等しい必要はありません。
- 各セグメンテーションラベルは、最低3つの
(x, y)点を持つ必要があります:<class-index> <x1> <y1> <x2> <y2> <x3> <y3>
データセットYAML形式
Ultralyticsフレームワークでは、セグメンテーションモデルをトレーニングするためのデータセットとモデル構成を定義するためにYAMLファイル形式を使用します。セグメンテーションデータセットを定義するために使用されるYAML形式の例を以下に示します。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-seg ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.ziptrainフィールドとvalフィールドは、それぞれトレーニング画像と検証画像を含むディレクトリへのパスを指定します。
namesはクラス名の辞書です。名前の順序は、YOLOデータセットファイル内のオブジェクトクラスインデックスの順序と一致させる必要があります。
使用方法
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-seg.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)サポートされているデータセット
Ultralytics YOLOは、インスタンスセグメンテーションタスク向けに様々なデータセットをサポートしています。以下に最も一般的に使用されるデータセットのリストを示します。
- Carparts-seg:自動車用途に最適な、自動車部品のセグメンテーションに特化したデータセットです。個々の自動車部品の詳細なアノテーションを含む様々な車両が含まれています。
- COCO:オブジェクト検出、セグメンテーション、キャプション付けのための包括的なデータセットであり、幅広いカテゴリにわたる20万枚以上のラベル付き画像を備えています。
- COCO8-seg:セグメンテーションモデルのトレーニングを迅速にテストするために設計されたCOCOの8枚の画像サブセットで、
ultralyticsリポジトリでのCIチェックやワークフロー検証に最適です。 - COCO128-seg:インスタンスセグメンテーションタスクのための小規模なデータセットで、セグメンテーションアノテーション付きの128枚のCOCO画像のサブセットが含まれています。
- Crack-seg:様々な表面の亀裂をセグメンテーションするために調整されたデータセットです。インフラのメンテナンスや品質管理に不可欠であり、構造的な弱点を特定するためのモデルトレーニングに詳細な画像を提供します。
- Package-seg:様々な種類の梱包材や形状のセグメンテーションに特化したデータセットです。物流や倉庫の自動化に特に有用であり、荷物の取り扱いや仕分けシステムの開発を支援します。
独自のデータセットを追加する
独自のデータセットを持ち、それをUltralytics YOLO形式でセグメンテーションモデルのトレーニングに使用したい場合は、「Ultralytics YOLO形式」で指定された形式に従っていることを確認してください。アノテーションを必要な形式に変換し、YAML構成ファイルでパス、クラス数、クラス名を指定します。images/とlabels/は同じ階層の独立したフォルダとして保持し、サブフォルダ構造を一致させてください。ラベルの.txtファイルを画像フォルダ内に配置すると、モデルがラベルを読み取れない原因になることがあります。
ラベルフォーマットの移植または変換
COCOデータセットフォーマットからYOLOフォーマットへ
以下のコードスニペットを使用して、一般的なCOCOデータセット形式からYOLO形式へ簡単にラベルを変換できます。
from ultralytics.data.converter import convert_coco
convert_coco(labels_dir="path/to/coco/annotations/", use_segments=True)この変換ツールを使用して、COCOデータセットやCOCO形式のデータセットをUltralytics YOLO形式に変換できます。
使用するデータセットがモデルと互換性があり、必要な形式規則に従っているかを確認してください。適切にフォーマットされたデータセットは、成功するセグメンテーションモデルをトレーニングするために非常に重要です。
自動アノテーション
自動アノテーションは、事前学習済みの検出モデルを使用してセグメンテーションデータセットを生成できる重要な機能です。手動でのラベル付けの必要なく、大量の画像を迅速かつ正確にアノテーションできるため、時間と労力を節約できます。
検出モデルを使用したセグメンテーションデータセットの生成
Ultralyticsフレームワークを使用してデータセットを自動アノテーションするには、以下に示すようにauto_annotate関数を使用できます。
from ultralytics.data.annotator import auto_annotate
auto_annotate(data="path/to/images", det_model="yolo26x.pt", sam_model="sam_b.pt")| 引数 | タイプ | デフォルト | 説明 |
|---|---|---|---|
data | str | 必須 | アノテーションまたはセグメンテーションの対象となる画像を含むディレクトリへのパス。 |
det_model | str | 'yolo26x.pt' | 最初のオブジェクト検出のためのYOLO検出モデルのパス。 |
sam_model | str | 'sam_b.pt' | セグメンテーションのためのSAMモデルのパス(SAM、SAM2バリアント、およびMobileSAMモデルをサポート)。 |
device | str | '' | 計算デバイス(例:'cuda:0'、'cpu'、または自動デバイス検出の場合は空文字列)。 |
conf | float | 0.25 | 弱い検出をフィルタリングするためのYOLO検出信頼度しきい値。 |
iou | float | 0.45 | 重なり合うボックスをフィルタリングするためのNon-Maximum SuppressionのIoUしきい値。 |
imgsz | int | 640 | 画像のサイズ変更のための入力サイズ(32の倍数である必要があります)。 |
max_det | int | 300 | メモリ効率のための画像あたりの最大検出数。 |
classes | list[int] | None | 検出するクラスインデックスのリスト(例:人&自転車の場合は[0, 1])。 |
output_dir | str | None | アノテーションの保存ディレクトリ(データパスからの相対でデフォルトは'./labels')。 |
auto_annotate関数は、画像へのパスと、事前学習済み検出モデル(YOLO26、YOLO11、またはその他のモデル)およびセグメンテーションモデル(SAM、SAM2、MobileSAM)を指定するためのオプション引数、モデルを実行するデバイス、アノテーション結果を保存する出力ディレクトリを受け取ります。
事前学習済みモデルの力を活用することで、自動アノテーションは高品質なセグメンテーションデータセットの作成に必要な時間と労力を大幅に削減できます。この機能は、大規模な画像コレクションを扱う研究者や開発者にとって特に有用であり、手動アノテーションではなくモデルの開発や評価に集中できるようになります。
データセットアノテーションの可視化
モデルをトレーニングする前に、データセットのアノテーションを可視化して正しさを確認すると役立ちます。Ultralyticsはこの目的のためにユーティリティ関数を提供しています。
from ultralytics.data.utils import visualize_image_annotations
label_map = { # Define the label map with all annotated class labels.
0: "person",
1: "car",
}
# Visualize
visualize_image_annotations(
"path/to/image.jpg", # Input image path.
"path/to/annotations.txt", # Annotation file path for the image.
label_map,
)この関数は、バウンディングボックスを描画し、クラス名でオブジェクトにラベルを付け、読みやすさを向上させるためにテキストの色を調整します。これにより、トレーニング前にアノテーションエラーを特定して修正するのに役立ちます。
セグメンテーションマスクのYOLO形式への変換
バイナリ形式のセグメンテーションマスクがある場合は、以下を使用してYOLOセグメンテーション形式に変換できます。
from ultralytics.data.converter import convert_segment_masks_to_yolo_seg
# For datasets like COCO with 80 classes
convert_segment_masks_to_yolo_seg(masks_dir="path/to/masks_dir", output_dir="path/to/output_dir", classes=80)このユーティリティは、バイナリマスク画像をYOLOセグメンテーション形式に変換し、指定された出力ディレクトリに保存します。
FAQ
Ultralytics YOLOはインスタンスセグメンテーションに対してどのようなデータセット形式をサポートしていますか?
Ultralytics YOLOはインスタンスセグメンテーションに対していくつかのデータセット形式をサポートしており、主要な形式は独自のUltralytics YOLO形式です。データセット内の各画像には、クラスインデックスと正規化されたバウンディング座標を列挙した、複数行(オブジェクトごとに1行)にセグメント化されたオブジェクト情報を持つテキストファイルが必要です。YOLOデータセット形式の詳細については、インスタンスセグメンテーションデータセットの概要をご覧ください。
COCOデータセットのアノテーションをYOLO形式に変換するにはどうすればよいですか?
Converting COCO format annotations to YOLO format is straightforward using Ultralytics tools. You can use the convert_coco function from the ultralytics.data.converter module:
from ultralytics.data.converter import convert_coco
convert_coco(labels_dir="path/to/coco/annotations/", use_segments=True)このスクリプトは、COCOデータセットのアノテーションを必要なYOLO形式に変換し、YOLOモデルのトレーニングに適した状態にします。詳細については、ラベル形式の移植または変換を参照してください。
Ultralytics YOLOモデルをトレーニングするためのYAMLファイルを作成するにはどうすればよいですか?
UltralyticsでYOLOモデルをトレーニングするためのYAMLファイルを作成するには、データセットのパスとクラス名を定義する必要があります。以下はYAML設定の例です。
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# COCO8-seg dataset (first 8 images from COCO train2017) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/segment/coco8-seg/
# Example usage: yolo train data=coco8-seg.yaml
# parent
# ├── ultralytics
# └── datasets
# └── coco8-seg ← downloads here (1 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: coco8-seg # dataset root dir
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)
# Classes
names:
0: person
1: bicycle
2: car
3: motorcycle
4: airplane
5: bus
6: train
7: truck
8: boat
9: traffic light
10: fire hydrant
11: stop sign
12: parking meter
13: bench
14: bird
15: cat
16: dog
17: horse
18: sheep
19: cow
20: elephant
21: bear
22: zebra
23: giraffe
24: backpack
25: umbrella
26: handbag
27: tie
28: suitcase
29: frisbee
30: skis
31: snowboard
32: sports ball
33: kite
34: baseball bat
35: baseball glove
36: skateboard
37: surfboard
38: tennis racket
39: bottle
40: wine glass
41: cup
42: fork
43: knife
44: spoon
45: bowl
46: banana
47: apple
48: sandwich
49: orange
50: broccoli
51: carrot
52: hot dog
53: pizza
54: donut
55: cake
56: chair
57: couch
58: potted plant
59: bed
60: dining table
61: toilet
62: tv
63: laptop
64: mouse
65: remote
66: keyboard
67: cell phone
68: microwave
69: oven
70: toaster
71: sink
72: refrigerator
73: book
74: clock
75: vase
76: scissors
77: teddy bear
78: hair drier
79: toothbrush
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/coco8-seg.zipデータセットに応じてパスとクラス名を必ず更新してください。詳細については、データセットYAML形式のセクションを確認してください。
Ultralytics YOLOの自動アノテーション機能とは何ですか?
Ultralytics YOLOの自動アノテーション機能を使用すると、事前学習済み検出モデルを使用してデータセットのセグメンテーションアノテーションを生成できます。これにより、手動でのラベル付けの必要性が大幅に削減されます。以下のようにauto_annotate関数を使用できます。
from ultralytics.data.annotator import auto_annotate
auto_annotate(data="path/to/images", det_model="yolo26x.pt", sam_model="sam_b.pt") # or sam_model="mobile_sam.pt"この関数はアノテーションプロセスを自動化し、より迅速かつ効率的にします。詳細については、自動アノテーションリファレンスを参照してください。