Übersicht der Instanzsegmentierungsdatensätze

Q: What is the auto-annotation feature in Ultralytics YOLO?

Die automatische Beschriftung in Ultralytics YOLO ermöglicht es Ihnen, mit Hilfe eines vorab trainierten Erkennungsmodells Segmentierungsbeschriftungen für Ihren Datensatz zu erstellen. Dadurch wird der Bedarf an manueller Beschriftung erheblich reduziert. Sie können die Funktion auto_annotate wie folgt verwenden: Diese Funktion automatisiert den Annotationsprozess und macht ihn schneller und effizienter. Weitere Einzelheiten finden Sie in der Auto-Annotate-Referenz.

Die Instanzsegmentierung ist eine Aufgabe der Computer Vision, bei der einzelne Objekte in einem Bild identifiziert und abgegrenzt werden. Dieser Leitfaden bietet einen Überblick über die von Ultralytics YOLO unterstützten Datensatzformate für Instanzsegmentierungsaufgaben sowie Anweisungen zur Vorbereitung, Konvertierung und Verwendung dieser Datensätze für das Training Ihrer Modelle.

Unterstützte Dataset-Formate

Ultralytics YOLO Format

Das Format der Datensatzbeschriftung, das für das Training der YOLO Segmentierungsmodelle verwendet wird, ist wie folgt:

Eine Textdatei pro Bild: Jedes Bild im Datensatz hat eine entsprechende Textdatei mit demselben Namen wie die Bilddatei und der Erweiterung ".txt".
Eine Zeile pro Objekt: Jede Zeile in der Textdatei entspricht einer Objektinstanz im Bild.
Objektinformationen pro Zeile: Jede Zeile enthält die folgenden Informationen über die Objektinstanz:
- Objektklassen-Index: Eine ganze Zahl, die die Klasse des Objekts angibt (z. B. 0 für Person, 1 für Auto usw.).
- Objekt-Begrenzungskoordinaten: Die Begrenzungskoordinaten um den Maskenbereich, normiert auf einen Wert zwischen 0 und 1.

Das Format für eine einzelne Zeile in der Segmentierungsdatensatzdatei ist wie folgt:

<class-index> <x1> <y1> <x2> <y2> ... <xn> <yn>

In diesem Format, <class-index> ist der Index der Klasse für das Objekt, und <x1> <y1> <x2> <y2> ... <xn> <yn> sind die Begrenzungskoordinaten der Segmentierungsmaske des Objekts. Die Koordinaten sind durch Leerzeichen getrennt.

Hier ist ein Beispiel für das YOLO Datensatzformat für ein einzelnes Bild mit zwei Objekten, die aus einem 3-Punkt-Segment und einem 5-Punkt-Segment bestehen.

0 0.681 0.485 0.670 0.487 0.676 0.487
1 0.504 0.000 0.501 0.004 0.498 0.004 0.493 0.010 0.492 0.0104

Tipp

Die Länge der einzelnen Zeilen muss nicht gleich sein.
Jedes Segmentierungsetikett muss eine mindestens 3 xy-Punkte: <class-index> <x1> <y1> <x2> <y2> <x3> <y3>

Datensatz YAML-Format

Das Ultralytics Framework verwendet ein YAML-Dateiformat, um den Datensatz und die Modellkonfiguration für das Training von Detection Models zu definieren. Hier ist ein Beispiel für das YAML-Format, das für die Definition eines Erkennungsdatensatzes verwendet wird:

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/coco8-seg # dataset root dir (absolute or relative; if relative, it's relative to default datasets_dir)
train: images/train # train images (relative to 'path') 4 images
val: images/val # val images (relative to 'path') 4 images
test: # test images (optional)

# Classes (80 COCO classes)
names:
    0: person
    1: bicycle
    2: car
    # ...
    77: teddy bear
    78: hair drier
    79: toothbrush

Die train und val geben die Pfade zu den Verzeichnissen an, die die Trainings- bzw. Validierungsbilder enthalten.

names ist ein Wörterbuch mit Klassennamen. Die Reihenfolge der Namen sollte mit der Reihenfolge der Objektklassenindizes in den Dateien des YOLO -Datensatzes übereinstimmen.

Verwendung

Beispiel

PythonCLI

from ultralytics import YOLO

# Load a model
model = YOLO("yolo11n-seg.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="coco8-seg.yaml", epochs=100, imgsz=640)

# Start training from a pretrained *.pt model
yolo segment train data=coco8-seg.yaml model=yolo11n-seg.pt epochs=100 imgsz=640

Unterstützte Datensätze

Ultralytics YOLO unterstützt verschiedene Datensätze für beispielsweise Segmentierungsaufgaben. Hier ist eine Liste der am häufigsten verwendeten:

COCO: Ein umfassender Datensatz für die Erkennung, Segmentierung und Beschriftung von Objekten mit über 200.000 beschrifteten Bildern aus einer Vielzahl von Kategorien.
COCO8-seg: Eine kompakte 8-Bilder-Teilmenge von COCO, die zum schnellen Testen des Segmentierungsmodells entwickelt wurde, ideal für CI-Checks und Workflow-Validierung in der ultralytics Repository.
COCO128-seg: Ein kleinerer Datensatz für Instanzsegmentierungsaufgaben, der eine Teilmenge von 128 COCO-Bildern mit Segmentierungskommentaren enthält.
Carparts-seg: Ein spezialisierter Datensatz, der sich auf die Segmentierung von Autoteilen konzentriert, ideal für Anwendungen im Automobilbereich. Er umfasst eine Vielzahl von Fahrzeugen mit detaillierten Anmerkungen zu den einzelnen Fahrzeugteilen.
Crack-seg: Ein Datensatz, der für die Segmentierung von Rissen in verschiedenen Oberflächen zugeschnitten ist. Er ist für die Instandhaltung von Infrastrukturen und die Qualitätskontrolle unerlässlich und liefert detaillierte Bilder für das Training von Modellen zur Erkennung struktureller Schwachstellen.
Package-seg: Ein Datensatz, der der Segmentierung verschiedener Arten von Verpackungsmaterialien und -formen gewidmet ist. Er ist besonders nützlich für Logistik und Lagerautomatisierung und hilft bei der Entwicklung von Systemen für die Handhabung und Sortierung von Verpackungen.

Hinzufügen eines eigenen Datensatzes

Wenn Sie einen eigenen Datensatz haben und diesen für das Training von Segmentierungsmodellen mit dem Format Ultralytics YOLO verwenden möchten, stellen Sie sicher, dass er dem oben unter "Ultralytics YOLO format" angegebenen Format entspricht. Konvertieren Sie Ihre Annotationen in das gewünschte Format und geben Sie die Pfade, Anzahl der Klassen und Klassennamen in der YAML-Konfigurationsdatei an.

Etikettenformate portieren oder konvertieren

COCO-Datensatzformat in YOLO Format

Mit dem folgenden Codeschnipsel können Sie ganz einfach Etiketten aus dem beliebten COCO-Datensatzformat in das Format YOLO konvertieren:

Beispiel

Python

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/", use_segments=True)

Dieses Konvertierungstool kann verwendet werden, um den COCO-Datensatz oder einen beliebigen Datensatz im COCO-Format in das Format Ultralytics YOLO zu konvertieren.

Vergewissern Sie sich, dass der Datensatz, den Sie verwenden möchten, mit Ihrem Modell kompatibel ist und den erforderlichen Formatkonventionen entspricht. Korrekt formatierte Datensätze sind entscheidend für das Training erfolgreicher Objekterkennungsmodelle.

Auto-Annotation

Die automatische Beschriftung ist eine wichtige Funktion, mit der Sie einen Segmentierungsdatensatz mithilfe eines vorab trainierten Erkennungsmodells erstellen können. Sie ermöglicht es Ihnen, eine große Anzahl von Bildern schnell und genau zu beschriften, ohne dass eine manuelle Beschriftung erforderlich ist, was Zeit und Mühe spart.

Erzeugen eines Segmentierungsdatensatzes unter Verwendung eines Erkennungsmodells

Um Ihren Datensatz mit Hilfe des Ultralytics Frameworks automatisch zu annotieren, können Sie die auto_annotate Funktion wie unten dargestellt:

Beispiel

Python

from ultralytics.data.annotator import auto_annotate

auto_annotate(data="path/to/images", det_model="yolo11x.pt", sam_model="sam_b.pt")

Argument	Typ	Standard	Beschreibung
`data`	`str`	erforderlich	Pfad zum Verzeichnis, das die Zielbilder für die Beschriftung oder Segmentierung enthält.
`det_model`	`str`	`'yolo11x.pt'`	YOLO Erkennungsmodellpfad für die anfängliche Objekterkennung.
`sam_model`	`str`	`'sam_b.pt'`	SAM für die Segmentierung (unterstützt SAM, SAM2 und mobile_sam-Modelle).
`device`	`str`	`''`	Berechnungsgerät (z. B. 'cuda:0', 'cpu' oder '' für die automatische Geräteerkennung).
`conf`	`float`	`0.25`	YOLO Schwellenwert für die Erkennungswahrscheinlichkeit zum Herausfiltern schwacher Erkennungen.
`iou`	`float`	`0.45`	IoU-Schwelle für die Nicht-Maximum-Unterdrückung, um überlappende Boxen zu filtern.
`imgsz`	`int`	`640`	Eingabegröße für die Größenänderung von Bildern (muss ein Vielfaches von 32 sein).
`max_det`	`int`	`300`	Maximale Anzahl von Erkennungen pro Bild, um den Speicher zu schonen.
`classes`	`list[int]`	`None`	Liste der zu erkennenden Klassenindizes (z. B., `[0, 1]` für Person & Fahrrad).
`output_dir`	`str`	`None`	Speicherverzeichnis für Anmerkungen (Standardwert ist './labels' relativ zum Datenpfad).

Die auto_annotate erhält den Pfad zu Ihren Bildern sowie optionale Argumente zur Angabe der trainierten Erkennungsmodelle, z. B. YOLO11, YOLOv8 oder andere Modelle und Segmentierungsmodelle, d.h, SAM, SAM2 oder MobileSAMdas Gerät, auf dem die Modelle ausgeführt werden sollen, und das Ausgabeverzeichnis zum Speichern der kommentierten Ergebnisse.

Durch die Nutzung der Leistungsfähigkeit von vorab trainierten Modellen kann die automatische Annotation den Zeit- und Arbeitsaufwand für die Erstellung hochwertiger Segmentierungsdatensätze erheblich reduzieren. Diese Funktion ist besonders nützlich für Forscher und Entwickler, die mit großen Bildsammlungen arbeiten, da sie sich auf die Modellentwicklung und -evaluierung statt auf die manuelle Annotation konzentrieren können.

Datensatzanmerkungen visualisieren

Bevor Sie Ihr Modell trainieren, ist es oft hilfreich, Ihre Datensatzkommentare zu visualisieren, um sicherzustellen, dass sie korrekt sind. Ultralytics bietet zu diesem Zweck eine Dienstprogrammfunktion:

from ultralytics.data.utils import visualize_image_annotations

label_map = {  # Define the label map with all annotated class labels.
    0: "person",
    1: "car",
}

# Visualize
visualize_image_annotations(
    "path/to/image.jpg",  # Input image path.
    "path/to/annotations.txt",  # Annotation file path for the image.
    label_map,
)

Diese Funktion zeichnet Begrenzungsrahmen (Bounding Boxes), beschriftet Objekte mit Klassennamen und passt die Textfarbe für eine bessere Lesbarkeit an, so dass Sie vor dem Training eventuelle Fehler in den Anmerkungen erkennen und korrigieren können.

Konvertierung von Segmentierungsmasken in das YOLO

Wenn Sie Segmentierungsmasken im Binärformat haben, können Sie diese mit in das YOLO konvertieren:

from ultralytics.data.converter import convert_segment_masks_to_yolo_seg

# For datasets like COCO with 80 classes
convert_segment_masks_to_yolo_seg(masks_dir="path/to/masks_dir", output_dir="path/to/output_dir", classes=80)

Dieses Dienstprogramm konvertiert binäre Maskenbilder in das YOLO und speichert sie im angegebenen Ausgabeverzeichnis.

FAQ

Welche Datensatzformate werden von Ultralytics YOLO für die Instanzsegmentierung unterstützt?

Ultralytics YOLO unterstützt mehrere Datensatzformate für die Segmentierung von Beispielen, wobei das Hauptformat sein eigenes Ultralytics YOLO Format ist. Jedes Bild in Ihrem Datensatz benötigt eine entsprechende Textdatei mit Objektinformationen, die in mehrere Zeilen (eine Zeile pro Objekt) segmentiert sind und den Klassenindex und normalisierte Begrenzungskoordinaten enthalten. Ausführlichere Anweisungen zum YOLO Dataset-Format finden Sie in der Übersicht über Instanzsegmentierungsdatensätze.

Wie kann ich COCO-Datensatz-Anmerkungen in das Format YOLO konvertieren?

Die Konvertierung von Anmerkungen im COCO-Format in das Format YOLO ist mit den Tools von Ultralytics ganz einfach. Sie können die convert_coco Funktion aus der ultralytics.data.converter Modul:

from ultralytics.data.converter import convert_coco

convert_coco(labels_dir="path/to/coco/annotations/", use_segments=True)

Dieses Skript konvertiert Ihre COCO-Datensatz-Annotationen in das erforderliche YOLO Format, so dass sie für das Training Ihrer YOLO Modelle geeignet sind. Weitere Einzelheiten finden Sie unter Portieren oder Konvertieren von Etikettenformaten.

Wie bereite ich eine YAML-Datei für das Training von Ultralytics YOLO Modellen vor?

Um eine YAML-Datei für das Training von YOLO Modellen mit Ultralytics vorzubereiten, müssen Sie die Pfade zu den Datensätzen und die Klassennamen definieren. Hier ist ein Beispiel für eine YAML-Konfiguration:

path: ../datasets/coco8-seg # dataset root dir
train: images/train # train images (relative to 'path')
val: images/val # val images (relative to 'path')

names:
    0: person
    1: bicycle
    2: car
    # ...

Stellen Sie sicher, dass Sie die Pfade und Klassennamen entsprechend Ihrem Datensatz aktualisieren. Weitere Informationen finden Sie im Abschnitt Dataset YAML Format.

Was ist die automatische Anmerkungsfunktion in Ultralytics YOLO ?

Mit der automatischen Beschriftung in Ultralytics YOLO können Sie mithilfe eines vorab trainierten Erkennungsmodells Segmentierungsbeschriftungen für Ihren Datensatz erstellen. Dadurch wird der Bedarf an manueller Beschriftung erheblich reduziert. Sie können die auto_annotate wie folgt funktionieren:

from ultralytics.data.annotator import auto_annotate

auto_annotate(data="path/to/images", det_model="yolo11x.pt", sam_model="sam_b.pt")  # or sam_model="mobile_sam.pt"

Diese Funktion automatisiert den Anmerkungsprozess und macht ihn schneller und effizienter. Weitere Einzelheiten finden Sie in der Auto-Annotate-Referenz.

📅 Erstellt vor 1 Jahr ✏️ Aktualisiert vor 8 Tagen

Übersicht der Instanzsegmentierungsdatensätze

Unterstützte Dataset-Formate

Ultralytics YOLO Format

Datensatz YAML-Format

Verwendung

Unterstützte Datensätze

Hinzufügen eines eigenen Datensatzes

Etikettenformate portieren oder konvertieren

COCO-Datensatzformat in YOLO Format

Auto-Annotation

Erzeugen eines Segmentierungsdatensatzes unter Verwendung eines Erkennungsmodells

Datensatzanmerkungen visualisieren

Konvertierung von Segmentierungsmasken in das YOLO

FAQ

Welche Datensatzformate werden von Ultralytics YOLO für die Instanzsegmentierung unterstützt?

Wie kann ich COCO-Datensatz-Anmerkungen in das Format YOLO konvertieren?

Wie bereite ich eine YAML-Datei für das Training von Ultralytics YOLO Modellen vor?

Was ist die automatische Anmerkungsfunktion in Ultralytics YOLO ?

Kommentare