Zum Inhalt springen

Datensätze

Ultralytics Platform-Datensätze bieten eine optimierte Lösung zur Verwaltung Ihrer Trainingsdaten. Nach dem Upload können Datensätze sofort für das Modelltraining verwendet werden, mit automatischer Verarbeitung und Statistikgenerierung.

Datensatz hochladen

Ultralytics akzeptiert mehrere Upload-Formate und bietet somit Flexibilität.

Unterstützte Formate

FormatErweiterungenHinweiseMaximale Größe
JPEG.jpg, .jpegAm häufigsten, empfohlen50 MB
PNG.pngUnterstützt Transparenz50 MB
WebP.webpModern, gute Kompression50 MB
BMP.bmpUnkomprimiert50 MB
TIFF.tiff, .tifHohe Qualität50 MB
HEIC.heiciPhone-Fotos50 MB
AVIF.avifFormat der nächsten Generation50 MB
JP2.jp2JPEG 200050 MB
DNG.dngRohkamera50 MB
MPO.mpoMehrfachbildobjekt50 MB

Videos werden auf der Client-Seite automatisch mit 1 FPS (maximal 100 Bilder pro Video) in Einzelbilder zerlegt.

FormatErweiterungenExtraktionMaximale Größe
MP4.mp41 FPS, maximal 100 Bilder1 GB
WebM.webm1 FPS, maximal 100 Bilder1 GB
MOV.mov1 FPS, maximal 100 Bilder1 GB
AVI.avi1 FPS, maximal 100 Bilder1 GB
MKV.mkv1 FPS, maximal 100 Bilder1 GB
M4V.m4v1 FPS, maximal 100 Bilder1 GB

Video-Frame-Extraktion

Vor dem Hochladen werden im Browser Videobilder mit einer Rate von 1 Bild pro Sekunde extrahiert. Ein 60-Sekunden-Video ergibt 60 Bilder. Die maximale Anzahl beträgt 100 Bilder pro Video – bei Videos, die länger als etwa 100 Sekunden sind, werden 100 Bilder gleichmäßig über die gesamte Dauer verteilt.

Archive werden automatisch extrahiert und verarbeitet.

FormatErweiterungenHinweiseKostenlosProEnterprise
ZIP.zipAm häufigsten10 GB20 GB50 GB
TAR.tar .tar.gz .tgzKomprimiert oder roh10 GB20 GB50 GB
NDJSON.ndjsonDatensatzexport10 GB20 GB50 GB

Vorbereitung Ihres Datensatzes

Die Plattform unterstützt zwei Annotationsformate sowie Rohdaten-Uploads: Ultralytics YOLO, COCOund Rohdaten (nicht annotierte Bilder):

Verwenden Sie die Standard YOLO mit einem data.yaml Datei:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Die yaml-Datei definiert Ihre Datensatzkonfiguration:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Verwenden Sie JSON-Annotationsdateien mit der Standard COCO :

my-coco-dataset/
├── train/
│   ├── _annotations.coco.json
│   ├── img001.jpg
│   └── img002.jpg
└── val/
    ├── _annotations.coco.json
    ├── img003.jpg
    └── img004.jpg

Die JSON-Datei enthält images, annotationsund categories Arrays:

{
    "images": [{ "id": 1, "file_name": "img001.jpg", "width": 640, "height": 480 }],
    "annotations": [{ "id": 1, "image_id": 1, "category_id": 0, "bbox": [100, 50, 200, 300] }],
    "categories": [{ "id": 0, "name": "person" }]
}

COCO-Annotationen werden während des Uploads automatisch konvertiert. Detection (bbox), segmentierung (segmentation Polygone) und Pose (keypoints) Aufgaben werden unterstützt. Kategorie-IDs werden über alle Annotationsdateien hinweg auf eine dichte, 0-indizierte Sequenz umgewandelt. Für die Konvertierung zwischen Formaten siehe Formatkonvertierungswerkzeuge.

Roh-Uploads

Rohdaten: Laden Sie unkommentierte Bilder (ohne Labels) hoch. Nützlich, wenn Sie planen, direkt auf der Plattform mit dem Annotationseditor zu annotieren.

Flache Verzeichnisstruktur

Sie können auch Bilder ohne die Ordnerstruktur „train/val“ hochladen. Bilder, die ohne getrennte Ordner hochgeladen werden, werden dem Ordner train Standardmäßig geteilt. Sie können sie später mithilfe der Funktion „Massenverschiebung zum Teilen“ neu zuweisen.

Automatische Erkennung des Formats

Das Format wird automatisch erkannt: Datensätze mit einer data.yaml enthaltend names, train, oder val Schlüssel werden als YOLO behandelt. Datensätze mit COCO -Dateien (die images, annotationsund categories Arrays) werden als COCO behandelt. Datasets, die nur Bilder und keine Annotationen enthalten, werden als Rohdaten behandelt.

Einzelheiten zum aufgabenspezifischen Format finden Sie unter „Unterstützte Aufgaben “ und „Übersicht über Datensätze“.

Upload-Prozess

  1. Navigieren zu Datasets in der Seitenleiste
  2. Klicken Sie New Dataset oder ziehen Sie Dateien in den Upload-Bereich
  3. Wählen Sie den Aufgabentyp aus (siehe unterstützte Aufgaben).
  4. Fügen Sie einen Namen und eine optionale Beschreibung hinzu
  5. Sichtbarkeit festlegen (öffentlich oder privat) und optionale Lizenz (siehe verfügbare Lizenzen)
  6. Klicken Sie Create

Ultralytics Datensätze Hochladen Dialogfeld Aufgabenauswahl

Nach dem Upload verarbeitet die Plattform Ihre Daten über eine mehrstufige Pipeline:

graph LR
    A[Upload] --> B[Validate]
    B --> C[Normalize]
    C --> D[Thumbnail]
    D --> E[Parse Labels]
    E --> F[Statistics]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#2196F3,color:#fff
    style D fill:#2196F3,color:#fff
    style E fill:#2196F3,color:#fff
    style F fill:#9C27B0,color:#fff
  1. Validierung: Format- und Größenprüfungen
  2. Normalisierung: Große Bilder skaliert (max. 4096px, min. Dimension 28px)
  3. Miniaturansichten: 256px WebP-Vorschauen generiert
  4. Label-Parsing: YOLO- und COCO-Format-Labels extrahiert
  5. Statistiken: Klassenverteilungen und Bilddimensionen berechnet.

Ultralytics Datensätze Fortschrittsbalken beim Hochladen

Vor dem Hochladen validieren

Sie können Ihren Datensatz lokal validieren, bevor Sie ihn hochladen:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")

Anforderungen an die Bildgröße

Bilder müssen an ihrer kürzesten Seite mindestens 28 Pixel groß sein. Bilder, die kleiner sind, werden während der Verarbeitung abgelehnt. Bilder, die an ihrer längsten Seite größer als 4096 Pixel sind, werden automatisch unter Beibehaltung des Seitenverhältnisses in der Größe angepasst.

Bilder durchsuchen

Zeigen Sie Ihre Datensatzbilder in verschiedenen Layouts an:

AnsichtBeschreibung
RasterMiniaturbildraster mit Anmerkungsüberlagerungen (Standard)
KompaktKleinere Miniaturbilder für schnelles Scannen
TabelleListe mit Miniaturansicht, Dateiname, Abmessungen, Größe, Aufteilung, Klassen und Anzahl der Beschriftungen

Ultralytics Datensätze Galerie Rasteransicht mit Anmerkungen

Sortieren und Filtern

Bilder können sortiert und gefiltert werden, um das Durchsuchen zu optimieren:

SortierenBeschreibung
NeuesteZuletzt hinzugefügt
ÄltesteAm frühesten hinzugefügt
Name A-ZAlphabetisch
Name Z-AUmgekehrte alphabetische Reihenfolge
Größe (kleinstes)Kleinste Dateien zuerst
Größe (größte)Größte Dateien zuerst
Die meisten EtikettenDie meisten Anmerkungen
Wenigste EtikettenWenigste Anmerkungen
FilterOptionen
Geteilter FilterTrainieren, Val, Testen oder Alle
EtikettenfilterAlle Bilder, annotiert oder unannotiert
SuchenBilder nach Dateinamen filtern

Unbeschriftete Bilder finden

Verwenden Sie den Etikettenfilter, der auf Unannotated um schnell Bilder zu finden, die noch kommentiert werden müssen. Dies ist besonders nützlich für große Datensätze, bei denen Sie den Fortschritt track möchten.

Vollbild-Viewer

Klicken Sie auf ein beliebiges Bild, um den Vollbild-Viewer zu öffnen mit:

  • Navigation: Pfeiltasten oder Miniaturansichten zum Durchsuchen
  • Metadaten: Dateiname, Dimensionen, Split-Badge, Anzahl der Annotationen
  • Annotationen: Sichtbarkeit der Annotationsüberlagerung umschalten
  • Klassenaufschlüsselung: Label-Anzahlen pro Klasse mit Farbindikatoren
  • Bearbeiten: Wechseln Sie in den Annotationsmodus, um Labels hinzuzufügen oder zu ändern.
  • Herunterladen: Laden Sie die Originalbilddatei herunter
  • Löschen: Das Bild aus dem Datensatz löschen.
  • Zoom: Cmd/Ctrl+Scroll vergrößern/verkleinern
  • Pixelansicht: Schaltet die pixelierte Darstellung für eine detaillierte Inspektion um

Ultralytics -Datensätze Vollbild-Viewer mit Metadaten-Panel

Nach Split filtern

Bilder nach ihrem Dataset-Split filtern:

SplitZweck
TrainierenVerwendet für das Modelltraining
ValidierenVerwendet zur Validierung während des Trainings
TestVerwendet für die finale Evaluierung

Datensatz-Tabs

Jede Datensatzseite verfügt über sechs Registerkarten, die über die Registerkartenleiste zugänglich sind:

Registerkarte „Bilder“

Die Standardansicht zeigt die Bildergalerie mit Anmerkungen. Unterstützt die Ansichtsmodi „Raster“, „Kompakt“ und „Tabelle“. Ziehen Sie Dateien hierher, um weitere Bilder hinzuzufügen.

Klassen-Tab

Verwalten Sie Annotationsklassen für Ihren Datensatz:

  • Klassenhistorgramm: Balkendiagramm, das die Annotationsanzahl pro Klasse mit Umschalter für lineare/logarithmische Skala zeigt
  • Klassentabelle: Sortierbare, durchsuchbare Tabelle mit Klassenname, Label-Anzahl und Bildanzahl
  • Klassennamen bearbeiten: Klicken Sie auf einen Klassennamen, um ihn inline umzubenennen.
  • Klassenfarben bearbeiten: Klicken Sie auf ein Farbfeld, um die Klassenfarbe zu ändern.
  • Neue Klasse hinzufügen: Verwenden Sie das Eingabefeld unten, um Klassen hinzuzufügen

Ultralytics Datensätze Registerkarte „Klassen“ Histogramm und Tabelle

Logarithmische Skala für unausgewogene Datensätze

Wenn Ihr Datensatz ein Klassenungleichgewicht aufweist (z. B. 10.000 Annotationen „Person”, aber nur 50 „Fahrrad”), verwenden Sie die Log Scale Aktivieren Sie das Klassenhistogramm, um alle Klassen übersichtlich darzustellen.

Diagramm-Registerkarte

Automatische Statistiken, berechnet aus Ihrem Datensatz:

DiagrammBeschreibung
Geteilte VerteilungDonut-Diagramm der Anzahl von Trainings-/Validierungs-/Testbildern und des prozentualen Anteils der gelabelten Bilder
Top-KlassenDonut-Diagramm der 10 häufigsten Annotationsklassen
BildbreitenHistogramm der Bildbreitenverteilung mit Mittelwert
BildhöhenHistogramm der Bildhöhenverteilung mit Mittelwert
Punkte pro InstanzAnzahl der Polygon-Eckpunkte oder Schlüsselpunkte pro Anmerkung (segment)
Annotationsorte2D-Heatmap der Mittelpunktpositionen von Bounding Boxes
Bildabmessungen2D-Breite-vs.-Höhe-Heatmap mit Seitenverhältnis-Hilfslinien

Ultralytics Datensätze Registerkarte „Diagramme“ Statistikraster

Statistik-Caching

Statistiken werden für 5 Minuten zwischengespeichert. Änderungen an Annotationen werden nach Ablauf des Caches übernommen.

Vollbild-Heatmaps

Klicken Sie auf den Erweitern-Button bei jeder Heatmap, um sie im Vollbildmodus anzuzeigen. Dies bietet eine größere, detailliertere Ansicht — nützlich zum Verständnis räumlicher Muster in großen Datensätzen.

Registerkarte „Modelle“

Alle Modelle, die mit diesem Datensatz trainiert wurden, in einer durchsuchbaren Tabelle anzeigen:

SpalteBeschreibung
NameModellname mit Link
ProjektÜbergeordnetes Projekt mit Symbol
StatusAusbildungsstatus-Abzeichen
AufgabeYOLO entyp
EpochenBeste Epoche / Gesamtepochen
mAP50-95Mittlere durchschnittliche Genauigkeit
mAP50mAP IoU ,50
ErstelltErstellungsdatum

Ultralytics Datensätze Registerkarte „Modelle“ Tabelle „Trainierte Modelle“

Registerkarte „Fehler“

Bilder, deren Verarbeitung fehlgeschlagen ist, werden hier mit folgenden Angaben aufgelistet:

  • Fehlerbanner: Gesamtanzahl der fehlgeschlagenen Bilder und Hinweise
  • Fehlertabelle: Dateiname, benutzerfreundliche Fehlerbeschreibung, Korrekturhinweise und Vorschaubild
  • Häufige Fehler sind beschädigte Dateien, nicht unterstützte Formate, zu kleine Bilder (min. 28px) und nicht unterstützte Farbmodi.

Ultralytics : Registerkarte „Fehler“ – Verarbeitungsfehler bei Datensätzen

Häufige Verarbeitungsfehler
FehlerUrsacheBeheben
Bilddatei kann nicht gelesen werdenBeschädigtes oder nicht unterstütztes FormatWiederausfuhr aus Bildbearbeitungsprogramm
Unvollständig oder beschädigtDie Datei wurde während der Übertragung abgeschnitten.Laden Sie die Originaldatei erneut herunter.
Bild zu kleinMindestgröße unter 28pxVerwenden Sie Quellbilder mit höherer Auflösung.
Nicht unterstützter FarbmodusCMYK- oder indizierter FarbmodusIn den RGB-Modus konvertieren

Registerkarte „Versionen“

Erstellen Sie unveränderliche NDJSON-Snapshots Ihres Datensatzes für reproduzierbares Training. Jede Version erfasst die Bildanzahl, Klassenanzahl, Annotationsanzahl und Dateigröße zum Zeitpunkt der Erstellung.

SpalteBeschreibung
VersionVersionsnummer (v1, v2, ...)
BeschreibungVom Benutzer bereitgestellte Beschreibung (bearbeitbar)
BilderBildanzahl zum Zeitpunkt der Momentaufnahme
KlassenKlassenanzahl zum Zeitpunkt der Aufnahme
AnnotationenAnzahl der Annotationen zum Zeitpunkt des Snapshots
GrößeNDJSON-Exportdateigröße
ErstelltAls die Version erstellt wurde

So erstellen Sie eine Version:

  1. Öffnen Sie die Registerkarte „Versionen “.
  2. Geben Sie optional eine Beschreibung ein (z. B. „500 Trainingsbilder hinzugefügt“ oder „Falsch beschriftete Klassen korrigiert“).
  3. Klicken Sie auf + Neue Version
  4. Der NDJSON-Snapshot wird automatisch generiert und heruntergeladen.

Jede Version wird fortlaufend nummeriert (v1, v2, v3...) und dauerhaft gespeichert. Sie können jede frühere Version jederzeit aus der Versionsübersicht herunterladen.

Wann Versionen erstellen?

Erstellen Sie eine Version vor und nach größeren Änderungen an Ihrem Datensatz — wie dem Hinzufügen von Bildern, dem Korrigieren von Annotationen oder dem Neuausgleich von Splits. Dies ermöglicht Ihnen den Vergleich der Modellleistung über verschiedene Datensatz-Zustände hinweg.

NDJSON-Dateigröße

Die angezeigte Größe ist die Größe der NDJSON-Exportdatei, die Bild-URLs und Anmerkungen enthält – nicht die Bilder selbst. Die eigentlichen Bilddaten werden separat gespeichert und über signierte URLs abgerufen.

Datensatz exportieren

Exportieren Sie Ihren Datensatz für die Offline-Nutzung. Die Plattform unterstützt mehrere Exportformate:

FormatBeschreibung
YOLOStandard YOLO mit Bildern und .txt Etiketten
COCOCOCO JSON-Format mit Annotations-Arrays
Pascal VOCXML-Annotationsdateien pro Bild
NDJSONEin JSON-Objekt pro Zeile (schlanke Metadaten)

Zum Exportieren:

  1. Klicken Sie auf die Exportieren-Schaltfläche im Datensatz-Header.
  2. Wählen Sie das gewünschte Format aus
  3. Der Exportvorgang läuft asynchron – Sie erhalten eine Benachrichtigung, sobald der Download bereitsteht

Ultralytics Datensätze exportieren Ndjson herunterladen

Das NDJSON-Format speichert ein JSON-Objekt pro Zeile. Die erste Zeile enthält Metadaten zum Datensatz, gefolgt von einer Zeile pro Bild:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}

Signierte URLs

Die Bild-URLs im exportierten NDJSON sind signiert und 7 Tage lang gültig. Wenn Sie neue URLs benötigen, exportieren Sie den Datensatz erneut oder erstellen Sie eine neue Version.

Die vollständige Spezifikation finden Sie in der Ultralytics NDJSON-Formatdokumentation.

Bildbearbeitung

Schnellaktionen

Klicken Sie mit der rechten Maustaste auf ein beliebiges Bild in der Raster- oder Kompaktansicht, um auf Schnellaktionen zuzugreifen:

AktionBeschreibung
Umzug nach SplitWeise das Bild der Trainings-, Validierungs- oder Testgruppe zu
HerunterladenDie ursprüngliche Bilddatei herunterladen
LöschenLöschen Sie das Bild aus dem Dataset

Ultralytics – Datensätze – Bildkarte – Kontextmenü

Einzelstück vs. Großpackung

Das Kontextmenü für Bilder gilt für ein einzelnes Bild. Für Massenoperationen an mehreren Bildern verwenden Sie bitte die Tabellenansicht mit der Auswahl über Kontrollkästchen.

Massenverschiebung zu Split

Wählen Sie die gewünschten Bilder aus und ordnen Sie sie einer anderen Aufteilung innerhalb desselben Datensatzes zu:

  1. Zur Tabellenansicht wechseln
  2. Bilder über Kontrollkästchen auswählen
  3. Rechtsklick zum Öffnen des Kontextmenüs
  4. Wählen Sie Move to split > Trainieren, Validierung, oder Test

Sie können Bilder auch per Drag & Drop auf die geteilten Filterregisterkarten in der Rasteransicht ziehen.

Organisation von Zug-/Val-Aufteilungen

Laden Sie alle Bilder in einen Datensatz hoch und verwenden Sie dann die Funktion „Bulk Move-to-Split“, um Teilmengen in Trainings-, Validierungs- und Testdatensätze zu organisieren.

Aufteilung der Umverteilung

Verteile alle Bilder anhand benutzerdefinierter Verhältnisse auf die Trainings-, Validierungs- und Testgruppen:

  1. Klicken Sie in der Symbolleiste des Datensatzes auf die Trennleiste, um das Dialogfeld „Trennungen neu verteilen “ zu öffnen
  2. Passen Sie die Aufteilungsprozentsätze mit einer der folgenden Methoden an
  3. Überprüfen Sie die Vorschau der Live-Bildanzahl, um die Verteilung zu bestätigen
  4. Klicken Sie auf „Übernehmen“, um alle Bilder entsprechend Ihren Prozentsätzen neu zuzuordnen

Dialogfeld „Neuverteilung der Datensätze“ Ultralytics

Das Dialogfeld bietet drei Möglichkeiten, Ihre gewünschten Aufteilungsverhältnisse festzulegen:

MethodeBeschreibung
ZiehenZiehen Sie die Ziehpunkte zwischen den farbigen Segmenten, um die Trennlinien visuell anzupassen
TypBearbeiten Sie den prozentualen Wert für eine beliebige Aufteilung (die beiden anderen Aufteilungen werden automatisch proportional angepasst)
AutoMit einem Klick können Sie sofort eine Aufteilung von 80/20 zwischen Trainings- und Validierungsdaten festlegen, wobei die Testaufteilung auf 0 % gesetzt ist.

Eine Live-Vorschau zeigt Ihnen genau, wie viele Bilder in jedem Bereich angezeigt werden, bevor Sie die Aufteilung anwenden.

Schnelle 80/20-Aufteilung

Klicken Sie auf die Schaltfläche „Auto“, um sofort die empfohlene Aufteilung von 80 % für das Training und 20 % für die Validierung festzulegen. Dies ist das gängigste Verhältnis für das Training.

Massenlöschung

Mehrere Bilder gleichzeitig löschen:

  1. Bilder in der Tabellenansicht auswählen
  2. Rechtsklick und auswählen Delete
  3. Löschung bestätigen

Datensatz-URI

Referenzieren Sie Plattform-Datensätze mit dem ul:// URI-Format (siehe Nutzung von Plattform-Datensätzen):

ul://username/datasets/dataset-slug

Verwenden Sie diese URI, um Modelle von überall aus zu trainieren:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Überall mit Plattformdaten trainieren

Die ul:// Die URI funktioniert in jeder Umgebung:

  • Lokale Maschine: Trainieren Sie auf Ihrer Hardware, Daten werden automatisch heruntergeladen
  • Google Colab: Greifen Sie in Notebooks auf Ihre Plattform-Datensätze zu
  • Remote-Server: Trainieren Sie auf Cloud-VMs mit vollem Datensatz-Zugriff

Verfügbare Lizenzen

Die Plattform unterstützt die folgenden Lizenzen für Datensätze:

LizenzTyp
KeineKeine Lizenz ausgewählt
CC0-1.0Öffentlicher Bereich
CC-BY-2.5Permissiv
CC-BY-4.0Permissiv
CC-BY-SA-4.0Copyleft
CC-BY-NC-4.0Nicht kommerziell
CC-BY-NC-SA-4.0Copyleft
CC-BY-ND-4.0Keine Derivate
CC-BY-NC-ND-4.0Nicht kommerziell
Apache-2.0Permissiv
MITPermissiv
AGPL-3.0Copyleft
GPL-3.0Copyleft
Nur für ForschungszweckeEingeschränkt
SonstigesBenutzerdefiniert

Copyleft-Lizenzen

Beim Klonen eines Datensatzes mit einer Copyleft-Lizenz (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0) übernimmt der Klon die Lizenz und die Lizenzauswahl ist gesperrt.

Sichtbarkeitseinstellungen

Kontrollieren Sie, wer Ihren Datensatz sehen kann:

EinstellungBeschreibung
PrivatNur Sie können zugreifen
ÖffentlichJeder kann auf der Explore-Seite anzeigen

Die Sichtbarkeit wird beim Erstellen eines Datensatzes in der New Dataset Dialog über einen Umschalter. Öffentliche Datensätze sind sichtbar auf der Erkunden Seite.

Datensatz bearbeiten

Datensatz-Metadaten werden direkt auf der Datensatzseite inline bearbeitet — kein Dialog erforderlich:

  • Name: Klicken Sie auf den Datensatznamen, um ihn zu bearbeiten. Änderungen werden automatisch beim Verlassen des Feldes oder Enter.
  • Beschreibung: Klicken Sie auf die Beschreibung (oder den Platzhalter „Beschreibung hinzufügen...“), um sie zu bearbeiten. Änderungen werden automatisch gespeichert.
  • Task type: Klicken Sie auf das Aufgaben-Badge, um einen anderen Aufgabentyp auszuwählen.
  • Lizenz: Klicken Sie auf den Lizenzwähler, um die Datensatzlizenz zu ändern.

Ändern des Aufgabentyps

Jedes Bild speichert Anmerkungen für alle Aufgabentypen zusammen. Durch Ändern des Aufgabentyps des Datensatzes wird gesteuert, welche Anmerkungen im Editor sichtbar sind und in Exporte sowie im Training berücksichtigt werden. Anmerkungen für andere Aufgabentypen bleiben in der Datenbank erhalten und werden wieder angezeigt, wenn Sie zurückwechseln.

Datensatz klonen

Wenn Sie einen öffentlichen Datensatz anzeigen, der Ihnen nicht gehört, klicken Sie auf Clone Dataset um eine Kopie in Ihrem Arbeitsbereich zu erstellen. Der Klon enthält alle Bilder, Anmerkungen und Klassendefinitionen. Wenn der ursprüngliche Datensatz eine Copyleft-Lizenz hat, wird diese vom Klon übernommen und die Lizenzauswahl ist gesperrt.

Stern und Teilen

  • Stern: Klicken Sie auf den Stern-Button, um ein Dataset zu favorisieren. Die Anzahl der Sterne ist für alle Benutzer sichtbar.
  • Teilen: Für öffentliche Datensätze klicken Sie auf die Schaltfläche „Teilen“, um einen Link zu kopieren oder auf sozialen Plattformen zu teilen.

Datensatz löschen

Ein nicht mehr benötigtes Dataset löschen:

  1. Öffnen Sie das Aktionsmenü des Datensatzes
  2. Klicken Sie Delete
  3. Im Dialog bestätigen: "Dies verschiebt [name] in den Papierkorb. Sie können es innerhalb von 30 Tagen wiederherstellen."

Papierkorb und Wiederherstellen

Gelöschte Datasets werden in den Papierkorb verschoben – nicht dauerhaft gelöscht. Sie können sie innerhalb von 30 Tagen wiederherstellen unter Settings > Trash.

Auf Datensatz trainieren

Training direkt von Ihrem Dataset starten:

  1. Klicken Sie New Model auf der Datensatzseite
  2. Ein Projekt auswählen oder ein neues erstellen
  3. Trainingsparameter konfigurieren
  4. Training starten
graph LR
    A[Dataset] --> B[New Model]
    B --> C[Select Project]
    C --> D[Configure]
    D --> E[Start Training]

    style A fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Details finden Sie unter Cloud-Training.

FAQ

Was passiert mit meinen Daten nach dem Upload?

Ihre Daten werden in der von Ihnen ausgewählten Region (US, EU oder AP) verarbeitet und gespeichert. Bilder sind:

  1. Auf Format und Größe validiert
  2. Abgelehnt, wenn die Mindestgröße unter 28 px liegt.
  3. Normalisiert, wenn größer als 4096px (unter Beibehaltung des Seitenverhältnisses; für optimierte Speicherung codiert)
  4. Gespeichert unter Verwendung von Content-Addressable Storage (CAS) mit XXH3-128-Hashfunktion
  5. Miniaturansichten mit 256 px WebP für schnelles Browsen

Wie funktioniert die Speicherung?

Die Ultralytics Plattform verwendet Content-Addressable Storage (CAS) für eine effiziente Speicherung:

  • Deduplizierung: Identische Bilder, die von verschiedenen Benutzern hochgeladen werden, werden nur einmal gespeichert
  • Integrität: XXH3-128-Hashing gewährleistet die Datenintegrität
  • Effizienz: Reduziert Speicherkosten und beschleunigt die Verarbeitung
  • Regional: Daten bleiben in Ihrer ausgewählten Region (US, EU oder AP)

Kann ich einem bestehenden Datensatz Bilder hinzufügen?

Ja, ziehen Sie Dateien per Drag & Drop auf die Datensatzseite oder verwenden Sie die Schaltfläche „Hochladen“, um weitere Bilder hinzuzufügen. Neue Statistiken werden automatisch berechnet.

Wie verschiebe ich Bilder zwischen Spalten?

Verwenden Sie die Funktion „Bulk Move-to-Split“:

  1. Bilder in der Tabellenansicht auswählen
  2. Rechtsklick und auswählen Move to split
  3. Wählen Sie die Zielaufteilung aus (Trainieren, Validieren oder Testen).

Welche Label-Formate werden unterstützt?

Ultralytics unterstützt zwei Annotationsformate für den Upload:

Eins .txt Datei pro Bild mit normalisierten Koordinaten (Bereich 0-1):

AufgabeFormatBeispiel
Erkennenclass cx cy w h0 0.5 0.5 0.2 0.3
Segmentierenclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
Poseclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
KlassifizierenVerzeichnisstrukturtrain/cats/, train/dogs/

Sichtbarkeitskennzeichen für Posen: 0 = nicht gekennzeichnet, 1 = gekennzeichnet, aber verdeckt, 2 = gekennzeichnet und sichtbar.

JSON-Dateien mit images, annotationsund categories Arrays. Unterstützt detect (bbox), segmentierung (Polygon) und Pose (keypoints) Aufgaben. COCO verwendet absolute Pixelkoordinaten, die beim Hochladen automatisch in ein normalisiertes Format umgewandelt werden.

Kann ich denselben Datensatz für mehrere Aufgabentypen annotieren?

Ja. Jedes Bild enthält Annotationen für alle 5 Aufgabentypen (detect, segment, Pose, OBB, classify) zusammen. Du kannst den aktiven Aufgabentyp des Datensatzes jederzeit wechseln, ohne dass dabei vorhandene Annotationen verloren gehen. Im Editor werden nur Annotationen angezeigt, die dem aktiven Aufgabentyp entsprechen, und diese werden auch in Exporte und Trainings einbezogen – Annotationen für andere Aufgaben bleiben erhalten und werden wieder angezeigt, sobald du zurückwechselst.



📅 Erstellt vor 2 Monaten ✏️ Aktualisiert vor 1 Tag
glenn-jochersergiuwaxmannt-hakobyanmykolaxboikoLaughing-q

Kommentare