Datensätze

Ultralytics Platform-Datensätze bieten eine optimierte Lösung zur Verwaltung deiner Trainingsdaten. Nach dem Hochladen verarbeitet die Plattform Bilder, Labels und Statistiken automatisch. Ein Datensatz ist bereit für das Training, sobald die Verarbeitung abgeschlossen ist und er mindestens ein Bild im train-Split, mindestens ein Bild im val- oder test-Split, mindestens ein gelabeltes Bild sowie insgesamt mindestens zwei Bilder enthält.

Datensatz hochladen

Die Ultralytics Platform akzeptiert zur flexiblen Nutzung verschiedene Upload-Formate.

Unterstützte Formate

FormatErweiterungenHinweiseMaximale Größe
JPEG.jpg, .jpegAm gängigsten, empfohlen50 MB
PNG.pngUnterstützt Transparenz50 MB
WebP.webpModern, gute Komprimierung50 MB
BMP.bmpUnkomprimiert50 MB
TIFF.tiff, .tifHohe Qualität50 MB
HEIC.heiciPhone-Fotos50 MB
AVIF.avifFormat der nächsten Generation50 MB
JP2.jp2JPEG 200050 MB
DNG.dngRaw-Kameraformat50 MB
MPO.mpoMulti-Picture-Objekt50 MB

Vorbereitung deines Datensatzes

Die Plattform unterstützt Ultralytics YOLO, COCO, Ultralytics NDJSON sowie Raw-Uploads (ohne Annotationen):

Verwende die standardmäßige YOLO-Verzeichnisstruktur mit einer data.yaml-Datei:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Die YAML-Datei definiert deine Datensatzkonfiguration:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog
Raw-Uploads

Raw: Lade unannotierte Bilder (ohne Labels) hoch. Nützlich, wenn du planst, direkt auf der Plattform mit dem Annotierungs-Editor zu arbeiten.

Flache Verzeichnisstruktur

Du kannst Bilder auch ohne explizite Split-Ordner hochladen. Die Plattform berücksichtigt beim Hochladen das aktive Split-Ziel, und für Nicht-Klassifizierungs-Datensätze erstellt sie bei fehlenden Split-Informationen möglicherweise automatisch einen Validierungs-Split aus einem Teil des Trainingssets. Du kannst Bilder später jederzeit über die Funktion zum Verschieben in einen Split oder durch Split-Neuzuweisung ändern.

Automatische Formaterkennung

Das Format wird automatisch erkannt: Datensätze mit einer data.yaml, die names-, train- oder val-Keys enthält, werden als YOLO behandelt. Datensätze mit COCO-JSON-Dateien (die images-, annotations- und categories-Arrays enthalten) werden als COCO behandelt. .ndjson-Exporte werden als Ultralytics NDJSON importiert. Datensätze, die nur aus Bildern ohne Annotationen bestehen, werden als Raw behandelt.

Für aufgabenspezifische Formatdetails siehe unterstützte Aufgaben und die Datensatz-Übersicht.

Upload-Prozess

  1. Navigiere in der Seitenleiste zu Datasets
  2. Klicke auf New Dataset oder ziehe Dateien in den Upload-Bereich
  3. Wähle den Aufgabentyp aus (siehe unterstützte Aufgaben)
  4. Füge einen Namen und eine optionale Beschreibung hinzu
  5. Lege die Sichtbarkeit fest (öffentlich oder privat) und optional eine Lizenz (siehe verfügbare Lizenzen)
  6. Klicke auf Create

Ultralytics Platform Datasets Upload Dialog Task Selector

Nach dem Hochladen durchlaufen deine Daten eine mehrstufige Pipeline:

graph LR
    A[Upload] --> B[Validate]
    B --> C[Normalize]
    C --> D[Thumbnail]
    D --> E[Parse Labels]
    E --> F[Statistics]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#2196F3,color:#fff
    style D fill:#2196F3,color:#fff
    style E fill:#2196F3,color:#fff
    style F fill:#9C27B0,color:#fff
  1. Validierung: Format- und Größenprüfungen
  2. Normalisierung: Große Bilder werden skaliert (max. 4096px, Mindestgröße 28px)
  3. Thumbnails: 256px WebP-Vorschauen werden generiert
  4. Label-Parsing: YOLO und COCO-Format-Labels werden extrahiert
  5. Statistiken: Klassenverteilungen und Bildabmessungen werden berechnet

Ultralytics Platform Datasets Upload Progress Bar

Vor dem Hochladen validieren

Du kannst deinen Datensatz vor dem Hochladen lokal validieren:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")
Anforderungen an die Bildgröße

Bilder müssen an ihrer kürzesten Seite mindestens 28px groß sein. Kleinere Bilder werden während der Verarbeitung abgelehnt. Bilder, die an ihrer längsten Seite größer als 4096px sind, werden automatisch unter Beibehaltung des Seitenverhältnisses skaliert.

Bilder durchsuchen

Betrachte deine Datensatzbilder in verschiedenen Layouts.

Öffne das Clustering-Panel in der Galerie-Symbolleiste, um deinen Datensatz als interaktives 2D-Streudiagramm zu erkunden.

AnsichtBeschreibung
RasterThumbnail-Raster mit Annotations-Overlays (Standard)
KompaktKleinere Thumbnails für schnelles Scannen
TabelleListe mit Thumbnail, Dateiname, Abmessungen, Größe, Split, Klassen und Label-Anzahl

Ultralytics Platform Datasets Gallery Grid View With Annotations

Sortieren und Filtern

Bilder können für ein effizientes Browsen sortiert und gefiltert werden:

SortierenBeschreibung
Neueste / ÄltesteUpload- / Erstellungsreihenfolge
Name A-Z / Z-ADateiname alphabetisch
Höhe ↑/↓Bildhöhe in Pixeln
Breite ↑/↓Bildbreite in Pixeln
Größe ↑/↓Dateigröße auf dem Datenträger
Anmerkungen ↑/↓Anzahl der Anmerkungen pro Bild
Große Datensätze

Für Datensätze mit über 100.000 Bildern sind die Sortierungen nach Name / Größe / Breite / Höhe deaktiviert, um die Galerie reaktionsfähig zu halten. Sortierungen nach neuesten, ältesten und der Anmerkungsanzahl bleiben verfügbar.

Unmarkierte Bilder finden

Verwende den auf Unlabeled gesetzten Label-Filter, um schnell Bilder zu finden, die noch mit Anmerkungen versehen werden müssen. Dies ist besonders nützlich bei großen Datensätzen, bei denen du den Fortschritt der Labeling-Arbeit verfolgen möchtest.

Vollbildanzeige

Klicke auf ein beliebiges Bild, um die Vollbildanzeige zu öffnen mit:

  • Navigation: Pfeiltasten oder Vorschaubilder zum Durchsuchen
  • Metadaten: Dateiname, Abmessungen, Split-Badge, Anmerkungsanzahl
  • Anmerkungen: Sichtbarkeit der Anmerkungsebene umschalten
  • Klassenaufschlüsselung: Label-Anzahlen pro Klasse mit Farbindikatoren
  • Bearbeiten: Wechsle in den Anmerkungsmodus, um Labels hinzuzufügen oder zu ändern
  • Download: Lade die originale Bilddatei herunter
  • Löschen: Lösche das Bild aus dem Datensatz
  • Zoomen: Cmd/Ctrl+Scroll, Cmd/Ctrl++ oder Cmd/Ctrl+= zum Hineinzoomen und Cmd/Ctrl+- zum Herauszoomen
  • Ansicht zurücksetzen: Cmd/Ctrl + 0 oder der Zurücksetzen-Button, um das Bild an den Viewer anzupassen
  • Verschieben: Halte Space gedrückt und ziehe, um die Arbeitsfläche bei Zoom zu verschieben
  • Pixel-Ansicht: Schalte die pixelgenaue Darstellung für eine genaue Inspektion um

Ultralytics Platform Datasets Fullscreen Viewer With Metadata Panel

Nach Split filtern

Bilder nach ihrem Datensatz-Split filtern:

SplitZweck
TrainierenWird für das Modelltraining verwendet
ValWird für die Validierung während des Trainings verwendet
TestWird für die abschließende Evaluierung verwendet

Clustering

Das Clustering-Panel projiziert deinen Datensatz in ein interaktives 2D-Streudiagramm, bei dem visuell ähnliche Bilder nah beieinander liegen. Nutze es, um Cluster aufzudecken, Duplikate und Ausreißer zu finden sowie zu untersuchen, wie Splits oder Klassen auf deine Daten verteilt sind – ohne die Galerie zu verlassen. Öffne es über das Streudiagramm-Symbol in der Galerieleiste auf jeder Datensatzseite.

Ultralytics Platform Datasets Clustering Empty State

Analyse ausführen

Starte eine Analyse:

  1. Öffne einen Datensatz und klicke auf das Streudiagramm-Symbol in der Galerieleiste
  2. Klicke auf Analyze Dataset
  3. Warte, bis der Fortschrittsbalken abgeschlossen ist – die Ergebnisse erscheinen im selben Panel

Die Analyse läuft im Hintergrund und kann je nach Größe deines Datensatzes einige Minuten dauern. Du kannst das Panel schließen oder die Seite verlassen und später zurückkehren.

Visualisierung

Sobald die Analyse abgeschlossen ist, zeigt das Panel ein 2D-Streudiagramm aller analysierten Bilder. Galeriefilter (Split, Klasse, markiert/unmarkiert) blenden Punkte außerhalb des Filters aus, damit du dich auf die für dich relevante Untermenge konzentrieren kannst.

Ultralytics Platform Datasets Clustering Scatter Plot

Einfärben nach

Ändere die Schattierung der Datenpunkte mit dem Color by-Dropdown in der Panel-Symbolleiste. Wechsle jederzeit zwischen den Anzeigemodi – das Diagramm wird sofort neu eingefärbt, damit du sehen kannst, wie Splits, Klassen oder Bildeigenschaften über deine Cluster verteilt sind:

OptionSchattierung
SplitsTrain / Val / Test
KlassenErste Anmerkungsklasse auf jedem Bild
WidthBildbreite
HeightBildhöhe
SizeDateigröße
AnnotationenAnzahl der Anmerkungen pro Bild

Ultralytics Platform Datasets Clustering Color Modes

Lasso-Auswahl

Zeichne eine freie Auswahl um einen Bereich, um Punkte im Diagramm hervorzuheben. Die Galerie filtert auf die passenden Bilder, sodass du sie inspizieren, neu labeln, verschieben oder mithilfe der üblichen image operations löschen kannst.

Auswahl aufheben

Ein Chip über dem Diagramm zeigt an, wie viele Punkte ausgewählt sind – klicke auf das ×, um das Lasso aufzuheben und zur vollständigen Galerieansicht zurückzukehren.

Verschieben und Zoomen

Navigiere durch große Streudiagramme direkt mit Maus und Tastatur:

EingabeAktion
ScrollDas Diagramm in 2D verschieben
Cmd/Ctrl+ScrollHinein- oder herauszoomen, am Cursor verankert
Hold SpaceIn den Drag-to-Pan-Modus wechseln

Neuanalyse

Wenn sich dein Datensatz nach der Analyse ändert, erscheint oben im Panel eine Re-analyze-Schaltfläche für Besitzer und Editoren.

Klicke auf Re-analyze, um Embeddings und die 2D-Projektion komplett neu zu berechnen.

Datensatz-Tabs

Jede Datensatzseite kann je nach Datensatzstatus und deinen Berechtigungen bis zu sechs Tabs anzeigen:

Bilder-Tab

Die Standardansicht zeigt die Bildergalerie mit Anmerkungs-Overlays. Unterstützt Raster-, Kompakt- und Tabellenansichtsmodi. Ziehe Dateien per Drag-and-Drop hierher, um weitere Bilder hinzuzufügen.

Klassen-Tab

Dieser Tab erscheint, wenn der Datensatz Bilder enthält.

Verwalte Anmerkungsklassen für deinen Datensatz:

  • Klassenhistogramm: Balkendiagramm mit Anmerkungsanzahl pro Klasse mit Umschalter für lineare/logarithmische Skalierung
  • Klasstabelle: Sortierbare, durchsuchbare Tabelle mit Klassenname, Label-Anzahl und Bildanzahl
  • Klassennamen bearbeiten: Klicke auf einen Klassennamen, um ihn inline umzubenennen
  • Klassenfarben bearbeiten: Klicke auf ein Farbfeld, um die Klassenfarbe zu ändern
  • Neue Klasse hinzufügen: Verwende das Eingabefeld am unteren Rand, um Klassen hinzuzufügen

Ultralytics Platform Datasets Classes Tab Histogram And Table

Logarithmische Skalierung für unausgewogene Datensätze

Wenn dein Datensatz ein Klassenungleichgewicht aufweist (z. B. 10.000 "Person"-Anmerkungen, aber nur 50 "Fahrrad"), verwende den Log Scale-Umschalter im Klassenhistogramm, um alle Klassen klar zu visualisieren.

Tab „Diagramme“

Dieser Tab erscheint, wenn der Datensatz Bilder enthält.

Automatische Statistiken für deinen Datensatz:

DiagrammBeschreibung
Split-VerteilungDonut-Diagramm der Bildanzahl für Train/Val/Test und prozentuale Verteilung der Annotationen
Häufigste KlassenDonut-Diagramm der 10 häufigsten Annotationsklassen
BildbreitenHistogramm der Bildbreitenverteilung mit Durchschnittswert
BildhöhenHistogramm der Bildhöhenverteilung mit Durchschnittswert
Punkte pro InstanzAnzahl der Polygon-Eckpunkte oder Keypoints pro Annotation (Segment/Pose)
Annotations-Positionen2D-Heatmap der Mittelpunkte der BBox
Bildabmessungen2D-Heatmap von Breite vs. Höhe mit Hilfslinien für das Seitenverhältnis

Ultralytics Platform Datasets Charts Tab Statistics Grid

Statistik-Caching

Statistiken werden für 5 Minuten zwischengespeichert. Änderungen an Annotationen werden sichtbar, sobald der Cache abläuft.

Vollbild-Heatmaps

Klicke auf den Erweitern-Button bei einer beliebigen Heatmap, um sie im Vollbildmodus anzuzeigen. Dies bietet eine größere, detailliertere Ansicht – nützlich, um räumliche Muster in großen Datensätzen zu verstehen.

Tab „Modelle“

Alle mit diesem Datensatz trainierten Modelle in einer durchsuchbaren Tabelle anzeigen:

SpalteBeschreibung
NameModellname mit Link
ProjektÜbergeordnetes Projekt mit Icon
StatusBadge für den Trainingsstatus
AufgabeYOLO-Aufgabentyp
EpochenBeste Epoche / Gesamtepochen
mAP50-95Mean Average Precision
mAP50mAP bei IoU 0.50
ErstelltErstellungsdatum

Ultralytics Platform Datasets Models Tab Trained Models Table

Tab „Fehler“

Dieser Tab erscheint nur, wenn eine oder mehrere Dateien nicht verarbeitet werden konnten.

Bilder, die nicht verarbeitet werden konnten, werden hier gelistet mit:

  • Fehler-Banner: Gesamtzahl der fehlerhaften Bilder und Hinweise
  • Fehler-Tabelle: Dateiname, benutzerfreundliche Fehlerbeschreibung, Korrekturhinweise und Vorschaubild
  • Häufige Fehler sind beschädigte Dateien, nicht unterstützte Formate, zu kleine Bilder (mind. 28px) und nicht unterstützte Farbmodi

Ultralytics Platform Datasets Errors Tab Processing Failures

Häufige Verarbeitungsfehler
FehlerUrsacheKorrektur
Bilddatei kann nicht gelesen werdenBeschädigtes oder nicht unterstütztes FormatAus dem Bildeditor neu exportieren
Unvollständig oder beschädigtDatei wurde während der Übertragung abgeschnittenOriginaldatei erneut herunterladen
Bild zu kleinMindestmaß unter 28pxQuellbilder mit höherer Auflösung verwenden
Nicht unterstützter FarbmodusCMYK- oder indizierter FarbmodusIn RGB-Modus konvertieren

Tab „Versionen“

Erstelle unveränderliche NDJSON-Snapshots deines Datensatzes für reproduzierbares Training. Jede Version erfasst zum Zeitpunkt der Erstellung die Anzahl der Bilder, Klassen, Annotationen und die Dateigröße.

SpalteBeschreibung
VersionVersionsnummer (v1, v2, ...)
BeschreibungVom Benutzer bereitgestellte Beschreibung (bearbeitbar)
BilderBildanzahl zum Zeitpunkt des Snapshots
KlassenKlassenanzahl zum Zeitpunkt des Snapshots
AnnotationenAnnotationsanzahl zum Zeitpunkt des Snapshots
GrößeDateigröße des NDJSON-Exports
ErstelltWann die Version erstellt wurde

Um eine Version zu erstellen:

  1. Öffne den Tab Versionen
  2. Optional eine Beschreibung eingeben (z. B. „500 Trainingsbilder hinzugefügt“ oder „Falsch annotierte Klassen korrigiert“)
  3. Klicke auf + Neue Version
  4. Die neue Version erscheint in der Tabelle
  5. Lade die Version bei Bedarf separat aus der Tabelle herunter

Jede Version wird fortlaufend nummeriert (v1, v2, v3...) und dauerhaft gespeichert. Du kannst jederzeit eine beliebige vorherige Version aus der Versionstabelle herunterladen.

Nur für fertige Datensätze

Die Versionerstellung ist verfügbar, sobald der Datensatz den Status ready erreicht hat.

Wann sollten Versionen erstellt werden?

Erstelle eine Version vor und nach größeren Änderungen an deinem Datensatz – beim Hinzufügen von Bildern, Korrigieren von Annotationen oder beim Neuabgleich der Splits. So kannst du die Modellleistung über verschiedene Datensatz-Zustände hinweg vergleichen.

NDJSON-Dateigröße

Die angezeigte Größe ist die des NDJSON-Exports, der Bild-URLs und Annotationen enthält – nicht die Bilder selbst. Die eigentlichen Bilddaten werden separat gespeichert und über signierte URLs aufgerufen.

Datensatz exportieren

Exportiere deinen Datensatz für die Offline-Nutzung über einen NDJSON-Download im Datensatz-Header oder im Tab „Versionen“.

Zum Exportieren:

  1. Klicke im Datensatz-Header auf den Export-Button
  2. Lade den aktuellen NDJSON-Snapshot direkt herunter
  3. Verwende den Tab Versionen, wenn du einen unveränderlichen, nummerierten Snapshot möchtest, den du später erneut herunterladen kannst

Ultralytics Platform Datasets Export Ndjson Download

Das NDJSON-Format speichert ein JSON-Objekt pro Zeile. Die erste Zeile enthält Metadaten zum Datensatz, gefolgt von einer Zeile pro Bild:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}
Signierte URLs

Bild-URLs im exportierten NDJSON sind signiert und 7 Tage lang gültig. Wenn du neue URLs benötigst, exportiere den Datensatz erneut oder erstelle eine neue Version.

Siehe die Ultralytics NDJSON-Format-Dokumentation für die vollständige Spezifikation.

Bildoperationen

Schnellaktionen

Klicke mit der rechten Maustaste auf ein beliebiges Bild in der Raster- oder Kompakt-Ansicht, um auf Schnellaktionen zuzugreifen:

AktionBeschreibung
In Split verschiebenWeise das Bild einem Train-, Val- oder Test-Split neu zu
HerunterladenLade die originale Bilddatei herunter
LöschenLösche das Bild aus dem Datensatz

Kontextmenü der Bildkarte in den Ultralytics Platform Datasets

Einzeln vs. Massenbearbeitung

Das Bild-Kontextmenü wirkt auf ein einzelnes Bild. Für Massenoperationen an mehreren Bildern verwende die Tabellenansicht mit Checkbox-Auswahl.

Massenverschiebung in Splits

Weise ausgewählte Bilder einem anderen Split innerhalb desselben Datensatzes zu:

  1. Wechsle zur Tabellenansicht
  2. Wähle Bilder über die Checkboxen aus
  3. Mache einen Rechtsklick, um das Kontextmenü zu öffnen
  4. Choose Move to split > Train, Validation, or Test

Du kannst Bilder auch per Drag-and-Drop auf die Split-Filter-Tabs in der Rasteransicht ziehen.

Train/Val-Splits organisieren

Lade alle Bilder in einen Datensatz hoch und verwende dann die Massenverschiebung, um Teilmengen in Train-, Validation- und Test-Splits zu unterteilen.

Split-Neuverteilung

Verteile alle Bilder mittels benutzerdefinierter Verhältnisse neu auf Train-, Validation- und Test-Splits:

  1. Klicke auf die Split-Leiste in der Datensatz-Symbolleiste, um das Dialogfeld Splits neu verteilen zu öffnen
  2. Passe die Split-Prozentsätze mit einer der unten genannten Methoden an
  3. Überprüfe die Live-Vorschau der Bildanzahl, um die Verteilung zu bestätigen
  4. Klicke auf Anwenden, um alle Bilder zufällig gemäß deinen Prozentsätzen neu zuzuweisen

Dialogfeld zur Split-Neuverteilung in den Ultralytics Platform Datasets

Der Dialog bietet drei Möglichkeiten, deine Ziel-Split-Verhältnisse festzulegen:

MethodeBeschreibung
ZiehenZiehe die Griffe zwischen den farbigen Segmenten, um die Split-Grenzen visuell anzupassen
EingebenBearbeite die Prozentangabe für einen Split (die anderen beiden Splits gleichen sich automatisch proportional an)
AutoMit einem Klick sofort ein 80/20 Train/Validation-Split festlegen, wobei der Test-Split auf 0% gesetzt wird

Eine Live-Vorschau zeigt dir genau, wie viele Bilder in jedem Split landen werden, bevor du den Vorgang anwendest.

Schneller 80/20-Split

Klicke auf die Auto-Schaltfläche, um sofort das empfohlene 80/20 Train/Validation-Verhältnis einzustellen. Dies ist das gängigste Verhältnis für das Training.

Massenlöschung

Lösche mehrere Bilder gleichzeitig:

  1. Wähle Bilder in der Tabellenansicht aus
  2. Right-click and choose Delete
  3. Bestätige den Löschvorgang

Datensatz-URI

Referenziere Platform-Datensätze über das ul:// URI-Format (siehe Platform-Datensätze verwenden):

ul://username/datasets/dataset-slug

Verwende diese URI, um Modelle von überall zu trainieren:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
Überall trainieren mit Platform-Daten

Die ul:// URI funktioniert in jeder Umgebung:

  • Lokale Maschine: Trainiere auf deiner Hardware, Daten werden automatisch heruntergeladen
  • Google Colab: Greife in Notebooks auf deine Platform-Datensätze zu
  • Remote-Server: Trainiere auf Cloud-VMs mit vollem Datensatz-Zugriff

Verfügbare Lizenzen

Die Platform unterstützt die folgenden Lizenzen für Datensätze:

LizenzTyp
KeineKeine Lizenz ausgewählt
CC0-1.0Gemeinfrei
CC-BY-2.5Freizügig
CC-BY-4.0Freizügig
CC-BY-SA-4.0Copyleft
CC-BY-NC-4.0Nicht-kommerziell
CC-BY-NC-SA-4.0Copyleft
CC-BY-ND-4.0Keine Bearbeitungen
CC-BY-NC-ND-4.0Nicht-kommerziell
Apache-2.0Freizügig
MITFreizügig
AGPL-3.0Copyleft
GPL-3.0Copyleft
Nur für die ForschungEingeschränkt
AndereBenutzerdefiniert
Copyleft-Lizenzen

Beim Klonen eines Datensatzes mit einer Copyleft-Lizenz (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0) erbt der Klon die Lizenz und der Lizenz-Selektor ist gesperrt.

Sichtbarkeitseinstellungen

Steuere, wer deinen Datensatz sehen kann:

EinstellungBeschreibung
PrivatNur du hast Zugriff
ÖffentlichJeder kann ihn auf der Entdecken-Seite ansehen

Visibility is set when creating a dataset in the New Dataset dialog using a toggle switch. Public datasets are visible on the Explore page.

Datensatz bearbeiten

Datensatz-Metadaten werden direkt auf der Datensatzseite inline bearbeitet — kein Dialog erforderlich:

  • Name: Klicke auf den Datensatznamen, um ihn zu bearbeiten. Änderungen werden beim Verlassen des Feldes oder durch Enter automatisch gespeichert.
  • Beschreibung: Klicke auf die Beschreibung (oder den "Füge eine Beschreibung hinzu..."-Platzhalter), um sie zu bearbeiten. Änderungen werden automatisch gespeichert.
  • Aufgabentyp: Klicke auf das Aufgaben-Badge, um einen anderen Aufgabentyp auszuwählen.
  • Lizenz: Klicke auf den Lizenz-Selektor, um die Datensatz-Lizenz zu ändern.
Aufgabentyp ändern

Jedes Bild speichert Annotationen für alle Aufgabentypen zusammen. Die Änderung des Datensatz-Aufgabentyps steuert, welche Annotationen im Editor sichtbar sind und in Exporte sowie in das Training einbezogen werden. Annotationen für andere Aufgabentypen bleiben in der Datenbank erhalten und erscheinen wieder, wenn du zurückwechselst.

Datensatz klonen

When viewing a public dataset you do not own, click Clone Dataset to create a copy in your workspace. The clone includes all images, annotations, and class definitions. If the original dataset has a copyleft license, the clone inherits it and the license selector is locked.

Mit Stern markieren und Teilen

  • Mit Stern markieren: Klicke auf die Stern-Schaltfläche, um einen Datensatz als Lesezeichen zu speichern. Die Anzahl der Sterne ist für alle Benutzer sichtbar.
  • Teilen: Klicke bei öffentlichen Datensätzen auf die Teilen-Schaltfläche, um einen Link zu kopieren oder auf sozialen Plattformen zu teilen.

Datensatz löschen

Lösche einen Datensatz, den du nicht mehr benötigst:

  1. Öffne das Datensatz-Aktionsmenü
  2. Click Delete
  3. Bestätige im Dialog: "Dies verschiebt [Name] in den Papierkorb. Du kannst ihn innerhalb von 30 Tagen wiederherstellen."
Papierkorb und Wiederherstellen

Gelöschte Datensätze werden in den Papierkorb verschoben – sie werden nicht dauerhaft gelöscht. Du kannst sie innerhalb von 30 Tagen über Settings > Trash wiederherstellen.

Mit Datensatz trainieren

Starte das Training direkt von deinem Datensatz aus:

  1. Klicke auf der Datensatzseite auf New Model
  2. Wähle ein Projekt aus oder erstelle ein neues
  3. Konfiguriere die Trainingsparameter
  4. Starte das Training
graph LR
    A[Dataset] --> B[New Model]
    B --> C[Select Project]
    C --> D[Configure]
    D --> E[Start Training]

    style A fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Siehe Cloud Training für Details.

FAQ

Was passiert nach dem Hochladen mit meinen Daten?

Deine Daten werden in der von dir gewählten Region (US, EU oder AP) verarbeitet und gespeichert. Bilder werden wie folgt behandelt:

  1. Validierung auf Format und Größe
  2. Ablehnung, falls die Mindestdimension unter 28px liegt
  3. Normalisierung, falls sie größer als 4096px sind (unter Beibehaltung des Seitenverhältnisses; kodiert für optimierte Speicherung)
  4. Speicherung mittels inhaltsadressierbarem Speicher (CAS) mit XXH3-128 Hashing
  5. Erstellung von Vorschaubildern im 256px WebP-Format für schnelles Browsen

Wie funktioniert die Speicherung?

Die Ultralytics Platform verwendet Content-Addressable Storage (CAS) für eine effiziente Speicherung:

  • Deduplizierung: Identische Bilder, die von verschiedenen Nutzern hochgeladen wurden, werden nur einmal gespeichert
  • Integrität: XXH3-128 Hashing stellt die Datenintegrität sicher
  • Effizienz: Reduziert Speicherkosten und beschleunigt die Verarbeitung
  • Regional: Daten verbleiben in der von dir gewählten Region (US, EU oder AP)

Kann ich Bilder zu einem bestehenden Datensatz hinzufügen?

Ja, ziehe Dateien per Drag & Drop auf die Datensatzseite oder verwende die Hochladen-Schaltfläche, um weitere Bilder hinzuzufügen. Neue Statistiken werden automatisch berechnet.

Wie verschiebe ich Bilder zwischen Splits?

Verwende die Bulk-Funktion zum Verschieben in Splits:

  1. Wähle Bilder in der Tabellenansicht aus
  2. Rechtsklick und wähle Move to split
  3. Wähle den Ziel-Split (Train, Validation oder Test)

Welche Label-Formate werden unterstützt?

Die Ultralytics Platform unterstützt YOLO-Labels, COCO JSON, Ultralytics NDJSON und den Upload von Rohbildern:

Eine .txt-Datei pro Bild mit normalisierten Koordinaten (Bereich 0-1):

AufgabeFormatBeispiel
Detectclass cx cy w h0 0.5 0.5 0.2 0.3
Segmentclass x1 y1 x2 y2 ...0 0.1 0.1 0.9 0.1 0.9 0.9
Poseclass cx cy w h kx1 ky1 v1 ...0 0.5 0.5 0.2 0.3 0.6 0.7 2
OBBclass x1 y1 x2 y2 x3 y3 x4 y40 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9
ClassifyVerzeichnisstrukturtrain/cats/, train/dogs/

Pose-Sichtbarkeits-Flags: 0=nicht gelabelt, 1=gelabelt aber verdeckt, 2=gelabelt und sichtbar.

Kann ich denselben Datensatz für mehrere Aufgabentypen annotieren?

Ja. Jedes Bild speichert Annotationen für alle 5 Aufgabentypen (detect, segment, pose, OBB, classify) zusammen. Du kannst den aktiven Aufgabentyp des Datensatzes jederzeit wechseln, ohne bestehende Annotationen zu verlieren. Nur Annotationen, die dem aktiven Aufgabentyp entsprechen, werden im Editor angezeigt und in Exporte sowie das Training einbezogen — Annotationen für andere Aufgaben bleiben erhalten und erscheinen wieder, wenn du zurückwechselst.

Kommentare