Link to this sectionDatensätze#
Ultralytics Platform Datasets bieten eine optimierte Lösung für die Verwaltung deiner Trainingsdaten. Nach dem Hochladen verarbeitet die Plattform Bilder, Labels und Statistiken automatisch. Ein Datensatz ist bereit für das Training, sobald die Verarbeitung abgeschlossen ist und er mindestens ein Bild im train-Split, mindestens ein Bild im val- oder test-Split, mindestens ein gelabeltes Bild sowie insgesamt mindestens zwei Bilder enthält.
Link to this sectionDatensatz hochladen#
Die Ultralytics Platform akzeptiert für mehr Flexibilität verschiedene Upload-Formate.
Wenn du bereits Datensätze im Ultralytics HUB oder in Roboflow hast, nutze Integrations, um diese direkt zu importieren – manueller Export oder erneutes Hochladen sind nicht erforderlich.
Link to this sectionUnterstützte Formate#
| Format | Erweiterungen | Hinweise | Maximale Größe |
|---|---|---|---|
| JPEG | .jpg, .jpeg | Am gebräuchlichsten, empfohlen | 50 MB |
| PNG | .png | Unterstützt Transparenz | 50 MB |
| WebP | .webp | Modern, gute Kompression | 50 MB |
| BMP | .bmp | Unkomprimiert | 50 MB |
| TIFF | .tiff, .tif | Hohe Qualität | 50 MB |
| HEIC | .heic | iPhone-Fotos | 50 MB |
| AVIF | .avif | Format der nächsten Generation | 50 MB |
| JP2 | .jp2 | JPEG 2000 | 50 MB |
| DNG | .dng | Rohdaten der Kamera | 50 MB |
| MPO | .mpo | Multi-Picture-Objekt | 50 MB |
Link to this sectionVorbereitung deines Datensatzes#
Die Plattform unterstützt Ultralytics YOLO, COCO, Ultralytics NDJSON sowie Raw-Uploads (ohne Annotationen):
Verwende die standardmäßige YOLO-Verzeichnisstruktur mit einer data.yaml-Datei:
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yamlDie YAML-Datei definiert deine Datensatzkonfiguration:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dogRaw: Lade nicht annotierte Bilder hoch (keine Labels). Nützlich, wenn du die Annotation direkt auf der Plattform mit dem Annotations-Editor vornehmen möchtest.
Du kannst Bilder auch ohne explizite Split-Ordner hochladen. Die Plattform berücksichtigt beim Hochladen das aktive Split-Ziel. Bei Datensätzen, die keine Klassifizierung sind, wird möglicherweise automatisch ein Validierungs-Split aus einem Teil des Trainingssets erstellt, wenn keine Split-Informationen bereitgestellt werden. Du kannst Bilder später jederzeit mit „Bulk Move-to-Split“ oder der Split-Neuverteilung neu zuweisen.
Das Format wird automatisch erkannt: Datensätze mit einer data.yaml, die names-, train- oder val-Schlüssel enthalten, werden als YOLO behandelt. Datensätze mit COCO-JSON-Dateien (die images-, annotations- und categories-Arrays enthalten) werden als COCO behandelt. .ndjson-Exporte werden als Ultralytics NDJSON importiert. Datensätze, die nur aus Bildern ohne Annotationen bestehen, werden als Raw behandelt.
Details zu aufgabenspezifischen Formaten findest du unter unterstützte Aufgaben und in der Datasets Overview.
Link to this sectionUpload-Prozess#
- Navigiere in der Seitenleiste zu
Datasets - Klicke auf
New Datasetoder ziehe Dateien in den Upload-Bereich - Wähle den Aufgabentyp aus (siehe unterstützte Aufgaben)
- Füge einen Namen und eine optionale Beschreibung hinzu
- Lege die Sichtbarkeit (öffentlich oder privat) und eine optionale Lizenz fest (siehe verfügbare Lizenzen)
- Klicke auf
Create & Upload(oderCreate Dataset, falls du einen leeren Datensatz erstellst)

Nach dem Hochladen verarbeitet die Plattform deine Daten durch eine mehrstufige Pipeline:
graph LR
A[Upload] --> B[Validate]
B --> C[Normalize]
C --> D[Thumbnail]
D --> E[Parse Labels]
E --> F[Statistics]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#2196F3,color:#fff
style D fill:#2196F3,color:#fff
style E fill:#2196F3,color:#fff
style F fill:#9C27B0,color:#fff- Validierung: Format- und Größenprüfungen
- Normalisierung: Große Bilder werden skaliert (max. 4096px, Mindestdimension 28px)
- Thumbnails: Es werden 256px WebP-Vorschauen generiert
- Label-Parsing: Labels im YOLO- und COCO-Format werden extrahiert
- Statistiken: Klassenvorverteilungen und Bildabmessungen werden berechnet

Vor dem Hochladen validieren
Du kannst deinen Datensatz vor dem Hochladen lokal validieren:
from ultralytics.data.utils import check_det_dataset
check_det_dataset("path/to/data.yaml")Bilder müssen an ihrer kürzesten Seite mindestens 28px groß sein. Kleinere Bilder werden während der Verarbeitung abgelehnt. Bilder, die an ihrer längsten Seite größer als 4096px sind, werden unter Beibehaltung des Seitenverhältnisses automatisch skaliert.
Link to this sectionBilder durchsuchen#
Zeige deine Datensatzbilder in verschiedenen Layouts an.
Öffne das Clustering-Panel über die Toolbar der Galerie, um deinen Datensatz als interaktives 2D-Streudiagramm zu erkunden.
| Ansicht | Beschreibung |
|---|---|
| Raster | Thumbnail-Raster mit Annotation-Overlays (Standard) |
| Kompakt | Kleinere Thumbnails für schnelles Scannen |
| Tabelle | Liste mit Thumbnail, Dateiname, Abmessungen, Größe, Split, Klassen und Label-Anzahl |

Link to this sectionSortieren und Filtern#
Bilder können für ein effizientes Browsen sortiert und gefiltert werden:
| Sortieren | Beschreibung |
|---|---|
| Neueste / Älteste | Reihenfolge Upload / Erstellung |
| Name A-Z / Z-A | Dateiname alphabetisch |
| Höhe ↑/↓ | Bildhöhe in Pixeln |
| Breite ↑/↓ | Bildbreite in Pixeln |
| Größe ↑/↓ | Dateigröße auf dem Datenträger |
| Anmerkungen ↑/↓ | Anzahl der Anmerkungen pro Bild |
Bei Datensätzen mit über 100.000 Bildern sind die Sortierungen nach Name / Größe / Breite / Höhe deaktiviert, damit die Galerie reaktionsfähig bleibt. Die Sortierungen nach Neueste, Älteste und Anzahl der Anmerkungen bleiben verfügbar.
Verwende den Filter Annotations auf Unannotated eingestellt, um schnell Bilder zu finden, die noch annotiert werden müssen. Dies ist besonders nützlich für große Datensätze, bei denen du den Fortschritt der Etikettierung verfolgen möchtest.
Link to this sectionVollbildanzeige#
Klicke auf ein beliebiges Bild, um die Vollbildanzeige zu öffnen mit:
- Navigation: Pfeiltasten oder Miniaturansichten zum Durchsuchen
- Metadaten: Dateiname, Abmessungen, Split-Badge, Anzahl der Anmerkungen
- Anmerkungen: Sichtbarkeit der Anmerkungs-Overlays umschalten
- Klassenaufschlüsselung: Anzahl der Labels pro Klasse mit Farbindikatoren
- Bearbeiten: Wechsle in den Anmerkungsmodus, um Labels hinzuzufügen oder zu ändern
- Herunterladen: Lade die originale Bilddatei herunter
- Löschen: Lösche das Bild aus dem Datensatz
- Zoom:
Cmd/Ctrl+Scroll,Cmd/Ctrl++oderCmd/Ctrl+=zum Hineinzoomen undCmd/Ctrl+-zum Herauszoomen - Ansicht zurücksetzen:
Cmd/Ctrl + 0oder die Reset-Schaltfläche, um das Bild an den Viewer anzupassen - Schwenken: Halte
Spacegedrückt und ziehe, um die Arbeitsfläche bei Zoom zu schwenken - Pixelansicht: Schalte die pixelige Darstellung für eine genaue Inspektion ein

Link to this sectionNach Split filtern#
Bilder nach ihrem Datensatz-Split filtern:
| Split | Zweck |
|---|---|
| Trainieren | Verwendet für das Modelltraining |
| Val | Verwendet für die Validierung während des Trainings |
| Test | Verwendet für die abschließende Bewertung |
Link to this sectionClustering#
Das Clustering-Panel projiziert deinen Datensatz in ein interaktives 2D-Streudiagramm, in dem visuell ähnliche Bilder eng beieinander liegen. Nutze es, um Cluster zu finden, Duplikate und Ausreißer zu entdecken und zu untersuchen, wie Splits oder Klassen über deine Daten verteilt sind – ohne die Galerie zu verlassen. Öffne es über das Streudiagramm-Symbol in der Galerie-Symbolleiste auf jeder Datensatzseite.

Link to this sectionAnalyse ausführen#
Starte eine Analyse:
- Öffne einen Datensatz und klicke auf das Streudiagramm-Symbol in der Galerie-Symbolleiste
- Klicke auf
Analyze Dataset - Warte, bis der Fortschrittsbalken abgeschlossen ist – die Ergebnisse erscheinen im selben Panel
Die Analyse läuft im Hintergrund und kann je nach Größe deines Datensatzes einige Minuten dauern. Du kannst das Panel schließen oder die Seite verlassen und später zurückkehren.
Link to this sectionVisualisierung#
Sobald die Analyse abgeschlossen ist, zeigt das Panel ein 2D-Streudiagramm aller analysierten Bilder. Galerie-Filter (Split, Klasse, annotiert/nicht annotiert) dimmen Punkte außerhalb des Filters, sodass du dich auf die für dich relevante Untermenge konzentrieren kannst.

Link to this sectionFärben nach#
Ändere die Schattierung der Datenpunkte mit dem Color by-Dropdown in der Panel-Symbolleiste. Wechsle jederzeit zwischen den Ansichtsmodi – das Diagramm wird sofort neu eingefärbt, sodass du sehen kannst, wie Splits, Klassen oder Bildeigenschaften über deine Cluster verteilt sind:
| Option | Schattierung |
|---|---|
| Splits | Train / Val / Test |
| Klassen | Erste Anmerkungsklasse auf jedem Bild |
| Breite | Bildbreite |
| Höhe | Bildhöhe |
| Größe | Dateigröße |
| Annotationen | Anzahl der Anmerkungen pro Bild |

Link to this sectionLasso-Auswahl#
Zeichne eine Freiform-Auswahl um einen Bereich, um Punkte im Diagramm hervorzuheben. Die Galerie filtert auf die passenden Bilder, sodass du sie mit den üblichen Bildoperationen prüfen, neu etikettieren, verschieben oder löschen kannst.
Ein Chip über dem Diagramm zeigt an, wie viele Punkte ausgewählt sind – klicke auf das ×, um das Lasso aufzuheben und zur vollständigen Galerieansicht zurückzukehren.
Link to this sectionSchwenken und Zoomen#
Navigiere große Streudiagramme direkt mit Maus und Tastatur:
| Eingabe | Aktion |
|---|---|
| Scrollen | Das Diagramm in 2D schwenken |
| Cmd/Ctrl+Scroll | Hinein- oder herauszoomen, verankert am Cursor |
| Space halten | In den Drag-to-Pan-Modus wechseln |
Link to this sectionNeu analysieren#
Wenn sich dein Datensatz nach der Analyse ändert, erscheint für Eigentümer und Editoren oben im Panel eine Re-analyze-Schaltfläche.
Klicke auf Re-analyze, um Einbettungen und die 2D-Projektion von Grund auf neu zu berechnen.
Link to this sectionDatensatz-Tabs#
Jede Datensatzseite kann je nach Datensatzstatus und deinen Berechtigungen bis zu sechs Tabs anzeigen:
Link to this sectionBilder-Tab#
Die Standardansicht zeigt die Bildergalerie mit Anmerkungs-Overlays. Unterstützt Raster-, Kompakt- und Tabellenansichtsmodi. Ziehe Dateien per Drag & Drop hierher, um weitere Bilder hinzuzufügen.
Link to this sectionKlassen-Tab#
Dieser Tab erscheint, wenn der Datensatz Bilder enthält.
Verwalte Anmerkungsklassen für deinen Datensatz:
- Klassen-Histogramm: Balkendiagramm, das die Anzahl der Anmerkungen pro Klasse mit Umschalter für lineare/logarithmische Skalierung zeigt
- Klassentabelle: Sortierbare, durchsuchbare Tabelle mit Klassennamen, Label-Anzahl und Bildanzahl
- Klassennamen bearbeiten: Klicke auf einen Klassennamen, um ihn direkt umzubenennen
- Klassenfarben bearbeiten: Klicke auf ein Farbfeld, um die Klassenfarbe zu ändern
- Neue Klasse hinzufügen: Verwende das Eingabefeld unten, um Klassen hinzuzufügen

Wenn dein Datensatz ein Klassenungleichgewicht aufweist (z. B. 10.000 „Person“-Annotationen, aber nur 50 „Fahrrad“), verwende den Log Scale-Schalter im Klassen-Histogramm, um alle Klassen klar zu visualisieren.
Link to this sectionRegisterkarte Diagramme#
Dieser Tab erscheint, wenn der Datensatz Bilder enthält.
Automatisch berechnete Statistiken aus deinem Datensatz:
| Diagramm | Beschreibung |
|---|---|
| Split-Verteilung | Donut-Diagramm der Bildanzahl für Train/Val/Test und der prozentualen Label-Verteilung |
| Top-Klassen | Donut-Diagramm der 10 häufigsten Annotationsklassen |
| Bildabmessungen | Histogramm der Verteilung von Bildbreite und -höhe (überlagert) mit Mittelwert |
| Punkte pro Instanz | Anzahl der Polygon-Eckpunkte oder Keypoints pro Annotation (Segment/Pose) |
| Annotations-Positionen | 2D-Heatmap der Mittelpunkte der Bounding Boxes |
| Bilddateigröße | Histogramm der Verteilung der Bilddateigröße |
| Bildformate | Verteilung der Quell-Bildformate (JPG, PNG, etc.) |
| Bounding Box-Abmessungen | Histogramm der Bounding Box-Breite und -höhe (überlagert) |
| Objekte pro Bild | Histogramm der Anzahl der Annotationen pro Bild |
| Bildabmessungen 2D | 2D-Heatmap von Breite vs. Höhe mit Hilfslinien für das Seitenverhältnis |

Statistiken werden für 5 Minuten zwischengespeichert. Änderungen an Annotationen werden sichtbar, nachdem der Cache abgelaufen ist.
Klicke auf die Expandieren-Schaltfläche bei einer beliebigen Heatmap, um sie im Vollbildmodus anzuzeigen. Dies bietet eine größere, detailliertere Ansicht – nützlich, um räumliche Muster in großen Datensätzen zu verstehen.
Link to this sectionRegisterkarte Modelle#
Sieh dir alle mit diesem Datensatz trainierten Modelle in einer durchsuchbaren Tabelle an:
| Spalte | Beschreibung |
|---|---|
| Name | Modellname mit Link |
| Projekt | Übergeordnetes Projekt mit Icon |
| Status | Trainingsstatus-Badge |
| Aufgabe | YOLO-Aufgabentyp |
| Epochen | Beste Epoche / gesamte Epochen |
| mAP50-95 | Mean Average Precision |
| mAP50 | mAP bei IoU 0,50 |
| Erstellt | Erstellungsdatum |

Link to this sectionRegisterkarte Fehler#
Diese Registerkarte erscheint nur, wenn eine oder mehrere Dateien bei der Verarbeitung fehlschlagen.
Bilder, deren Verarbeitung fehlgeschlagen ist, werden hier aufgelistet mit:
- Fehlerbanner: Gesamtzahl der fehlgeschlagenen Bilder und Hilfestellung
- Fehlertabelle: Dateiname, benutzerfreundliche Fehlerbeschreibung, Lösungshinweise und Vorschaubild
- Häufige Fehler sind beschädigte Dateien, nicht unterstützte Formate, zu kleine Bilder (mind. 28px) und nicht unterstützte Farbmodi

Häufige Verarbeitungsfehler
| Fehler | Ursache | Lösung |
|---|---|---|
| Bilddatei kann nicht gelesen werden | Beschädigtes oder nicht unterstütztes Format | Erneut aus dem Bildeditor exportieren |
| Unvollständig oder beschädigt | Datei wurde während der Übertragung abgeschnitten | Originaldatei erneut herunterladen |
| Bild zu klein | Mindestdimension unter 28px | Verwende Quellbilder mit höherer Auflösung |
| Nicht unterstützter Farbmodus | CMYK- oder indizierter Farbmodus | In den RGB-Modus konvertieren |
Link to this sectionRegisterkarte Versionen#
Erstelle unveränderliche NDJSON-Snapshots deines Datensatzes für reproduzierbares Training. Jede Version erfasst die Bildanzahl, Klassenanzahl, Annotationsanzahl und Dateigröße zum Zeitpunkt der Erstellung.
| Spalte | Beschreibung |
|---|---|
| Version | Versionsnummer (v1, v2, ...) |
| Beschreibung | Benutzerdefinierte Beschreibung (bearbeitbar) |
| Bilder | Bildanzahl zum Zeitpunkt des Snapshots |
| Klassen | Klassenanzahl zum Zeitpunkt des Snapshots |
| Annotationen | Annotationsanzahl zum Zeitpunkt des Snapshots |
| Größe | Dateigröße des NDJSON-Exports |
| Erstellt | Zeitpunkt der Versionerstellung |
So erstellst du eine Version:
- Öffne die Registerkarte Versionen
- Gib optional eine Beschreibung ein (z. B. „500 Trainingsbilder hinzugefügt“ oder „Fehlerhaft gelabelte Klassen korrigiert“)
- Klicke auf + New Version
- Die neue Version erscheint in der Tabelle
- Lade die Version bei Bedarf separat aus der Tabelle herunter
Jede Version wird fortlaufend nummeriert (v1, v2, v3...) und dauerhaft gespeichert. Du kannst jederzeit eine frühere Version aus der Versionstabelle herunterladen.
Die Erstellung von Versionen ist verfügbar, sobald der Datensatz den Status ready erreicht hat.
Erstelle eine Version vor und nach größeren Änderungen an deinem Datensatz – Hinzufügen von Bildern, Korrigieren von Annotationen oder Neuausbalancieren der Splits. Dies ermöglicht es dir, die Modellleistung über verschiedene Datensatzstände hinweg zu vergleichen.
Die angezeigte Größe bezieht sich auf die NDJSON-Exportdatei, die Bild-URLs und Annotationen enthält – nicht die Bilder selbst. Die tatsächlichen Bilddaten werden separat gespeichert und über signierte URLs abgerufen.
Link to this sectionDataset exportieren#
Exportiere deinen Datensatz für die Offline-Nutzung mit einem NDJSON-Download aus dem Datensatz-Header oder der Registerkarte Versionen.
So exportierst du:
- Klicke auf die Download-Schaltfläche (Download-Symbol) im Datensatz-Header
- Lade den aktuellen NDJSON-Snapshot direkt herunter
- Verwende den Versions-Tab, wenn du einen unveränderlichen, nummerierten Snapshot möchtest, den du später erneut herunterladen kannst

Das NDJSON-Format speichert ein JSON-Objekt pro Zeile. Die erste Zeile enthält Dataset-Metadaten, gefolgt von einer Zeile pro Bild:
{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "bytes": 12345678, "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}Bild-URLs im exportierten NDJSON sind signiert und 7 Tage lang gültig. Wenn du neue URLs benötigst, exportiere das Dataset erneut oder erstelle eine neue Version.
Siehe die Ultralytics NDJSON format documentation für die vollständige Spezifikation.
Link to this sectionBildoperationen#
Link to this sectionSchnellaktionen#
Klicke mit der rechten Maustaste auf ein beliebiges Bild in der Grid- oder Compact-Ansicht, um auf Schnellaktionen zuzugreifen:
| Aktion | Beschreibung |
|---|---|
| Move to Split | Ordne das Bild dem Train-, Val- oder Test-Split zu |
| Download | Lade die ursprüngliche Bilddatei herunter |
| Delete | Lösche das Bild aus dem Dataset |

Das Kontextmenü für Bilder funktioniert für ein einzelnes Bild. Für Massenvorgänge bei mehreren Bildern verwende die Table-Ansicht mit Auswahl per Checkbox.
Link to this sectionBulk Move to Split#
Ordne ausgewählte Bilder einem anderen Split innerhalb desselben Datasets zu:
- Wechsle zur Table-Ansicht
- Wähle Bilder über Checkboxen aus
- Klicke mit der rechten Maustaste, um das Kontextmenü zu öffnen
- Wähle
Move to split> Train, Validation oder Test
Du kannst Bilder in der Grid-Ansicht auch per Drag-and-Drop auf die Split-Filter-Tabs ziehen.
Lade alle Bilder in ein Dataset hoch und verwende dann die Bulk-Funktion zum Verschieben, um Teilmengen in Train-, Validation- und Test-Splits zu organisieren.
Link to this sectionSplit-Umverteilung#
Verteile alle Bilder mittels benutzerdefinierter Verhältnisse auf Train-, Validation- und Test-Splits:
- Klicke auf die Split-Leiste in der Dataset-Symbolleiste, um den Dialog Redistribute Splits zu öffnen
- Passe die Split-Prozentsätze mit einer der unten genannten Methoden an
- Überprüfe die Live-Vorschau der Bildanzahl, um die Verteilung zu bestätigen
- Klicke auf Apply, um alle Bilder zufällig gemäß deinen Prozentsätzen neu zuzuordnen

Der Dialog bietet drei Möglichkeiten, deine Ziel-Split-Verhältnisse festzulegen:
| Methode | Beschreibung |
|---|---|
| Drag | Ziehe die Regler zwischen den farbigen Segmenten, um die Split-Grenzen visuell anzupassen |
| Type | Bearbeite die Prozentangabe für einen Split (die anderen beiden Splits werden automatisch proportional ausgeglichen) |
| Auto | Ein Klick, um sofort einen 80/20 Train/Validation-Split einzustellen, wobei der Test-Split auf 0% gesetzt wird |
Eine Live-Vorschau zeigt genau, wie viele Bilder in jedem Split landen, bevor du die Änderungen anwendest.
Klicke auf den Auto-Button, um sofort den empfohlenen 80/20 Train/Validation-Split einzustellen. Dies ist das gängigste Verhältnis für das Training.
Link to this sectionBulk Delete#
Lösche mehrere Bilder gleichzeitig:
- Wähle Bilder in der Tabellenansicht aus
- Klicke mit der rechten Maustaste und wähle
Delete - Bestätige das Löschen
Link to this sectionDataset URI#
Referenziere Platform-Datasets über das ul:// URI-Format (siehe Using Platform Datasets):
ul://username/datasets/dataset-slug
Verwende diese URI, um Modelle von überall aus zu trainieren:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Die ul:// URI funktioniert aus jeder Umgebung:
- Lokale Maschine: Trainiere auf deiner Hardware, Daten werden automatisch heruntergeladen
- Google Colab: Greife in Notebooks auf deine Platform-Datasets zu
- Remote-Server: Trainiere auf Cloud-VMs mit vollem Zugriff auf das Dataset
Link to this sectionVerfügbare Lizenzen#
Die Platform unterstützt die folgenden Lizenzen für Datasets:
| Lizenz | Typ |
|---|---|
| Keine | Keine Lizenz ausgewählt |
| CC0-1.0 | Public Domain |
| CC-BY-2.5 | Permissiv |
| CC-BY-4.0 | Permissiv |
| CC-BY-SA-4.0 | Copyleft |
| CC-BY-NC-4.0 | Nicht-kommerziell |
| CC-BY-NC-SA-4.0 | Copyleft |
| CC-BY-ND-4.0 | Keine Derivate |
| CC-BY-NC-ND-4.0 | Nicht-kommerziell |
| Apache-2.0 | Permissiv |
| MIT | Permissiv |
| AGPL-3.0 | Copyleft |
| GPL-3.0 | Copyleft |
| Nur für die Forschung | Eingeschränkt |
| Sonstiges | Benutzerdefiniert |
Beim Klonen eines Datasets mit einer Copyleft-Lizenz (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0) erbt der Klon die Lizenz und die Lizenzauswahl ist gesperrt.
Link to this sectionSichtbarkeitseinstellungen#
Kontrolliere, wer dein Dataset sehen kann:
| Einstellung | Beschreibung |
|---|---|
| Privat | Nur du hast Zugriff |
| Öffentlich | Jeder kann es auf der Explore-Seite sehen |
Die Sichtbarkeit wird beim Erstellen eines Datasets im New Dataset-Dialog über einen Schalter festgelegt. Öffentliche Datasets sind auf der Explore-Seite sichtbar.
Link to this sectionDataset bearbeiten#
Dataset-Metadaten werden direkt auf der Dataset-Seite inline bearbeitet — kein Dialog erforderlich:
- Name: Klicke auf den Namen des Datasets, um ihn zu bearbeiten. Änderungen werden beim Verlassen des Feldes oder durch
Enterautomatisch gespeichert. - Beschreibung: Klicke auf die Beschreibung (oder den Platzhalter "Add a description..."), um sie zu bearbeiten. Änderungen werden automatisch gespeichert.
- Aufgabentyp: Klicke auf das Aufgaben-Badge, um einen anderen Aufgabentyp auszuwählen.
- Lizenz: Klicke auf die Lizenzauswahl, um die Dataset-Lizenz zu ändern.
Jedes Bild speichert Annotationen für alle Aufgabentypen zusammen. Das Ändern des Dataset-Aufgabentyps steuert, welche Annotationen im Editor sichtbar sind und in Exporte sowie das Training einfließen. Annotationen für andere Aufgabentypen bleiben in der Datenbank erhalten und erscheinen wieder, wenn du zurückwechselst.
Link to this sectionDataset klonen#
Wenn du einen öffentlichen Datensatz ansiehst, der dir nicht gehört, klicke auf Clone Dataset, um eine Kopie in deinem Arbeitsbereich zu erstellen. Der Klon enthält alle Bilder, Annotationen und Klassendefinitionen. Wenn der ursprüngliche Datensatz eine Copyleft-Lizenz hat, erbt der Klon diese und die Lizenzauswahl ist gesperrt.
Link to this sectionStern vergeben und teilen#
- Stern vergeben: Klicke auf die Stern-Schaltfläche, um einen Datensatz als Lesezeichen zu speichern. Die Anzahl der Sterne ist für alle Benutzer sichtbar.
- Teilen: Bei öffentlichen Datensätzen klicke auf die Teilen-Schaltfläche, um einen Link zu kopieren oder ihn auf sozialen Plattformen zu teilen.
Link to this sectionDataset löschen#
Lösche einen Datensatz, den du nicht mehr benötigst:
- Öffne das Aktionsmenü für Datensätze
- Klicke auf
Delete - Bestätige im Dialogfeld: "Dies verschiebt [name] in den Papierkorb. Du kannst ihn innerhalb von 30 Tagen wiederherstellen."
Gelöschte Datensätze werden in den Papierkorb verschoben – sie werden nicht dauerhaft gelöscht. Du kannst sie innerhalb von 30 Tagen unter Settings > Trash wiederherstellen.
Link to this sectionAuf Datensatz trainieren#
Starte das Training direkt von deinem Datensatz aus:
- Klicke auf
New Modelauf der Datensatz-Seite - Wähle ein Projekt aus oder erstelle ein neues
- Konfiguriere die Trainingsparameter
- Starte das Training
graph LR
A[Dataset] --> B[New Model]
B --> C[Select Project]
C --> D[Configure]
D --> E[Start Training]
style A fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fffSiehe Cloud Training für Details.
Link to this sectionFAQ#
Link to this sectionWas passiert nach dem Hochladen mit meinen Daten?#
Deine Daten werden in der von dir gewählten Region (US, EU oder AP) verarbeitet und gespeichert. Bilder werden wie folgt behandelt:
- Validierung von Format und Größe
- Ablehnung, wenn die Mindestdimension unter 28px liegt
- Normalisierung, wenn sie größer als 4096px sind (unter Beibehaltung des Seitenverhältnisses; kodiert für optimierte Speicherung)
- Speicherung mittels Content-Addressable Storage (CAS) mit XXH3-128 Hashing
- Erstellung von Thumbnails im 256px WebP-Format für schnelles Durchsuchen
Link to this sectionWie funktioniert die Speicherung?#
Die Ultralytics Plattform nutzt Content-Addressable Storage (CAS) für effiziente Speicherung:
- Deduplizierung: Identische Bilder, die von verschiedenen Benutzern hochgeladen wurden, werden nur einmal gespeichert
- Integrität: XXH3-128 Hashing stellt die Datenintegrität sicher
- Effizienz: Reduziert Speicherkosten und beschleunigt die Verarbeitung
- Regional: Daten verbleiben in deiner gewählten Region (US, EU oder AP)
Link to this sectionKann ich Bilder zu einem bestehenden Datensatz hinzufügen?#
Ja, ziehe Dateien per Drag-and-Drop auf die Datensatz-Seite oder nutze die Upload-Schaltfläche, um weitere Bilder hinzuzufügen. Neue Statistiken werden automatisch berechnet.
Link to this sectionWie verschiebe ich Bilder zwischen Splits?#
Verwende die Funktion zum massenhaften Verschieben in Splits:
- Wähle Bilder in der Tabellenansicht aus
- Mache einen Rechtsklick und wähle
Move to split - Wähle den Ziel-Split (Train, Validation oder Test)
Link to this sectionWelche Label-Formate werden unterstützt?#
Die Ultralytics Plattform unterstützt YOLO Labels, COCO JSON, Ultralytics NDJSON und den Upload von Rohbildern:
Eine .txt-Datei pro Bild mit normalisierten Koordinaten (Bereich 0-1):
| Aufgabe | Format | Beispiel |
|---|---|---|
| Detect | class cx cy w h | 0 0.5 0.5 0.2 0.3 |
| Segment | class x1 y1 x2 y2 ... | 0 0.1 0.1 0.9 0.1 0.9 0.9 |
| Pose | class cx cy w h kx1 ky1 v1 ... | 0 0.5 0.5 0.2 0.3 0.6 0.7 2 |
| OBB | class x1 y1 x2 y2 x3 y3 x4 y4 | 0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9 |
| Classify | Verzeichnisstruktur | train/cats/, train/dogs/ |
Pose-Sichtbarkeits-Flags: 0=nicht annotiert, 1=annotiert aber verdeckt, 2=annotiert und sichtbar.
Link to this sectionKann ich denselben Datensatz für mehrere Aufgabentypen annotieren?#
Ja. Jedes Bild speichert Annotationen für alle 6 Aufgabentypen (detect, segment, semantic, pose, OBB, classify) zusammen. Du kannst den aktiven Aufgabentyp des Datensatzes jederzeit ändern, ohne bestehende Annotationen zu verlieren. Nur Annotationen, die dem aktiven Aufgabentyp entsprechen, werden im Editor angezeigt und in Exporte sowie das Training einbezogen — Annotationen für andere Aufgaben bleiben erhalten und erscheinen wieder, wenn du zurückwechselst.