Link to this sectionDatensätze#

Q: Wie funktioniert die Speicherung?

Die Ultralytics Plattform nutzt Content-Addressable Storage (CAS) für effiziente Speicherung: Deduplizierung: Identische Bilder, die von verschiedenen Benutzern hochgeladen wurden, werden nur einmal gespeichert; Integrität: XXH3-128 Hashing stellt die Datenintegrität sicher; Effizienz: Reduziert Speicherkosten und beschleunigt die Verarbeitung; Regional: Daten verbleiben in deiner gewählten Region (US, EU oder AP)

Ultralytics Platform Datasets bieten eine optimierte Lösung für die Verwaltung deiner Trainingsdaten. Nach dem Hochladen verarbeitet die Plattform Bilder, Labels und Statistiken automatisch. Ein Datensatz ist bereit für das Training, sobald die Verarbeitung abgeschlossen ist und er mindestens ein Bild im train-Split, mindestens ein Bild im val- oder test-Split, mindestens ein gelabeltes Bild sowie insgesamt mindestens zwei Bilder enthält.

Link to this sectionDatensatz hochladen#

Die Ultralytics Platform akzeptiert für mehr Flexibilität verschiedene Upload-Formate.

Hast du bereits Daten an anderer Stelle?

Wenn du bereits Datensätze in Ultralytics HUB oder Roboflow hast, nutze Integrations, um sie direkt zu importieren – es ist kein manueller Export oder erneutes Hochladen erforderlich. Daten in Google Cloud Storage, Amazon S3 oder Azure Blob Storage können direkt über Cloud storage verwendet werden. Enterprise-Workspaces können On Premise nutzen, um lokale Daten zu indizieren und damit zu trainieren, ohne dass Pixel an die Plattform gesendet werden müssen.

Link to this sectionUnterstützte Formate#

Format	Erweiterungen	Hinweise	Maximale Größe
JPEG	`.jpg`, `.jpeg`	Am gebräuchlichsten, empfohlen	50 MB
PNG	`.png`	Unterstützt Transparenz	50 MB
WebP	`.webp`	Modern, gute Kompression	50 MB
BMP	`.bmp`	Unkomprimiert	50 MB
TIFF	`.tiff`, `.tif`	Hohe Qualität	50 MB
HEIC	`.heic`	iPhone-Fotos	50 MB
AVIF	`.avif`	Format der nächsten Generation	50 MB
JP2	`.jp2`	JPEG 2000	50 MB
DNG	`.dng`	Rohdaten der Kamera	50 MB
MPO	`.mpo`	Multi-Picture-Objekt	50 MB

Link to this sectionBrowser Codec Support#

Die Dateiendung allein reicht nicht aus: Ein Video kann trotzdem fehlschlagen, wenn sein Container oder Codec nicht von deinem Browser unterstützt wird.

Verwende H.264 MP4

H.264-Video in einem MP4-Container bietet die breiteste Unterstützung in allen gängigen Browsern und ist die sicherste Wahl. Wenn ein Video nicht hochgeladen werden kann, codiere es mit FFmpeg neu:

ffmpeg -i input.mov \
  -c:v libx264 -pix_fmt yuv420p \
  -c:a aac -movflags +faststart \
  output.mp4

Welche Video-Codecs funktionieren

Dies sind die Codecs, die Chromium-basierte Browser normalerweise decodieren. Safari und Firefox können abweichen, betrachte daher die Ja/Nein-Werte unten nicht als universelle Browser-Unterstützung:

Codec	Decodiert in Chrome	Hinweise
H.264 (AVC)	Ja	Empfohlen — breiteste Browser-Unterstützung
VP8, VP9, AV1	Ja	Lizenzfrei; gebräuchlich in WebM und MKV
HEVC (H.265)	Nur Hardware	Nur auf Geräten mit einem HEVC-Decoder
ProRes, MPEG-2, DivX/Xvid, MJPEG, …	Nein	Neu codieren zu H.264

Link to this sectionVorbereitung deines Datensatzes#

Die Plattform unterstützt Ultralytics YOLO, COCO, Ultralytics NDJSON sowie Raw-Uploads (ohne Annotationen):

Verwende die standardmäßige YOLO-Verzeichnisstruktur mit einer data.yaml-Datei:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Die YAML-Datei definiert deine Datensatzkonfiguration:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Raw-Uploads

Raw: Lade nicht annotierte Bilder hoch (keine Labels). Nützlich, wenn du die Annotation direkt auf der Plattform mit dem Annotations-Editor vornehmen möchtest.

Flache Verzeichnisstruktur

Du kannst Bilder auch ohne explizite Split-Ordner hochladen. Die Plattform berücksichtigt beim Hochladen das aktive Split-Ziel. Bei Datensätzen, die keine Klassifizierung sind, wird möglicherweise automatisch ein Validierungs-Split aus einem Teil des Trainingssets erstellt, wenn keine Split-Informationen bereitgestellt werden. Du kannst Bilder später jederzeit mit „Bulk Move-to-Split“ oder der Split-Neuverteilung neu zuweisen.

Format-Autoerkennung

Das Format wird automatisch erkannt: Datensätze mit einer data.yaml, die names-, train- oder val-Schlüssel enthalten, werden als YOLO behandelt. Datensätze mit COCO-JSON-Dateien (die images-, annotations- und categories-Arrays enthalten) werden als COCO behandelt. .ndjson-Exporte werden als Ultralytics NDJSON importiert. Datensätze, die nur aus Bildern ohne Annotationen bestehen, werden als Raw behandelt.

Details zu aufgabenspezifischen Formaten findest du unter unterstützte Aufgaben und in der Datasets Overview.

Link to this sectionUpload-Prozess#

Navigiere in der Seitenleiste zu Datasets
Klicke auf New Dataset oder ziehe Dateien in den Upload-Bereich
Wähle den Aufgabentyp aus (siehe unterstützte Aufgaben)
Füge einen Namen und eine optionale Beschreibung hinzu
Lege die Sichtbarkeit (öffentlich oder privat) und eine optionale Lizenz fest (siehe verfügbare Lizenzen)
Klicke auf Create & Upload (oder Create Dataset, falls du einen leeren Datensatz erstellst)

Ultralytics Platform Datasets Upload Dialog Task Selector

Nach dem Hochladen verarbeitet die Plattform deine Daten durch eine mehrstufige Pipeline:

graph LR
    A[Upload]:::start --> B[Validate]:::proc
    B --> C[Normalize]:::proc
    C --> D[Thumbnail]:::proc
    D --> E[Parse Labels]:::proc
    E --> F[Statistics]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Validierung: Format- und Größenprüfungen
Normalisierung: Große Bilder werden skaliert (max. 4096px, Mindestdimension 28px)
Thumbnails: Es werden 256px WebP-Vorschauen generiert
Label-Parsing: Labels im YOLO- und COCO-Format werden extrahiert
Statistiken: Klassenvorverteilungen und Bildabmessungen werden berechnet

Ultralytics Platform Datasets Upload Progress Bar

Vor dem Hochladen validieren

Du kannst deinen Datensatz vor dem Hochladen lokal validieren:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")

Anforderungen an die Bildgröße

Bilder müssen an ihrer kürzesten Seite mindestens 28px groß sein. Kleinere Bilder werden während der Verarbeitung abgelehnt. Bilder, die an ihrer längsten Seite größer als 4096px sind, werden unter Beibehaltung des Seitenverhältnisses automatisch skaliert.

Link to this sectionBilder durchsuchen#

Zeige deine Datensatzbilder in verschiedenen Layouts an.

Öffne das Clustering-Panel über die Toolbar der Galerie, um deinen Datensatz als interaktives 2D-Streudiagramm zu erkunden.

Ansicht	Beschreibung
Raster	Thumbnail-Raster mit Annotation-Overlays (Standard)
Kompakt	Kleinere Thumbnails für schnelles Scannen
Tabelle	Liste mit Thumbnail, Dateiname, Abmessungen, Größe, Split, Klassen und Label-Anzahl

Ultralytics Platform Datasets Gallery Grid View With Annotations

Link to this sectionSortieren und Filtern#

Bilder können für ein effizientes Browsen sortiert und gefiltert werden:

Sortieren	Beschreibung
Neueste / Älteste	Reihenfolge Upload / Erstellung
Name A-Z / Z-A	Dateiname alphabetisch
Höhe ↑/↓	Bildhöhe in Pixeln
Breite ↑/↓	Bildbreite in Pixeln
Größe ↑/↓	Dateigröße auf dem Datenträger
Anmerkungen ↑/↓	Anzahl der Anmerkungen pro Bild

Große Datensätze

Bei Datensätzen mit über 100.000 Bildern sind die Sortierungen nach Name / Größe / Breite / Höhe deaktiviert, damit die Galerie reaktionsfähig bleibt. Die Sortierungen nach Neueste, Älteste und Anzahl der Anmerkungen bleiben verfügbar.

Nicht beschriftete Bilder finden

Verwende den Filter Annotations auf Unannotated eingestellt, um schnell Bilder zu finden, die noch annotiert werden müssen. Dies ist besonders nützlich für große Datensätze, bei denen du den Fortschritt der Etikettierung verfolgen möchtest.

Link to this sectionVollbildanzeige#

Klicke auf ein beliebiges Bild, um die Vollbildanzeige zu öffnen mit:

Navigation: Pfeiltasten oder Miniaturansichten zum Durchsuchen
Metadaten: Dateiname, Abmessungen, Split-Badge, Anzahl der Anmerkungen
Anmerkungen: Sichtbarkeit der Anmerkungs-Overlays umschalten
Klassenaufschlüsselung: Anzahl der Labels pro Klasse mit Farbindikatoren
Bearbeiten: Wechsle in den Anmerkungsmodus, um Labels hinzuzufügen oder zu ändern
Herunterladen: Lade die originale Bilddatei herunter
Löschen: Lösche das Bild aus dem Datensatz
Zoom: Cmd/Ctrl+Scroll, Cmd/Ctrl++ oder Cmd/Ctrl+= zum Hineinzoomen und Cmd/Ctrl+- zum Herauszoomen
Ansicht zurücksetzen: Cmd/Ctrl + 0 oder die Reset-Schaltfläche, um das Bild an den Viewer anzupassen
Schwenken: Halte Space gedrückt und ziehe, um die Arbeitsfläche bei Zoom zu schwenken
Pixelansicht: Schalte die pixelige Darstellung für eine genaue Inspektion ein

Ultralytics Platform Datasets Fullscreen Viewer With Metadata Panel

Link to this sectionNach Split filtern#

Bilder nach ihrem Datensatz-Split filtern:

Split	Zweck
Trainieren	Verwendet für das Modelltraining
Val	Verwendet für die Validierung während des Trainings
Testen	Verwendet für die abschließende Bewertung

Link to this sectionClustering#

Das Clustering-Panel projiziert deinen Datensatz in ein interaktives 2D-Streudiagramm, in dem visuell ähnliche Bilder eng beieinander liegen. Nutze es, um Cluster zu finden, Duplikate und Ausreißer zu entdecken und zu untersuchen, wie Splits oder Klassen über deine Daten verteilt sind – ohne die Galerie zu verlassen. Öffne es über das Streudiagramm-Symbol in der Galerie-Symbolleiste auf jeder Datensatzseite.

Ultralytics Platform Datasets Clustering Empty State

Link to this sectionAnalyse ausführen#

Starte eine Analyse:

Öffne einen Datensatz und klicke auf das Streudiagramm-Symbol in der Galerie-Symbolleiste
Klicke auf Analyze Dataset
Warte, bis der Fortschrittsbalken abgeschlossen ist – die Ergebnisse erscheinen im selben Panel

Die Analyse läuft im Hintergrund und kann je nach Größe deines Datensatzes einige Minuten dauern. Du kannst das Panel schließen oder die Seite verlassen und später zurückkehren.

Link to this sectionVisualisierung#

Sobald die Analyse abgeschlossen ist, zeigt das Panel ein 2D-Streudiagramm aller analysierten Bilder. Galerie-Filter (Split, Klasse, annotiert/nicht annotiert) dimmen Punkte außerhalb des Filters, sodass du dich auf die für dich relevante Untermenge konzentrieren kannst.

Ultralytics Platform Datasets Clustering Scatter Plot

Link to this sectionFärben nach#

Ändere die Schattierung der Datenpunkte mit dem Color by-Dropdown in der Panel-Symbolleiste. Wechsle jederzeit zwischen den Ansichtsmodi – das Diagramm wird sofort neu eingefärbt, sodass du sehen kannst, wie Splits, Klassen oder Bildeigenschaften über deine Cluster verteilt sind:

Option	Schattierung
Splits	Train / Val / Test
Klassen	Erste Anmerkungsklasse auf jedem Bild
Breite	Bildbreite
Höhe	Bildhöhe
Größe	Dateigröße
Annotationen	Anzahl der Anmerkungen pro Bild

Ultralytics Platform Datasets Clustering Color Modes

Link to this sectionLasso-Auswahl#

Zeichne eine Freiform-Auswahl um einen Bereich, um Punkte im Diagramm hervorzuheben. Die Galerie filtert auf die passenden Bilder, sodass du sie mit den üblichen Bildoperationen prüfen, neu etikettieren, verschieben oder löschen kannst.

Auswahl aufheben

Ein Chip über dem Diagramm zeigt an, wie viele Punkte ausgewählt sind – klicke auf das ×, um das Lasso aufzuheben und zur vollständigen Galerieansicht zurückzukehren.

Link to this sectionSchwenken und Zoomen#

Navigiere große Streudiagramme direkt mit Maus und Tastatur:

Eingabe	Aktion
Scrollen	Das Diagramm in 2D schwenken
Cmd/Ctrl+Scroll	Hinein- oder herauszoomen, verankert am Cursor
Space halten	In den Drag-to-Pan-Modus wechseln

Link to this sectionNeu analysieren#

Wenn sich dein Datensatz nach der Analyse ändert, erscheint für Eigentümer und Editoren oben im Panel eine Re-analyze-Schaltfläche.

Klicke auf Re-analyze, um Einbettungen und die 2D-Projektion von Grund auf neu zu berechnen.

Link to this sectionDatensatz-Tabs#

Jede Datensatzseite kann je nach Datensatzstatus und deinen Berechtigungen bis zu sechs Tabs anzeigen:

Link to this sectionBilder-Tab#

Die Standardansicht zeigt die Bildergalerie mit Anmerkungs-Overlays. Unterstützt Raster-, Kompakt- und Tabellenansichtsmodi. Ziehe Dateien per Drag & Drop hierher, um weitere Bilder hinzuzufügen.

Link to this sectionKlassen-Tab#

Dieser Tab erscheint, wenn der Datensatz Bilder enthält.

Verwalte Anmerkungsklassen für deinen Datensatz:

Klassen-Histogramm: Balkendiagramm, das die Anzahl der Anmerkungen pro Klasse mit Umschalter für lineare/logarithmische Skalierung zeigt
Klassentabelle: Sortierbare, durchsuchbare Tabelle mit Klassennamen, Label-Anzahl und Bildanzahl
Klassennamen bearbeiten: Klicke auf einen Klassennamen, um ihn direkt umzubenennen
Klassenfarben bearbeiten: Klicke auf ein Farbfeld, um die Klassenfarbe zu ändern
Neue Klasse hinzufügen: Verwende das Eingabefeld unten, um Klassen hinzuzufügen

Ultralytics Platform Datasets Classes Tab Histogram And Table

Logarithmische Skalierung für unausgewogene Datensätze

Wenn dein Datensatz ein Klassenungleichgewicht aufweist (z. B. 10.000 „Person“-Annotationen, aber nur 50 „Fahrrad“), verwende den Log Scale-Schalter im Klassen-Histogramm, um alle Klassen klar zu visualisieren.

Link to this sectionRegisterkarte Diagramme#

Dieser Tab erscheint, wenn der Datensatz Bilder enthält.

Automatisch berechnete Statistiken aus deinem Datensatz:

Diagramm	Beschreibung
Split-Verteilung	Donut-Diagramm der Bildanzahl für Train/Val/Test und der prozentualen Label-Verteilung
Top-Klassen	Donut-Diagramm der 10 häufigsten Annotationsklassen
Bildabmessungen	Histogramm der Verteilung von Bildbreite und -höhe (überlagert) mit Mittelwert
Punkte pro Instanz	Anzahl der Polygon-Eckpunkte oder Keypoints pro Annotation (Segment/Pose)
Annotations-Positionen	2D-Heatmap der Mittelpunkte der Bounding Boxes
Bilddateigröße	Histogramm der Verteilung der Bilddateigröße
Bildformate	Verteilung der Quell-Bildformate (JPG, PNG, etc.)
Bounding Box-Abmessungen	Histogramm der Bounding Box-Breite und -höhe (überlagert)
Objekte pro Bild	Histogramm der Anzahl der Annotationen pro Bild
Bildabmessungen 2D	2D-Heatmap von Breite vs. Höhe mit Hilfslinien für das Seitenverhältnis

Ultralytics Platform Datasets Charts Tab Statistics Grid

Statistik-Caching

Statistiken werden für 5 Minuten zwischengespeichert. Änderungen an Annotationen werden sichtbar, nachdem der Cache abgelaufen ist.

Vollbild-Heatmaps

Klicke auf die Expandieren-Schaltfläche bei einer beliebigen Heatmap, um sie im Vollbildmodus anzuzeigen. Dies bietet eine größere, detailliertere Ansicht – nützlich, um räumliche Muster in großen Datensätzen zu verstehen.

Link to this sectionRegisterkarte Modelle#

Sieh dir alle mit diesem Datensatz trainierten Modelle in einer durchsuchbaren Tabelle an:

Spalte	Beschreibung
Name	Modellname mit Link
Projekt	Übergeordnetes Projekt mit Icon
Version	Unveränderliche Dataset-Version, die gegebenenfalls für das Training verwendet wird
Status	Trainingsstatus-Badge
Aufgabe	YOLO-Aufgabentyp
Epochen	Beste Epoche / gesamte Epochen
mAP50-95	Mean Average Precision
mAP50	mAP bei IoU 0,50
Erstellt	Erstellungsdatum

Ultralytics Platform Datasets Models Tab Trained Models Table

Link to this sectionRegisterkarte Fehler#

Diese Registerkarte erscheint nur, wenn eine oder mehrere Dateien bei der Verarbeitung fehlschlagen.

Bilder, deren Verarbeitung fehlgeschlagen ist, werden hier aufgelistet mit:

Fehlerbanner: Gesamtzahl der fehlgeschlagenen Bilder und Hilfestellung
Fehlertabelle: Dateiname, benutzerfreundliche Fehlerbeschreibung, Lösungshinweise und Vorschaubild
Häufige Fehler sind beschädigte Dateien, nicht unterstützte Formate, zu kleine Bilder (mind. 28px) und nicht unterstützte Farbmodi

Ultralytics Platform Datasets Errors Tab Processing Failures

Häufige Verarbeitungsfehler

Fehler	Ursache	Lösung
Bilddatei kann nicht gelesen werden	Beschädigtes oder nicht unterstütztes Format	Erneut aus dem Bildeditor exportieren
Unvollständig oder beschädigt	Datei wurde während der Übertragung abgeschnitten	Originaldatei erneut herunterladen
Bild zu klein	Mindestdimension unter 28px	Verwende Quellbilder mit höherer Auflösung
Nicht unterstützter Farbmodus	CMYK- oder indizierter Farbmodus	In den RGB-Modus konvertieren

Link to this sectionRegisterkarte Versionen#

Erstelle unveränderliche NDJSON-Snapshots deines Datensatzes für reproduzierbares Training. Jede Version erfasst die Bildanzahl, Klassenanzahl, Annotationsanzahl und Dateigröße zum Zeitpunkt der Erstellung.

Spalte	Beschreibung
Version	Versionsnummer (v1, v2, ...)
Beschreibung	Benutzerdefinierte Beschreibung (bearbeitbar)
Bilder	Bildanzahl zum Zeitpunkt des Snapshots
Klassen	Klassenanzahl zum Zeitpunkt des Snapshots
Annotationen	Annotationsanzahl zum Zeitpunkt des Snapshots
Größe	Dateigröße des NDJSON-Exports
Erstellt	Zeitpunkt der Versionerstellung

So erstellst du eine Version:

Öffne die Registerkarte Versionen
Gib optional eine Beschreibung ein (z. B. „500 Trainingsbilder hinzugefügt“ oder „Fehlerhaft gelabelte Klassen korrigiert“)
Klicke auf + New Version
Die neue Version erscheint in der Tabelle
Lade die Version bei Bedarf separat aus der Tabelle herunter

Jede Version wird fortlaufend nummeriert (v1, v2, v3...) und dauerhaft gespeichert. Du kannst jederzeit eine frühere Version aus der Versionstabelle herunterladen.

Speichere eine Version während des Trainings

Aktiviere Save Dataset Version im Cloud Training-Dialog, um ein Modell mit dem exakten Dataset zu verknüpfen, das für das Training verwendet wurde. Die Platform verwendet eine passende Version wieder, wenn sich die Inhalte des Datasets nicht geändert haben, und erstellt nur dann eine neue Version, wenn dies der Fall ist.

Nur bereite Datensätze

Die Erstellung von Versionen ist verfügbar, sobald der Datensatz den Status ready erreicht hat.

Wann Versionen erstellt werden sollten

Erstelle eine Version vor und nach größeren Änderungen an deinem Datensatz – Hinzufügen von Bildern, Korrigieren von Annotationen oder Neuausbalancieren der Splits. Dies ermöglicht es dir, die Modellleistung über verschiedene Datensatzstände hinweg zu vergleichen.

NDJSON-Dateigröße

Die angezeigte Größe bezieht sich auf die NDJSON-Exportdatei, die Bild-URLs und Annotationen enthält – nicht die Bilder selbst. Die tatsächlichen Bilddaten werden separat gespeichert und über signierte URLs abgerufen.

Link to this sectionDataset exportieren#

Exportiere deinen Datensatz für die Offline-Nutzung mit einem NDJSON-Download aus dem Datensatz-Header oder der Registerkarte Versionen.

So exportierst du:

Klicke auf die Download-Schaltfläche (Download-Symbol) im Datensatz-Header
Lade den aktuellen NDJSON-Snapshot direkt herunter
Verwende den Versions-Tab, wenn du einen unveränderlichen, nummerierten Snapshot möchtest, den du später erneut herunterladen kannst

Ultralytics Platform Datasets Export Ndjson Download

Das NDJSON-Format speichert ein JSON-Objekt pro Zeile. Die erste Zeile enthält Dataset-Metadaten, gefolgt von einer Zeile pro Bild:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "bytes": 12345678, "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}

Signierte URLs

Bild-URLs im exportierten NDJSON sind signiert und 7 Tage lang gültig. Wenn du neue URLs benötigst, exportiere das Dataset erneut oder erstelle eine neue Version.

Siehe die Ultralytics NDJSON format documentation für die vollständige Spezifikation.

Link to this sectionBildoperationen#

Link to this sectionSchnellaktionen#

Klicke mit der rechten Maustaste auf ein beliebiges Bild in der Grid- oder Compact-Ansicht, um auf Schnellaktionen zuzugreifen:

Aktion	Beschreibung
Move to Split	Ordne das Bild dem Train-, Val- oder Test-Split zu
Download	Lade die ursprüngliche Bilddatei herunter
Delete	Lösche das Bild aus dem Dataset

Einzeln vs. Bulk

Das Kontextmenü für Bilder funktioniert für ein einzelnes Bild. Für Massenvorgänge bei mehreren Bildern verwende die Table-Ansicht mit Auswahl per Checkbox.

Link to this sectionBulk Move to Split#

Ordne ausgewählte Bilder einem anderen Split innerhalb desselben Datasets zu:

Wechsle zur Table-Ansicht
Wähle Bilder über Checkboxen aus
Klicke mit der rechten Maustaste, um das Kontextmenü zu öffnen
Wähle Move to split > Train, Validation oder Test

Du kannst Bilder in der Grid-Ansicht auch per Drag-and-Drop auf die Split-Filter-Tabs ziehen.

Train/Val-Splits organisieren

Lade alle Bilder in ein Dataset hoch und verwende dann die Bulk-Funktion zum Verschieben, um Teilmengen in Train-, Validation- und Test-Splits zu organisieren.

Link to this sectionSplit-Umverteilung#

Verteile alle Bilder mittels benutzerdefinierter Verhältnisse auf Train-, Validation- und Test-Splits:

Klicke auf die Split-Leiste in der Dataset-Symbolleiste, um den Dialog Redistribute Splits zu öffnen
Passe die Split-Prozentsätze mit einer der unten genannten Methoden an
Überprüfe die Live-Vorschau der Bildanzahl, um die Verteilung zu bestätigen
Klicke auf Apply, um alle Bilder zufällig gemäß deinen Prozentsätzen neu zuzuordnen

Ultralytics Platform Datasets Split Redistribution Dialog

Der Dialog bietet drei Möglichkeiten, deine Ziel-Split-Verhältnisse festzulegen:

Methode	Beschreibung
Drag	Ziehe die Regler zwischen den farbigen Segmenten, um die Split-Grenzen visuell anzupassen
Type	Bearbeite die Prozentangabe für einen Split (die anderen beiden Splits werden automatisch proportional ausgeglichen)
Auto	Ein Klick, um sofort einen 80/20 Train/Validation-Split einzustellen, wobei der Test-Split auf 0% gesetzt wird

Eine Live-Vorschau zeigt genau, wie viele Bilder in jedem Split landen, bevor du die Änderungen anwendest.

Schneller 80/20 Split

Klicke auf den Auto-Button, um sofort den empfohlenen 80/20 Train/Validation-Split einzustellen. Dies ist das gängigste Verhältnis für das Training.

Link to this sectionBulk Delete#

Lösche mehrere Bilder gleichzeitig:

Wähle Bilder in der Tabellenansicht aus
Klicke mit der rechten Maustaste und wähle Delete
Bestätige das Löschen

Link to this sectionDataset URI#

Referenziere Platform-Datasets über das ul:// URI-Format (siehe Using Platform Datasets):

ul://username/datasets/dataset-slug

Du kannst auch eine Dataset- oder Modell-Web-URL direkt einfügen (z. B. https://platform.ultralytics.com/username/datasets/dataset-slug); sie wird automatisch in den ul:// URI umgewandelt. Wenn du eine Liste von Datensätzen übergibst, wird ein Basismodell nacheinander für jeden davon feinabgestimmt, zum Beispiel model.train(data=["ul://username/datasets/a", "ul://username/datasets/b"]).

Verwende diese URI, um Modelle von überall aus zu trainieren:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Train Anywhere with Platform Data

Die ul:// URI funktioniert aus jeder Umgebung:

Lokale Maschine: Trainiere auf deiner Hardware, Daten werden automatisch heruntergeladen
Google Colab: Greife in Notebooks auf deine Platform-Datasets zu
Remote-Server: Trainiere auf Cloud-VMs mit vollem Zugriff auf das Dataset

Link to this sectionVerfügbare Lizenzen#

Die Platform unterstützt die folgenden Lizenzen für Datasets:

Lizenz	Typ
Keine	Keine Lizenz ausgewählt
CC0-1.0	Public Domain
CC-BY-2.5	Permissiv
CC-BY-4.0	Permissiv
CC-BY-SA-4.0	Copyleft
CC-BY-NC-4.0	Nicht-kommerziell
CC-BY-NC-SA-4.0	Copyleft
CC-BY-ND-4.0	Keine Derivate
CC-BY-NC-ND-4.0	Nicht-kommerziell
Apache-2.0	Permissiv
MIT	Permissiv
AGPL-3.0	Copyleft
GPL-3.0	Copyleft
Nur für die Forschung	Eingeschränkt
Sonstiges	Benutzerdefiniert

Copyleft-Lizenzen

Beim Klonen eines Datasets mit einer Copyleft-Lizenz (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0) erbt der Klon die Lizenz und die Lizenzauswahl ist gesperrt.

Link to this sectionSichtbarkeitseinstellungen#

Kontrolliere, wer dein Dataset sehen kann:

Einstellung	Beschreibung
Privat	Nur du hast Zugriff
Öffentlich	Jeder kann es auf der Explore-Seite sehen

Die Sichtbarkeit wird beim Erstellen eines Datasets im New Dataset-Dialog über einen Schalter festgelegt. Öffentliche Datasets sind auf der Explore-Seite sichtbar.

Link to this sectionDataset bearbeiten#

Dataset-Metadaten werden direkt auf der Dataset-Seite inline bearbeitet — kein Dialog erforderlich:

Name: Klicke auf den Namen des Datasets, um ihn zu bearbeiten. Änderungen werden beim Verlassen des Feldes oder durch Enter automatisch gespeichert.
Beschreibung: Klicke auf die Beschreibung (oder den Platzhalter "Add a description..."), um sie zu bearbeiten. Änderungen werden automatisch gespeichert.
Aufgabentyp: Klicke auf das Aufgaben-Badge, um einen anderen Aufgabentyp auszuwählen.
Lizenz: Klicke auf die Lizenzauswahl, um die Dataset-Lizenz zu ändern.

Aufgabentyp ändern

Jedes Bild speichert Annotationen für alle Aufgabentypen zusammen. Das Ändern des Dataset-Aufgabentyps steuert, welche Annotationen im Editor sichtbar sind und in Exporte sowie das Training einfließen. Annotationen für andere Aufgabentypen bleiben in der Datenbank erhalten und erscheinen wieder, wenn du zurückwechselst.

Link to this sectionDataset klonen#

Wenn du einen öffentlichen Datensatz ansiehst, der dir nicht gehört, klicke auf Clone Dataset, um eine Kopie in deinem Arbeitsbereich zu erstellen. Der Klon enthält alle Bilder, Annotationen und Klassendefinitionen. Wenn der ursprüngliche Datensatz eine Copyleft-Lizenz hat, erbt der Klon diese und die Lizenzauswahl ist gesperrt.

Link to this sectionStern vergeben und teilen#

Stern vergeben: Klicke auf die Stern-Schaltfläche, um einen Datensatz als Lesezeichen zu speichern. Die Anzahl der Sterne ist für alle Benutzer sichtbar.
Teilen: Bei öffentlichen Datensätzen klicke auf die Teilen-Schaltfläche, um einen Link zu kopieren oder ihn auf sozialen Plattformen zu teilen.

Link to this sectionDataset löschen#

Lösche einen Datensatz, den du nicht mehr benötigst:

Öffne das Aktionsmenü für Datensätze
Klicke auf Delete
Bestätige im Dialogfeld: "Dies verschiebt [name] in den Papierkorb. Du kannst ihn innerhalb von 30 Tagen wiederherstellen."

Papierkorb und Wiederherstellung

Gelöschte Datensätze werden in den Papierkorb verschoben – sie werden nicht dauerhaft gelöscht. Du kannst sie innerhalb von 30 Tagen unter Settings > Trash wiederherstellen.

Link to this sectionAuf Datensatz trainieren#

Starte das Training direkt von deinem Datensatz aus:

Klicke auf New Model auf der Datensatz-Seite
Wähle ein Projekt aus oder erstelle ein neues
Konfiguriere die Trainingsparameter
Starte das Training

graph LR
    A[Dataset]:::start --> B[New Model]:::proc
    B --> C[Select Project]:::proc
    C --> D[Configure]:::proc
    D --> E[Start Training]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Siehe Cloud Training für Details.

Link to this sectionFAQ#

Link to this sectionWas passiert nach dem Hochladen mit meinen Daten?#

Deine Daten werden in der von dir gewählten Region (US, EU oder AP) verarbeitet und gespeichert. Bilder werden wie folgt behandelt:

Validierung von Format und Größe
Ablehnung, wenn die Mindestdimension unter 28px liegt
Normalisierung, wenn sie größer als 4096px sind (unter Beibehaltung des Seitenverhältnisses; kodiert für optimierte Speicherung)
Speicherung mittels Content-Addressable Storage (CAS) mit XXH3-128 Hashing
Erstellung von Thumbnails im 256px WebP-Format für schnelles Durchsuchen

Link to this sectionWie funktioniert die Speicherung?#

Die Ultralytics Plattform nutzt Content-Addressable Storage (CAS) für effiziente Speicherung:

Deduplizierung: Identische Bilder, die von verschiedenen Benutzern hochgeladen wurden, werden nur einmal gespeichert
Integrität: XXH3-128 Hashing stellt die Datenintegrität sicher
Effizienz: Reduziert Speicherkosten und beschleunigt die Verarbeitung
Regional: Daten verbleiben in deiner gewählten Region (US, EU oder AP)

Link to this sectionKann ich Bilder zu einem bestehenden Datensatz hinzufügen?#

Ja, ziehe Dateien per Drag-and-Drop auf die Datensatz-Seite oder nutze die Upload-Schaltfläche, um weitere Bilder hinzuzufügen. Neue Statistiken werden automatisch berechnet.

Link to this sectionWie verschiebe ich Bilder zwischen Splits?#

Verwende die Funktion zum massenhaften Verschieben in Splits:

Wähle Bilder in der Tabellenansicht aus
Mache einen Rechtsklick und wähle Move to split
Wähle den Ziel-Split (Train, Validation oder Test)

Link to this sectionWelche Label-Formate werden unterstützt?#

Die Ultralytics Plattform unterstützt YOLO Labels, COCO JSON, Ultralytics NDJSON und den Upload von Rohbildern:

Eine .txt-Datei pro Bild mit normalisierten Koordinaten (Bereich 0-1):

Aufgabe	Format	Beispiel
Detect	`class cx cy w h`	`0 0.5 0.5 0.2 0.3`
Segment	`class x1 y1 x2 y2 ...`	`0 0.1 0.1 0.9 0.1 0.9 0.9`
Pose	`class cx cy w h kx1 ky1 v1 ...`	`0 0.5 0.5 0.2 0.3 0.6 0.7 2`
OBB	`class x1 y1 x2 y2 x3 y3 x4 y4`	`0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9`
Classify	Verzeichnisstruktur	`train/cats/`, `train/dogs/`

Pose-Sichtbarkeits-Flags: 0=nicht annotiert, 1=annotiert aber verdeckt, 2=annotiert und sichtbar.

Link to this sectionKann ich denselben Datensatz für mehrere Aufgabentypen annotieren?#

Ja. Jedes Bild speichert Annotationen für alle 6 Aufgabentypen (detect, segment, semantic, pose, OBB, classify) zusammen. Du kannst den aktiven Aufgabentyp des Datensatzes jederzeit ändern, ohne bestehende Annotationen zu verlieren. Nur Annotationen, die dem aktiven Aufgabentyp entsprechen, werden im Editor angezeigt und in Exporte sowie das Training einbezogen — Annotationen für andere Aufgaben bleiben erhalten und erscheinen wieder, wenn du zurückwechselst.

Mitwirkende

GLglenn-jocher²⁴ SEsergiuwaxmann⁵ LAlaodouya³ T-t-hakobyan² MYmykolaxboiko¹ LALaughing-q¹

Erstellt 14. Jan. 2026Aktualisiert gestern