Zum Inhalt springen

Datensätze

Die Datensätze Ultralytics bieten eine optimierte Lösung für die Verwaltung Ihrer Trainingsdaten. Nach dem Hochladen können die Datensätze sofort für das Modelltraining verwendet werden, wobei die Verarbeitung und die Erstellung von Statistiken automatisch erfolgen.


Ansehen: Daten-Sets auf Ultralytics hochladen

Datensatz hochladen

Ultralytics akzeptiert mehrere Upload-Formate, um Flexibilität zu gewährleisten:

FormatBeschreibung
BilderEinzelne Bilddateien (JPG, PNG, WebP, TIFF, RAW)
ZIP-ArchivKomprimierter Ordner mit Bildern und optionalen Beschriftungen
VideoMP4-, AVI-Dateien – Bilder mit ~1 fps extrahiert
YOLOYOLO mit Beschriftungen

Video-Frame-Extraktion

Beim Hochladen von Videos werden automatisch Einzelbilder extrahiert:

  • Bildfrequenz: ~1 Bild pro Sekunde
  • Maximale Bildanzahl: 100 Bilder pro Video
  • Verarbeitung: Clientseitige Extraktion vor dem Hochladen
  • Format: Frames in Standardbildformat konvertiert

Dies ist ideal für die Erstellung von Trainingsdatensätzen aus Überwachungsaufnahmen, Aktionsaufzeichnungen oder beliebigen Videoquellen.

Vorbereitung Ihres Datensatzes

Verwenden Sie für beschriftete Datensätze das YOLO :

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

Die YAML-Datei definiert die Konfiguration Ihres Datensatzes:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Upload-Prozess

  1. Navigieren Sie in der Seitenleiste zu „Datensätze “.
  2. Klicken Sie auf „Datensatz hochladen“ oder ziehen Sie die Dateien in den Upload-Bereich.
  3. Wählen Sie den Aufgabentyp aus (detect, segment, Pose, OBB, classify).
  4. Fügen Sie einen Namen und optional eine Beschreibung hinzu.
  5. Klicken Sie auf „Hochladen“

Nach dem Hochladen verarbeitet die Plattform Ihre Daten:

  1. Normalisierung: Große Bilder werden in der Größe angepasst (max. 4096 px)
  2. Miniaturansichten: 256px-Vorschauen generiert
  3. Label-Parsing: YOLO -Labels extrahiert
  4. Statistik: Klassenverteilungen berechnet
Vor dem Hochladen überprüfen

Sie können Ihren Datensatz vor dem Hochladen lokal validieren:

from ultralytics.hub import check_dataset

check_dataset("path/to/dataset.zip", task="detect")

Bilder durchsuchen

Zeigen Sie Ihre Datensatzbilder in verschiedenen Layouts an:

AnsichtBeschreibung
GitterMiniaturbildraster mit Anmerkungsüberlagerungen
KompaktKleinere Miniaturansichten für schnelles Scannen
TabelleListe mit Dateinamen, Abmessungen und Anzahl der Beschriftungen

Vollbild-Viewer

Klicken Sie auf ein beliebiges Bild, um den Vollbild-Viewer zu öffnen mit:

  • Navigation: Pfeiltasten oder Klicken zum Blättern
  • Metadaten: Dateiname, Abmessungen, Aufteilung, Anzahl der Beschriftungen
  • Anmerkungen: Sichtbarkeit von Anmerkungen umschalten
  • Aufschlüsselung nach Klassen: Anzahl der Labels pro Klasse

Nach Split filtern

Bilder nach ihrer Datensatzaufteilung filtern:

TeilungZweck
TrainierenWird für das Modelltraining verwendet
ValidierenWird zur Validierung während des Trainings verwendet
TestFür die abschließende Bewertung verwendet
UnbekanntKeine Aufteilung zugewiesen

Statistik zum Datensatz

Die Registerkarte „Statistik“ bietet eine automatische Analyse Ihres Datensatzes:

Klasse Verteilung

Balkendiagramm, das die Anzahl der Anmerkungen pro Klasse zeigt:

Standort-Heatmap

Visualisierung der Stellen, an denen Anmerkungen in Bildern erscheinen:

Dimensionsanalyse

Streudiagramm der Bildabmessungen (Breite vs. Höhe):

Statistik-Caching

Statistiken werden für 5 Minuten zwischengespeichert. Änderungen an Anmerkungen werden nach Ablauf des Caches übernommen.

Datensatz exportieren

Exportieren Sie Ihren Datensatz im NDJSON-Format für die Offline-Nutzung:

  1. Öffnen Sie das Menü „Datensatzaktionen“.
  2. Klicken Sie auf „Exportieren“.
  3. Laden Sie die NDJSON-Datei herunter.

Das NDJSON-Format speichert ein JSON-Objekt pro Zeile:

{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}

Die vollständige Spezifikation finden Sie in der Dokumentation zumUltralytics Format.

Datensatz-URI

Referenzplattform-Datensätze unter Verwendung der ul:// URI-Format:

ul://username/datasets/dataset-slug

Verwenden Sie diese URI, um Modelle von überall aus zu trainieren:

export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100

Mit Plattformdaten überall trainieren

Die ul:// URI funktioniert in jeder Umgebung:

  • Lokaler Rechner: Trainieren Sie auf Ihrer Hardware, Daten werden automatisch heruntergeladen.
  • Google : Greifen Sie in Notizbüchern auf Ihre Plattform-Datensätze zu
  • Remote-Server: Trainieren Sie auf Cloud-VMs mit vollständigem Zugriff auf den Datensatz.

Sichtbarkeitseinstellungen

Steuern Sie, wer Ihren Datensatz sehen kann:

EinstellungBeschreibung
PrivatNur Sie haben Zugriff darauf.
ÖffentlichJeder kann die Seite „Entdecken“ anzeigen.

Um die Sichtbarkeit zu ändern:

  1. Menü „Datensatzaktionen“ öffnen
  2. Klicken Sie auf „Bearbeiten“
  3. Sichtbarkeitseinstellung umschalten
  4. Klicken Sie auf „Speichern“.

Datensatz bearbeiten

Aktualisieren Sie den Namen, die Beschreibung oder die Sichtbarkeit des Datensatzes:

  1. Menü „Datensatzaktionen“ öffnen
  2. Klicken Sie auf „Bearbeiten“
  3. Änderungen vornehmen
  4. Klicken Sie auf „Speichern“.

Datensatz löschen

Löschen Sie einen Datensatz, den Sie nicht mehr benötigen:

  1. Menü „Datensatzaktionen“ öffnen
  2. Auf „Löschen“ klicken
  3. Löschen bestätigen

Löschen und wiederherstellen

Gelöschte Datensätze werden für 30 Tage in den Papierkorb verschoben. Sie können sie über die Seite „Papierkorb“ in den Einstellungen wiederherstellen.

Trainieren Sie mit Datensatz

Beginnen Sie das Training direkt mit Ihrem Datensatz:

  1. Klicken Sie auf „Zugmodell“ auf der Datensatzseite.
  2. Projekt auswählen oder neu erstellen
  3. Trainingsparameter konfigurieren
  4. Mit dem Training beginnen

Weitere Informationen finden Sie unter Cloud-Schulungen.

FAQ

Was passiert mit meinen Daten nach dem Hochladen?

Ihre Daten werden in der von Ihnen ausgewählten Region (USA, EU oder AP) verarbeitet und gespeichert. Bilder sind:

  1. Validiert für Format und Größe
  2. Normalisiert, wenn größer als 4096px (unter Beibehaltung des Seitenverhältnisses)
  3. Gespeichert unter Verwendung von Content-Addressable Storage (CAS) mit SHA-256-Hashfunktion
  4. Miniaturansichten mit einer Größe von 256 px für schnelles Browsen
  5. Niemals ohne Ihre Zustimmung weitergegeben

Wie funktioniert die Speicherung?

Ultralytics nutzt Content-Addressable Storage (CAS) für eine effiziente Speicherung:

  • Deduplizierung: Identische Bilder, die von verschiedenen Benutzern hochgeladen wurden, werden nur einmal gespeichert.
  • Integrität: SHA-256-Hashfunktion gewährleistet Datenintegrität
  • Effizienz: Reduziert Lagerkosten und beschleunigt die Verarbeitung
  • Regional: Die Daten verbleiben in der von Ihnen ausgewählten Region (USA, EU oder AP).

Kann ich Bilder zu einem bestehenden Datensatz hinzufügen?

Ja, verwenden Sie die Schaltfläche „Bilder hinzufügen” auf der Datensatzseite, um zusätzliche Bilder hochzuladen. Neue Statistiken werden automatisch berechnet.

Wie verschiebe ich Bilder zwischen Datensätzen?

Verwenden Sie die Funktion zur Massenauswahl:

  1. Bilder in der Galerie auswählen
  2. Klicken Sie auf „Verschieben “ oder „Kopieren“.
  3. Zieldatensatz auswählen

Welche Etikettenformate werden unterstützt?

Ultralytics unterstützt YOLO -Labels:

  • Erkennen: class_id x_center y_center width height
  • Segmentieren: class_id x1 y1 x2 y2 ... (Polygonpunkte)
  • Pose: class_id x_center y_center width height kp1_x kp1_y kp1_v ...
  • OBB: class_id x1 y1 x2 y2 x3 y3 x4 y4

Alle Koordinaten sind normalisiert (Bereich 0-1).



📅 Erstellt vor 0 Tagen ✏️ Aktualisiert vor 0 Tagen
glenn-jocher

Kommentare