Datensätze
Die Datensätze Ultralytics bieten eine optimierte Lösung für die Verwaltung Ihrer Trainingsdaten. Nach dem Hochladen können die Datensätze sofort für das Modelltraining verwendet werden, wobei die Verarbeitung und die Erstellung von Statistiken automatisch erfolgen.
Ansehen: Daten-Sets auf Ultralytics hochladen
Datensatz hochladen
Ultralytics akzeptiert mehrere Upload-Formate, um Flexibilität zu gewährleisten:
| Format | Beschreibung |
|---|---|
| Bilder | Einzelne Bilddateien (JPG, PNG, WebP, TIFF, RAW) |
| ZIP-Archiv | Komprimierter Ordner mit Bildern und optionalen Beschriftungen |
| Video | MP4-, AVI-Dateien – Bilder mit ~1 fps extrahiert |
| YOLO | YOLO mit Beschriftungen |
Video-Frame-Extraktion
Beim Hochladen von Videos werden automatisch Einzelbilder extrahiert:
- Bildfrequenz: ~1 Bild pro Sekunde
- Maximale Bildanzahl: 100 Bilder pro Video
- Verarbeitung: Clientseitige Extraktion vor dem Hochladen
- Format: Frames in Standardbildformat konvertiert
Dies ist ideal für die Erstellung von Trainingsdatensätzen aus Überwachungsaufnahmen, Aktionsaufzeichnungen oder beliebigen Videoquellen.
Vorbereitung Ihres Datensatzes
Verwenden Sie für beschriftete Datensätze das YOLO :
my-dataset/
├── images/
│ ├── train/
│ │ ├── img001.jpg
│ │ └── img002.jpg
│ └── val/
│ ├── img003.jpg
│ └── img004.jpg
├── labels/
│ ├── train/
│ │ ├── img001.txt
│ │ └── img002.txt
│ └── val/
│ ├── img003.txt
│ └── img004.txt
└── data.yaml
Die YAML-Datei definiert die Konfiguration Ihres Datensatzes:
# data.yaml
path: .
train: images/train
val: images/val
names:
0: person
1: car
2: dog
Upload-Prozess
- Navigieren Sie in der Seitenleiste zu „Datensätze “.
- Klicken Sie auf „Datensatz hochladen“ oder ziehen Sie die Dateien in den Upload-Bereich.
- Wählen Sie den Aufgabentyp aus (detect, segment, Pose, OBB, classify).
- Fügen Sie einen Namen und optional eine Beschreibung hinzu.
- Klicken Sie auf „Hochladen“
Nach dem Hochladen verarbeitet die Plattform Ihre Daten:
- Normalisierung: Große Bilder werden in der Größe angepasst (max. 4096 px)
- Miniaturansichten: 256px-Vorschauen generiert
- Label-Parsing: YOLO -Labels extrahiert
- Statistik: Klassenverteilungen berechnet
Vor dem Hochladen überprüfen
Sie können Ihren Datensatz vor dem Hochladen lokal validieren:
from ultralytics.hub import check_dataset
check_dataset("path/to/dataset.zip", task="detect")
Bilder durchsuchen
Zeigen Sie Ihre Datensatzbilder in verschiedenen Layouts an:
| Ansicht | Beschreibung |
|---|---|
| Gitter | Miniaturbildraster mit Anmerkungsüberlagerungen |
| Kompakt | Kleinere Miniaturansichten für schnelles Scannen |
| Tabelle | Liste mit Dateinamen, Abmessungen und Anzahl der Beschriftungen |
Vollbild-Viewer
Klicken Sie auf ein beliebiges Bild, um den Vollbild-Viewer zu öffnen mit:
- Navigation: Pfeiltasten oder Klicken zum Blättern
- Metadaten: Dateiname, Abmessungen, Aufteilung, Anzahl der Beschriftungen
- Anmerkungen: Sichtbarkeit von Anmerkungen umschalten
- Aufschlüsselung nach Klassen: Anzahl der Labels pro Klasse
Nach Split filtern
Bilder nach ihrer Datensatzaufteilung filtern:
| Teilung | Zweck |
|---|---|
| Trainieren | Wird für das Modelltraining verwendet |
| Validieren | Wird zur Validierung während des Trainings verwendet |
| Test | Für die abschließende Bewertung verwendet |
| Unbekannt | Keine Aufteilung zugewiesen |
Statistik zum Datensatz
Die Registerkarte „Statistik“ bietet eine automatische Analyse Ihres Datensatzes:
Klasse Verteilung
Balkendiagramm, das die Anzahl der Anmerkungen pro Klasse zeigt:
Standort-Heatmap
Visualisierung der Stellen, an denen Anmerkungen in Bildern erscheinen:
Dimensionsanalyse
Streudiagramm der Bildabmessungen (Breite vs. Höhe):
Statistik-Caching
Statistiken werden für 5 Minuten zwischengespeichert. Änderungen an Anmerkungen werden nach Ablauf des Caches übernommen.
Datensatz exportieren
Exportieren Sie Ihren Datensatz im NDJSON-Format für die Offline-Nutzung:
- Öffnen Sie das Menü „Datensatzaktionen“.
- Klicken Sie auf „Exportieren“.
- Laden Sie die NDJSON-Datei herunter.
Das NDJSON-Format speichert ein JSON-Objekt pro Zeile:
{"filename": "img001.jpg", "split": "train", "labels": [...]}
{"filename": "img002.jpg", "split": "train", "labels": [...]}
Die vollständige Spezifikation finden Sie in der Dokumentation zumUltralytics Format.
Datensatz-URI
Referenzplattform-Datensätze unter Verwendung der ul:// URI-Format:
ul://username/datasets/dataset-slug
Verwenden Sie diese URI, um Modelle von überall aus zu trainieren:
export ULTRALYTICS_API_KEY="your_api_key"
yolo train model=yolo11n.pt data=ul://username/datasets/my-dataset epochs=100
Mit Plattformdaten überall trainieren
Die ul:// URI funktioniert in jeder Umgebung:
- Lokaler Rechner: Trainieren Sie auf Ihrer Hardware, Daten werden automatisch heruntergeladen.
- Google : Greifen Sie in Notizbüchern auf Ihre Plattform-Datensätze zu
- Remote-Server: Trainieren Sie auf Cloud-VMs mit vollständigem Zugriff auf den Datensatz.
Sichtbarkeitseinstellungen
Steuern Sie, wer Ihren Datensatz sehen kann:
| Einstellung | Beschreibung |
|---|---|
| Privat | Nur Sie haben Zugriff darauf. |
| Öffentlich | Jeder kann die Seite „Entdecken“ anzeigen. |
Um die Sichtbarkeit zu ändern:
- Menü „Datensatzaktionen“ öffnen
- Klicken Sie auf „Bearbeiten“
- Sichtbarkeitseinstellung umschalten
- Klicken Sie auf „Speichern“.
Datensatz bearbeiten
Aktualisieren Sie den Namen, die Beschreibung oder die Sichtbarkeit des Datensatzes:
- Menü „Datensatzaktionen“ öffnen
- Klicken Sie auf „Bearbeiten“
- Änderungen vornehmen
- Klicken Sie auf „Speichern“.
Datensatz löschen
Löschen Sie einen Datensatz, den Sie nicht mehr benötigen:
- Menü „Datensatzaktionen“ öffnen
- Auf „Löschen“ klicken
- Löschen bestätigen
Löschen und wiederherstellen
Gelöschte Datensätze werden für 30 Tage in den Papierkorb verschoben. Sie können sie über die Seite „Papierkorb“ in den Einstellungen wiederherstellen.
Trainieren Sie mit Datensatz
Beginnen Sie das Training direkt mit Ihrem Datensatz:
- Klicken Sie auf „Zugmodell“ auf der Datensatzseite.
- Projekt auswählen oder neu erstellen
- Trainingsparameter konfigurieren
- Mit dem Training beginnen
Weitere Informationen finden Sie unter Cloud-Schulungen.
FAQ
Was passiert mit meinen Daten nach dem Hochladen?
Ihre Daten werden in der von Ihnen ausgewählten Region (USA, EU oder AP) verarbeitet und gespeichert. Bilder sind:
- Validiert für Format und Größe
- Normalisiert, wenn größer als 4096px (unter Beibehaltung des Seitenverhältnisses)
- Gespeichert unter Verwendung von Content-Addressable Storage (CAS) mit SHA-256-Hashfunktion
- Miniaturansichten mit einer Größe von 256 px für schnelles Browsen
- Niemals ohne Ihre Zustimmung weitergegeben
Wie funktioniert die Speicherung?
Ultralytics nutzt Content-Addressable Storage (CAS) für eine effiziente Speicherung:
- Deduplizierung: Identische Bilder, die von verschiedenen Benutzern hochgeladen wurden, werden nur einmal gespeichert.
- Integrität: SHA-256-Hashfunktion gewährleistet Datenintegrität
- Effizienz: Reduziert Lagerkosten und beschleunigt die Verarbeitung
- Regional: Die Daten verbleiben in der von Ihnen ausgewählten Region (USA, EU oder AP).
Kann ich Bilder zu einem bestehenden Datensatz hinzufügen?
Ja, verwenden Sie die Schaltfläche „Bilder hinzufügen” auf der Datensatzseite, um zusätzliche Bilder hochzuladen. Neue Statistiken werden automatisch berechnet.
Wie verschiebe ich Bilder zwischen Datensätzen?
Verwenden Sie die Funktion zur Massenauswahl:
- Bilder in der Galerie auswählen
- Klicken Sie auf „Verschieben “ oder „Kopieren“.
- Zieldatensatz auswählen
Welche Etikettenformate werden unterstützt?
Ultralytics unterstützt YOLO -Labels:
- Erkennen:
class_id x_center y_center width height - Segmentieren:
class_id x1 y1 x2 y2 ...(Polygonpunkte) - Pose:
class_id x_center y_center width height kp1_x kp1_y kp1_v ... - OBB:
class_id x1 y1 x2 y2 x3 y3 x4 y4
Alle Koordinaten sind normalisiert (Bereich 0-1).