Zum Inhalt springen

Datenvorbereitung

Die Datenvorbereitung ist die Grundlage für erfolgreiche Computer-Vision-Modelle. Die Ultralytics Platform bietet umfassende Tools zur Verwaltung Ihrer Trainingsdaten, vom Upload über die Annotation bis zur Analyse.



Ansehen: Erste Schritte mit Ultralytics – Daten

Überblick

Der Datenbereich der Ultralytics Platform hilft Ihnen dabei:

  • Hochladen Bilder, Videos und Datensatzdateien (ZIP, TAR einschließlich .tar.gz/.tgz, NDJSON)
  • Annotieren mit manuellen Zeichenwerkzeugen und SAM-gestützter intelligenter Beschriftung — wählen Sie aus SAM 2.1 oder dem neuen SAM 3
  • Analysieren Ihrer Daten mit Statistiken und Visualisierungen
  • Export im NDJSON-Format für lokales Training

Ultralytics Datenübersicht Seitenleiste Datensätze

Workflow

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
PhaseBeschreibung
HochladenBilder, Videos oder Archive mit automatischer Verarbeitung importieren
AnnotierenKennzeichnen Sie Daten mit manuellen Tools für alle 5 Aufgabentypen oder verwenden Sie SAM für detect, segment und OBB.
AnalysierenKlassenverteilungen, räumliche Heatmaps und Dimensionsstatistiken anzeigen
ExportHerunterladen im NDJSON-Format zur Offline-Nutzung

Unterstützte Aufgaben

Die Ultralytics Plattform unterstützt alle 5 YOLO-Aufgabentypen:

AufgabeBeschreibungAnnotationstool
ErkennenObjekterkennung mit Bounding BoxesRechteck-Werkzeug
SegmentierenInstanzsegmentierung mit PixelmaskenPolygon-Werkzeug
PoseSchlüsselpunkt-Schätzung mit integrierten und benutzerdefinierten SkelettvorlagenKeypoint-Werkzeug
OBBOrientierte Bounding Boxes für rotierte ObjekteWerkzeug für orientierte Boxen
KlassifizierenKlassifizierung auf BildebeneKlassenselektor

Auswahl der Aufgabenart

Der Aufgabentyp wird beim Erstellen eines Datensatzes festgelegt und bestimmt, welche Annotationswerkzeuge verfügbar sind. Sie können ihn später in den Datensatzeinstellungen ändern, aber inkompatible Annotationen werden nach dem Wechsel nicht angezeigt.

Hauptmerkmale

Intelligenter Speicher

Ultralytics nutzt Content-Addressable Storage (CAS) für eine effiziente Datenverwaltung:

  • Deduplizierung: Identische Bilder werden nur einmal mittels XXH3-128-Hashing gespeichert.
  • Integrität: Hash-basierte Adressierung gewährleistet die Datenintegrität
  • Effizienz: Optimierte Speicherung und schnelle Verarbeitung

Dataset-URIs

Referenzdatensätze unter Verwendung des ul:// URI-Format (siehe Nutzung von Plattform-Datensätzen):

yolo train data=ul://username/datasets/my-dataset

Dadurch ist es möglich, mit Ihrem API-Schlüssel von jedem beliebigen Gerät aus auf den Datensätzen der Plattform zu trainieren.

Plattformdaten aus Python verwenden

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Datensatz-Versionierung

Erstellen Sie unveränderliche NDJSON-Snapshots Ihres Datensatzes für reproduzierbares Training. Jede Version erfasst die Bildanzahl, Klassenanzahl und Annotationsanzahl zum Zeitpunkt der Erstellung. Details finden Sie im Versions-Tab.

Datensatz-Tabs

Jede Datensatzseite verfügt über sechs Registerkarten:

RegisterkarteBeschreibung
BilderBilder in Gitter-, Kompakt- oder Tabellenansicht mit Annotations-Overlays durchsuchen
KlassenKlassenbezeichnungen, Farben und Anzahl der Beschriftungen pro Klasse anzeigen und bearbeiten
DiagrammeAutomatische Statistiken: Verteilung der Splits, Klassenanzahlen, Heatmaps
ModelleModelle, die auf diesem Datensatz trainiert wurden, mit Metriken und Status
VersionenErstellen und laden Sie unveränderliche NDJSON-Snapshots für reproduzierbares Training herunter
FehlerBilder, deren Verarbeitung fehlgeschlagen ist, mit Fehlerdetails und Anweisungen zur Behebung

Statistiken und Visualisierung

Die Charts Die Registerkarte bietet eine automatische Analyse, einschließlich:

  • Aufteilungsverteilung: Donut-Diagramm der Bildanzahlen für Training/Validierung/Test
  • Top-Klassen: Donut-Diagramm der häufigsten Annotationsklassen
  • Bildbreiten: Histogramm der Bildbreitenverteilung
  • Bildhöhen: Histogramm der Bildhöhenverteilung
  • Punkte pro Instanz: Verteilung der Polygon-Eckpunkte oder Schlüsselpunkte (segment/pose Datensätze)
  • Annotationspositionen: 2D-Heatmap der Mittelpunktspositionen von Bounding Boxes
  • Bildabmessungen: 2D-Heatmap von Breite vs. Höhe mit Seitenverhältnis-Hilfslinien
  • Datensätze: Ihre Trainingsdaten hochladen, verwalten und exportieren
  • Annotation: Daten mit manuellen und KI-gestützten Tools labeln
  • Cloud-Training: Modelle auf Ihren annotierten Datensätzen trainieren
  • Datensatz-URI: Verwenden Sie ul:// URIs – Trainieren Sie von überall aus

FAQ

Welche Dateiformate werden für den Upload unterstützt?

Die Ultralytics Platform unterstützt:

Bilder: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (jeweils max. 50 MB)

Videos: MP4, WebM, MOV, AVI, MKV, M4V (max. 1 GB, Bilder mit 1 FPS extrahiert, max. 100 Bilder)

Datensatzdateien: ZIP- oder TAR-Archive, einschließlich .tar.gz und .tgz (max. 10 GB bei Free, 20 GB bei Pro, 50 GB bei Enterprise) enthält Bilder mit optionalen YOLO-Bezeichnungen, plus NDJSON-Exporte

Wie groß ist die maximale Dataset-Größe?

Speicherlimits hängen von Ihrem Plan ab:

PlanSpeicherlimit
Kostenlos100 GB
Pro500 GB
EnterpriseUnbegrenzt

Größenbeschränkungen für einzelne Dateien: Bilder 50 MB, Videos 1 GB, Datensätze 10 GB (Free) / 20 GB (Pro) / 50 GB (Enterprise)

Kann ich meine Platform-Datasets für das lokale Training verwenden?

Ja! Verwenden Sie das Dataset-URI-Format, um lokal zu trainieren:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Oder exportieren Sie Ihren Datensatz im NDJSON-Format für ein vollständig offline durchgeführtes Training.



📅 Erstellt vor 2 Monaten ✏️ Aktualisiert vor 4 Tagen
glenn-jocherRizwanMunawaramanharshxsergiuwaxmann

Kommentare