Zum Inhalt springen

Datenvorbereitung

Die Datenvorbereitung ist die Grundlage für erfolgreiche Computer-Vision-Modelle. Die Ultralytics Platform bietet umfassende Tools zur Verwaltung Ihrer Trainingsdaten, vom Upload über die Annotation bis zur Analyse.

Überblick

Der Datenbereich der Ultralytics Platform hilft Ihnen dabei:

  • Bilder, Videos und Archive (ZIP, TAR, GZ) hochladen
  • Mit manuellen Zeichenwerkzeugen und SAM intelligenter Beschriftung kommentieren
  • Analysieren Ihrer Daten mit Statistiken und Visualisierungen
  • Export im NDJSON-Format für lokales Training

Ultralytics Datenübersicht Seitenleiste Datensätze

Workflow

graph LR
    A[Upload] --> B[Annotate]
    B --> C[Analyze]
    C --> D[Train]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
PhaseBeschreibung
HochladenBilder, Videos oder Archive mit automatischer Verarbeitung importieren
AnnotierenDaten mit Bounding Boxes, Polygonen, Keypoints oder Klassifizierungen beschriften
AnalysierenKlassenverteilungen, räumliche Heatmaps und Dimensionsstatistiken anzeigen
ExportIm NDJSON-Format für die Offline-Nutzung herunterladen

Unterstützte Aufgaben

Die Ultralytics Plattform unterstützt alle 5 YOLO-Aufgabentypen:

AufgabeBeschreibungAnnotationstool
ErkennenObjekterkennung mit Bounding BoxesRechteck-Werkzeug
SegmentierenInstanzsegmentierung mit PixelmaskenPolygon-Werkzeug
PoseKeypoint-Schätzung (17-Punkt COCO-Format)Keypoint-Werkzeug
OBBOrientierte Bounding Boxes für rotierte ObjekteWerkzeug für orientierte Boxen
KlassifizierenKlassifizierung auf BildebeneKlassenselektor

Auswahl der Aufgabenart

Der Aufgabentyp wird beim Erstellen eines Datensatzes festgelegt und bestimmt, welche Annotationswerkzeuge verfügbar sind. Sie können ihn später in den Datensatzeinstellungen ändern, aber inkompatible Annotationen werden nach dem Wechsel nicht angezeigt.

Hauptmerkmale

Intelligenter Speicher

Ultralytics nutzt Content-Addressable Storage (CAS) für eine effiziente Datenverwaltung:

  • Deduplizierung: Identische Bilder werden dank XXH3-128-Hashing nur einmal gespeichert.
  • Integrität: Hash-basierte Adressierung gewährleistet Datenintegrität
  • Effizienz: Optimierte Speicherung und schnelle Verarbeitung

Dataset-URIs

Referenzdatensätze unter Verwendung des ul:// URI-Format (siehe Nutzung von Plattform-Datensätzen):

yolo train data=ul://username/datasets/my-dataset

Dadurch ist es möglich, mit Ihrem API-Schlüssel von jedem beliebigen Gerät aus auf den Datensätzen der Plattform zu trainieren.

Plattformdaten aus Python verwenden

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Datenbank-Registerkarten

Jede Datensatzseite enthält fünf Registerkarten:

RegisterkarteBeschreibung
BilderBilder in Raster-, Kompakt- oder Tabellenansicht mit Anmerkungsüberlagerungen durchsuchen
UnterrichtKlassenbezeichnungen, Farben und Anzahl der Beschriftungen pro Klasse anzeigen und bearbeiten
DiagrammeAutomatische Statistiken: Split-Verteilung, Klassenanzahl, Heatmaps
ModelleMit Metriken und Status auf diesem Datensatz trainierte Modelle
FehlerBilder, deren Verarbeitung fehlgeschlagen ist, mit Fehlerdetails und Anweisungen zur Behebung

Statistiken und Visualisierung

Die Charts Die Registerkarte bietet eine automatische Analyse, einschließlich:

  • Geteilte Verteilung: Donut-Diagramm der Anzahl von Trainings-/Validierungs-/Testbildern
  • Top-Klassen: Donut-Diagramm der häufigsten Annotationsklassen
  • Bildbreiten: Histogramm der Bildbreitenverteilung
  • Bildhöhen: Histogramm der Bildhöhenverteilung
  • Punkte pro Instanz: Verteilung der Polygon-Scheitelpunkte oder Schlüsselpunkte (segment-Datensätze)
  • Annotationspositionen: 2D-Heatmap der Positionen der Mittelpunkte der Begrenzungsrahmen
  • Bildabmessungen: 2D-Heatmap von Breite vs. Höhe mit Hilfslinien für das Seitenverhältnis
  • Datensätze: Laden Sie Ihre Trainingsdaten hoch und verwalten Sie sie
  • Annotation: Daten mit manuellen und KI-gestützten Tools labeln

FAQ

Welche Dateiformate werden für den Upload unterstützt?

Die Ultralytics Platform unterstützt:

Bilder: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (jeweils max. 50 MB)

Videos: MP4, WebM, MOV, AVI, MKV, M4V (max. 1 GB, Bilder mit 1 FPS extrahiert, max. 100 Bilder)

Archive: ZIP, TAR, TAR.GZ, TGZ, GZ (max. 10 GB) mit Bildern und optionalen BeschriftungenYOLO

Wie groß ist die maximale Dataset-Größe?

Speicherlimits hängen von Ihrem Plan ab:

PlanSpeicherlimit
Kostenlos100 GB
Pro500 GB
EnterpriseBenutzerdefiniert

Individuelle Dateibeschränkungen: Bilder 50 MB, Videos 1 GB, Archive 10 GB

Kann ich meine Platform-Datasets für das lokale Training verwenden?

Ja! Verwenden Sie das Dataset-URI-Format, um lokal zu trainieren:

export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os

os.environ["ULTRALYTICS_API_KEY"] = "your_key"

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Oder exportieren Sie Ihren Datensatz im NDJSON-Format für ein vollständig offline durchgeführtes Training.



📅 Erstellt vor 1 Monat ✏️ Aktualisiert vor 4 Tagen
glenn-jochersergiuwaxmann

Kommentare