Datenvorbereitung
Die Datenvorbereitung ist die Grundlage für erfolgreiche Computer-Vision-Modelle. Die Ultralytics Platform bietet umfassende Tools zur Verwaltung Ihrer Trainingsdaten, vom Upload über die Annotation bis zur Analyse.
Überblick
Der Datenbereich der Ultralytics Platform hilft Ihnen dabei:
- Bilder, Videos und Archive (ZIP, TAR, GZ) hochladen
- Mit manuellen Zeichenwerkzeugen und SAM intelligenter Beschriftung kommentieren
- Analysieren Ihrer Daten mit Statistiken und Visualisierungen
- Export im NDJSON-Format für lokales Training

Workflow
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Phase | Beschreibung |
|---|---|
| Hochladen | Bilder, Videos oder Archive mit automatischer Verarbeitung importieren |
| Annotieren | Daten mit Bounding Boxes, Polygonen, Keypoints oder Klassifizierungen beschriften |
| Analysieren | Klassenverteilungen, räumliche Heatmaps und Dimensionsstatistiken anzeigen |
| Export | Im NDJSON-Format für die Offline-Nutzung herunterladen |
Unterstützte Aufgaben
Die Ultralytics Plattform unterstützt alle 5 YOLO-Aufgabentypen:
| Aufgabe | Beschreibung | Annotationstool |
|---|---|---|
| Erkennen | Objekterkennung mit Bounding Boxes | Rechteck-Werkzeug |
| Segmentieren | Instanzsegmentierung mit Pixelmasken | Polygon-Werkzeug |
| Pose | Keypoint-Schätzung (17-Punkt COCO-Format) | Keypoint-Werkzeug |
| OBB | Orientierte Bounding Boxes für rotierte Objekte | Werkzeug für orientierte Boxen |
| Klassifizieren | Klassifizierung auf Bildebene | Klassenselektor |
Auswahl der Aufgabenart
Der Aufgabentyp wird beim Erstellen eines Datensatzes festgelegt und bestimmt, welche Annotationswerkzeuge verfügbar sind. Sie können ihn später in den Datensatzeinstellungen ändern, aber inkompatible Annotationen werden nach dem Wechsel nicht angezeigt.
Hauptmerkmale
Intelligenter Speicher
Ultralytics nutzt Content-Addressable Storage (CAS) für eine effiziente Datenverwaltung:
- Deduplizierung: Identische Bilder werden dank XXH3-128-Hashing nur einmal gespeichert.
- Integrität: Hash-basierte Adressierung gewährleistet Datenintegrität
- Effizienz: Optimierte Speicherung und schnelle Verarbeitung
Dataset-URIs
Referenzdatensätze unter Verwendung des ul:// URI-Format (siehe Nutzung von Plattform-Datensätzen):
yolo train data=ul://username/datasets/my-dataset
Dadurch ist es möglich, mit Ihrem API-Schlüssel von jedem beliebigen Gerät aus auf den Datensätzen der Plattform zu trainieren.
Plattformdaten aus Python verwenden
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Datenbank-Registerkarten
Jede Datensatzseite enthält fünf Registerkarten:
| Registerkarte | Beschreibung |
|---|---|
| Bilder | Bilder in Raster-, Kompakt- oder Tabellenansicht mit Anmerkungsüberlagerungen durchsuchen |
| Unterricht | Klassenbezeichnungen, Farben und Anzahl der Beschriftungen pro Klasse anzeigen und bearbeiten |
| Diagramme | Automatische Statistiken: Split-Verteilung, Klassenanzahl, Heatmaps |
| Modelle | Mit Metriken und Status auf diesem Datensatz trainierte Modelle |
| Fehler | Bilder, deren Verarbeitung fehlgeschlagen ist, mit Fehlerdetails und Anweisungen zur Behebung |
Statistiken und Visualisierung
Die Charts Die Registerkarte bietet eine automatische Analyse, einschließlich:
- Geteilte Verteilung: Donut-Diagramm der Anzahl von Trainings-/Validierungs-/Testbildern
- Top-Klassen: Donut-Diagramm der häufigsten Annotationsklassen
- Bildbreiten: Histogramm der Bildbreitenverteilung
- Bildhöhen: Histogramm der Bildhöhenverteilung
- Punkte pro Instanz: Verteilung der Polygon-Scheitelpunkte oder Schlüsselpunkte (segment-Datensätze)
- Annotationspositionen: 2D-Heatmap der Positionen der Mittelpunkte der Begrenzungsrahmen
- Bildabmessungen: 2D-Heatmap von Breite vs. Höhe mit Hilfslinien für das Seitenverhältnis
Schnellzugriffe
- Datensätze: Laden Sie Ihre Trainingsdaten hoch und verwalten Sie sie
- Annotation: Daten mit manuellen und KI-gestützten Tools labeln
FAQ
Welche Dateiformate werden für den Upload unterstützt?
Die Ultralytics Platform unterstützt:
Bilder: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (jeweils max. 50 MB)
Videos: MP4, WebM, MOV, AVI, MKV, M4V (max. 1 GB, Bilder mit 1 FPS extrahiert, max. 100 Bilder)
Archive: ZIP, TAR, TAR.GZ, TGZ, GZ (max. 10 GB) mit Bildern und optionalen BeschriftungenYOLO
Wie groß ist die maximale Dataset-Größe?
Speicherlimits hängen von Ihrem Plan ab:
| Plan | Speicherlimit |
|---|---|
| Kostenlos | 100 GB |
| Pro | 500 GB |
| Enterprise | Benutzerdefiniert |
Individuelle Dateibeschränkungen: Bilder 50 MB, Videos 1 GB, Archive 10 GB
Kann ich meine Platform-Datasets für das lokale Training verwenden?
Ja! Verwenden Sie das Dataset-URI-Format, um lokal zu trainieren:
export ULTRALYTICS_API_KEY="your_key"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "your_key"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Oder exportieren Sie Ihren Datensatz im NDJSON-Format für ein vollständig offline durchgeführtes Training.