Datenvorbereitung
Die Datenvorbereitung ist die Grundlage für erfolgreiche Computer-Vision-Modelle. Die Ultralytics Platform bietet umfassende Tools zur Verwaltung Ihrer Trainingsdaten, vom Upload über die Annotation bis zur Analyse.
Ansehen: Erste Schritte mit Ultralytics – Daten
Überblick
Der Datenbereich der Ultralytics Platform hilft Ihnen dabei:
- Hochladen Bilder, Videos und Datensatzdateien (ZIP, TAR einschließlich
.tar.gz/.tgz, NDJSON) - Annotieren mit manuellen Zeichenwerkzeugen und SAM-gestützter intelligenter Beschriftung — wählen Sie aus SAM 2.1 oder dem neuen SAM 3
- Analysieren Ihrer Daten mit Statistiken und Visualisierungen
- Export im NDJSON-Format für lokales Training

Workflow
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Phase | Beschreibung |
|---|---|
| Hochladen | Bilder, Videos oder Archive mit automatischer Verarbeitung importieren |
| Annotieren | Kennzeichnen Sie Daten mit manuellen Tools für alle 5 Aufgabentypen oder verwenden Sie SAM für detect, segment und OBB. |
| Analysieren | Klassenverteilungen, räumliche Heatmaps und Dimensionsstatistiken anzeigen |
| Export | Herunterladen im NDJSON-Format zur Offline-Nutzung |
Unterstützte Aufgaben
Die Ultralytics Plattform unterstützt alle 5 YOLO-Aufgabentypen:
| Aufgabe | Beschreibung | Annotationstool |
|---|---|---|
| Erkennen | Objekterkennung mit Bounding Boxes | Rechteck-Werkzeug |
| Segmentieren | Instanzsegmentierung mit Pixelmasken | Polygon-Werkzeug |
| Pose | Schlüsselpunkt-Schätzung mit integrierten und benutzerdefinierten Skelettvorlagen | Keypoint-Werkzeug |
| OBB | Orientierte Bounding Boxes für rotierte Objekte | Werkzeug für orientierte Boxen |
| Klassifizieren | Klassifizierung auf Bildebene | Klassenselektor |
Auswahl der Aufgabenart
Der Aufgabentyp wird beim Erstellen eines Datensatzes festgelegt und bestimmt, welche Annotationswerkzeuge verfügbar sind. Sie können ihn später in den Datensatzeinstellungen ändern, aber inkompatible Annotationen werden nach dem Wechsel nicht angezeigt.
Hauptmerkmale
Intelligenter Speicher
Ultralytics nutzt Content-Addressable Storage (CAS) für eine effiziente Datenverwaltung:
- Deduplizierung: Identische Bilder werden nur einmal mittels XXH3-128-Hashing gespeichert.
- Integrität: Hash-basierte Adressierung gewährleistet die Datenintegrität
- Effizienz: Optimierte Speicherung und schnelle Verarbeitung
Dataset-URIs
Referenzdatensätze unter Verwendung des ul:// URI-Format (siehe Nutzung von Plattform-Datensätzen):
yolo train data=ul://username/datasets/my-dataset
Dadurch ist es möglich, mit Ihrem API-Schlüssel von jedem beliebigen Gerät aus auf den Datensätzen der Plattform zu trainieren.
Plattformdaten aus Python verwenden
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Datensatz-Versionierung
Erstellen Sie unveränderliche NDJSON-Snapshots Ihres Datensatzes für reproduzierbares Training. Jede Version erfasst die Bildanzahl, Klassenanzahl und Annotationsanzahl zum Zeitpunkt der Erstellung. Details finden Sie im Versions-Tab.
Datensatz-Tabs
Jede Datensatzseite verfügt über sechs Registerkarten:
| Registerkarte | Beschreibung |
|---|---|
| Bilder | Bilder in Gitter-, Kompakt- oder Tabellenansicht mit Annotations-Overlays durchsuchen |
| Klassen | Klassenbezeichnungen, Farben und Anzahl der Beschriftungen pro Klasse anzeigen und bearbeiten |
| Diagramme | Automatische Statistiken: Verteilung der Splits, Klassenanzahlen, Heatmaps |
| Modelle | Modelle, die auf diesem Datensatz trainiert wurden, mit Metriken und Status |
| Versionen | Erstellen und laden Sie unveränderliche NDJSON-Snapshots für reproduzierbares Training herunter |
| Fehler | Bilder, deren Verarbeitung fehlgeschlagen ist, mit Fehlerdetails und Anweisungen zur Behebung |
Statistiken und Visualisierung
Die Charts Die Registerkarte bietet eine automatische Analyse, einschließlich:
- Aufteilungsverteilung: Donut-Diagramm der Bildanzahlen für Training/Validierung/Test
- Top-Klassen: Donut-Diagramm der häufigsten Annotationsklassen
- Bildbreiten: Histogramm der Bildbreitenverteilung
- Bildhöhen: Histogramm der Bildhöhenverteilung
- Punkte pro Instanz: Verteilung der Polygon-Eckpunkte oder Schlüsselpunkte (segment/pose Datensätze)
- Annotationspositionen: 2D-Heatmap der Mittelpunktspositionen von Bounding Boxes
- Bildabmessungen: 2D-Heatmap von Breite vs. Höhe mit Seitenverhältnis-Hilfslinien
Schnellzugriffe
- Datensätze: Ihre Trainingsdaten hochladen, verwalten und exportieren
- Annotation: Daten mit manuellen und KI-gestützten Tools labeln
- Cloud-Training: Modelle auf Ihren annotierten Datensätzen trainieren
- Datensatz-URI: Verwenden Sie
ul://URIs – Trainieren Sie von überall aus
FAQ
Welche Dateiformate werden für den Upload unterstützt?
Die Ultralytics Platform unterstützt:
Bilder: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (jeweils max. 50 MB)
Videos: MP4, WebM, MOV, AVI, MKV, M4V (max. 1 GB, Bilder mit 1 FPS extrahiert, max. 100 Bilder)
Datensatzdateien: ZIP- oder TAR-Archive, einschließlich .tar.gz und .tgz (max. 10 GB bei Free, 20 GB bei Pro, 50 GB bei Enterprise) enthält Bilder mit optionalen YOLO-Bezeichnungen, plus NDJSON-Exporte
Wie groß ist die maximale Dataset-Größe?
Speicherlimits hängen von Ihrem Plan ab:
| Plan | Speicherlimit |
|---|---|
| Kostenlos | 100 GB |
| Pro | 500 GB |
| Enterprise | Unbegrenzt |
Größenbeschränkungen für einzelne Dateien: Bilder 50 MB, Videos 1 GB, Datensätze 10 GB (Free) / 20 GB (Pro) / 50 GB (Enterprise)
Kann ich meine Platform-Datasets für das lokale Training verwenden?
Ja! Verwenden Sie das Dataset-URI-Format, um lokal zu trainieren:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100
import os
os.environ["ULTRALYTICS_API_KEY"] = "YOUR_API_KEY"
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)
Oder exportieren Sie Ihren Datensatz im NDJSON-Format für ein vollständig offline durchgeführtes Training.