Cloud-Training

Das Ultralytics Platform Cloud-Training bietet Training mit nur einem Klick auf Cloud-GPUs, wodurch das Modelltraining ohne komplexe Einrichtung zugänglich wird. Trainiere YOLO-Modelle mit Echtzeit-Metrik-Streaming und automatischer Checkpoint-Speicherung.

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

Trainingsdialog

Starte das Training über die Plattform-Benutzeroberfläche, indem du auf jeder Projektseite auf Neues Modell (oder auf einer Datensatzseite auf Trainieren) klickst. Der Trainingsdialog hat zwei Reiter: Cloud-Training und Lokales Training.

Ultralytics Platform Training Dialog Cloud Tab

Schritt 1: Basismodell auswählen

Wähle aus offiziellen YOLO26-Modellen oder deinen eigenen trainierten Modellen:

KategorieBeschreibung
OffiziellAlle 25 YOLO26-Modelle (5 Größen x 5 Aufgaben)
Deine ModelleDeine abgeschlossenen Modelle für das Finetuning

Offizielle Modelle sind nach Aufgabentyp sortiert (Detect, Segment, Pose, OBB, Classify) mit Größen von nano bis xlarge.

Schritt 2: Datensatz auswählen

Wähle einen Datensatz für das Training aus (siehe Datasets):

OptionBeschreibung
OffiziellKuratierte Datensätze von Ultralytics
Deine DatensätzeDatensätze, die du hochgeladen hast
Datensatzanforderungen

Datensätze müssen den Status ready haben, mit mindestens 1 Bild im Trainings-Split, 1 Bild im Validierungs- oder Test-Split und mindestens 1 beschrifteten Bild.

Aufgaben-Nichtübereinstimmung

Eine Warnung zur Aufgaben-Nichtübereinstimmung erscheint, wenn die Modellaufgabe (z. B. detect) nicht mit der Datensatzaufgabe (z. B. segment) übereinstimmt. Das Training schlägt fehl, wenn du mit nicht übereinstimmenden Aufgaben fortfährst. Stelle sicher, dass sowohl das Modell als auch der Datensatz denselben Aufgabentyp verwenden, wie in den Aufgabenanleitungen beschrieben.

Schritt 3: Parameter konfigurieren

Lege die grundlegenden Trainingsparameter fest:

ParameterBeschreibungStandardwert
EpochenAnzahl der Trainingsiterationen100
Batch-GrößeStichproben pro Iteration-1 (auto)
Image SizeEingabeauflösung (Dropdown 320/416/512/640/1280, jedes Vielfache von 32 zwischen 32-4096 im YAML-Editor)640
LaufnameOptionaler Name für den Trainingslaufauto

Schritt 4: Erweiterte Einstellungen (optional)

Erweitere die Erweiterten Einstellungen, um auf den vollständigen YAML-basierten Parameter-Editor mit über 40 Trainingsparametern zuzugreifen, die nach Gruppen organisiert sind (siehe Konfigurationsreferenz):

GruppeParameter
Lernratelr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
Optimiererauto (Standard), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax
Verlustgewichtungenbox, cls, dfl, pose, kobj, label_smoothing
Farb-Augmentierunghsv_h, hsv_s, hsv_v
Geometrische Augment.degrees, translate, scale, shear, perspective
Flip & Mix Augment.flipud, fliplr, mosaic, mixup, copy_paste
Trainingssteuerungpatience, seed, deterministic, amp, cos_lr, close_mosaic, save_period
Datensatzfraction, freeze, single_cls, rect, multi_scale, resume

Parameter sind aufgabenbewusst (z. B. wird copy_paste nur für Segmentierungsaufgaben angezeigt, pose/kobj nur für Pose-Aufgaben). Ein Geändert-Badge erscheint, wenn Werte von den Standardwerten abweichen, und du kannst alle mit der Reset-Schaltfläche auf die Standardwerte zurücksetzen.

Beispiel: Augmentierung für kleine Datensätze optimieren

Für kleine Datensätze (<1000 Bilder), erhöhe die Augmentierung, um Overfitting zu reduzieren:

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

Schritt 5: GPU auswählen (Cloud-Reiter)

Wähle deine GPU aus der Ultralytics Cloud:

Ultralytics Platform Training Dialog Gpu Selector And Cost

GPUGenerationVRAMKosten/StundeAm besten für
RTX 2000 AdaAda16 GB$0.24Kleine Datensätze, Tests
RTX A4500Ampere20 GB$0.25Kleine bis mittlere Datensätze
RTX 4000 AdaAda20 GB$0.26Mittlere Datensätze
RTX A5000Ampere24 GB$0.27Mittlere Datensätze
L4Ada24 GB$0.39Inference-optimiert
A40Ampere48 GB$0.44Größere Batch-Größen
RTX 3090Ampere24 GB$0.46Allgemeines Training
RTX A6000Ampere48 GB$0.49Große Modelle
RTX PRO 4500Blackwell32 GB$0.64Tolles Preis-/Leistungsverhältnis
RTX 4090Ada24 GB$0.69Bestes Preis-/Leistungsverhältnis
RTX 6000 AdaAda48 GB$0,77Training mit großen Batches
L40SAda48 GB$0,86Training mit großen Batches
RTX 5090Blackwell32 GB$0,99Neueste Consumer-Generation
L40Ada48 GB$0,99Große Modelle
A100 PCIeAmpere80 GB$1,39Produktionstraining
A100 SXMAmpere80 GB$1,49Produktionstraining
RTX PRO 6000Blackwell96 GB$1,89Empfohlener Standard
H100 PCIeHopper80 GB$2,39Hochleistungstraining
H100 SXMHopper80 GB$2,99Schnellstes Training
H100 NVLHopper94 GB$3,07Maximale Leistung
H200 NVLHopper143 GB$3,39Maximaler Speicher
H200 SXMHopper141 GB$3,99Maximale Leistung
B200Blackwell180 GB$5,49Große Modelle (Pro+)
B300Blackwell288 GB$7,39Größte Modelle (Pro+)
GPU-Auswahl
  • RTX PRO 6000: 96 GB Blackwell, empfohlener Standard für die meisten Aufgaben
  • A100 SXM: 80 GB HBM2e – starke Wahl für große Batch-Größen oder größere Modelle
  • H100 PCIe / H100 SXM / H100 NVL: 80–94 GB Hopper für zeitkritische Trainings (verfügbar in allen Tarifen)
  • H200 NVL / H200 SXM: 141–143 GB Hopper für speicherintensive Workloads (verfügbar in allen Tarifen)
  • B200 / B300: 180–288 GB NVIDIA Blackwell für modernste Workloads – erfordert Pro oder Enterprise

Der Dialog zeigt dein aktuelles Guthaben und eine Aufladen-Schaltfläche. Die geschätzten Kosten und die Dauer werden basierend auf deiner Konfiguration berechnet (Modellgröße, Datensatzbilder, Epochen, GPU-Geschwindigkeit).

Schritt 6: Training starten

Klicke auf Training starten, um deinen Job zu starten. Die Plattform:

  1. Stellt eine GPU-Instanz bereit
  2. Lädt deinen Datensatz herunter
  3. Beginnt mit dem Training
  4. Streamt Metriken in Echtzeit

Lebenszyklus von Trainingsjobs

Trainingsjobs durchlaufen die folgenden Status:

StatusBeschreibung
AusstehendJob übermittelt, wartet auf GPU-Zuweisung
Wird gestartetGPU bereitgestellt, Datensatz und Modell werden heruntergeladen
LäuftTraining läuft, Metriken werden in Echtzeit gestreamt
AbgeschlossenTraining erfolgreich beendet
FehlgeschlagenTraining fehlgeschlagen (siehe Konsolenprotokolle für Details)
AbgebrochenTraining wurde vom Benutzer abgebrochen
Kostenlose Credits

Neue Konten erhalten Anmeldeguthaben – 5 $ für persönliche E-Mails und 25 $ für geschäftliche E-Mails. Überprüfe dein Guthaben unter Einstellungen > Abrechnung.

Ultralytics Platform Training Progress With Charts

Training überwachen

Sieh dir den Trainingsfortschritt in Echtzeit auf dem Reiter Training der Modellseite an:

Unter-Reiter Diagramme

Ultralytics Platform Model Training Live Charts

MetrikBeschreibung
Verlust (Loss)Trainings- und Validierungsverlust
mAPMean Average Precision
PräzisionKorrekte positive Vorhersagen
Trefferquote (Recall)Erkannte Ground Truths

Konsole-Untertab

Live-Konsolenausgabe mit ANSI-Farbunterstützung, Fortschrittsbalken und Fehlererkennung.

System-Untertab

Echtzeit-GPU-Auslastung, Speicher, Temperatur, CPU- und Festplattennutzung.

Checkpoints

Nach Abschluss des Trainings wird das best model (best.pt, der Checkpoint mit dem höchsten mAP) auf die Plattform hochgeladen und steht zum Download, Export und für die Bereitstellung zur Verfügung.

Training abbrechen

Klicke auf der Modellseite auf Cancel Training, um einen laufenden Job zu stoppen:

  • Die Compute-Instanz wird beendet
  • Guthaben wird nicht mehr abgebucht
  • Der beste Checkpoint bleibt verfügbar, sofern er vor dem Abbruch erreicht wurde

Remote-Training

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Trainiere auf deiner eigenen Hardware, während du Metriken an die Plattform streamst.

Anforderung an die Paketversion

Die Plattform-Integration erfordert ultralytics>=8.4.35. Niedrigere Versionen funktionieren NICHT mit der Plattform.

pip install -U ultralytics

API-Schlüssel einrichten

  1. Gehe zu Settings > API Keys
  2. Erstelle einen neuen Schlüssel (oder die Plattform erstellt automatisch einen, wenn du den Local Training Tab öffnest)
  3. Setze die Umgebungsvariable:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"

Training mit Streaming

Verwende die Parameter project und name, um Metriken zu streamen:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1

Der Local Training Tab im Trainingsdialog zeigt einen vorkonfigurierten Befehl mit deinem API-Schlüssel, ausgewählten Parametern und erweiterten Argumenten.

Plattform-Datensätze verwenden

Trainiere mit Datensätzen, die auf der Plattform gespeichert sind, unter Verwendung des ul:// URI-Formats:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1

Das ul:// URI-Format lädt deinen Datensatz automatisch herunter und konfiguriert ihn. Das Modell wird automatisch mit dem Datensatz auf der Plattform verknüpft (siehe Using Platform Datasets).

Abrechnung

Trainingskosten basieren auf der GPU-Nutzung:

Kostenschätzung

Vor Beginn des Trainings schätzt die Plattform die Gesamtkosten durch:

  1. Schätzung der Sekunden pro Epoche basierend auf Datensatzgröße, Modellkomplexität, Bildgröße, Batchgröße und GPU-Geschwindigkeit
  2. Berechnung der gesamten Trainingszeit durch Multiplikation der Sekunden pro Epoche mit der Anzahl der Epochen, zuzüglich Start-Overhead
  3. Berechnung der geschätzten Kosten aus der gesamten Trainingszeit multipliziert mit dem Stundensatz der GPU

Faktoren, die die Kosten beeinflussen:

FaktorAuswirkung
DatensatzgrößeMehr Bilder = längere Trainingszeit (Basis: ~2,8s Rechenzeit pro 1000 Bilder auf RTX 4090)
ModellgrößeGrößere Modelle (m, l, x) trainieren langsamer als (n, s)
Anzahl der EpochenDirekter Multiplikator für die Trainingszeit
Image SizeGrößere imgsz erhöht die Berechnung: 320px=0,25x, 640px=1,0x (Basis), 1280px=4,0x
Batch-GrößeGrößere Batches sind effizienter (batch 32 = ~0,85x Zeit, batch 8 = ~1,2x Zeit im Vergleich zur batch 16 Basis)
GPU-GeschwindigkeitSchnellere GPUs verkürzen die Trainingszeit (z. B. H100 SXM = ~3,4x schneller als RTX 4090)
Startup-OverheadBis zu 5 Minuten für Instanz-Initialisierung, Datendownload und Aufwärmphase (skaliert mit Datensatzgröße)

Kostenbeispiele

Schätzungen

Kostenschätzungen sind annähernd und hängen von vielen Faktoren ab. Der Trainingsdialog zeigt eine Echtzeitschätzung, bevor du das Training startest.

SzenarioGPUGeschätzte Kosten
500 Bilder, YOLO26n, 50 EpochenRTX 4090~$0,50
1000 Bilder, YOLO26n, 100 EpochenRTX PRO 6000~$5
5000 Bilder, YOLO26s, 100 EpochenH100 SXM~$23

Abrechnungsablauf

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

Abrechnungsablauf für Cloud-Training:

  1. Schätzung: Kostenberechnung vor Trainingsbeginn
  2. Guthabenprüfung: Verfügbares Guthaben wird vor dem Start geprüft
  3. Training: Job läuft auf ausgewählter Compute-Instanz
  4. Abrechnung: Endgültige Kosten basieren auf der tatsächlichen Laufzeit
Verbraucherschutz

Die Abrechnung erfasst die tatsächliche Compute-Nutzung, einschließlich abgebrochener Teilläufe. Für fehlgeschlagene Trainingsläufe wird dir nichts berechnet.

Abrechnung nach Jobstatus

StatusBerechnet?
AbgeschlossenJa – tatsächliche genutzte GPU-Zeit
AbgebrochenJa – GPU-Zeit vom Start bis zum Abbruch
FehlgeschlagenNein – fehlgeschlagene Läufe werden nicht berechnet
BlockiertTeilweise – nur die tatsächliche Trainingszeit wird berechnet
Keine Kosten bei Fehlern

Wenn ein Trainingslauf aufgrund eines Konfigurationsfehlers, eines Speichermangels oder eines anderen Fehlers fehlschlägt, wird dir nichts berechnet. Nur die erfolgreiche Rechenzeit wird in Rechnung gestellt. Blockierte Jobs (keine Aktivität für mehr als 4 Stunden) werden automatisch beendet und nur für die Zeit berechnet, in der die GPU aktiv trainiert hat, nicht für die Leerlaufzeit.

Zahlungsmethoden

MethodeBeschreibung
KontostandVorausbezahltes Guthaben
Zahlung pro JobAbrechnung bei Jobabschluss
Mindestguthaben

Der Trainingsstart erfordert ein positives verfügbares Guthaben und genügend Credits für die geschätzten Jobkosten.

Trainingskosten anzeigen

Nach dem Training kannst du die detaillierten Kosten im Billing Tab einsehen:

  • Kostenaufschlüsselung pro Epoche
  • Gesamte GPU-Zeit
  • Kostenbericht herunterladen

Ultralytics Platform Training Billing Details

Trainingstipps

Wähle die richtige Modellgröße

ModellParameterAm besten für
YOLO26n2,4 Mio.Echtzeit, Edge-Geräte
YOLO26s9,5 Mio.Ausgewogene Geschwindigkeit/Genauigkeit
YOLO26m20,4 Mio.Höhere Genauigkeit
YOLO26l24,8 Mio.Produktionsgenauigkeit
YOLO26x55,7 Mio.Maximale Genauigkeit

Trainingszeit optimieren

Kostensparende Strategien
  1. Klein anfangen: Teste mit 10-20 Epochen auf einer günstigen GPU, um sicherzustellen, dass dein Datensatz und die Konfiguration funktionieren
  2. Wähle die passende GPU: RTX PRO 6000 bewältigt die meisten Workloads gut
  3. Dataset validieren: Behebe Kennzeichnungsfehler, bevor du Geld für das Training ausgibst
  4. Frühzeitig überwachen: Brich das Training ab, wenn der Verlust stagniert — du zahlst nur für die tatsächlich genutzte Rechenzeit

Fehlerbehebung

ProblemLösung
Training bleibt bei 0% stehenDataset-Format prüfen, erneut versuchen
Zu wenig ArbeitsspeicherBatch-Größe reduzieren oder größere GPU verwenden
Schlechte GenauigkeitEpochen erhöhen, Datenqualität prüfen
Training langsamSchnellere GPU in Betracht ziehen
Aufgaben-FehlanpassungStelle sicher, dass Modell- und Dataset-Aufgaben übereinstimmen

FAQ

Wie lange dauert das Training?

Die Trainingsdauer hängt ab von:

  • Dataset-Größe
  • Modellgröße
  • Anzahl der Epochen
  • GPU ausgewählt

Typische Zeiten (1000 Bilder, 100 Epochen):

ModellRTX PRO 6000A100 SXM
YOLO26n~20 Min.~15 Min.
YOLO26m~40 Min.~30 Min.
YOLO26x~80 Min.~60 Min.
Ungefähre Zeiten

Die Trainingszeiten sind ungefähre Angaben und variieren je nach Dataset-Komplexität, Augmentierungseinstellungen und Batch-Größe. Nutze die Kostenschätzung im Trainingsdialog für genauere Prognosen.

Kann ich über Nacht trainieren?

Ja, das Training läuft bis zur Fertigstellung weiter. Du erhältst eine Benachrichtigung, sobald das Training abgeschlossen ist. Stelle sicher, dass dein Konto über ausreichend Guthaben für epochenbasiertes Training verfügt.

Was passiert, wenn mein Guthaben aufgebraucht ist?

Wenn dein Guthaben während eines Trainingslaufs auf Null sinkt, wird das Training bis zur Fertigstellung fortgesetzt und dein Saldo rutscht ins Negative. Dies stellt sicher, dass dein Trainingsjob niemals mitten im Lauf unterbrochen wird.

Nach Abschluss des Trainings musst du Guthaben hinzufügen, um deinen Saldo wieder auf einen positiven Stand zu bringen, bevor du neue Trainingsjobs starten kannst. Dein fertiggestelltes Modell, Checkpoints und alle Trainingsartefakte bleiben unabhängig vom Kontostand vollständig erhalten.

Negativer Saldo

Ein negativer Saldo verhindert lediglich das Starten neuer Trainingsjobs. Bestehende Deployments und andere Plattformfunktionen funktionieren weiterhin normal. Füge Guthaben über Einstellungen > Abrechnung hinzu oder aktiviere automatische Aufladung, um Unterbrechungen zu vermeiden.

Was passiert, wenn mein Training mehr kostet als geschätzt?

Kostenschätzungen sind Richtwerte — die tatsächliche Trainingszeit kann aufgrund von Faktoren wie Datenladegeschwindigkeit, GPU-Aufwärmphase und Konvergenzverhalten des Modells variieren. Wenn die tatsächlichen Kosten die Schätzung übersteigen, kann dein Saldo negativ werden (siehe oben). Die Plattform stoppt das Training nicht basierend auf der Schätzung.

Um die Kosten zu verwalten:

  • Überwache den Trainingsfortschritt in Echtzeit und brich bei Bedarf frühzeitig ab
  • Aktiviere automatische Aufladung, um Guthaben automatisch aufzustocken
  • Starte mit kürzeren Läufen (weniger Epochen), um ein Gefühl für den Verbrauch zu bekommen

Kann ich benutzerdefinierte Trainingsargumente verwenden?

Ja, klappe den Bereich Erweiterte Einstellungen im Trainingsdialog aus, um auf einen YAML-Editor mit über 40 konfigurierbaren Parametern zuzugreifen. Nicht-Standardwerte werden sowohl in Cloud- als auch in lokalen Trainingsbefehlen berücksichtigt.

Der YAML-Editor unterstützt auch das Importieren von Konfigurationen aus früheren Trainingsläufen:

  • Von bestehendem Modell kopieren: Auf der Seite jedes abgeschlossenen Modells befindet sich auf der Karte "Trainingskonfiguration" eine Schaltfläche Als JSON kopieren. Kopiere das JSON und füge es direkt in den YAML-Editor ein — er erkennt das JSON-Format automatisch und importiert alle Parameter.
  • YAML oder JSON einfügen: Füge eine beliebige gültige YAML- oder JSON-Trainingskonfiguration in den Editor ein. Parameter werden automatisch validiert, wobei Werte außerhalb des Bereichs korrigiert und Warnungen angezeigt werden.
  • Dateien per Drag & Drop: Ziehe eine .yaml- oder .json-Datei direkt in den Editor, um deren Parameter zu importieren.

Ultralytics Platform Training Dialog Copy Training Config JSON

Dies erleichtert es, frühere Trainingskonfigurationen zu reproduzieren oder anzupassen, ohne jeden Parameter manuell neu eingeben zu müssen.

Kann ich von einer Dataset-Seite aus trainieren?

Ja, die Trainieren-Schaltfläche auf Dataset-Seiten öffnet den Trainingsdialog, wobei das Dataset bereits ausgewählt und gesperrt ist. Du wählst dann ein Projekt und ein Modell aus, um das Training zu beginnen.

Referenz der Trainingsparameter

ParameterTypStandardwertBereichBeschreibung
epochsint1001-10000Anzahl der Trainingsepochen
batchint-1 (auto)-1 bis 512Batch-Größe (-1 = automatische Anpassung an verfügbaren VRAM)
imgszint64032-4096Eingabebildgröße
patienceint1001-1000Patience für frühes Stoppen
seedint00-2147483647Zufälliger Startwert für Reproduzierbarkeit
deterministicboolTrue-Deterministischer Trainingsmodus
ampboolTrue-Automatische gemischte Präzision
close_mosaicint100-50Mosaik in den letzten N Epochen deaktivieren
save_periodint-1-1-100Checkpunkt alle N Epochen speichern
workersint80-64Dataloader-Worker
cacheselectfalseram/disk/falseBilder zwischenspeichern
Aufgabenspezifische Parameter

Einige Parameter gelten nur für bestimmte Aufgaben:

  • Nur für Erkennungsaufgaben (detect, segment, pose, OBB — nicht classify): box, dfl, degrees, translate, shear, perspective, mosaic, mixup, close_mosaic
  • Nur Segmentierung: copy_paste
  • Nur Pose: pose (Verlustgewicht), kobj (Keypoint-Objekthaftigkeit)

Kommentare