Cloud-Training
Das Ultralytics Platform Cloud-Training bietet Training mit nur einem Klick auf Cloud-GPUs, wodurch das Modelltraining ohne komplexe Einrichtung zugänglich wird. Trainiere YOLO-Modelle mit Echtzeit-Metrik-Streaming und automatischer Checkpoint-Speicherung.
graph LR
A[Configure] --> B[Start Training]
B --> C[Provision GPU]
C --> D[Download Dataset]
D --> E[Train]
E --> F[Stream Metrics]
F --> G[Save Checkpoints]
G --> H[Complete]
style A fill:#2196F3,color:#fff
style B fill:#FF9800,color:#fff
style E fill:#9C27B0,color:#fff
style H fill:#4CAF50,color:#fffTrainingsdialog
Starte das Training über die Plattform-Benutzeroberfläche, indem du auf jeder Projektseite auf Neues Modell (oder auf einer Datensatzseite auf Trainieren) klickst. Der Trainingsdialog hat zwei Reiter: Cloud-Training und Lokales Training.

Schritt 1: Basismodell auswählen
Wähle aus offiziellen YOLO26-Modellen oder deinen eigenen trainierten Modellen:
| Kategorie | Beschreibung |
|---|---|
| Offiziell | Alle 25 YOLO26-Modelle (5 Größen x 5 Aufgaben) |
| Deine Modelle | Deine abgeschlossenen Modelle für das Finetuning |
Offizielle Modelle sind nach Aufgabentyp sortiert (Detect, Segment, Pose, OBB, Classify) mit Größen von nano bis xlarge.
Schritt 2: Datensatz auswählen
Wähle einen Datensatz für das Training aus (siehe Datasets):
| Option | Beschreibung |
|---|---|
| Offiziell | Kuratierte Datensätze von Ultralytics |
| Deine Datensätze | Datensätze, die du hochgeladen hast |
Datensätze müssen den Status ready haben, mit mindestens 1 Bild im Trainings-Split, 1 Bild im Validierungs- oder Test-Split und mindestens 1 beschrifteten Bild.
Eine Warnung zur Aufgaben-Nichtübereinstimmung erscheint, wenn die Modellaufgabe (z. B. detect) nicht mit der Datensatzaufgabe (z. B. segment) übereinstimmt. Das Training schlägt fehl, wenn du mit nicht übereinstimmenden Aufgaben fortfährst. Stelle sicher, dass sowohl das Modell als auch der Datensatz denselben Aufgabentyp verwenden, wie in den Aufgabenanleitungen beschrieben.
Schritt 3: Parameter konfigurieren
Lege die grundlegenden Trainingsparameter fest:
| Parameter | Beschreibung | Standardwert |
|---|---|---|
| Epochen | Anzahl der Trainingsiterationen | 100 |
| Batch-Größe | Stichproben pro Iteration | -1 (auto) |
| Image Size | Eingabeauflösung (Dropdown 320/416/512/640/1280, jedes Vielfache von 32 zwischen 32-4096 im YAML-Editor) | 640 |
| Laufname | Optionaler Name für den Trainingslauf | auto |
Schritt 4: Erweiterte Einstellungen (optional)
Erweitere die Erweiterten Einstellungen, um auf den vollständigen YAML-basierten Parameter-Editor mit über 40 Trainingsparametern zuzugreifen, die nach Gruppen organisiert sind (siehe Konfigurationsreferenz):
| Gruppe | Parameter |
|---|---|
| Lernrate | lr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr |
| Optimierer | auto (Standard), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax |
| Verlustgewichtungen | box, cls, dfl, pose, kobj, label_smoothing |
| Farb-Augmentierung | hsv_h, hsv_s, hsv_v |
| Geometrische Augment. | degrees, translate, scale, shear, perspective |
| Flip & Mix Augment. | flipud, fliplr, mosaic, mixup, copy_paste |
| Trainingssteuerung | patience, seed, deterministic, amp, cos_lr, close_mosaic, save_period |
| Datensatz | fraction, freeze, single_cls, rect, multi_scale, resume |
Parameter sind aufgabenbewusst (z. B. wird copy_paste nur für Segmentierungsaufgaben angezeigt, pose/kobj nur für Pose-Aufgaben). Ein Geändert-Badge erscheint, wenn Werte von den Standardwerten abweichen, und du kannst alle mit der Reset-Schaltfläche auf die Standardwerte zurücksetzen.
Beispiel: Augmentierung für kleine Datensätze optimieren
Für kleine Datensätze (<1000 Bilder), erhöhe die Augmentierung, um Overfitting zu reduzieren:
mosaic: 1.0 # Keep mosaic on
mixup: 0.3 # Add mixup blending
copy_paste: 0.3 # Add copy-paste (segment only)
fliplr: 0.5 # Horizontal flip
degrees: 10.0 # Slight rotation
scale: 0.9 # Aggressive scalingSchritt 5: GPU auswählen (Cloud-Reiter)
Wähle deine GPU aus der Ultralytics Cloud:

| GPU | Generation | VRAM | Kosten/Stunde | Am besten für |
|---|---|---|---|---|
| RTX 2000 Ada | Ada | 16 GB | $0.24 | Kleine Datensätze, Tests |
| RTX A4500 | Ampere | 20 GB | $0.25 | Kleine bis mittlere Datensätze |
| RTX 4000 Ada | Ada | 20 GB | $0.26 | Mittlere Datensätze |
| RTX A5000 | Ampere | 24 GB | $0.27 | Mittlere Datensätze |
| L4 | Ada | 24 GB | $0.39 | Inference-optimiert |
| A40 | Ampere | 48 GB | $0.44 | Größere Batch-Größen |
| RTX 3090 | Ampere | 24 GB | $0.46 | Allgemeines Training |
| RTX A6000 | Ampere | 48 GB | $0.49 | Große Modelle |
| RTX PRO 4500 | Blackwell | 32 GB | $0.64 | Tolles Preis-/Leistungsverhältnis |
| RTX 4090 | Ada | 24 GB | $0.69 | Bestes Preis-/Leistungsverhältnis |
| RTX 6000 Ada | Ada | 48 GB | $0,77 | Training mit großen Batches |
| L40S | Ada | 48 GB | $0,86 | Training mit großen Batches |
| RTX 5090 | Blackwell | 32 GB | $0,99 | Neueste Consumer-Generation |
| L40 | Ada | 48 GB | $0,99 | Große Modelle |
| A100 PCIe | Ampere | 80 GB | $1,39 | Produktionstraining |
| A100 SXM | Ampere | 80 GB | $1,49 | Produktionstraining |
| RTX PRO 6000 | Blackwell | 96 GB | $1,89 | Empfohlener Standard |
| H100 PCIe | Hopper | 80 GB | $2,39 | Hochleistungstraining |
| H100 SXM | Hopper | 80 GB | $2,99 | Schnellstes Training |
| H100 NVL | Hopper | 94 GB | $3,07 | Maximale Leistung |
| H200 NVL | Hopper | 143 GB | $3,39 | Maximaler Speicher |
| H200 SXM | Hopper | 141 GB | $3,99 | Maximale Leistung |
| B200 | Blackwell | 180 GB | $5,49 | Große Modelle (Pro+) |
| B300 | Blackwell | 288 GB | $7,39 | Größte Modelle (Pro+) |
- RTX PRO 6000: 96 GB Blackwell, empfohlener Standard für die meisten Aufgaben
- A100 SXM: 80 GB HBM2e – starke Wahl für große Batch-Größen oder größere Modelle
- H100 PCIe / H100 SXM / H100 NVL: 80–94 GB Hopper für zeitkritische Trainings (verfügbar in allen Tarifen)
- H200 NVL / H200 SXM: 141–143 GB Hopper für speicherintensive Workloads (verfügbar in allen Tarifen)
- B200 / B300: 180–288 GB NVIDIA Blackwell für modernste Workloads – erfordert Pro oder Enterprise
Der Dialog zeigt dein aktuelles Guthaben und eine Aufladen-Schaltfläche. Die geschätzten Kosten und die Dauer werden basierend auf deiner Konfiguration berechnet (Modellgröße, Datensatzbilder, Epochen, GPU-Geschwindigkeit).
Schritt 6: Training starten
Klicke auf Training starten, um deinen Job zu starten. Die Plattform:
- Stellt eine GPU-Instanz bereit
- Lädt deinen Datensatz herunter
- Beginnt mit dem Training
- Streamt Metriken in Echtzeit
Lebenszyklus von Trainingsjobs
Trainingsjobs durchlaufen die folgenden Status:
| Status | Beschreibung |
|---|---|
| Ausstehend | Job übermittelt, wartet auf GPU-Zuweisung |
| Wird gestartet | GPU bereitgestellt, Datensatz und Modell werden heruntergeladen |
| Läuft | Training läuft, Metriken werden in Echtzeit gestreamt |
| Abgeschlossen | Training erfolgreich beendet |
| Fehlgeschlagen | Training fehlgeschlagen (siehe Konsolenprotokolle für Details) |
| Abgebrochen | Training wurde vom Benutzer abgebrochen |
Neue Konten erhalten Anmeldeguthaben – 5 $ für persönliche E-Mails und 25 $ für geschäftliche E-Mails. Überprüfe dein Guthaben unter Einstellungen > Abrechnung.

Training überwachen
Sieh dir den Trainingsfortschritt in Echtzeit auf dem Reiter Training der Modellseite an:
Unter-Reiter Diagramme

| Metrik | Beschreibung |
|---|---|
| Verlust (Loss) | Trainings- und Validierungsverlust |
| mAP | Mean Average Precision |
| Präzision | Korrekte positive Vorhersagen |
| Trefferquote (Recall) | Erkannte Ground Truths |
Konsole-Untertab
Live-Konsolenausgabe mit ANSI-Farbunterstützung, Fortschrittsbalken und Fehlererkennung.
System-Untertab
Echtzeit-GPU-Auslastung, Speicher, Temperatur, CPU- und Festplattennutzung.
Checkpoints
Nach Abschluss des Trainings wird das best model (best.pt, der Checkpoint mit dem höchsten mAP) auf die Plattform hochgeladen und steht zum Download, Export und für die Bereitstellung zur Verfügung.
Training abbrechen
Klicke auf der Modellseite auf Cancel Training, um einen laufenden Job zu stoppen:
- Die Compute-Instanz wird beendet
- Guthaben wird nicht mehr abgebucht
- Der beste Checkpoint bleibt verfügbar, sofern er vor dem Abbruch erreicht wurde
Remote-Training
graph LR
A[Local GPU] --> B[Train]
B --> C[ultralytics Package]
C --> D[Stream Metrics]
D --> E[Platform Dashboard]
style A fill:#FF9800,color:#fff
style C fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fffTrainiere auf deiner eigenen Hardware, während du Metriken an die Plattform streamst.
Die Plattform-Integration erfordert ultralytics>=8.4.35. Niedrigere Versionen funktionieren NICHT mit der Plattform.
pip install -U ultralyticsAPI-Schlüssel einrichten
- Gehe zu
Settings > API Keys - Erstelle einen neuen Schlüssel (oder die Plattform erstellt automatisch einen, wenn du den Local Training Tab öffnest)
- Setze die Umgebungsvariable:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"Training mit Streaming
Verwende die Parameter project und name, um Metriken zu streamen:
yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
project=username/my-project name=experiment-1Der Local Training Tab im Trainingsdialog zeigt einen vorkonfigurierten Befehl mit deinem API-Schlüssel, ausgewählten Parametern und erweiterten Argumenten.
Plattform-Datensätze verwenden
Trainiere mit Datensätzen, die auf der Plattform gespeichert sind, unter Verwendung des ul:// URI-Formats:
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
project=username/my-project name=exp1Das ul:// URI-Format lädt deinen Datensatz automatisch herunter und konfiguriert ihn. Das Modell wird automatisch mit dem Datensatz auf der Plattform verknüpft (siehe Using Platform Datasets).
Abrechnung
Trainingskosten basieren auf der GPU-Nutzung:
Kostenschätzung
Vor Beginn des Trainings schätzt die Plattform die Gesamtkosten durch:
- Schätzung der Sekunden pro Epoche basierend auf Datensatzgröße, Modellkomplexität, Bildgröße, Batchgröße und GPU-Geschwindigkeit
- Berechnung der gesamten Trainingszeit durch Multiplikation der Sekunden pro Epoche mit der Anzahl der Epochen, zuzüglich Start-Overhead
- Berechnung der geschätzten Kosten aus der gesamten Trainingszeit multipliziert mit dem Stundensatz der GPU
Faktoren, die die Kosten beeinflussen:
| Faktor | Auswirkung |
|---|---|
| Datensatzgröße | Mehr Bilder = längere Trainingszeit (Basis: ~2,8s Rechenzeit pro 1000 Bilder auf RTX 4090) |
| Modellgröße | Größere Modelle (m, l, x) trainieren langsamer als (n, s) |
| Anzahl der Epochen | Direkter Multiplikator für die Trainingszeit |
| Image Size | Größere imgsz erhöht die Berechnung: 320px=0,25x, 640px=1,0x (Basis), 1280px=4,0x |
| Batch-Größe | Größere Batches sind effizienter (batch 32 = ~0,85x Zeit, batch 8 = ~1,2x Zeit im Vergleich zur batch 16 Basis) |
| GPU-Geschwindigkeit | Schnellere GPUs verkürzen die Trainingszeit (z. B. H100 SXM = ~3,4x schneller als RTX 4090) |
| Startup-Overhead | Bis zu 5 Minuten für Instanz-Initialisierung, Datendownload und Aufwärmphase (skaliert mit Datensatzgröße) |
Kostenbeispiele
Kostenschätzungen sind annähernd und hängen von vielen Faktoren ab. Der Trainingsdialog zeigt eine Echtzeitschätzung, bevor du das Training startest.
| Szenario | GPU | Geschätzte Kosten |
|---|---|---|
| 500 Bilder, YOLO26n, 50 Epochen | RTX 4090 | ~$0,50 |
| 1000 Bilder, YOLO26n, 100 Epochen | RTX PRO 6000 | ~$5 |
| 5000 Bilder, YOLO26s, 100 Epochen | H100 SXM | ~$23 |
Abrechnungsablauf
graph LR
A[Estimate Cost] --> B[Balance Check]
B --> C[Train]
C --> D[Charge Actual Runtime]
style A fill:#2196F3,color:#fff
style B fill:#FF9800,color:#fff
style C fill:#9C27B0,color:#fff
style D fill:#4CAF50,color:#fffAbrechnungsablauf für Cloud-Training:
- Schätzung: Kostenberechnung vor Trainingsbeginn
- Guthabenprüfung: Verfügbares Guthaben wird vor dem Start geprüft
- Training: Job läuft auf ausgewählter Compute-Instanz
- Abrechnung: Endgültige Kosten basieren auf der tatsächlichen Laufzeit
Die Abrechnung erfasst die tatsächliche Compute-Nutzung, einschließlich abgebrochener Teilläufe. Für fehlgeschlagene Trainingsläufe wird dir nichts berechnet.
Abrechnung nach Jobstatus
| Status | Berechnet? |
|---|---|
| Abgeschlossen | Ja – tatsächliche genutzte GPU-Zeit |
| Abgebrochen | Ja – GPU-Zeit vom Start bis zum Abbruch |
| Fehlgeschlagen | Nein – fehlgeschlagene Läufe werden nicht berechnet |
| Blockiert | Teilweise – nur die tatsächliche Trainingszeit wird berechnet |
Wenn ein Trainingslauf aufgrund eines Konfigurationsfehlers, eines Speichermangels oder eines anderen Fehlers fehlschlägt, wird dir nichts berechnet. Nur die erfolgreiche Rechenzeit wird in Rechnung gestellt. Blockierte Jobs (keine Aktivität für mehr als 4 Stunden) werden automatisch beendet und nur für die Zeit berechnet, in der die GPU aktiv trainiert hat, nicht für die Leerlaufzeit.
Zahlungsmethoden
| Methode | Beschreibung |
|---|---|
| Kontostand | Vorausbezahltes Guthaben |
| Zahlung pro Job | Abrechnung bei Jobabschluss |
Der Trainingsstart erfordert ein positives verfügbares Guthaben und genügend Credits für die geschätzten Jobkosten.
Trainingskosten anzeigen
Nach dem Training kannst du die detaillierten Kosten im Billing Tab einsehen:
- Kostenaufschlüsselung pro Epoche
- Gesamte GPU-Zeit
- Kostenbericht herunterladen

Trainingstipps
Wähle die richtige Modellgröße
| Modell | Parameter | Am besten für |
|---|---|---|
| YOLO26n | 2,4 Mio. | Echtzeit, Edge-Geräte |
| YOLO26s | 9,5 Mio. | Ausgewogene Geschwindigkeit/Genauigkeit |
| YOLO26m | 20,4 Mio. | Höhere Genauigkeit |
| YOLO26l | 24,8 Mio. | Produktionsgenauigkeit |
| YOLO26x | 55,7 Mio. | Maximale Genauigkeit |
Trainingszeit optimieren
- Klein anfangen: Teste mit 10-20 Epochen auf einer günstigen GPU, um sicherzustellen, dass dein Datensatz und die Konfiguration funktionieren
- Wähle die passende GPU: RTX PRO 6000 bewältigt die meisten Workloads gut
- Dataset validieren: Behebe Kennzeichnungsfehler, bevor du Geld für das Training ausgibst
- Frühzeitig überwachen: Brich das Training ab, wenn der Verlust stagniert — du zahlst nur für die tatsächlich genutzte Rechenzeit
Fehlerbehebung
| Problem | Lösung |
|---|---|
| Training bleibt bei 0% stehen | Dataset-Format prüfen, erneut versuchen |
| Zu wenig Arbeitsspeicher | Batch-Größe reduzieren oder größere GPU verwenden |
| Schlechte Genauigkeit | Epochen erhöhen, Datenqualität prüfen |
| Training langsam | Schnellere GPU in Betracht ziehen |
| Aufgaben-Fehlanpassung | Stelle sicher, dass Modell- und Dataset-Aufgaben übereinstimmen |
FAQ
Wie lange dauert das Training?
Die Trainingsdauer hängt ab von:
- Dataset-Größe
- Modellgröße
- Anzahl der Epochen
- GPU ausgewählt
Typische Zeiten (1000 Bilder, 100 Epochen):
| Modell | RTX PRO 6000 | A100 SXM |
|---|---|---|
| YOLO26n | ~20 Min. | ~15 Min. |
| YOLO26m | ~40 Min. | ~30 Min. |
| YOLO26x | ~80 Min. | ~60 Min. |
Die Trainingszeiten sind ungefähre Angaben und variieren je nach Dataset-Komplexität, Augmentierungseinstellungen und Batch-Größe. Nutze die Kostenschätzung im Trainingsdialog für genauere Prognosen.
Kann ich über Nacht trainieren?
Ja, das Training läuft bis zur Fertigstellung weiter. Du erhältst eine Benachrichtigung, sobald das Training abgeschlossen ist. Stelle sicher, dass dein Konto über ausreichend Guthaben für epochenbasiertes Training verfügt.
Was passiert, wenn mein Guthaben aufgebraucht ist?
Wenn dein Guthaben während eines Trainingslaufs auf Null sinkt, wird das Training bis zur Fertigstellung fortgesetzt und dein Saldo rutscht ins Negative. Dies stellt sicher, dass dein Trainingsjob niemals mitten im Lauf unterbrochen wird.
Nach Abschluss des Trainings musst du Guthaben hinzufügen, um deinen Saldo wieder auf einen positiven Stand zu bringen, bevor du neue Trainingsjobs starten kannst. Dein fertiggestelltes Modell, Checkpoints und alle Trainingsartefakte bleiben unabhängig vom Kontostand vollständig erhalten.
Ein negativer Saldo verhindert lediglich das Starten neuer Trainingsjobs. Bestehende Deployments und andere Plattformfunktionen funktionieren weiterhin normal. Füge Guthaben über Einstellungen > Abrechnung hinzu oder aktiviere automatische Aufladung, um Unterbrechungen zu vermeiden.
Was passiert, wenn mein Training mehr kostet als geschätzt?
Kostenschätzungen sind Richtwerte — die tatsächliche Trainingszeit kann aufgrund von Faktoren wie Datenladegeschwindigkeit, GPU-Aufwärmphase und Konvergenzverhalten des Modells variieren. Wenn die tatsächlichen Kosten die Schätzung übersteigen, kann dein Saldo negativ werden (siehe oben). Die Plattform stoppt das Training nicht basierend auf der Schätzung.
Um die Kosten zu verwalten:
- Überwache den Trainingsfortschritt in Echtzeit und brich bei Bedarf frühzeitig ab
- Aktiviere automatische Aufladung, um Guthaben automatisch aufzustocken
- Starte mit kürzeren Läufen (weniger Epochen), um ein Gefühl für den Verbrauch zu bekommen
Kann ich benutzerdefinierte Trainingsargumente verwenden?
Ja, klappe den Bereich Erweiterte Einstellungen im Trainingsdialog aus, um auf einen YAML-Editor mit über 40 konfigurierbaren Parametern zuzugreifen. Nicht-Standardwerte werden sowohl in Cloud- als auch in lokalen Trainingsbefehlen berücksichtigt.
Der YAML-Editor unterstützt auch das Importieren von Konfigurationen aus früheren Trainingsläufen:
- Von bestehendem Modell kopieren: Auf der Seite jedes abgeschlossenen Modells befindet sich auf der Karte "Trainingskonfiguration" eine Schaltfläche Als JSON kopieren. Kopiere das JSON und füge es direkt in den YAML-Editor ein — er erkennt das JSON-Format automatisch und importiert alle Parameter.
- YAML oder JSON einfügen: Füge eine beliebige gültige YAML- oder JSON-Trainingskonfiguration in den Editor ein. Parameter werden automatisch validiert, wobei Werte außerhalb des Bereichs korrigiert und Warnungen angezeigt werden.
- Dateien per Drag & Drop: Ziehe eine
.yaml- oder.json-Datei direkt in den Editor, um deren Parameter zu importieren.

Dies erleichtert es, frühere Trainingskonfigurationen zu reproduzieren oder anzupassen, ohne jeden Parameter manuell neu eingeben zu müssen.
Kann ich von einer Dataset-Seite aus trainieren?
Ja, die Trainieren-Schaltfläche auf Dataset-Seiten öffnet den Trainingsdialog, wobei das Dataset bereits ausgewählt und gesperrt ist. Du wählst dann ein Projekt und ein Modell aus, um das Training zu beginnen.
Referenz der Trainingsparameter
| Parameter | Typ | Standardwert | Bereich | Beschreibung |
|---|---|---|---|---|
epochs | int | 100 | 1-10000 | Anzahl der Trainingsepochen |
batch | int | -1 (auto) | -1 bis 512 | Batch-Größe (-1 = automatische Anpassung an verfügbaren VRAM) |
imgsz | int | 640 | 32-4096 | Eingabebildgröße |
patience | int | 100 | 1-1000 | Patience für frühes Stoppen |
seed | int | 0 | 0-2147483647 | Zufälliger Startwert für Reproduzierbarkeit |
deterministic | bool | True | - | Deterministischer Trainingsmodus |
amp | bool | True | - | Automatische gemischte Präzision |
close_mosaic | int | 10 | 0-50 | Mosaik in den letzten N Epochen deaktivieren |
save_period | int | -1 | -1-100 | Checkpunkt alle N Epochen speichern |
workers | int | 8 | 0-64 | Dataloader-Worker |
cache | select | false | ram/disk/false | Bilder zwischenspeichern |
Einige Parameter gelten nur für bestimmte Aufgaben:
- Nur für Erkennungsaufgaben (detect, segment, pose, OBB — nicht classify):
box,dfl,degrees,translate,shear,perspective,mosaic,mixup,close_mosaic - Nur Segmentierung:
copy_paste - Nur Pose:
pose(Verlustgewicht),kobj(Keypoint-Objekthaftigkeit)