Modal-Schnellstartanleitung für Ultralytics

Dieser Leitfaden bietet eine umfassende Einführung in die Ausführung von Ultralytics YOLO26 auf Modal und deckt serverlose GPU-Inferenz sowie das Modelltraining ab.

Modal ist eine serverlose Cloud-Computing-Plattform für KI- und Machine Learning-Workloads. Sie übernimmt automatisch die Bereitstellung, Skalierung und Ausführung – du schreibst Python-Code lokal, und Modal führt ihn in der Cloud mit GPU-Zugriff aus. Dies macht es ideal für die Ausführung von Deep Learning-Modellen wie YOLO26, ohne dass du die Infrastruktur selbst verwalten musst.

Link to this sectionWas du lernen wirst#

Modal einrichten und authentifizieren
YOLO26-Inferenz auf Modal ausführen
GPUs für schnellere Inferenz nutzen
YOLO26-Modelle auf Modal trainieren

Link to this sectionVoraussetzungen#

Ein Modal-Konto (kostenlos registrieren unter modal.com)
Python 3.9 oder höher auf deinem lokalen Rechner installiert

Link to this sectionInstallation#

Installiere das Modal Python-Paket:

pip install modal

Authentifiziere dann das CLI mit deinem Modal-Konto:

modal token new

Authentifizierung

Der Befehl modal token new öffnet ein Browserfenster zur Authentifizierung deines Modal-Kontos. Nach der Authentifizierung kannst du Modal-Befehle vom Terminal aus ausführen.

Link to this sectionYOLO26-Inferenz ausführen#

Erstelle eine neue Python-Datei namens modal_yolo.py, um die Inferenz mit folgendem Code auszuführen:

"""
Modal + Ultralytics YOLO26 Quickstart
Run: modal run modal_yolo.py.
"""

import modal

app = modal.App("ultralytics-yolo")

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image)
def predict(image_url: str):
    """Run YOLO26 inference on an image URL."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)

    for r in results:
        print(f"Detected {len(r.boxes)} objects:")
        for box in r.boxes:
            print(f"  - {model.names[int(box.cls)]}: {float(box.conf):.2f}")

@app.local_entrypoint()
def main():
    """Test inference with sample image."""
    predict.remote("https://ultralytics.com/images/bus.jpg")

Führe die Inferenz aus:

modal run modal_yolo.py

Erwartete Ausgabe:

✓ Initialized. View run at https://modal.com/apps/your-username/main/ap-xxxxxxxx
✓ Created objects.
├── 🔨 Created mount modal_yolo.py
└── 🔨 Created function predict.
Downloading https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt to 'yolo26n.pt'...
Downloading https://ultralytics.com/images/bus.jpg to 'bus.jpg'...
image 1/1 /root/bus.jpg: 640x480 4 persons, 1 bus, 377.8ms
Speed: 5.8ms preprocess, 377.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 480)

Detected 5 objects:
  - bus: 0.92
  - person: 0.91
  - person: 0.91
  - person: 0.87
  - person: 0.53
✓ App completed.

Du kannst deine Funktionsausführung im Modal-Dashboard überwachen:

Modal Dashboard Function Calls

Link to this sectionGPU für schnellere Inferenz nutzen#

Füge deiner Funktion eine GPU hinzu, indem du den gpu-Parameter angibst:

@app.function(image=image, gpu="T4")  # Options: "T4", "A10G", "A100", "H100"
def predict_gpu(image_url: str):
    """Run YOLO26 inference on GPU."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)
    print(results[0].boxes)

GPU	Speicher	Am besten für
T4	16 GB	Inferenz, Training kleiner Modelle
A10G	24 GB	Mittlere Trainingsaufträge
A100	40 GB	Großflächiges Training
H100	80 GB	Maximale Leistung

Verwende zum Trainieren eine GPU und Modal Volumes für dauerhaften Speicher. Erstelle eine neue Python-Datei namens train_yolo.py:

import modal

app = modal.App("ultralytics-training")

volume = modal.Volume.from_name("yolo-training-vol", create_if_missing=True)

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image, gpu="T4", timeout=3600, volumes={"/data": volume})
def train():
    """Train YOLO26 model on Modal."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    model.train(data="coco8.yaml", epochs=3, imgsz=640, project="/data/runs")

@app.local_entrypoint()
def main():
    train.remote()

Training starten:

modal run train_yolo.py

Volume-Persistenz

Modal Volumes speichern Daten dauerhaft zwischen Funktionsausführungen. Trainierte Gewichte werden unter /data/runs/train/weights/ gespeichert.

Herzlichen Glückwunsch! Du hast Ultralytics YOLO26 erfolgreich auf Modal eingerichtet. Zum weiteren Lernen:

Erkunde die Ultralytics YOLO26-Dokumentation für erweiterte Funktionen
Erfahre mehr über das Training benutzerdefinierter Modelle mit eigenen Datensätzen
Probiere den Docker-Schnellstart für containerisierte Bereitstellungen
Besuche die Modal-Dokumentation für erweiterte Plattformfunktionen

Link to this sectionFAQ#

Link to this sectionWie wähle ich die richtige GPU für meine YOLO26-Workload aus?#

Für Inferenz ist eine NVIDIA T4 (16 GB) normalerweise ausreichend und kostengünstig. Für das Training oder bei größeren Modellen wie YOLO26x solltest du A10G- oder A100-GPUs in Betracht ziehen.

Modal nutzt eine Abrechnung pro Sekunde. Ungefähre Preise: CPU ~0,05 $/Std., T4 ~0,59 $/Std., A10G ~1,10 $/Std., A100 ~2,10 $/Std. Prüfe die Modal-Preisgestaltung für aktuelle Tarife.

Link to this sectionKann ich mein eigenes, benutzerdefiniert trainiertes YOLO-Modell verwenden?#

Ja, du kannst dein eigenes, benutzerdefiniert trainiertes YOLO-Modell auf Modal ausführen, indem du die Gewichtsdatei von einem Modal Volume lädst:

model = YOLO("/data/my_custom_model.pt")

Weitere Informationen zum Training benutzerdefinierter Modelle findest du im Trainingsleitfaden.

Mitwirkende

RAraimbekovm² GLglenn-jocher¹

Erstellt vor 3 MonatenAktualisiert vor 2 Wochen

Link to this sectionModal-Schnellstartanleitung für Ultralytics#

Link to this sectionWas ist Modal?#