Schnellstartanleitung für Ultralytics
Dieser Leitfaden bietet eine umfassende Einführung in die Nutzung von Ultralytics auf Modal und behandelt dabei sowohl GPU serverlose GPU als auch das Modelltraining.
Was ist Modal?
Modal ist eine serverlose Cloud-Computing-Plattform für KI- und Machine-Learning-Anwendungen. Sie übernimmt automatisch die Bereitstellung, Skalierung und Ausführung – Sie schreiben Python lokal, und Modal führt ihn in der Cloud mit GPU aus. Damit eignet sich die Plattform ideal für die Ausführung von Deep-Learning-Modellen wie YOLO26, ohne dass Sie sich um die Infrastruktur kümmern müssen.
Was Sie lernen werden
- Modal einrichten und authentifizieren
- Ausführen der YOLO26-Inferenz auf Modal
- Einsatz von GPUs für eine schnellere Inferenz
- Training von YOLO26-Modellen auf Modal
Voraussetzungen
- Ein Modal-Konto (kostenlos registrieren unter modal.com)
- Python .9 oder höher muss auf Ihrem lokalen Rechner installiert sein
Installation
Installieren Sie das Python „Modal“ und melden Sie sich an:
pip install modal
modal token new
Authentifizierung
Die modal token new Mit diesem Befehl wird ein Browserfenster geöffnet, in dem Sie sich bei Ihrem Modal-Konto anmelden können. Nach der Anmeldung können Sie Modal-Befehle über das Terminal ausführen.
Ausführen der YOLO26-Inferenz
Erstellen Sie eine neue Python mit dem Namen modal_yolo.py mit dem folgenden Code:
"""
Modal + Ultralytics YOLO26 Quickstart
Run: modal run modal_yolo.py.
"""
import modal
app = modal.App("ultralytics-yolo")
image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")
@app.function(image=image)
def predict(image_url: str):
"""Run YOLO26 inference on an image URL."""
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
results = model(image_url)
for r in results:
print(f"Detected {len(r.boxes)} objects:")
for box in r.boxes:
print(f" - {model.names[int(box.cls)]}: {float(box.conf):.2f}")
@app.local_entrypoint()
def main():
"""Test inference with sample image."""
predict.remote("https://ultralytics.com/images/bus.jpg")
Führen Sie die Inferenz durch:
modal run modal_yolo.py
Erwartetes Ergebnis:
✓ Initialized. View run at https://modal.com/apps/your-username/main/ap-xxxxxxxx
✓ Created objects.
├── 🔨 Created mount modal_yolo.py
└── 🔨 Created function predict.
Downloading https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt to 'yolo26n.pt'...
Downloading https://ultralytics.com/images/bus.jpg to 'bus.jpg'...
image 1/1 /root/bus.jpg: 640x480 4 persons, 1 bus, 377.8ms
Speed: 5.8ms preprocess, 377.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 480)
Detected 5 objects:
- bus: 0.92
- person: 0.91
- person: 0.91
- person: 0.87
- person: 0.53
✓ App completed.
Sie können die Ausführung Ihrer Funktionen im Modal-Dashboard überwachen:

Einsatz von GPU eine schnellere Inferenz
Fügen Sie Ihrer Funktion eine GPU , indem Sie die gpu Parameter:
@app.function(image=image, gpu="T4") # Options: "T4", "A10G", "A100", "H100"
def predict_gpu(image_url: str):
"""Run YOLO26 inference on GPU."""
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
results = model(image_url)
print(results[0].boxes)
| GPU | Arbeitsspeicher | Am besten geeignet für |
|---|---|---|
| T4 | 16 GB | Inferenz, Training kleiner Modelle |
| A10G | 24 GB | Stellenangebote im Bereich Ausbildung |
| A100 | 40 GB | Großangelegte Schulung |
| H100 | 80 GB | Maximale Leistung |
Training von YOLO26 auf Modal
Verwenden Sie für das Training eine GPU Modal Bände für die dauerhafte Speicherung. Erstellen Sie eine neue Python mit dem Namen train_yolo.py:
import modal
app = modal.App("ultralytics-training")
volume = modal.Volume.from_name("yolo-training-vol", create_if_missing=True)
image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")
@app.function(image=image, gpu="T4", timeout=3600, volumes={"/data": volume})
def train():
"""Train YOLO26 model on Modal."""
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="coco8.yaml", epochs=3, imgsz=640, project="/data/runs")
@app.local_entrypoint()
def main():
train.remote()
Lauftraining:
modal run train_yolo.py
Volumenstabilität
Modale Volumina bewahren Daten zwischen Funktionsausführungen. Die trainierten Gewichte werden gespeichert in /data/runs/detect/train/weights/.
Herzlichen Glückwunsch! Du hast Ultralytics erfolgreich auf Modal eingerichtet. Weitere Informationen findest du hier:
- Entdecken Sie die Dokumentation zu Ultralytics für erweiterte Funktionen
- Erfahren Sie mehr über das Trainieren benutzerdefinierter Modelle mit Ihren eigenen Datensätzen
- Weitere Informationen zu den erweiterten Funktionen der Plattform finden Sie in der Modal-Dokumentation
FAQ
Wie wähle ich die richtige GPU meine YOLO26-Anwendung aus?
Für die Inferenz ist eine NVIDIA (16 GB) in der Regel ausreichend und kostengünstig. Für das Training oder größere Modelle wie YOLO26x sollten Sie A10G- oder A100-GPUs in Betracht ziehen.
Wie viel kostet es, YOLO26 auf Modal auszuführen?
Modal berechnet seine Preise auf Sekundenbasis. Ungefähre Preise: CPU 0,05 $/Std., T4 ~0,59 $/Std., A10G ~1,10 $/Std., A100 ~2,10 $/Std. Die aktuellen Preise finden Sie in der Modal-Preisliste.
Kann ich mein eigenes, individuell trainiertes YOLO verwenden?
Ja! Benutzerdefinierte Modelle aus einem Modal Volume laden:
model = YOLO("/data/my_custom_model.pt")
Weitere Informationen zum Trainieren benutzerdefinierter Modelle finden Sie im Trainingsleitfaden.