Guide de démarrage rapide de Modal pour…

Ce guide fournit une introduction complète à l'exécution de Ultralytics YOLO26 sur Modal, couvrant l'inférence GPU sans serveur et l'entraînement de modèles.

Modal est une plateforme d'informatique en nuage sans serveur pour les charges de travail en IA et en apprentissage automatique. Elle gère automatiquement le provisionnement, la mise à l'échelle et l'exécution : tu écris du code Python localement et Modal l'exécute dans le cloud avec un accès GPU. Cela le rend idéal pour faire fonctionner des modèles d'apprentissage profond comme YOLO26 sans gérer d'infrastructure.

Ce que tu vas apprendre#

Configuration de Modal et authentification
Exécuter l'inférence YOLO26 sur Modal
Utiliser des GPU pour une inférence plus rapide
Entraîner des modèles YOLO26 sur Modal

Prérequis#

Un compte Modal (inscris-toi gratuitement sur modal.com)
Python 3.9 ou version ultérieure installé sur ta machine locale

Installation#

Installe le package Python de Modal :

pip install modal

Ensuite, authentifie l'interface CLI avec ton compte Modal :

modal token new

Authentification

La commande modal token new ouvrira une fenêtre de navigateur pour authentifier ton compte Modal. Après l'authentification, tu pourras exécuter les commandes Modal depuis le terminal.

Exécuter l'inférence YOLO26#

Crée un nouveau fichier Python appelé modal_yolo.py pour exécuter l'inférence avec le code suivant :

"""
Modal + Ultralytics YOLO26 Quickstart
Run: modal run modal_yolo.py.
"""

import modal

app = modal.App("ultralytics-yolo")

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image)
def predict(image_url: str):
    """Run YOLO26 inference on an image URL."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)

    for r in results:
        print(f"Detected {len(r.boxes)} objects:")
        for box in r.boxes:
            print(f"  - {model.names[int(box.cls)]}: {float(box.conf):.2f}")

@app.local_entrypoint()
def main():
    """Test inference with sample image."""
    predict.remote("https://ultralytics.com/images/bus.jpg")

Exécute l'inférence :

modal run modal_yolo.py

Sortie attendue :

✓ Initialized. View run at https://modal.com/apps/your-username/main/ap-xxxxxxxx
✓ Created objects.
├── 🔨 Created mount modal_yolo.py
└── 🔨 Created function predict.
Downloading https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt to 'yolo26n.pt'...
Downloading https://ultralytics.com/images/bus.jpg to 'bus.jpg'...
image 1/1 /root/bus.jpg: 640x480 4 persons, 1 bus, 377.8ms
Speed: 5.8ms preprocess, 377.8ms inference, 0.3ms postprocess per image at shape (1, 3, 640, 480)

Detected 5 objects:
  - bus: 0.92
  - person: 0.91
  - person: 0.91
  - person: 0.87
  - person: 0.53
✓ App completed.

Tu peux surveiller l'exécution de ta fonction dans le tableau de bord Modal :

Modal Dashboard Function Calls

Utiliser un GPU pour une inférence plus rapide#

Ajoute un GPU à ta fonction en spécifiant le paramètre gpu :

@app.function(image=image, gpu="T4")  # Options: "T4", "A10G", "A100", "H100"
def predict_gpu(image_url: str):
    """Run YOLO26 inference on GPU."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    results = model(image_url)
    print(results[0].boxes)

GPU	Mémoire	Idéal pour
T4	16 GB	Inférence, entraînement de petit modèle
A10G	24 GB	Tâches d'entraînement moyennes
A100	40 Go	Entraînement à grande échelle
H100	80 GB	Performance maximale

Pour l'entraînement, utilise un GPU et les Volumes de Modal pour le stockage persistant. Crée un nouveau fichier Python appelé train_yolo.py :

import modal

app = modal.App("ultralytics-training")

volume = modal.Volume.from_name("yolo-training-vol", create_if_missing=True)

image = modal.Image.debian_slim(python_version="3.11").apt_install("libgl1", "libglib2.0-0").pip_install("ultralytics")

@app.function(image=image, gpu="T4", timeout=3600, volumes={"/data": volume})
def train():
    """Train YOLO26 model on Modal."""
    from ultralytics import YOLO

    model = YOLO("yolo26n.pt")
    model.train(data="coco8.yaml", epochs=3, imgsz=640, project="/data/runs")

@app.local_entrypoint()
def main():
    train.remote()

Exécute l'entraînement :

modal run train_yolo.py

Persistance des volumes

Les volumes Modal conservent les données entre les exécutions de fonctions. Les poids entraînés sont enregistrés dans /data/runs/train/weights/.

Félicitations ! Tu as configuré avec succès Ultralytics YOLO26 sur Modal. Pour aller plus loin :

Explore la documentation Ultralytics YOLO26 pour découvrir les fonctionnalités avancées
Apprends à entraîner des modèles personnalisés avec tes propres jeux de données
Essaie le Guide de démarrage rapide Docker pour un déploiement conteneurisé
Visite la documentation Modal pour les fonctionnalités avancées de la plateforme

FAQ#

Comment choisir le bon GPU pour ma charge de travail YOLO26 ?#

Pour l'inférence, un NVIDIA T4 (16 Go) est généralement suffisant et rentable. Pour l'entraînement ou les modèles plus grands comme YOLO26x, envisage des GPU A10G ou A100.

Modal utilise une tarification à la seconde. Tarifs approximatifs : CPU ~0,05 $/h, T4 ~0,59 $/h, A10G ~1,10 $/h, A100 ~2,10 $/h. Vérifie les tarifs de Modal pour connaître les prix actuels.

Puis-je utiliser mon propre modèle YOLO entraîné sur mesure ?#

Oui, tu peux exécuter ton propre modèle YOLO personnalisé sur Modal en chargeant le fichier de poids à partir d'un volume Modal :

model = YOLO("/data/my_custom_model.pt")

Pour plus d'informations sur l'entraînement de modèles personnalisés, consulte le guide d'entraînement.

Contributeurs

RAraimbekovm² GLglenn-jocher¹

Créé il y a 3 moisMis à jour il y a 2 semaines

Guide de démarrage rapide de Modal pour Ultralytics#

Qu'est-ce que Modal ?#