Meet YOLO26: next-gen vision AI.

Link to this sectionInférence#

Ultralytics Platform fournit une API d'inférence pour tester les modèles entraînés. Utilise l'onglet Predict basé sur le navigateur pour une validation rapide ou l'REST API pour un accès par programmation.

Ultralytics Platform Model Predict Tab With Detections Overlay

Link to this sectionOnglet Prédire#

Chaque modèle inclut un onglet Predict pour l'inférence via le navigateur :

  1. Accède à ton modèle
  2. Clique sur l'onglet Predict
  3. Télécharge une image, utilise un exemple ou ouvre ta webcam
  4. Visualise instantanément les prédictions avec des superpositions de boîtes englobantes

Ultralytics Platform Predict Tab Image Upload Dropzone

Link to this sectionMéthodes d'entrée#

Le panneau de prédiction prend en charge plusieurs méthodes d'entrée :

MéthodeDescription
Téléchargement d'imageGlisse-dépose ou clique pour télécharger une image
Images d'exempleClique sur des exemples intégrés (images du dataset ou par défaut)
Capture webcamFlux vidéo en direct avec capture d'image unique
graph LR
    A[Upload Image] --> D[Auto-Inference]
    B[Example Image] --> D
    C[Webcam Capture] --> D
    D --> E[Results + Overlays]

    style D fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Link to this sectionTélécharger une image#

Glisse-dépose ou clique pour télécharger :

  • Formats pris en charge : JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP, DNG, MPO
  • Taille max : 10 Mo
  • Auto-inférence : Les résultats apparaissent automatiquement après le téléchargement
Auto-Inférence

Le panneau de prédiction exécute l'inférence automatiquement lorsque tu télécharges une image, sélectionnes un exemple ou captures une image via la webcam. Aucun clic sur un bouton n'est nécessaire.

Link to this sectionImages d'exemple#

Le panneau de prédiction affiche des images d'exemple provenant du dataset lié à ton modèle. Si aucun dataset n'est lié, des exemples par défaut sont utilisés :

ImageContenu
bus.jpgScène de rue avec des véhicules
zidane.jpgScène sportive avec des personnes

Pour les modèles OBB, des images aériennes de bateaux et d'aéroports sont affichées à la place.

Images préchargées

Les images d'exemple sont préchargées au chargement de la page, donc cliquer sur un exemple déclenche une inférence quasi instantanée sans attendre de téléchargement.

Link to this sectionWebcam#

Clique sur la carte de la webcam pour démarrer un flux vidéo en direct :

  1. Accorde la permission d'accès à la caméra lorsque cela est demandé
  2. Clique sur l'aperçu vidéo pour capturer une image
  3. L'inférence s'exécute automatiquement sur l'image capturée
  4. Clique à nouveau pour redémarrer la webcam

Link to this sectionVoir les résultats#

Les résultats de l'inférence s'affichent :

  • Bounding boxes avec des étiquettes de classe en superposition SVG
  • Scores de confiance pour chaque détection
  • Couleurs des classes provenant de la palette de couleurs de ton dataset (ou de la palette par défaut d'Ultralytics)
  • Répartition de la vitesse : Prétraitement, inférence, post-traitement et temps réseau

Ultralytics Platform Predict Tab Results With Detections And Speed Stats

Le panneau de résultats affiche :

ChampDescription
Liste des détectionsChaque détection avec le nom de la classe et la confiance
Statistiques de vitessePrétraitement, inférence, post-traitement, réseau (ms)
Réponse JSONRéponse API brute dans un bloc de code

Link to this sectionParamètres d'inférence#

Ajuste le comportement de la détection avec les paramètres dans la section pliable Parameters :

Ultralytics Platform Predict Tab Parameters Sliders

ParamètrePlageDéfautDescription
Confiance0,01 – 1,00.25Seuil de confiance minimum
IoU0,0 – 0,950.7Seuil IoU NMS
Taille de l'image320, 640, 1280 (bascule UI)640Dimension de redimensionnement de l'entrée (l'API accepte toute valeur de 32 à 1280)
Auto-réexécution

Modifier n'importe quel paramètre relance automatiquement l'inférence sur l'image actuelle avec un debounce de 500ms. Pas besoin de retélécharger.

Link to this sectionSeuil de confiance#

Filtre les prédictions par confiance :

  • Plus élevé (0,5+) : Moins de prédictions, mais plus certaines
  • Plus bas (0,1-0,25) : Plus de prédictions, avec un peu de bruit
  • Par défaut (0,25) : Équilibré pour la plupart des cas d'utilisation

Link to this sectionSeuil IoU#

Contrôle la NMS (Non-Maximum Suppression) :

  • Plus élevé (0,7+) : Autorise plus de boîtes qui se chevauchent
  • Plus bas (0,3-0,5) : Fusionne les détections proches de manière plus agressive
  • Par défaut (0,7) : Comportement NMS équilibré pour la plupart des cas d'utilisation

Link to this sectionInférence de déploiement#

Chaque dedicated endpoint en cours d'exécution inclut un onglet Predict directement sur sa carte de déploiement. Cela utilise le propre service d'inférence du déploiement plutôt que le service de prédiction partagé, te permettant de tester ton endpoint déployé depuis le navigateur.

Link to this sectionREST API#

Accède à l'inférence par programmation :

Link to this sectionAuthentification#

Inclus ta clé API dans les requêtes :

Authorization: Bearer YOUR_API_KEY
Clé API requise

Pour exécuter l'inférence depuis tes propres scripts, notebooks ou applications, inclus une clé API. Génère-en une dans Settings > API Keys.

Link to this sectionPoint de terminaison#

POST https://platform.ultralytics.com/api/models/{modelId}/predict

Link to this sectionRequête#

import requests

url = "https://platform.ultralytics.com/api/models/MODEL_ID/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())

Ultralytics Platform Predict Tab Code Examples Python Tab

Link to this sectionParamètres de requête#

ParamètreTypeDéfautPlageDescription
filefichier--Fichier image ou vidéo (requis sauf si source est défini)
confflottant0.250,01 – 1,0Seuil de confiance minimum
iouflottant0.70,0 – 0,95Seuil IoU NMS
imgszentier64032 – 1280Taille de l'image d'entrée en pixels
normalizeboolfalse-Retourne les coordonnées des boîtes englobantes entre 0 et 1
decimalsentier50 – 10Précision décimale pour les valeurs de coordonnées
sourcecha'ne de caract'res--URL d'image ou chaîne base64 (alternative au file)

Link to this sectionRéponse#

{
    "images": [
        {
            "shape": [1080, 1920],
            "results": [
                {
                    "class": 0,
                    "name": "person",
                    "confidence": 0.92,
                    "box": { "x1": 100, "y1": 50, "x2": 300, "y2": 400 }
                },
                {
                    "class": 2,
                    "name": "car",
                    "confidence": 0.87,
                    "box": { "x1": 400, "y1": 200, "x2": 600, "y2": 350 }
                }
            ],
            "speed": {
                "preprocess": 1.2,
                "inference": 12.5,
                "postprocess": 2.3
            }
        }
    ],
    "metadata": {
        "imageCount": 1,
        "functionTimeCall": 0.018,
        "model": "model.pt",
        "version": {
            "ultralytics": "8.x.x",
            "torch": "2.6.0",
            "torchvision": "0.21.0",
            "python": "3.13.0"
        }
    }
}

Ultralytics Platform Predict Tab Json Response View

Link to this sectionChamps de réponse#

ChampTypeDescription
imagesarrayListe des images traitées
images[].shapearrayDimensions de l'image [hauteur, largeur]
images[].resultsarrayListe des détections
images[].results[].classentierIndice de classe (ID entier)
images[].results[].namecha'ne de caract'resNom de la classe
images[].results[].confidenceflottantConfiance de la détection (0-1)
images[].results[].boxobjetCoordonnées de la boîte englobante
images[].speedobjetTemps de traitement en millisecondes
metadataobjetMétadonnées de la requête et informations sur la version

Link to this sectionRéponses spécifiques à la tâche#

Le format de réponse varie selon la tâche :

{
  "class": 0,
  "name": "person",
  "confidence": 0.92,
  "box": {"x1": 100, "y1": 50, "x2": 300, "y2": 400}
}

Link to this sectionFacturation#

L'inférence partagée (l'onglet Predict et le point de terminaison /api/models/{id}/predict) est incluse sans coût additionnel dans tous les forfaits. Il n'y a pas de frais par requête pour l'inférence partagée.

Pour les charges de travail en production nécessitant un débit plus élevé, déploie un point de terminaison dédié.

Link to this sectionLimites de taux#

L'inférence partagée est limitée à 20 requêtes/min par clé API. En cas de limitation, l'API renvoie 429 avec un en-tête Retry-After. Consulte la référence complète des limites de débit pour toutes les catégories de points de terminaison.

Besoin de plus de débit ?

Déploie un point de terminaison dédié pour une inférence illimitée sans limites de débit, un débit prévisible et des réponses à faible latence cohérentes. Pour l'inférence locale, consulte le guide du mode Predict.

Link to this sectionGestion des erreurs#

Réponses d'erreur courantes :

CodeMessageSolution
400Image invalideVérifie le format de fichier
401Non autoriséVérifie ta clé API
404Modèle introuvableVérifie l'ID du modèle
429Limite de débit atteinteAttends et réessaie, ou utilise un point de terminaison dédié pour un débit illimité
500Erreur serveurRéessaie la requête
503Service indisponibleLe service Predict démarre ou est injoignable ; attends un court instant et réessaie

Link to this sectionFAQ#

Link to this sectionPuis-je exécuter l'inférence sur une vidéo ?#

Les deux méthodes d'inférence acceptent les fichiers vidéo :

  • Les points de terminaison dédiés acceptent directement les fichiers vidéo. Formats supportés (jusqu'à 100 Mo) : ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV. Chaque image est traitée individuellement et les résultats sont renvoyés par image. Consulte les points de terminaison dédiés pour plus de détails.
  • L'inférence partagée (/api/models/{id}/predict) utilise le même service predict et accepte les mêmes formats vidéo. Cependant, l'onglet Predict du navigateur dans l'interface utilisateur ne télécharge que des images — utilise directement l'API REST ou un point de terminaison dédié pour les flux de travail vidéo. Le point de terminaison partagé est également limité à 20 req/min, donc les points de terminaison dédiés sont un meilleur choix pour les charges de travail vidéo lourdes.

Link to this sectionComment puis-je obtenir l'image annotée ?#

L'API renvoie des prédictions JSON. Pour visualiser :

  1. Utilise les prédictions pour dessiner les boîtes localement
  2. Utilise la méthode plot() d'Ultralytics :
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
results = model("image.jpg")
results[0].save("annotated.jpg")

Consulte la documentation du mode Predict pour l'API complète des résultats et les options de visualisation.

Link to this sectionQuelle est la taille maximale d'une image ?#

  • Limite de téléchargement : 10 Mo
  • Recommandé : <5 Mo pour une inférence rapide
  • Redimensionnement automatique : Les images sont redimensionnées selon le paramètre Image Size sélectionné

Les grandes images sont automatiquement redimensionnées tout en préservant le rapport hauteur/largeur.

Link to this sectionPuis-je exécuter l'inférence par lots ?#

L'API actuelle traite une image par requête. Pour le mode par lots :

  1. Envoie des requêtes simultanées
  2. Utilise un point de terminaison dédié pour un débit plus élevé
  3. Envisage l'inférence locale pour les grands lots
Inférence par lots avec Python
import concurrent.futures

import requests

url = "https://predict-abc123.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
images = ["img1.jpg", "img2.jpg", "img3.jpg"]

def predict(image_path):
    with open(image_path, "rb") as f:
        return requests.post(url, headers=headers, files={"file": f}).json()

with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
    results = list(executor.map(predict, images))

Commentaires