Meet YOLO26: next-gen vision AI.

Link to this sectionTerminaux dédiés#

Ultralytics Platform permet le déploiement de modèles YOLO vers des points de terminaison dédiés dans 43 régions mondiales. Chaque point de terminaison est un service à locataire unique avec une mise à l'échelle vers zéro, une URL de point de terminaison unique et un suivi indépendant.

Onglet de déploiement de modèle de la plateforme Ultralytics avec carte régionale et tableau

Link to this sectionCréer un point de terminaison#

Link to this sectionDepuis l'onglet Déployer#

Déploie un modèle depuis son onglet Deploy :

  1. Accède à ton modèle
  2. Clique sur l'onglet Deploy
  3. Sélectionne une région sur la carte interactive du monde — les régions sont codées par couleur selon la latence depuis ton emplacement sur un dégradé du vert au rouge (les régions les plus rapides sont vertes, les plus lentes sont rouges)
  4. Clique sur Deploy sur la ligne de la région

Le nom du déploiement est généré automatiquement à partir du nom du modèle et de la ville de la région (par ex., yolo26n-iowa).

Link to this sectionDepuis la page Déploiements#

Crée un déploiement depuis la page globale Deploy dans la barre latérale :

  1. Clique sur New Deployment
  2. Sélectionne un modèle dans le sélecteur de modèle
  3. Sélectionne une région sur la carte ou dans le tableau
  4. Vérifie le nom de déploiement généré automatiquement (modifiable) et les ressources par défaut
  5. Clique sur Deploy Model

Boîte de dialogue de nouveau déploiement de la plateforme Ultralytics avec sélecteur de modèle et carte régionale

Link to this sectionCycle de vie du déploiement#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Link to this sectionSélection de la région#

Choisis parmi 43 régions dans le monde. La carte interactive et le tableau des régions montrent :

  • Repères de région : Codés par couleur selon la latence sur un dégradé du vert au rouge (les régions les plus rapides sont vertes, les plus lentes sont rouges)
  • Régions déployées : Mises en évidence avec un badge "Deployed"
  • Régions en cours de déploiement : Indicateur à impulsion animé
  • Mise en évidence bidirectionnelle : Le survol sur la carte met en évidence la ligne du tableau, et vice versa

Tableau de latence des régions de l'onglet Déployer de la plateforme Ultralytics trié par latence

Le tableau des régions sur l'onglet Deploy du modèle inclut :

ColonneDescription
LocationVille et pays avec une icône de drapeau
ZoneIdentifiant de la région
LatenceTemps de ping mesuré (médiane de 3 pings)
DistanceDistance depuis ton emplacement en km
ActionsBouton Déployer ou badge d'état "Deployed"
Boîte de dialogue Nouveau déploiement

La boîte de dialogue New Deployment (depuis la page globale Deploy) affiche un tableau des régions plus simple avec uniquement les colonnes Location, Latency et Select.

Choisis judicieusement

Sélectionne la région la plus proche de tes utilisateurs pour une latence minimale. Utilise le bouton Rescan pour remesurer la latence depuis ton emplacement actuel.

Link to this sectionRégions disponibles#

ZoneEmplacement
us-central1Iowa, USA
us-east1Caroline du Sud, USA
us-east4Virginie du Nord, USA
us-east5Columbus, USA
us-south1Dallas, USA
us-west1Oregon, USA
us-west2Los Angeles, USA
us-west3Salt Lake City, USA
us-west4Las Vegas, USA
northamerica-northeast1Montréal, Canada
northamerica-northeast2Toronto, Canada
northamerica-south1Queretaro, Mexique
southamerica-east1São Paulo, Brésil
southamerica-west1Santiago, Chili

Link to this sectionConfiguration de l'endpoint#

Link to this sectionBoîte de dialogue Nouveau déploiement#

La boîte de dialogue New Deployment fournit :

ParamètreDescriptionDéfaut
ModèleSélectionne parmi les modèles terminés-
RégionRégion du déploiement-
Nom du déploiementGénéré automatiquement, modifiable-
Cœurs CPUDéfaut fixe1
Mémoire (Go)Défaut fixe2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Les déploiements utilisent des valeurs par défaut fixes de 1 CPU, 2 GiB de mémoire, minInstances = 0 et maxInstances = 1. Ils passent à zéro en cas d'inactivité, tu ne paies donc que pour le temps d'inférence actif.

Noms générés automatiquement

Le nom du déploiement est généré automatiquement à partir du nom du modèle et de la ville de la région (par exemple, yolo26n-iowa). Si tu déploies à nouveau le même modèle dans la même région, un suffixe numérique est ajouté (par exemple, yolo26n-iowa-2).

Link to this sectionOnglet Déploiement (Déploiement rapide)#

Lors d'un déploiement depuis l'onglet Deploy du modèle, les endpoints sont créés avec des ressources par défaut (1 CPU, 2 Go de mémoire) avec la mise à l'échelle à zéro activée. Le nom du déploiement est généré automatiquement.

Link to this sectionGérer les endpoints#

Link to this sectionModes d'affichage#

La liste des déploiements prend en charge trois modes d'affichage :

ModeDescription
CartesCartes détaillées avec journaux, exemples de code, panneau de prédiction
CompactGrille de cartes plus petites avec des mesures clés
TableauTableau de données (DataTable) avec colonnes triables et recherche

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this sectionCarte de déploiement (Vue cartes)#

Chaque carte de déploiement dans la vue cartes affiche :

  • En-tête : Nom, drapeau de la région, badge de statut, boutons démarrer/arrêter/supprimer
  • URL de l'endpoint : URL copiable avec lien vers la documentation de l'API
  • Métriques : Nombre de requêtes (24h), latence P95, taux d'erreur
  • Contrôle de santé : Indicateur de santé en direct avec latence et rafraîchissement manuel
  • Onglets : Logs, Code et Predict

L'onglet Logs affiche les entrées de journal récentes avec filtrage par gravité (Tous / Erreurs). L'onglet Code montre des exemples de code prêts à l'emploi en Python, JavaScript et cURL avec ton URL d'endpoint réelle et ta clé API. L'onglet Predict fournit un panneau de prédiction intégré pour effectuer des tests directement sur le déploiement.

Link to this sectionStatuts du déploiement#

StatutDescription
CréationLe déploiement est en cours de configuration
DéploiementLe conteneur est en cours de démarrage
PrêtL'endpoint est actif et accepte les requêtes
Arrêt en coursL'endpoint est en cours d'extinction
ArrêtéL'endpoint est en pause (pas de facturation)
ÉchouéLe déploiement a échoué (voir le message d'erreur)

Link to this sectionURL de l'endpoint#

Chaque endpoint possède une URL unique, par exemple :

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

Clique sur le bouton de copie pour copier l'URL. Clique sur l'icône de documentation pour voir la documentation API générée automatiquement pour l'endpoint.

Link to this sectionGestion du cycle de vie#

Contrôle l'état de ton endpoint :

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
ActionDescription
DémarrerRelancer un endpoint arrêté
ArrêterMettre l'endpoint en pause (pas de facturation)
DeleteSupprimer définitivement l'endpoint

Link to this sectionArrêter l'endpoint#

Arrête un endpoint pour suspendre la facturation :

  1. Clique sur l'icône de pause sur la carte de déploiement
  2. Le statut de l'endpoint passe à "Arrêt en cours" puis "Arrêté"

Endpoints arrêtés :

  • N'acceptent pas les requêtes
  • N'engendrent pas de frais
  • Peuvent être redémarrés à tout moment

Link to this sectionSupprimer l'endpoint#

Supprimer définitivement un endpoint :

  1. Clique sur l'icône de suppression (corbeille) sur la carte de déploiement
  2. Confirme la suppression dans la boîte de dialogue
Action permanente

La suppression est immédiate et irréversible. Tu peux toujours créer un nouvel endpoint.

Link to this sectionUtiliser les endpoints#

Link to this sectionAuthentification#

Chaque déploiement est créé avec une clé API liée à ton compte. Inclus-la dans tes requêtes :

Authorization: Bearer YOUR_API_KEY

Le préfixe de la clé API est affiché dans le pied de page de la carte de déploiement pour identification. Génère des clés depuis API Keys.

Link to this sectionPas de limites de débit#

Les requêtes envoyées directement à l'URL de ton endpoint dédié ne sont pas soumises aux limites de débit de la Platform API — le débit est limité uniquement par le CPU, la mémoire et la configuration de mise à l'échelle de ton endpoint. (Les requêtes transmises via la Platform API, telles que le testeur intégré au navigateur, utilisent toujours la limite standard de 20 requêtes/min pour la prédiction.) C'est un avantage clé par rapport à l'inférence partagée, qui est limitée à 20 requêtes/min par clé API.

Link to this sectionExemple de requête#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this sectionParamètres de requête#

ParamètreTypeDéfautPlageDescription
filefichier--Fichier image ou vidéo (obligatoire)
confflottant0.250,01 – 1,0Seuil de confiance minimum
iouflottant0.70,0 – 0,95Seuil IoU NMS
imgszentier64032 – 1280Taille de l'image d'entrée en pixels
normalizeboolfalse-Retourne les coordonnées des boîtes englobantes entre 0 et 1
decimalsentier50 – 10Précision décimale pour les valeurs de coordonnées
sourcecha'ne de caract'res--URL d'image ou chaîne base64 (alternative au file)
Inférence vidéo

Les endpoints dédiés acceptent à la fois les images et les vidéos via le paramètre file.

  • Formats d'image (jusqu'à 100 Mo) : AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • Formats vidéo (jusqu'à 100 Mo) : ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Chaque image vidéo est traitée individuellement et les résultats sont renvoyés par image. Tu peux aussi passer une URL d'image publique ou une image encodée en base64 via le paramètre source au lieu de file.

Link to this sectionFormat de réponse#

Identique à l'inférence partagée avec des champs spécifiques à la tâche.

Link to this sectionTarification#

Les endpoints dédiés de base sont gratuits sur tous les plans. Les configurations à plus hautes ressources (plus de vCPU, plus de mémoire, démarrage à chaud) proposeront une tarification à l'usage à l'avenir.

Optimisation des coûts
  • Utilise le passage à l'échelle vers zéro (par défaut) pour que les endpoints ne s'exécutent que lorsqu'ils reçoivent des requêtes
  • Définit le nombre maximum d'instances approprié pour ton trafic
  • Surveille l'utilisation dans le tableau de bord Monitoring

Link to this sectionFAQ#

Link to this sectionCombien d'endpoints puis-je créer ?#

Les limites des endpoints dépendent du plan :

  • Gratuit : Jusqu'à 3 déploiements
  • Pro : Jusqu'à 10 déploiements
  • Enterprise : Déploiements illimités

Chaque modèle peut toujours être déployé dans plusieurs régions en fonction de ton quota de plan.

Link to this sectionPuis-je changer de région après le déploiement ?#

Non, les régions sont fixes. Pour changer de région :

  1. Supprime l'endpoint existant
  2. Crée un nouvel endpoint dans la région souhaitée

Link to this sectionComment gérer le déploiement multi-région ?#

Pour une couverture mondiale :

  1. Déploie dans plusieurs régions
  2. Utilise un équilibreur de charge ou un routage DNS
  3. Route les utilisateurs vers l'endpoint le plus proche

Link to this sectionQuel est le temps de démarrage à froid ?#

Le temps de démarrage à froid dépend de la taille du modèle et du fait que le conteneur soit déjà en cache dans la région. Plages typiques :

ScénarioDémarrage à froid
Conteneur mis en cache~5-15 secondes
Premier déploiement/région~15-45 secondes

La vérification de santé utilise un délai d'attente de 55 secondes pour accommoder les pires cas de démarrage à froid.

Link to this sectionPuis-je utiliser des domaines personnalisés ?#

Les domaines personnalisés arrivent bientôt. Actuellement, les endpoints utilisent des URL générées par la plateforme.

Commentaires