Ir al contenido

API de inferencia de Ultralytics HUB

Después de entrenar un modelo, puedes utilizar la API de Inferencia Compartida de forma gratuita. Si eres un usuario Pro, puedes acceder a la API de Inferencia Dedicada. La API de Inferencia de Ultralytics HUB te permite ejecutar la inferencia a través de nuestra API REST sin necesidad de instalar y configurar el entorno Ultralytics YOLO localmente.

Captura de pantalla de Ultralytics HUB de la pestaña Deploy (Desplegar) dentro de la página del modelo con una flecha que apunta a la tarjeta Dedicated Inference API y otra a la tarjeta Shared Inference API


Ver: Tutorial de la API de inferencia de Ultralytics HUB

API de inferencia dedicada

En respuesta a la gran demanda e interés generalizado, nos complace presentar la API de Inferencia Dedicada de Ultralytics HUB, que ofrece una implementación con un solo clic en un entorno dedicado para nuestros usuarios Pro.

Nota

Nos complace ofrecer esta función GRATIS durante nuestra versión beta pública como parte del Plan Pro, con posibles niveles de pago en el futuro.

  • Cobertura global: Desplegado en 38 regiones de todo el mundo, lo que garantiza un acceso de baja latencia desde cualquier ubicación. Consulta la lista completa de regiones de Google Cloud.
  • Con el respaldo de Google Cloud Run: Con el respaldo de Google Cloud Run, que proporciona una infraestructura infinitamente escalable y altamente fiable.
  • Alta Velocidad: Es posible una latencia inferior a 100 ms para la inferencia de YOLOv8n a una resolución de 640 desde regiones cercanas según las pruebas de Ultralytics.
  • Seguridad mejorada: Proporciona funciones de seguridad sólidas para proteger sus datos y garantizar el cumplimiento de los estándares de la industria. Obtenga más información sobre la seguridad de Google Cloud.

Para usar la API de Inferencia Dedicada de Ultralytics HUB, haga clic en el botón Start Endpoint. A continuación, utilice la URL de endpoint única como se describe en las siguientes guías.

Captura de pantalla de Ultralytics HUB de la pestaña Deploy (Desplegar) dentro de la página del modelo con una flecha que apunta al botón Start Endpoint (Iniciar Endpoint) en la tarjeta Dedicated Inference API

Consejo

Elija la región con la latencia más baja para obtener el mejor rendimiento, tal y como se describe en la documentación.

Para cerrar el endpoint dedicado, haz clic en el botón Stop Endpoint.

Captura de pantalla de Ultralytics HUB de la pestaña Deploy (Desplegar) dentro de la página del modelo con una flecha que apunta al botón Stop Endpoint (Detener Endpoint) en la tarjeta Dedicated Inference API

API de inferencia compartida

Para usar la API de Inferencia Compartida de Ultralytics HUB, siga las siguientes guías.

La API de inferencia compartida de Ultralytics HUB tiene los siguientes límites de uso:

  • 100 llamadas / hora

Python

Para acceder a la API de inferencia de Ultralytics HUB utilizando Python, utilice el siguiente código:

import requests

# API URL
url = "https://predict.ultralytics.com"

# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}

# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}

# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
    files = {"file": image_file}
    response = requests.post(url, headers=headers, files=files, data=data)

print(response.json())

Nota

Reemplaza MODEL_ID con el ID del modelo deseado, API_KEY con tu clave API real, y path/to/image.jpg con la ruta a la imagen en la que quieres ejecutar la inferencia.

Si está utilizando nuestro API de inferencia dedicada, reemplaza el url también.

cURL

Para acceder a la API de inferencia de Ultralytics HUB utilizando cURL, utilice el siguiente código:

curl -X POST "https://predict.ultralytics.com" \
  -H "x-api-key: API_KEY" \
  -F "model=https://hub.ultralytics.com/models/MODEL_ID" \
  -F "file=@/path/to/image.jpg" \
  -F "imgsz=640" \
  -F "conf=0.25" \
  -F "iou=0.45"

Nota

Reemplaza MODEL_ID con el ID del modelo deseado, API_KEY con tu clave API real, y path/to/image.jpg con la ruta a la imagen en la que quieres ejecutar la inferencia.

Si está utilizando nuestro API de inferencia dedicada, reemplaza el url también.

Argumentos

Consulta la tabla siguiente para obtener una lista completa de los argumentos de inferencia disponibles.

Argumento Predeterminado Tipo Descripción
file file Archivo de imagen o vídeo que se utilizará para la inferencia.
imgsz 640 int Tamaño de la imagen de entrada, el rango válido es 32 - 1280 píxeles.
conf 0.25 float Umbral de confianza para las predicciones, rango válido 0.01 - 1.0.
iou 0.45 float Intersección sobre Unión umbral (IoU), rango válido 0.0 - 0.95.

Respuesta

La API de inferencia de Ultralytics HUB devuelve una respuesta JSON.

Clasificación

Modelo de Clasificación

from ultralytics import YOLO

# Load model
model = YOLO("yolov8n-cls.pt")

# Run inference
results = model("image.jpg")

# Print image.jpg results in JSON format
print(results[0].to_json())
curl -X POST "https://predict.ultralytics.com" \
  -H "x-api-key: API_KEY" \
  -F "model=https://hub.ultralytics.com/models/MODEL_ID" \
  -F "file=@/path/to/image.jpg" \
  -F "imgsz=640" \
  -F "conf=0.25" \
  -F "iou=0.45"
import requests

# API URL
url = "https://predict.ultralytics.com"

# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}

# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}

# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
    files = {"file": image_file}
    response = requests.post(url, headers=headers, files=files, data=data)

print(response.json())
{
  "images": [
    {
      "results": [
        {
          "class": 0,
          "name": "person",
          "confidence": 0.92
        }
      ],
      "shape": [
        750,
        600
      ],
      "speed": {
        "inference": 200.8,
        "postprocess": 0.8,
        "preprocess": 2.8
      }
    }
  ],
  "metadata": ...
}

Detección

Modelo de Detección

from ultralytics import YOLO

# Load model
model = YOLO("yolov8n.pt")

# Run inference
results = model("image.jpg")

# Print image.jpg results in JSON format
print(results[0].to_json())
curl -X POST "https://predict.ultralytics.com" \
  -H "x-api-key: API_KEY" \
  -F "model=https://hub.ultralytics.com/models/MODEL_ID" \
  -F "file=@/path/to/image.jpg" \
  -F "imgsz=640" \
  -F "conf=0.25" \
  -F "iou=0.45"
import requests

# API URL
url = "https://predict.ultralytics.com"

# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}

# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}

# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
    files = {"file": image_file}
    response = requests.post(url, headers=headers, files=files, data=data)

print(response.json())
{
  "images": [
    {
      "results": [
        {
          "class": 0,
          "name": "person",
          "confidence": 0.92,
          "box": {
            "x1": 118,
            "x2": 416,
            "y1": 112,
            "y2": 660
          }
        }
      ],
      "shape": [
        750,
        600
      ],
      "speed": {
        "inference": 200.8,
        "postprocess": 0.8,
        "preprocess": 2.8
      }
    }
  ],
  "metadata": ...
}

OBB

Modelo OBB

from ultralytics import YOLO

# Load model
model = YOLO("yolov8n-obb.pt")

# Run inference
results = model("image.jpg")

# Print image.jpg results in JSON format
print(results[0].tojson())
curl -X POST "https://predict.ultralytics.com" \
  -H "x-api-key: API_KEY" \
  -F "model=https://hub.ultralytics.com/models/MODEL_ID" \
  -F "file=@/path/to/image.jpg" \
  -F "imgsz=640" \
  -F "conf=0.25" \
  -F "iou=0.45"
import requests

# API URL
url = "https://predict.ultralytics.com"

# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}

# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}

# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
    files = {"file": image_file}
    response = requests.post(url, headers=headers, files=files, data=data)

print(response.json())
{
  "images": [
    {
      "results": [
        {
          "class": 0,
          "name": "person",
          "confidence": 0.92,
          "box": {
            "x1": 374.85565,
            "x2": 392.31824,
            "x3": 412.81805,
            "x4": 395.35547,
            "y1": 264.40704,
            "y2": 267.45728,
            "y3": 150.0966,
            "y4": 147.04634
          }
        }
      ],
      "shape": [
        750,
        600
      ],
      "speed": {
        "inference": 200.8,
        "postprocess": 0.8,
        "preprocess": 2.8
      }
    }
  ],
  "metadata": ...
}

Segmentación

Modelo de Segmentación

from ultralytics import YOLO

# Load model
model = YOLO("yolov8n-seg.pt")

# Run inference
results = model("image.jpg")

# Print image.jpg results in JSON format
print(results[0].tojson())
curl -X POST "https://predict.ultralytics.com" \
  -H "x-api-key: API_KEY" \
  -F "model=https://hub.ultralytics.com/models/MODEL_ID" \
  -F "file=@/path/to/image.jpg" \
  -F "imgsz=640" \
  -F "conf=0.25" \
  -F "iou=0.45"
import requests

# API URL
url = "https://predict.ultralytics.com"

# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}

# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}

# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
    files = {"file": image_file}
    response = requests.post(url, headers=headers, files=files, data=data)

print(response.json())
{
  "images": [
    {
      "results": [
        {
          "class": 0,
          "name": "person",
          "confidence": 0.92,
          "box": {
            "x1": 118,
            "x2": 416,
            "y1": 112,
            "y2": 660
          },
          "segments": {
            "x": [
              266.015625,
              266.015625,
              258.984375,
              ...
            ],
            "y": [
              110.15625,
              113.67188262939453,
              120.70311737060547,
              ...
            ]
          }
        }
      ],
      "shape": [
        750,
        600
      ],
      "speed": {
        "inference": 200.8,
        "postprocess": 0.8,
        "preprocess": 2.8
      }
    }
  ],
  "metadata": ...
}

Pose

Modelo de pose

from ultralytics import YOLO

# Load model
model = YOLO("yolov8n-pose.pt")

# Run inference
results = model("image.jpg")

# Print image.jpg results in JSON format
print(results[0].tojson())
curl -X POST "https://predict.ultralytics.com" \
  -H "x-api-key: API_KEY" \
  -F "model=https://hub.ultralytics.com/models/MODEL_ID" \
  -F "file=@/path/to/image.jpg" \
  -F "imgsz=640" \
  -F "conf=0.25" \
  -F "iou=0.45"
import requests

# API URL
url = "https://predict.ultralytics.com"

# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}

# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}

# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
    files = {"file": image_file}
    response = requests.post(url, headers=headers, files=files, data=data)

print(response.json())
{
  "images": [
    {
      "results": [
        {
          "class": 0,
          "name": "person",
          "confidence": 0.92,
          "box": {
            "x1": 118,
            "x2": 416,
            "y1": 112,
            "y2": 660
          },
          "keypoints": {
            "visible": [
              0.9909399747848511,
              0.8162999749183655,
              0.9872099757194519,
              ...
            ],
            "x": [
              316.3871765136719,
              315.9374694824219,
              304.878173828125,
              ...
            ],
            "y": [
              156.4207763671875,
              148.05775451660156,
              144.93240356445312,
              ...
            ]
          }
        }
      ],
      "shape": [
        750,
        600
      ],
      "speed": {
        "inference": 200.8,
        "postprocess": 0.8,
        "preprocess": 2.8
      }
    }
  ],
  "metadata": ...
}


📅 Creado hace 1 año ✏️ Actualizado hace 5 meses

Comentarios