API de inferencia de Ultralytics HUB
Después de entrenar un modelo, puedes utilizar la API de Inferencia Compartida de forma gratuita. Si eres un usuario Pro, puedes acceder a la API de Inferencia Dedicada. La API de Inferencia de Ultralytics HUB te permite ejecutar la inferencia a través de nuestra API REST sin necesidad de instalar y configurar el entorno Ultralytics YOLO localmente.
Ver: Tutorial de la API de inferencia de Ultralytics HUB
API de inferencia dedicada
En respuesta a la gran demanda e interés generalizado, nos complace presentar la API de Inferencia Dedicada de Ultralytics HUB, que ofrece una implementación con un solo clic en un entorno dedicado para nuestros usuarios Pro.
Nota
Nos complace ofrecer esta función GRATIS durante nuestra versión beta pública como parte del Plan Pro, con posibles niveles de pago en el futuro.
- Cobertura global: Desplegado en 38 regiones de todo el mundo, lo que garantiza un acceso de baja latencia desde cualquier ubicación. Consulta la lista completa de regiones de Google Cloud.
- Con el respaldo de Google Cloud Run: Con el respaldo de Google Cloud Run, que proporciona una infraestructura infinitamente escalable y altamente fiable.
- Alta Velocidad: Es posible una latencia inferior a 100 ms para la inferencia de YOLOv8n a una resolución de 640 desde regiones cercanas según las pruebas de Ultralytics.
- Seguridad mejorada: Proporciona funciones de seguridad sólidas para proteger sus datos y garantizar el cumplimiento de los estándares de la industria. Obtenga más información sobre la seguridad de Google Cloud.
Para usar la API de Inferencia Dedicada de Ultralytics HUB, haga clic en el botón Start Endpoint. A continuación, utilice la URL de endpoint única como se describe en las siguientes guías.
Consejo
Elija la región con la latencia más baja para obtener el mejor rendimiento, tal y como se describe en la documentación.
Para cerrar el endpoint dedicado, haz clic en el botón Stop Endpoint.
API de inferencia compartida
Para usar la API de Inferencia Compartida de Ultralytics HUB, siga las siguientes guías.
La API de inferencia compartida de Ultralytics HUB tiene los siguientes límites de uso:
- 100 llamadas / hora
Python
Para acceder a la API de inferencia de Ultralytics HUB utilizando Python, utilice el siguiente código:
import requests
# API URL
url = "https://predict.ultralytics.com"
# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}
# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}
# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
files = {"file": image_file}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
Nota
Reemplaza MODEL_ID
con el ID del modelo deseado, API_KEY
con tu clave API real, y path/to/image.jpg
con la ruta a la imagen en la que quieres ejecutar la inferencia.
Si está utilizando nuestro API de inferencia dedicada, reemplaza el url
también.
cURL
Para acceder a la API de inferencia de Ultralytics HUB utilizando cURL, utilice el siguiente código:
curl -X POST "https://predict.ultralytics.com" \
-H "x-api-key: API_KEY" \
-F "model=https://hub.ultralytics.com/models/MODEL_ID" \
-F "file=@/path/to/image.jpg" \
-F "imgsz=640" \
-F "conf=0.25" \
-F "iou=0.45"
Nota
Reemplaza MODEL_ID
con el ID del modelo deseado, API_KEY
con tu clave API real, y path/to/image.jpg
con la ruta a la imagen en la que quieres ejecutar la inferencia.
Si está utilizando nuestro API de inferencia dedicada, reemplaza el url
también.
Argumentos
Consulta la tabla siguiente para obtener una lista completa de los argumentos de inferencia disponibles.
Argumento | Predeterminado | Tipo | Descripción |
---|---|---|---|
file |
file |
Archivo de imagen o vídeo que se utilizará para la inferencia. | |
imgsz |
640 |
int |
Tamaño de la imagen de entrada, el rango válido es 32 - 1280 píxeles. |
conf |
0.25 |
float |
Umbral de confianza para las predicciones, rango válido 0.01 - 1.0 . |
iou |
0.45 |
float |
Intersección sobre Unión umbral (IoU), rango válido 0.0 - 0.95 . |
Respuesta
La API de inferencia de Ultralytics HUB devuelve una respuesta JSON.
Clasificación
Modelo de Clasificación
from ultralytics import YOLO
# Load model
model = YOLO("yolov8n-cls.pt")
# Run inference
results = model("image.jpg")
# Print image.jpg results in JSON format
print(results[0].to_json())
curl -X POST "https://predict.ultralytics.com" \
-H "x-api-key: API_KEY" \
-F "model=https://hub.ultralytics.com/models/MODEL_ID" \
-F "file=@/path/to/image.jpg" \
-F "imgsz=640" \
-F "conf=0.25" \
-F "iou=0.45"
import requests
# API URL
url = "https://predict.ultralytics.com"
# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}
# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}
# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
files = {"file": image_file}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
{
"images": [
{
"results": [
{
"class": 0,
"name": "person",
"confidence": 0.92
}
],
"shape": [
750,
600
],
"speed": {
"inference": 200.8,
"postprocess": 0.8,
"preprocess": 2.8
}
}
],
"metadata": ...
}
Detección
Modelo de Detección
from ultralytics import YOLO
# Load model
model = YOLO("yolov8n.pt")
# Run inference
results = model("image.jpg")
# Print image.jpg results in JSON format
print(results[0].to_json())
curl -X POST "https://predict.ultralytics.com" \
-H "x-api-key: API_KEY" \
-F "model=https://hub.ultralytics.com/models/MODEL_ID" \
-F "file=@/path/to/image.jpg" \
-F "imgsz=640" \
-F "conf=0.25" \
-F "iou=0.45"
import requests
# API URL
url = "https://predict.ultralytics.com"
# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}
# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}
# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
files = {"file": image_file}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
{
"images": [
{
"results": [
{
"class": 0,
"name": "person",
"confidence": 0.92,
"box": {
"x1": 118,
"x2": 416,
"y1": 112,
"y2": 660
}
}
],
"shape": [
750,
600
],
"speed": {
"inference": 200.8,
"postprocess": 0.8,
"preprocess": 2.8
}
}
],
"metadata": ...
}
OBB
Modelo OBB
from ultralytics import YOLO
# Load model
model = YOLO("yolov8n-obb.pt")
# Run inference
results = model("image.jpg")
# Print image.jpg results in JSON format
print(results[0].tojson())
curl -X POST "https://predict.ultralytics.com" \
-H "x-api-key: API_KEY" \
-F "model=https://hub.ultralytics.com/models/MODEL_ID" \
-F "file=@/path/to/image.jpg" \
-F "imgsz=640" \
-F "conf=0.25" \
-F "iou=0.45"
import requests
# API URL
url = "https://predict.ultralytics.com"
# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}
# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}
# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
files = {"file": image_file}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
{
"images": [
{
"results": [
{
"class": 0,
"name": "person",
"confidence": 0.92,
"box": {
"x1": 374.85565,
"x2": 392.31824,
"x3": 412.81805,
"x4": 395.35547,
"y1": 264.40704,
"y2": 267.45728,
"y3": 150.0966,
"y4": 147.04634
}
}
],
"shape": [
750,
600
],
"speed": {
"inference": 200.8,
"postprocess": 0.8,
"preprocess": 2.8
}
}
],
"metadata": ...
}
Segmentación
Modelo de Segmentación
from ultralytics import YOLO
# Load model
model = YOLO("yolov8n-seg.pt")
# Run inference
results = model("image.jpg")
# Print image.jpg results in JSON format
print(results[0].tojson())
curl -X POST "https://predict.ultralytics.com" \
-H "x-api-key: API_KEY" \
-F "model=https://hub.ultralytics.com/models/MODEL_ID" \
-F "file=@/path/to/image.jpg" \
-F "imgsz=640" \
-F "conf=0.25" \
-F "iou=0.45"
import requests
# API URL
url = "https://predict.ultralytics.com"
# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}
# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}
# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
files = {"file": image_file}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
{
"images": [
{
"results": [
{
"class": 0,
"name": "person",
"confidence": 0.92,
"box": {
"x1": 118,
"x2": 416,
"y1": 112,
"y2": 660
},
"segments": {
"x": [
266.015625,
266.015625,
258.984375,
...
],
"y": [
110.15625,
113.67188262939453,
120.70311737060547,
...
]
}
}
],
"shape": [
750,
600
],
"speed": {
"inference": 200.8,
"postprocess": 0.8,
"preprocess": 2.8
}
}
],
"metadata": ...
}
Pose
Modelo de pose
from ultralytics import YOLO
# Load model
model = YOLO("yolov8n-pose.pt")
# Run inference
results = model("image.jpg")
# Print image.jpg results in JSON format
print(results[0].tojson())
curl -X POST "https://predict.ultralytics.com" \
-H "x-api-key: API_KEY" \
-F "model=https://hub.ultralytics.com/models/MODEL_ID" \
-F "file=@/path/to/image.jpg" \
-F "imgsz=640" \
-F "conf=0.25" \
-F "iou=0.45"
import requests
# API URL
url = "https://predict.ultralytics.com"
# Headers, use actual API_KEY
headers = {"x-api-key": "API_KEY"}
# Inference arguments (use actual MODEL_ID)
data = {"model": "https://hub.ultralytics.com/models/MODEL_ID", "imgsz": 640, "conf": 0.25, "iou": 0.45}
# Load image and send request
with open("path/to/image.jpg", "rb") as image_file:
files = {"file": image_file}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
{
"images": [
{
"results": [
{
"class": 0,
"name": "person",
"confidence": 0.92,
"box": {
"x1": 118,
"x2": 416,
"y1": 112,
"y2": 660
},
"keypoints": {
"visible": [
0.9909399747848511,
0.8162999749183655,
0.9872099757194519,
...
],
"x": [
316.3871765136719,
315.9374694824219,
304.878173828125,
...
],
"y": [
156.4207763671875,
148.05775451660156,
144.93240356445312,
...
]
}
}
],
"shape": [
750,
600
],
"speed": {
"inference": 200.8,
"postprocess": 0.8,
"preprocess": 2.8
}
}
],
"metadata": ...
}