Выделенные эндпоинты

Ultralytics Platform позволяет развертывать модели YOLO на выделенных эндпоинтах в 43 регионах мира. Каждый эндпоинт представляет собой однопользовательский сервис с возможностью масштабирования до нуля, уникальным URL и независимым мониторингом.

Вкладка развертывания модели на платформе Ultralytics с картой регионов и таблицей

Создать эндпоинт

На вкладке развертывания (Deploy)

Разверни модель на вкладке Deploy:

  1. Перейди к своей модели
  2. Перейди на вкладку Deploy
  3. Выбери регион на интерактивной карте мира — регионы имеют цветовую кодировку в зависимости от задержки (ping) от твоего местоположения (зеленый < 100 мс, желтый < 200 мс, красный > 200 мс)
  4. Нажми Deploy в строке выбранного региона

Имя развертывания создается автоматически на основе названия модели и города региона (например, yolo26n-iowa).

На странице развертываний

Создай развертывание на глобальной странице Deploy в боковой панели:

  1. Нажми New Deployment
  2. Выбери модель в селекторе моделей
  3. Выбери регион на карте или в таблице
  4. Проверь автоматически созданное имя развертывания (его можно изменить) и ресурсы по умолчанию
  5. Нажми Deploy Model

Диалоговое окно создания нового развертывания на платформе Ultralytics с выбором модели и картой регионов

Жизненный цикл развертывания

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Выбор региона

Выбирай из 43 регионов по всему миру. Интерактивная карта регионов и таблица показывают:

  • Метки регионов: цветовая кодировка по задержке (зеленый < 100 мс, желтый < 200 мс, красный > 200 мс)
  • Развернутые регионы: отмечены значком "Deployed"
  • Регионы в процессе развертывания: анимированный индикатор пульсации
  • Двусторонняя подсветка: наведение курсора на карту подсвечивает строку в таблице, и наоборот

Таблица задержек регионов на вкладке развертывания платформы Ultralytics, отсортированная по задержке

Таблица регионов на вкладке модели Deploy включает:

СтолбецОписание
РасположениеГород и страна со значком флага
ЗонаИдентификатор региона
ЗадержкаИзмеренное время отклика (медиана по 3 пингам)
РасстояниеРасстояние от твоего местоположения в км
ДействияКнопка развертывания или статус "Deployed"
Диалоговое окно нового развертывания

Диалоговое окно New Deployment (на глобальной странице Deploy) показывает упрощенную таблицу регионов только со столбцами Location, Latency и Select.

Выбирай с умом

Выбери регион, ближайший к твоим пользователям, для минимальной задержки. Используй кнопку Rescan, чтобы перемерить задержку из твоего текущего местоположения.

Доступные регионы

ЗонаРасположение
us-central1Айова, США
us-east1Южная Каролина, США
us-east4Северная Вирджиния, США
us-east5Колумбус, США
us-south1Даллас, США
us-west1Орегон, США
us-west2Лос-Анджелес, США
us-west3Солт-Лейк-Сити, США
us-west4Лас-Вегас, США
northamerica-northeast1Монреаль, Канада
northamerica-northeast2Торонто, Канада
northamerica-south1Керетаро, Мексика
southamerica-east1Сан-Паулу, Бразилия
southamerica-west1Сантьяго, Чили

Конфигурация эндпоинта

Диалоговое окно нового развертывания

Диалоговое окно New Deployment предоставляет:

НастройкаОписаниеПо умолчанию
МодельВыберите из готовых моделей-
РегионРегион развертывания-
Имя развертыванияАвтоматически сгенерировано, можно редактировать-
Ядра CPUФиксированное значение по умолчанию1
Память (ГБ)Фиксированное значение по умолчанию2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Развертывания используют фиксированные значения по умолчанию: 1 CPU, 2 GiB памяти, minInstances = 0 и maxInstances = 1. Они масштабируются до нуля при бездействии, поэтому ты платишь только за активное время инференса.

Автоматически сгенерированные имена

Имя развертывания автоматически создается на основе имени модели и города региона (например, yolo26n-iowa). Если ты снова развернешь ту же модель в том же регионе, добавится числовой суффикс (например, yolo26n-iowa-2).

Вкладка Deploy (Быстрое развертывание)

При развертывании через вкладку модели Deploy эндпоинты создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.

Управление эндпоинтами

Режимы просмотра

Список развертываний поддерживает три режима просмотра:

РежимОписание
КарточкиПодробные карточки с логами, примерами кода и панелью предсказаний
КомпактныйСетка из компактных карточек с ключевыми метриками
ТаблицаТаблица (DataTable) с сортируемыми столбцами и поиском

Ultralytics Platform Deploy Tab Active Deployments Cards View

Карточка развертывания (режим карточек)

Каждая карточка развертывания в режиме карточек отображает:

  • Заголовок: Имя, флаг региона, индикатор статуса, кнопки запуска/остановки/удаления
  • URL эндпоинта: URL, который можно скопировать, со ссылкой на документацию API
  • Метрики: Количество запросов (24ч), задержка P95, уровень ошибок
  • Проверка работоспособности: Индикатор состояния в реальном времени с задержкой и ручным обновлением
  • Вкладки: Logs, Code и Predict

Вкладка Logs отображает последние записи логов с фильтрацией по уровню важности (Все / Ошибки). Вкладка Code показывает готовые примеры кода на Python, JavaScript и cURL с твоим актуальным URL эндпоинта и ключом API. Вкладка Predict предоставляет встроенную панель предсказаний для тестирования напрямую в развертывании.

Статусы развертывания

СтатусОписание
Создание (Creating)Развертывание настраивается
Развертывание (Deploying)Контейнер запускается
Готов (Ready)Эндпоинт активен и принимает запросы
Остановка (Stopping)Эндпоинт выключается
Остановлен (Stopped)Эндпоинт приостановлен (оплата не взимается)
FailedРазвертывание не удалось (см. сообщение об ошибке)

URL эндпоинта

Каждый эндпоинт имеет уникальный URL, например:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

Нажми кнопку копирования, чтобы скопировать URL. Нажми на иконку документации, чтобы просмотреть автоматически сгенерированную API-документацию для этого эндпоинта.

Управление жизненным циклом

Управляй состоянием своего эндпоинта:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
ДействиеОписание
ЗапускВозобновить работу остановленного эндпоинта
ОстановкаПриостановить работу эндпоинта (оплата не взимается)
УдалитьБезвозвратно удалить эндпоинт

Остановка эндпоинта

Останови эндпоинт, чтобы приостановить начисления:

  1. Нажми иконку паузы на карточке развертывания
  2. Статус эндпоинта изменится на "Stopping", а затем на "Stopped"

Остановленные эндпоинты:

  • Не принимают запросы
  • Не влекут расходов
  • Могут быть перезапущены в любое время

Удаление эндпоинта

Безвозвратное удаление эндпоинта:

  1. Нажми иконку удаления (корзину) на карточке развертывания
  2. Подтверди удаление в диалоговом окне
Необратимое действие

Удаление происходит мгновенно и является окончательным. Ты всегда можешь создать новый эндпоинт.

Использование эндпоинтов

Аутентификация

Каждое развертывание создается с использованием API-ключа из твоего аккаунта. Включай его в запросы:

Authorization: Bearer YOUR_API_KEY

Префикс API-ключа отображается в нижней части карточки развертывания для идентификации. Генерируй ключи в разделе API Keys.

Без ограничений по количеству запросов

На выделенные эндпоинты не распространяются лимиты Platform API. Запросы отправляются напрямую в твой выделенный сервис, поэтому пропускная способность ограничивается только конфигурацией CPU, памяти и масштабированием твоего эндпоинта. Это ключевое преимущество перед общим инференсом, где действует ограничение в 20 запросов/мин на каждый API ключ.

Пример запроса

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Параметры запроса

ПараметрТипПо умолчаниюДиапазонОписание
fileфайл--Файл изображения или видео (обязательно)
confчисло с плавающей точкой0.250.01 – 1.0Минимальный порог уверенности
iouчисло с плавающей точкой0.70.0 – 0.95Порог NMS IoU
imgszint64032 – 1280Размер входного изображения в пикселях
normalizeboolfalse-Возвращать координаты ограничивающей рамки в диапазоне от 0 до 1
decimalsint50 – 10Точность знаков после запятой для значений координат
sourceстрока--URL изображения или строка base64 (альтернатива file)
Инференс видео

Выделенные эндпоинты принимают как изображения, так и видео через параметр file.

  • Форматы изображений (до 50 МБ): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • Форматы видео (до 100 МБ): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Каждый кадр видео обрабатывается отдельно, и результаты возвращаются для каждого кадра. Ты также можешь передать публичный URL изображения или изображение в формате base64 через параметр source вместо file.

Формат ответа

Тот же, что и при общем инференсе, с добавлением полей, специфичных для конкретной задачи.

Ценообразование

Базовые выделенные эндпоинты бесплатны на всех тарифах. Конфигурации с более высокими ресурсами (больше vCPU, больше памяти, «теплый» запуск) в будущем будут использовать модель оплаты по мере использования.

Оптимизация затрат
  • Используй масштабирование до нуля (по умолчанию), чтобы эндпоинты работали только во время получения запросов
  • Устанавливай подходящее максимальное количество экземпляров для твоего трафика
  • Отслеживай использование на панели мониторинга

Часто задаваемые вопросы (FAQ)

Сколько эндпоинтов я могу создать?

Лимиты эндпоинтов зависят от тарифа:

  • Free: до 3 развертываний
  • Pro: до 10 развертываний
  • Enterprise: неограниченное количество развертываний

Каждая модель по-прежнему может быть развернута в нескольких регионах в рамках квоты твоего тарифа.

Могу ли я изменить регион после развертывания?

Нет, регионы фиксированы. Чтобы изменить регион:

  1. Удали существующий эндпоинт
  2. Создай новый эндпоинт в нужном регионе

Как настроить развертывание в нескольких регионах?

Для глобального охвата:

  1. Разверни модель в нескольких регионах
  2. Используй балансировщик нагрузки или DNS-маршрутизацию
  3. Направляй пользователей к ближайшему эндпоинту

Какое время «холодного» старта?

Время «холодного» старта зависит от размера модели и от того, кэширован ли контейнер в данном регионе. Типичные диапазоны:

СценарийХолодный старт
Кэшированный контейнер~5-15 секунд
Первое развертывание/регион~15-45 секунд

Проверка работоспособности использует тайм-аут 55 секунд, чтобы учесть самые медленные случаи «холодного» старта.

Могу ли я использовать пользовательские домены?

Пользовательские домены появятся в ближайшее время. В данный момент эндпоинты используют URL, сгенерированные платформой.

Комментарии