Перейти к содержанию

Выделенные конечные точки

Платформа Ultralytics обеспечивает развертывание моделей YOLO на выделенные конечные точки в 43 регионах мира. Каждая конечная точка представляет собой однопользовательский сервис с автомасштабированием, уникальным URL-адресом конечной точки и независимым мониторингом.

Ultralytics Platform Вкладка «Развертывание модели» с картой регионов и таблицей

Создать конечную точку

Из вкладки "Развертывание"

Развернуть модель из ее Deploy вкладка:

  1. Перейдите к вашей модели
  2. Нажмите на вкладку Deploy
  3. Выберите регион из таблицы регионов (отсортировано по задержке от вашего местоположения)
  4. Нажмите Развернуть в строке региона

Имя развертывания генерируется автоматически из имени модели и города региона (например, yolo11n-iowa).

Со страницы "Развертывания"

Создайте развертывание из глобального Deploy страница на боковой панели:

  1. Нажмите Новое развертывание
  2. Выберите модель из селектора моделей
  3. Выберите регион с карты или из таблицы
  4. Опционально настройте имя развертывания и ресурсы
  5. Нажмите Развернуть модель

Диалоговое окно нового развертывания платформы Ultralytics с селектором модели и картой регионов

Жизненный цикл развертывания

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Выбор региона

Выбирайте из 43 регионов по всему миру. Интерактивная карта регионов и таблица показывают:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Развернутые регионы: Отмечены значком «Развернуто»
  • Развертываемые регионы: Анимированный индикатор пульсации
  • Двунаправленное выделение: Наведение курсора на карту выделяет строку таблицы, и наоборот.

Ultralytics Platform Вкладка «Развертывание» Таблица задержек по регионам, отсортированная по задержке

Таблица регионов по модели Deploy вкладка включает:

СтолбецОписание
МестоположениеГород и страна со значком флага
ЗонаИдентификатор региона
ЗадержкаИзмеренное время пинга (медиана из 3 пингов)
РасстояниеРасстояние от вашего местоположения в км
ДействияКнопка развертывания или значок статуса "Развернуто"

Новое диалоговое окно развертывания

Параметр New Deployment диалог (из глобального Deploy странице) показана более простая таблица регионов только со столбцами «Местоположение», «Задержка» и «Выбрать».

Выбирайте с умом

Выберите регион, ближайший к вашим пользователям, для минимальной задержки. Используйте кнопку Rescan, чтобы повторно измерить задержку из вашего текущего местоположения.

Доступные регионы

ЗонаМестоположение
us-central1Айова, США
us-east1Южная Каролина, США
us-east4Северная Вирджиния, США
us-east5Колумбус, США
us-south1Даллас, США
us-west1Орегон, США
us-west2Лос-Анджелес, США
us-west3Солт-Лейк-Сити, США
us-west4Лас-Вегас, США
northamerica-northeast1Монреаль, Канада
northamerica-northeast2Торонто, Канада
northamerica-south1Керетаро, Мексика
southamerica-east1Сан-Паулу, Бразилия
southamerica-west1Сантьяго, Чили
ЗонаМестоположение
europe-west1Сент-Гислен, Бельгия
europe-west2Лондон, Великобритания
europe-west3Франкфурт, Германия
europe-west4Эмсхавен, Нидерланды
europe-west6Цюрих, Швейцария
europe-west8Милан, Италия
europe-west9Париж, Франция
europe-west10Берлин, Германия
europe-west12Турин, Италия
europe-north1Хамина, Финляндия
europe-north2Стокгольм, Швеция
europe-central2Варшава, Польша
europe-southwest1Мадрид, Испания
ЗонаМестоположение
asia-east1Чжанхуа, Тайвань
asia-east2Коулун, Гонконг
asia-northeast1Токио, Япония
asia-northeast2Осака, Япония
asia-northeast3Сеул, Южная Корея
asia-south1Мумбаи, Индия
asia-south2Дели, Индия
asia-southeast1Джуронг-Уэст, Сингапур
asia-southeast2Джакарта, Индонезия
asia-southeast3Бангкок, Таиланд
australia-southeast1Сидней, Австралия
australia-southeast2Мельбурн, Австралия
ЗонаМестоположение
africa-south1Йоханнесбург, Южная Африка
me-central1Доха, Катар
me-central2Даммам, Саудовская Аравия
me-west1Тель-Авив, Израиль

Конфигурация конечной точки

Новое диалоговое окно развертывания

Параметр New Deployment диалог предоставляет:

НастройкаОписаниеПо умолчанию
МодельВыберите из завершенных моделей-
РегионРегион развертывания-
Имя развертыванияАвтоматически сгенерировано, редактируемо-
Ядра CPUВыделение CPU (1-8)1
Память (ГБ)Выделение памяти (1-32 ГБ)2

Развернутая панель ресурсов диалогового окна нового развертывания платформы Ultralytics

Настройки ресурсов доступны в раскрывающемся разделе Ресурсы. Развертывания по умолчанию используют масштабирование до нуля (минимальное количество экземпляров = 0, максимальное количество экземпляров = 1) — вы платите только за активное время инференса.

Автоматически сгенерированные имена

Имя развертывания автоматически генерируется из имени модели и города региона (например, yolo11n-iowa). Если вы снова развертываете ту же модель в том же регионе, добавляется числовой суффикс (например, yolo11n-iowa-2).

Вкладка "Развертывание" (Быстрое развертывание)

При развертывании из модели Deploy вкладке конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.

Управление конечными точками

Режимы просмотра

Список развертываний поддерживает три режима просмотра:

РежимОписание
КарточкиПодробные карточки с логами, примерами кода, панелью прогнозирования
КомпактныйСетка небольших карточек с ключевыми метриками
ТаблицаТаблица данных с сортируемыми столбцами и поиском

Ultralytics Platform Вкладка «Развертывание» Вид карточек активных развертываний

Карточка развертывания (Представление карточек)

Каждая карточка развертывания в режиме карточек показывает:

  • Заголовок: Имя, флаг региона, значок статуса, кнопки запуска/остановки/удаления
  • URL конечной точки: Копируемый URL со ссылкой на документацию API
  • Метрики: Количество запросов (24 часа), задержка P95, частота ошибок
  • Проверка работоспособности: Индикатор состояния в реальном времени с отображением задержки и ручным обновлением
  • Вкладки: Logs, Codeи Predict

Параметр Logs вкладка показывает недавние записи журнала с фильтрацией по уровню серьезности (Все / Ошибки). Эта Code вкладка показывает готовые к использованию примеры кода на Python, JavaScript и cURL с вашим фактическим URL-адресом конечной точки и ключом API. Эта Predict вкладка предоставляет встроенную панель прогнозирования для тестирования непосредственно на развертывании.

Статусы развертывания

СтатусОписание
СозданиеРазвертывание настраивается
РазвертываниеКонтейнер запускается
ГотовоКонечная точка активна и принимает запросы
ОстановкаКонечная точка завершает работу
ОстановленоКонечная точка приостановлена (без списания средств)
НеудачноРазвертывание не удалось (см. сообщение об ошибке)

URL конечной точки

Каждая конечная точка имеет уникальный URL-адрес, например:

https://predict-abc123.run.app

Ultralytics Platform Карточка развертывания URL конечной точки с кнопкой копирования

Нажмите кнопку копирования, чтобы скопировать URL-адрес. Нажмите значок документации, чтобы просмотреть автоматически сгенерированную документацию API для конечной точки.

Управление жизненным циклом

Управление состоянием конечной точки:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
ДействиеОписание
ЗапуститьВозобновить работу остановленной конечной точки
ОстановитьПриостановить работу конечной точки (без тарификации)
УдалитьОкончательно удалить конечную точку

Остановить конечную точку

Остановите конечную точку, чтобы приостановить тарификацию:

  1. Нажмите значок паузы на карточке развертывания.
  2. Статус конечной точки меняется на "Останавливается", затем "Остановлена"

Остановленные конечные точки:

  • Не принимают запросы
  • Не тарифицируются
  • Может быть перезапущен в любой момент

Удалить конечную точку

Безвозвратное удаление конечной точки:

  1. Нажмите значок удаления (корзины) на карточке развертывания.
  2. Подтвердите удаление в диалоговом окне

Необратимое действие

Удаление происходит немедленно и безвозвратно. Вы всегда можете создать новую конечную точку.

Использование конечных точек

Аутентификация

Каждое развертывание создается с использованием ключа API из вашей учетной записи. Включите его в запросы:

Authorization: Bearer YOUR_API_KEY

Префикс ключа API отображается в нижней части карточки развертывания для идентификации. Сгенерируйте ключи на странице API Keys.

Без ограничений по частоте запросов

Выделенные конечные точки не подпадают под ограничения скорости Platform API. Запросы направляются непосредственно в ваш выделенный сервис, поэтому пропускная способность ограничена только CPU, памятью и конфигурацией масштабирования вашей конечной точки. Это ключевое преимущество перед общим выводом, который ограничен 20 запросами/мин на каждый ключ API.

Пример запроса

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Параметры запроса

ПараметрТипПо умолчаниюОписание
fileфайла-Файл изображения (обязательно)
conffloat0.25Минимальный порог достоверности
ioufloat0.7Порог IoU для NMS
imgszint640Размер входного изображения
normalizeстрока-Вернуть нормализованные координаты

Формат ответа

Аналогично общему выводу с полями, специфичными для задачи.

Цены

Выделенные конечные точки тарифицируются на основе:

КомпонентТариф
CPUЗа секунду vCPU
ПамятьЗа ГБ-секунду
ЗапросыЗа миллион запросов

Оптимизация затрат

  • Используйте масштабирование до нуля для конечных точек разработки
  • Установите соответствующее максимальное количество экземпляров
  • Отслеживайте использование на панели мониторинга Мониторинг
  • Просмотрите расходы в Настройки > Оплата

Часто задаваемые вопросы

Сколько конечных точек я могу создать?

Лимиты конечных точек зависят от тарифа:

  • Бесплатно: До 3 развертываний
  • Про: До 10 развертываний
  • Корпоративный: Неограниченное количество развертываний

Каждая модель по-прежнему может быть развернута в нескольких регионах в пределах квоты вашего плана.

Могу ли я изменить регион после развертывания?

Нет, регионы фиксированы. Чтобы изменить регионы:

  1. Удалите существующую конечную точку
  2. Создайте новую конечную точку в желаемом регионе

Как реализовать многорегиональное развертывание?

Для глобального охвата:

  1. Развертывание в нескольких регионах
  2. Используйте балансировщик нагрузки или маршрутизацию DNS
  3. Направляйте пользователей к ближайшей конечной точке

Каково время холодного старта?

Время холодного запуска зависит от размера модели и от того, кэширован ли контейнер уже в регионе. Типичные диапазоны:

СценарийХолодный старт
Кэшированный контейнер~5-15 секунд
Первое развертывание/регион~15-45 секунд

Проверка работоспособности использует тайм-аут в 55 секунд для учета холодных запусков в наихудшем сценарии.

Могу ли я использовать пользовательские домены?

Пользовательские домены скоро появятся. В настоящее время конечные точки используют URL-адреса, сгенерированные платформой.



📅 Создано 2 месяцев назад ✏️ Обновлено 25 дней назад
glenn-jochersergiuwaxmann

Комментарии