Перейти к содержанию

Выделенные конечные точки

Ultralytics позволяет развертывать YOLO на выделенных конечных точках в 43 регионах мира. Каждая конечная точка представляет собой однопользовательский сервис с автомасштабированием, уникальным URL-адресом и независимым мониторингом.

Вкладка «Развертывание модели» Ultralytics с картой регионов и таблицей

Создать конечную точку

На вкладке «Развертывание»

Разверните модель из ее Deploy вкладка:

  1. Перейдите к вашей модели
  2. Нажмите на вкладку Deploy
  3. Выберите регион из таблицы регионов (отсортированной по задержке от вашего местоположения)
  4. Нажмите «Развернуть» в строке региона.

Имя развертывания автоматически генерируется на основе имени модели и города региона (например, yolo11n-iowa).

Со страницы «Развертывания»

Создать развертывание из глобального Deploy страница в боковой панели:

  1. Нажмите «Новое развертывание»
  2. Выберите модель из селектора моделей
  3. Выберите регион на карте или в таблице
  4. При желании настройте имя развертывания и ресурсы
  5. Нажмите «Развернуть модель»

Новое диалоговое окно развертывания Ultralytics с выбором модели и картой региона

Жизненный цикл развертывания

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Выбор региона

Выберите из 43 регионов по всему миру. Интерактивная карта регионов и таблица показывают:

  • Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
  • Развернутые регионы: выделены значком «Развернуто»
  • Развертывание регионов: анимированный индикатор импульса
  • Двунаправленное выделение: при наведении курсора на карту выделяется строка таблицы и наоборот.

Вкладка «Развертывание» Ultralytics Таблица задержек по регионам, отсортированная по задержкам

Таблица регионов в модели Deploy Вкладка включает:

СтолбецОписание
МестоположениеГород и страна с флагом
ЗонаИдентификатор региона
ЗадержкаИзмеренное время пинга (медиана 3 пингов)
РасстояниеРасстояние от вашего местоположения в км
ДействияКнопка «Развернуть» или значок статуса «Развернуто»

Диалоговое окно «Новое развертывание»

Параметр New Deployment диалог (из глобального Deploy страница) показана более простая таблица регионов, содержащая только столбцы «Местоположение», «Задержка» и «Выбор».

Выбирайте с умом

Выберите регион, наиболее близкий к вашим пользователям, для минимальной задержки. Используйте кнопку «Повторно сканировать», чтобы повторно измерить задержку из вашего текущего местоположения.

Доступные регионы

ЗонаМестоположение
us-central1Айова, США
us-east1Южная Каролина, США
us-east4Северная Вирджиния, США
us-east5Колумбус, США
us-south1Даллас, США
us-west1Орегон, США
us-west2Лос-Анджелес, США
us-west3Солт-Лейк-Сити, США
us-west4Лас-Вегас, США
northamerica-northeast1Монреаль, Канада
northamerica-northeast2Торонто, Канада
севернаяамерика-южная1Керетаро, Мексика
southamerica-east1Сан-Паулу, Бразилия
southamerica-west1Сантьяго, Чили
ЗонаМестоположение
europe-west1Сен-Гислен, Бельгия
europe-west2Лондон, Великобритания
europe-west3Франкфурт, Германия
europe-west4Эмсхавен, Нидерланды
europe-west6Цюрих, Швейцария
europe-west8Милан, Италия
europe-west9Париж, Франция
europe-west10Берлин, Германия
europe-west12Турин, Италия
europe-north1Хамина, Финляндия
европа-север2Стокгольм, Швеция
europe-central2Варшава, Польша
europe-southwest1Мадрид, Испания
ЗонаМестоположение
asia-east1Чанхуа, Тайвань
asia-east2Коулун, Гонконг
asia-northeast1Токио, Япония
asia-northeast2Осака, Япония
asia-northeast3Сеул, Южная Корея
asia-south1Мумбаи, Индия
asia-south2Дели, Индия
asia-southeast1Джуронг-Уэст, Сингапур
asia-southeast2Джакарта, Индонезия
Юго-Восточная Азия3Бангкок, Таиланд
australia-southeast1Сидней, Австралия
australia-southeast2Мельбурн, Австралия
ЗонаМестоположение
африка-юг1Йоханнесбург, Южная Африка
me-central1Доха, Катар
me-central2Даммам, Саудовская Аравия
me-west1Тель-Авив, Израиль

Конфигурация конечной точки

Диалоговое окно «Новое развертывание»

Параметр New Deployment диалог предоставляет:

НастройкаОписаниеПо умолчанию
МодельВыберите из готовых моделей-
РегионРегион развертывания-
Название развертыванияАвтоматически сгенерированный, редактируемый-
CPUCPU (1-8)1
Память (ГБ)Распределение памяти (1–32 ГБ)2

Ultralytics Новое развертывание Диалоговое окно «Ресурсы» Расширено

Настройки ресурсов доступны в сворачиваемом разделе «Ресурсы ». По умолчанию для развертываний используется масштабирование до нуля (мин. количество экземпляров = 0, макс. количество экземпляров = 1) — вы платите только за активное время инференции.

Автоматически сгенерированные имена

Имя развертывания автоматически генерируется на основе имени модели и города региона (например, yolo11n-iowa). Если вы снова развернете ту же модель в том же регионе, будет добавлен числовой суффикс (например, yolo11n-iowa-2).

Вкладка «Развертывание» (быстрое развертывание)

При развертывании из модели Deploy На вкладке «Развертывание» конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) с включенной функцией масштабирования до нуля. Имя развертывания генерируется автоматически.

Управление конечными точками

Режимы просмотра

Список развертываний поддерживает три режима просмотра:

РежимОписание
КартыПодробные карты с журналами, примерами кода, панелью прогнозирования
КомпактныйСетка из небольших карточек с ключевыми показателями
ТаблицаТаблица данных с сортируемыми столбцами и поиском

Вкладка «Развертывание» Ultralytics Карты активных развертываний

Карта развертывания (вид карт)

Каждая карта развертывания в окне просмотра карт отображает:

  • Заголовок: имя, флаг региона, значок статуса, кнопки «Пуск/Стоп/Удалить»
  • URL конечной точки: копируемый URL со ссылкой на документацию API
  • Показатели: количество запросов (за 24 часа), задержка P95, коэффициент ошибок
  • Проверка работоспособности: индикатор работоспособности в реальном времени с задержкой и ручным обновлением
  • Вкладки: Logs, Codeи Predict

Параметр Logs Вкладка «Журнал» отображает последние записи журнала с фильтрацией по степени серьезности (Все / Ошибки). Code Вкладка «Примеры кода» содержит готовые к использованию примеры кода на Python, JavaScript и cURL с вашим фактическим URL-адресом конечной точки и ключом API. Predict Вкладка «tab» предоставляет встроенную панель прогнозирования для тестирования непосредственно на развертывании.

Статусы развертывания

СтатусОписание
СозданиеРазвертывание настраивается
РазвертываниеКонтейнер запускается
ГотовКонечная точка работает и принимает запросы
ОстановкаКонечная точка выключается
ОстановленКонечная точка приостановлена (без начисления платы)
НеудачаРазвертывание не удалось (см. сообщение об ошибке)

URL конечной точки

Каждая конечная точка имеет уникальный URL-адрес, например:

https://predict-abc123.run.app

Карта развертывания Ultralytics URL-адрес конечной точки с кнопкой «Копировать»

Нажмите кнопку «Копировать», чтобы скопировать URL-адрес. Нажмите значок «Документы», чтобы просмотреть автоматически сгенерированную документацию API для конечной точки.

Управление жизненным циклом

Управление состоянием конечной точки:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
ДействиеОписание
ЗапуститьВозобновить работу остановленной конечной точки
ОстановитьПриостановить работу конечной точки (без тарификации)
УдалитьОкончательно удалить конечную точку

Остановить конечную точку

Остановите конечную точку, чтобы приостановить тарификацию:

  1. Нажмите значок паузы на карте развертывания.
  2. Статус конечной точки меняется на «Остановка», а затем на «Остановлено».

Остановленные конечные точки:

  • Не принимают запросы
  • Не тарифицируются
  • Может быть перезапущен в любой момент

Удалить конечную точку

Безвозвратное удаление конечной точки:

  1. Нажмите значок удаления (корзина) на карте развертывания.
  2. Подтвердите удаление в диалоговом окне

Необратимое действие

Удаление происходит немедленно и безвозвратно. Вы всегда можете создать новую конечную точку.

Использование конечных точек

Аутентификация

Каждое развертывание создается с помощью ключа API из вашей учетной записи. Включите его в запросы:

Authorization: Bearer YOUR_API_KEY

Префикс ключа API отображается в нижнем колонтитуле карты развертывания для идентификации. Сгенерируйте ключи в разделе «Ключи API».

Без ограничений по ставкам

Выделенные конечные точки не подпадают под ограничения скорости API платформы. Запросы поступают непосредственно в ваш выделенный сервис, поэтому пропускная способность ограничивается только конфигурацией CPU, памяти и масштабирования вашей конечной точки. Это ключевое преимущество по сравнению с общим выводом, скорость которого ограничена 20 запросами в минуту на один ключ API.

Пример запроса

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");

// Send image for inference
const response = await fetch(
  "https://predict-abc123.run.app/predict",
  {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  }
);

const result = await response.json();
console.log(result);
curl -X POST \
  "https://predict-abc123.run.app/predict" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@image.jpg" \
  -F "conf=0.25" \
  -F "iou=0.7" \
  -F "imgsz=640"

Параметры запроса

ПараметрТипПо умолчаниюОписание
fileфайла-Файл изображения (обязательно)
conffloat0.25Минимальный порог достоверности
ioufloat0.7Порог IoU для NMS
imgszint640Размер входного изображения
normalizeстрока-Возврат нормализованных координат

Формат ответа

Аналогично общему выводу с полями, специфичными для задачи.

Цены

Выделенные конечные точки тарифицируются на основе:

КомпонентТариф
CPUЗа секунду vCPU
ПамятьЗа ГБ-секунду
ЗапросыЗа миллион запросов

Оптимизация затрат

  • Используйте масштабирование до нуля для конечных точек разработки
  • Установите соответствующее максимальное количество экземпляров
  • Отслеживайте использование на панели мониторинга Мониторинг
  • Проверьте расходы в разделе «Настройки» > «Биллинг».

Часто задаваемые вопросы

Сколько конечных точек я могу создать?

Ограничения конечных точек зависят от тарифного плана:

  • Бесплатно: до 3 развертываний
  • Плюс: до 10 развертываний
  • Предприятие: неограниченное количество развертываний

Каждая модель по-прежнему может быть развернута в нескольких регионах в пределах квоты вашего плана.

Могу ли я изменить регион после развертывания?

Нет, регионы фиксированы. Чтобы изменить регионы:

  1. Удалите существующую конечную точку
  2. Создайте новую конечную точку в желаемом регионе

Как реализовать многорегиональное развертывание?

Для глобального охвата:

  1. Развертывание в нескольких регионах
  2. Используйте балансировщик нагрузки или маршрутизацию DNS
  3. Направляйте пользователей к ближайшей конечной точке

Каково время холодного старта?

Время холодного запуска зависит от размера модели и от того, кэширован ли контейнер в регионе. Типичные диапазоны:

СценарийХолодный старт
Кэшированный контейнер~5–15 секунд
Первое развертывание/регион~15–45 секунд

Проверка работоспособности использует 55-секундный таймаут, чтобы учесть худший случай холодного запуска.

Могу ли я использовать пользовательские домены?

Пользовательские домены скоро появятся. В настоящее время конечные точки используют URL-адреса, сгенерированные платформой.



📅 Создано 1 месяц назад ✏️ Обновлено 5 дней назад
glenn-jochersergiuwaxmann

Комментарии