Link to this sectionВыделенные эндпоинты#

Q: Сколько эндпоинтов я могу создать?

Лимиты эндпоинтов зависят от тарифного плана: Free: до 3 развертываний; Pro: до 10 развертываний; Enterprise: неограниченное количество развертываний. Каждая модель по-прежнему может быть развернута в нескольких регионах в рамках квоты твоего тарифного плана.

Ultralytics Platform позволяет развертывать модели YOLO на выделенных эндпоинтах в 43 регионах по всему миру. Каждый эндпоинт представляет собой однопользовательский сервис с возможностью масштабирования до нуля, уникальным URL-адресом и независимым мониторингом.

Вкладка развертывания модели на Ultralytics Platform с картой регионов и таблицей

Link to this sectionСоздать эндпоинт#

Link to this sectionИз вкладки Deploy#

Разверни модель на вкладке Deploy:

Перейди к своей модели
Нажми на вкладку Deploy
Выбери регион на интерактивной карте мира — регионы окрашены в цвета в зависимости от задержки (latency) от твоего местоположения по градиенту от зеленого к красному (чем быстрее регион, тем он зеленее; чем медленнее, тем краснее)
Нажми Deploy в строке выбранного региона

Имя развертывания генерируется автоматически на основе названия модели и города региона (например, yolo26n-iowa).

Link to this sectionСо страницы Deployments#

Создай развертывание на глобальной странице Deploy в боковой панели:

Нажми New Deployment
Выбери модель из селектора моделей
Выбери регион на карте или в таблице
Проверь автоматически сгенерированное имя развертывания (его можно изменить) и ресурсы по умолчанию
Нажми Deploy Model

Диалоговое окно нового развертывания на Ultralytics Platform с селектором моделей и картой регионов

Link to this sectionЖизненный цикл развертывания#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff
    classDef error fill:#F44336,color:#fff
    classDef extern fill:#607D8B,color:#fff
    class Creating,Deploying,Stopping proc
    class Ready out
    class Failed error
    class Stopped extern

Link to this sectionВыбор региона#

Выбирай из 43 регионов по всему миру. Интерактивная карта и таблица регионов отображают:

Маркеры регионов: цветовая кодировка по задержке на градиенте от зеленого к красному (быстрее — зеленее, медленнее — краснее)
Развернутые регионы: выделены значком "Deployed"
Регионы в процессе развертывания: анимированный индикатор пульсации
Двусторонняя подсветка: наведение курсора на карту подсвечивает строку в таблице, и наоборот

Таблица задержек регионов на вкладке Deploy в Ultralytics Platform, отсортированная по задержке

Таблица регионов на вкладке Deploy для модели включает:

Столбец	Описание
Location	Город и страна со значком флага
Zone	Идентификатор региона
Задержка	Измеренное время пинга (медиана из 3 попыток)
Distance	Расстояние от твоего местоположения в км
Actions	Кнопка Deploy или статус "Deployed"

Диалоговое окно нового развертывания

Диалоговое окно New Deployment (со страницы глобального Deploy) показывает упрощенную таблицу регионов только с колонками Location, Latency и Select.

Выбирай с умом

Выбери регион, который находится ближе всего к твоим пользователям, для минимизации задержки. Используй кнопку Rescan, чтобы заново измерить задержку из твоего текущего местоположения.

Link to this sectionДоступные регионы#

Zone	Расположение
us-central1	Айова, США
us-east1	Южная Каролина, США
us-east4	Северная Вирджиния, США
us-east5	Колумбус, США
us-south1	Даллас, США
us-west1	Орегон, США
us-west2	Лос-Анджелес, США
us-west3	Солт-Лейк-Сити, США
us-west4	Лас-Вегас, США
northamerica-northeast1	Монреаль, Канада
northamerica-northeast2	Торонто, Канада
northamerica-south1	Керетаро, Мексика
southamerica-east1	Сан-Паулу, Бразилия
southamerica-west1	Сантьяго, Чили

Link to this sectionКонфигурация конечной точки#

Link to this sectionДиалоговое окно нового развертывания#

Диалоговое окно New Deployment предоставляет следующее:

Настройка	Описание	По умолчанию
Модель	Выбор из завершенных моделей	-
Регион	Регион развертывания	-
Имя развертывания	Автоматически сгенерировано, можно редактировать	-
Ядра CPU	Фиксированное значение по умолчанию	1
Память (ГБ)	Фиксированное значение по умолчанию	2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Развертывания используют фиксированные значения по умолчанию: 1 CPU, 2 GiB оперативной памяти, minInstances = 0 и maxInstances = 1. Они масштабируются до нуля в режиме простоя, поэтому ты платишь только за активное время инференса.

Автоматически сгенерированные имена

Имя развертывания автоматически создается на основе названия модели и города региона (например, yolo26n-iowa). Если ты снова развернешь ту же модель в том же регионе, добавится числовой суффикс (например, yolo26n-iowa-2).

Link to this sectionВкладка Deploy (быстрое развертывание)#

При развертывании через вкладку Deploy модели конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.

Link to this sectionУправление конечными точками#

Link to this sectionРежимы отображения#

Список развертываний поддерживает три режима просмотра:

Режим	Описание
Cards	Карточки с полной информацией, логами, примерами кода и панелью предсказаний
Compact	Сетка из небольших карточек с ключевыми метриками
Table	Таблица с сортируемыми столбцами и поиском

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this sectionКарточка развертывания (режим карточек)#

Каждая карточка развертывания в режиме карточек отображает:

Заголовок: имя, флаг региона, значок статуса, кнопки запуска/остановки/удаления
URL конечной точки: URL, который можно скопировать, со ссылкой на документацию API
Метрики: количество запросов (24ч), задержка P95, частота ошибок
Проверка работоспособности: индикатор состояния в реальном времени с задержкой и ручным обновлением
Вкладки: Logs, Code и Predict

Вкладка Logs показывает последние записи логов с фильтрацией по уровню критичности (Все / Ошибки). Вкладка Code показывает готовые к использованию примеры кода на Python, JavaScript и cURL с твоим актуальным URL конечной точки и API ключом. Вкладка Predict предоставляет встроенную панель предсказаний для тестирования прямо на развертывании.

Link to this sectionСтатусы развертывания#

Статус	Описание
Создание	Развертывание настраивается
Развертывание	Запуск контейнера
Готово	Конечная точка активна и принимает запросы
Остановка	Конечная точка завершает работу
Остановлено	Конечная точка на паузе (биллинг не идет)
Failed	Ошибка развертывания (см. сообщение об ошибке)

Link to this sectionURL конечной точки#

Каждая конечная точка имеет уникальный URL, например:

https://predict-abc123.run.app

Нажми кнопку копирования, чтобы скопировать URL. Нажми значок документации, чтобы посмотреть автоматически сгенерированную API документацию для этой конечной точки.

Link to this sectionУправление жизненным циклом#

Управляй состоянием своей конечной точки:

graph LR
    R[Ready]:::out -->|Stop| S[Stopped]:::extern
    S -->|Start| R
    R -->|Delete| D[Deleted]:::error
    S -->|Delete| D

    classDef out fill:#9C27B0,color:#fff
    classDef error fill:#F44336,color:#fff
    classDef extern fill:#607D8B,color:#fff

Действие	Описание
Запуск	Возобновить работу остановленной конечной точки
Стоп	Приостановить работу конечной точки (биллинг не идет)
Delete (Удалить)	Безвозвратно удалить конечную точку

Link to this sectionОстановить конечную точку#

Останови конечную точку, чтобы приостановить биллинг:

Нажми значок паузы на карточке развертывания
Статус конечной точки изменится на "Stopping", а затем на "Stopped"

Остановленные конечные точки:

Не принимают запросы
Не влекут расходов
Могут быть перезапущены в любое время

Link to this sectionУдалить конечную точку#

Безвозвратно удали конечную точку:

Нажми значок удаления (корзина) на карточке развертывания
Подтверди удаление в диалоговом окне

Необратимое действие

Удаление происходит мгновенно и безвозвратно. Ты всегда можешь создать новую конечную точку.

Link to this sectionИспользование конечных точек#

Link to this sectionАутентификация#

Каждое развертывание создается с использованием API ключа из твоего аккаунта. Включай его в запросы:

Authorization: Bearer YOUR_API_KEY

Префикс API ключа отображается в нижней части карточки развертывания для идентификации. Генерируй ключи в разделе API Keys.

Link to this sectionОтсутствие ограничений частоты запросов#

Запросы, отправленные напрямую на URL твоей выделенной конечной точки, не подпадают под ограничения частоты запросов Platform API — пропускная способность ограничена только конфигурацией CPU, памяти и масштабирования твоей конечной точки. (Запросы, проксируемые через Platform API, например, через внутрибраузерный тестер, по-прежнему используют стандартное ограничение в 20 запросов/мин на предсказание). Это ключевое преимущество перед shared inference, где установлено ограничение в 20 запросов/мин на API ключ.

Link to this sectionПример запроса#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this sectionПараметры запроса#

Параметр	Тип	По умолчанию	Диапазон	Описание
`file`	файл	-	-	Файл изображения или видео (обязательно)
`conf`	float	0.25	0.01 – 1.0	Минимальный порог достоверности
`iou`	float	0.7	0.0 – 0.95	Порог NMS IoU
`imgsz`	int	640	32 – 1280	Размер входного изображения в пикселях
`normalize`	bool	false	-	Возвращать координаты рамки в диапазоне 0–1
`decimals`	int	5	0 – 10	Десятичная точность для значений координат
`source`	string	-	-	URL изображения или строка base64 (альтернатива для `file`)

Видео-вывод

Выделенные эндпоинты принимают как изображения, так и видео через параметр file.

Форматы изображений (до 100 МБ): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
Форматы видео (до 100 МБ): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Каждый кадр видео обрабатывается отдельно, а результаты возвращаются для каждого кадра. Ты также можешь передать публичный URL-адрес изображения или изображение в кодировке base64 через параметр source вместо file.

Link to this sectionФормат ответа#

То же самое, что и общий вывод с полями, специфичными для задачи.

Link to this sectionЦенообразование#

Базовые выделенные эндпоинты бесплатны на всех тарифных планах. Конфигурации с более высокими ресурсами (больше vCPU, больше памяти, «теплый» старт) в будущем будут использовать модель ценообразования на основе фактического использования.

Оптимизация затрат

Используй масштабирование до нуля (по умолчанию), чтобы эндпоинты работали только при получении запросов
Установи соответствующие максимальные экземпляры для своего трафика
Отслеживай использование на панели мониторинга

Link to this sectionFAQ#

Link to this sectionСколько эндпоинтов я могу создать?#

Лимиты эндпоинтов зависят от тарифного плана:

Free: до 3 развертываний
Pro: до 10 развертываний
Enterprise: неограниченное количество развертываний

Каждая модель по-прежнему может быть развернута в нескольких регионах в рамках квоты твоего тарифного плана.

Link to this sectionМогу ли я изменить регион после развертывания?#

Нет, регионы фиксированы. Чтобы изменить регион:

Удали существующий эндпоинт
Создай новый эндпоинт в нужном регионе

Link to this sectionКак мне настроить развертывание в нескольких регионах?#

Для глобального покрытия:

Разверни модель в нескольких регионах
Используй балансировщик нагрузки или DNS-маршрутизацию
Направляй пользователей к ближайшему эндпоинту

Link to this sectionКаково время «холодного» старта?#

Время «холодного» старта зависит от размера модели и от того, кэширован ли уже контейнер в этом регионе. Типичные диапазоны:

Сценарий	Холодный старт
Кэшированный контейнер	~5-15 секунд
Первое развертывание/регион	~15-45 секунд

Для проверки работоспособности используется тайм-аут 55 секунд, чтобы учесть «холодный» старт в худшем случае.

Link to this sectionМогу ли я использовать собственные домены?#

Собственные домены появятся в ближайшее время. В настоящее время эндпоинты используют URL-адреса, генерируемые платформой.

Участники

GLglenn-jocher¹³ T-t-hakobyan¹ SEsergiuwaxmann¹

Создано 14 янв. 2026 г.Обновлено 4 дня назад