Link to this sectionВыделенные эндпоинты#
Ultralytics Platform позволяет развертывать модели YOLO на выделенных эндпоинтах в 43 регионах по всему миру. Каждый эндпоинт представляет собой однопользовательский сервис с возможностью масштабирования до нуля, уникальным URL-адресом и независимым мониторингом.

Link to this sectionСоздать эндпоинт#
Link to this sectionИз вкладки Deploy#
Разверни модель на вкладке Deploy:
- Перейди к своей модели
- Нажми на вкладку Deploy
- Выбери регион на интерактивной карте мира — регионы окрашены в цвета в зависимости от задержки (latency) от твоего местоположения по градиенту от зеленого к красному (чем быстрее регион, тем он зеленее; чем медленнее, тем краснее)
- Нажми Deploy в строке выбранного региона
Имя развертывания генерируется автоматически на основе названия модели и города региона (например, yolo26n-iowa).
Link to this sectionСо страницы Deployments#
Создай развертывание на глобальной странице Deploy в боковой панели:
- Нажми New Deployment
- Выбери модель из селектора моделей
- Выбери регион на карте или в таблице
- Проверь автоматически сгенерированное имя развертывания (его можно изменить) и ресурсы по умолчанию
- Нажми Deploy Model

Link to this sectionЖизненный цикл развертывания#
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteLink to this sectionВыбор региона#
Выбирай из 43 регионов по всему миру. Интерактивная карта и таблица регионов отображают:
- Маркеры регионов: цветовая кодировка по задержке на градиенте от зеленого к красному (быстрее — зеленее, медленнее — краснее)
- Развернутые регионы: выделены значком "Deployed"
- Регионы в процессе развертывания: анимированный индикатор пульсации
- Двусторонняя подсветка: наведение курсора на карту подсвечивает строку в таблице, и наоборот

Таблица регионов на вкладке Deploy для модели включает:
| Столбец | Описание |
|---|---|
| Location | Город и страна со значком флага |
| Zone | Идентификатор региона |
| Задержка | Измеренное время пинга (медиана из 3 попыток) |
| Distance | Расстояние от твоего местоположения в км |
| Actions | Кнопка Deploy или статус "Deployed" |
Диалоговое окно New Deployment (со страницы глобального Deploy) показывает упрощенную таблицу регионов только с колонками Location, Latency и Select.
Выбери регион, который находится ближе всего к твоим пользователям, для минимизации задержки. Используй кнопку Rescan, чтобы заново измерить задержку из твоего текущего местоположения.
Link to this sectionДоступные регионы#
| Zone | Расположение |
|---|---|
| us-central1 | Айова, США |
| us-east1 | Южная Каролина, США |
| us-east4 | Северная Вирджиния, США |
| us-east5 | Колумбус, США |
| us-south1 | Даллас, США |
| us-west1 | Орегон, США |
| us-west2 | Лос-Анджелес, США |
| us-west3 | Солт-Лейк-Сити, США |
| us-west4 | Лас-Вегас, США |
| northamerica-northeast1 | Монреаль, Канада |
| northamerica-northeast2 | Торонто, Канада |
| northamerica-south1 | Керетаро, Мексика |
| southamerica-east1 | Сан-Паулу, Бразилия |
| southamerica-west1 | Сантьяго, Чили |
Link to this sectionКонфигурация конечной точки#
Link to this sectionДиалоговое окно нового развертывания#
Диалоговое окно New Deployment предоставляет следующее:
| Настройка | Описание | По умолчанию |
|---|---|---|
| Модель | Выбор из завершенных моделей | - |
| Регион | Регион развертывания | - |
| Имя развертывания | Автоматически сгенерировано, можно редактировать | - |
| Ядра CPU | Фиксированное значение по умолчанию | 1 |
| Память (ГБ) | Фиксированное значение по умолчанию | 2 |

Развертывания используют фиксированные значения по умолчанию: 1 CPU, 2 GiB оперативной памяти, minInstances = 0 и maxInstances = 1. Они масштабируются до нуля в режиме простоя, поэтому ты платишь только за активное время инференса.
Имя развертывания автоматически создается на основе названия модели и города региона (например, yolo26n-iowa). Если ты снова развернешь ту же модель в том же регионе, добавится числовой суффикс (например, yolo26n-iowa-2).
Link to this sectionВкладка Deploy (быстрое развертывание)#
При развертывании через вкладку Deploy модели конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.
Link to this sectionУправление конечными точками#
Link to this sectionРежимы отображения#
Список развертываний поддерживает три режима просмотра:
| Режим | Описание |
|---|---|
| Cards | Карточки с полной информацией, логами, примерами кода и панелью предсказаний |
| Compact | Сетка из небольших карточек с ключевыми метриками |
| Table | Таблица с сортируемыми столбцами и поиском |

Link to this sectionКарточка развертывания (режим карточек)#
Каждая карточка развертывания в режиме карточек отображает:
- Заголовок: имя, флаг региона, значок статуса, кнопки запуска/остановки/удаления
- URL конечной точки: URL, который можно скопировать, со ссылкой на документацию API
- Метрики: количество запросов (24ч), задержка P95, частота ошибок
- Проверка работоспособности: индикатор состояния в реальном времени с задержкой и ручным обновлением
- Вкладки:
Logs,CodeиPredict
Вкладка Logs показывает последние записи логов с фильтрацией по уровню критичности (Все / Ошибки). Вкладка Code показывает готовые к использованию примеры кода на Python, JavaScript и cURL с твоим актуальным URL конечной точки и API ключом. Вкладка Predict предоставляет встроенную панель предсказаний для тестирования прямо на развертывании.
Link to this sectionСтатусы развертывания#
| Статус | Описание |
|---|---|
| Создание | Развертывание настраивается |
| Развертывание | Запуск контейнера |
| Готово | Конечная точка активна и принимает запросы |
| Остановка | Конечная точка завершает работу |
| Остановлено | Конечная точка на паузе (биллинг не идет) |
| Failed | Ошибка развертывания (см. сообщение об ошибке) |
Link to this sectionURL конечной точки#
Каждая конечная точка имеет уникальный URL, например:
https://predict-abc123.run.app

Нажми кнопку копирования, чтобы скопировать URL. Нажми значок документации, чтобы посмотреть автоматически сгенерированную API документацию для этой конечной точки.
Link to this sectionУправление жизненным циклом#
Управляй состоянием своей конечной точки:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| Действие | Описание |
|---|---|
| Запуск | Возобновить работу остановленной конечной точки |
| Стоп | Приостановить работу конечной точки (биллинг не идет) |
| Delete (Удалить) | Безвозвратно удалить конечную точку |
Link to this sectionОстановить конечную точку#
Останови конечную точку, чтобы приостановить биллинг:
- Нажми значок паузы на карточке развертывания
- Статус конечной точки изменится на "Stopping", а затем на "Stopped"
Остановленные конечные точки:
- Не принимают запросы
- Не влекут расходов
- Могут быть перезапущены в любое время
Link to this sectionУдалить конечную точку#
Безвозвратно удали конечную точку:
- Нажми значок удаления (корзина) на карточке развертывания
- Подтверди удаление в диалоговом окне
Удаление происходит мгновенно и безвозвратно. Ты всегда можешь создать новую конечную точку.
Link to this sectionИспользование конечных точек#
Link to this sectionАутентификация#
Каждое развертывание создается с использованием API ключа из твоего аккаунта. Включай его в запросы:
Authorization: Bearer YOUR_API_KEYПрефикс API ключа отображается в нижней части карточки развертывания для идентификации. Генерируй ключи в разделе API Keys.
Link to this sectionОтсутствие ограничений частоты запросов#
Запросы, отправленные напрямую на URL твоей выделенной конечной точки, не подпадают под ограничения частоты запросов Platform API — пропускная способность ограничена только конфигурацией CPU, памяти и масштабирования твоей конечной точки. (Запросы, проксируемые через Platform API, например, через внутрибраузерный тестер, по-прежнему используют стандартное ограничение в 20 запросов/мин на предсказание). Это ключевое преимущество перед shared inference, где установлено ограничение в 20 запросов/мин на API ключ.
Link to this sectionПример запроса#
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Link to this sectionПараметры запроса#
| Параметр | Тип | По умолчанию | Диапазон | Описание |
|---|---|---|---|---|
file | файл | - | - | Файл изображения или видео (обязательно) |
conf | float | 0.25 | 0.01 – 1.0 | Минимальный порог достоверности |
iou | float | 0.7 | 0.0 – 0.95 | Порог NMS IoU |
imgsz | int | 640 | 32 – 1280 | Размер входного изображения в пикселях |
normalize | bool | false | - | Возвращать координаты рамки в диапазоне 0–1 |
decimals | int | 5 | 0 – 10 | Десятичная точность для значений координат |
source | string | - | - | URL изображения или строка base64 (альтернатива для file) |
Выделенные эндпоинты принимают как изображения, так и видео через параметр file.
- Форматы изображений (до 100 МБ): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- Форматы видео (до 100 МБ): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Каждый кадр видео обрабатывается отдельно, а результаты возвращаются для каждого кадра. Ты также можешь передать публичный URL-адрес изображения или изображение в кодировке base64 через параметр source вместо file.
Link to this sectionФормат ответа#
То же самое, что и общий вывод с полями, специфичными для задачи.
Link to this sectionЦенообразование#
Базовые выделенные эндпоинты бесплатны на всех тарифных планах. Конфигурации с более высокими ресурсами (больше vCPU, больше памяти, «теплый» старт) в будущем будут использовать модель ценообразования на основе фактического использования.
- Используй масштабирование до нуля (по умолчанию), чтобы эндпоинты работали только при получении запросов
- Установи соответствующие максимальные экземпляры для своего трафика
- Отслеживай использование на панели мониторинга
Link to this sectionFAQ#
Link to this sectionСколько эндпоинтов я могу создать?#
Лимиты эндпоинтов зависят от тарифного плана:
- Free: до 3 развертываний
- Pro: до 10 развертываний
- Enterprise: неограниченное количество развертываний
Каждая модель по-прежнему может быть развернута в нескольких регионах в рамках квоты твоего тарифного плана.
Link to this sectionМогу ли я изменить регион после развертывания?#
Нет, регионы фиксированы. Чтобы изменить регион:
- Удали существующий эндпоинт
- Создай новый эндпоинт в нужном регионе
Link to this sectionКак мне настроить развертывание в нескольких регионах?#
Для глобального покрытия:
- Разверни модель в нескольких регионах
- Используй балансировщик нагрузки или DNS-маршрутизацию
- Направляй пользователей к ближайшему эндпоинту
Link to this sectionКаково время «холодного» старта?#
Время «холодного» старта зависит от размера модели и от того, кэширован ли уже контейнер в этом регионе. Типичные диапазоны:
| Сценарий | Холодный старт |
|---|---|
| Кэшированный контейнер | ~5-15 секунд |
| Первое развертывание/регион | ~15-45 секунд |
Для проверки работоспособности используется тайм-аут 55 секунд, чтобы учесть «холодный» старт в худшем случае.
Link to this sectionМогу ли я использовать собственные домены?#
Собственные домены появятся в ближайшее время. В настоящее время эндпоинты используют URL-адреса, генерируемые платформой.