Выделенные эндпоинты
Ultralytics Platform позволяет развертывать модели YOLO на выделенных эндпоинтах в 43 регионах мира. Каждый эндпоинт представляет собой однопользовательский сервис с возможностью масштабирования до нуля, уникальным URL и независимым мониторингом.

Создать эндпоинт
На вкладке развертывания (Deploy)
Разверни модель на вкладке Deploy:
- Перейди к своей модели
- Перейди на вкладку Deploy
- Выбери регион на интерактивной карте мира — регионы имеют цветовую кодировку в зависимости от задержки (ping) от твоего местоположения (зеленый < 100 мс, желтый < 200 мс, красный > 200 мс)
- Нажми Deploy в строке выбранного региона
Имя развертывания создается автоматически на основе названия модели и города региона (например, yolo26n-iowa).
На странице развертываний
Создай развертывание на глобальной странице Deploy в боковой панели:
- Нажми New Deployment
- Выбери модель в селекторе моделей
- Выбери регион на карте или в таблице
- Проверь автоматически созданное имя развертывания (его можно изменить) и ресурсы по умолчанию
- Нажми Deploy Model

Жизненный цикл развертывания
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: DeleteВыбор региона
Выбирай из 43 регионов по всему миру. Интерактивная карта регионов и таблица показывают:
- Метки регионов: цветовая кодировка по задержке (зеленый < 100 мс, желтый < 200 мс, красный > 200 мс)
- Развернутые регионы: отмечены значком "Deployed"
- Регионы в процессе развертывания: анимированный индикатор пульсации
- Двусторонняя подсветка: наведение курсора на карту подсвечивает строку в таблице, и наоборот

Таблица регионов на вкладке модели Deploy включает:
| Столбец | Описание |
|---|---|
| Расположение | Город и страна со значком флага |
| Зона | Идентификатор региона |
| Задержка | Измеренное время отклика (медиана по 3 пингам) |
| Расстояние | Расстояние от твоего местоположения в км |
| Действия | Кнопка развертывания или статус "Deployed" |
Диалоговое окно New Deployment (на глобальной странице Deploy) показывает упрощенную таблицу регионов только со столбцами Location, Latency и Select.
Выбери регион, ближайший к твоим пользователям, для минимальной задержки. Используй кнопку Rescan, чтобы перемерить задержку из твоего текущего местоположения.
Доступные регионы
| Зона | Расположение |
|---|---|
| us-central1 | Айова, США |
| us-east1 | Южная Каролина, США |
| us-east4 | Северная Вирджиния, США |
| us-east5 | Колумбус, США |
| us-south1 | Даллас, США |
| us-west1 | Орегон, США |
| us-west2 | Лос-Анджелес, США |
| us-west3 | Солт-Лейк-Сити, США |
| us-west4 | Лас-Вегас, США |
| northamerica-northeast1 | Монреаль, Канада |
| northamerica-northeast2 | Торонто, Канада |
| northamerica-south1 | Керетаро, Мексика |
| southamerica-east1 | Сан-Паулу, Бразилия |
| southamerica-west1 | Сантьяго, Чили |
Конфигурация эндпоинта
Диалоговое окно нового развертывания
Диалоговое окно New Deployment предоставляет:
| Настройка | Описание | По умолчанию |
|---|---|---|
| Модель | Выберите из готовых моделей | - |
| Регион | Регион развертывания | - |
| Имя развертывания | Автоматически сгенерировано, можно редактировать | - |
| Ядра CPU | Фиксированное значение по умолчанию | 1 |
| Память (ГБ) | Фиксированное значение по умолчанию | 2 |

Развертывания используют фиксированные значения по умолчанию: 1 CPU, 2 GiB памяти, minInstances = 0 и maxInstances = 1. Они масштабируются до нуля при бездействии, поэтому ты платишь только за активное время инференса.
Имя развертывания автоматически создается на основе имени модели и города региона (например, yolo26n-iowa). Если ты снова развернешь ту же модель в том же регионе, добавится числовой суффикс (например, yolo26n-iowa-2).
Вкладка Deploy (Быстрое развертывание)
При развертывании через вкладку модели Deploy эндпоинты создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.
Управление эндпоинтами
Режимы просмотра
Список развертываний поддерживает три режима просмотра:
| Режим | Описание |
|---|---|
| Карточки | Подробные карточки с логами, примерами кода и панелью предсказаний |
| Компактный | Сетка из компактных карточек с ключевыми метриками |
| Таблица | Таблица (DataTable) с сортируемыми столбцами и поиском |

Карточка развертывания (режим карточек)
Каждая карточка развертывания в режиме карточек отображает:
- Заголовок: Имя, флаг региона, индикатор статуса, кнопки запуска/остановки/удаления
- URL эндпоинта: URL, который можно скопировать, со ссылкой на документацию API
- Метрики: Количество запросов (24ч), задержка P95, уровень ошибок
- Проверка работоспособности: Индикатор состояния в реальном времени с задержкой и ручным обновлением
- Вкладки:
Logs,CodeиPredict
Вкладка Logs отображает последние записи логов с фильтрацией по уровню важности (Все / Ошибки). Вкладка Code показывает готовые примеры кода на Python, JavaScript и cURL с твоим актуальным URL эндпоинта и ключом API. Вкладка Predict предоставляет встроенную панель предсказаний для тестирования напрямую в развертывании.
Статусы развертывания
| Статус | Описание |
|---|---|
| Создание (Creating) | Развертывание настраивается |
| Развертывание (Deploying) | Контейнер запускается |
| Готов (Ready) | Эндпоинт активен и принимает запросы |
| Остановка (Stopping) | Эндпоинт выключается |
| Остановлен (Stopped) | Эндпоинт приостановлен (оплата не взимается) |
| Failed | Развертывание не удалось (см. сообщение об ошибке) |
URL эндпоинта
Каждый эндпоинт имеет уникальный URL, например:
https://predict-abc123.run.app

Нажми кнопку копирования, чтобы скопировать URL. Нажми на иконку документации, чтобы просмотреть автоматически сгенерированную API-документацию для этого эндпоинта.
Управление жизненным циклом
Управляй состоянием своего эндпоинта:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff| Действие | Описание |
|---|---|
| Запуск | Возобновить работу остановленного эндпоинта |
| Остановка | Приостановить работу эндпоинта (оплата не взимается) |
| Удалить | Безвозвратно удалить эндпоинт |
Остановка эндпоинта
Останови эндпоинт, чтобы приостановить начисления:
- Нажми иконку паузы на карточке развертывания
- Статус эндпоинта изменится на "Stopping", а затем на "Stopped"
Остановленные эндпоинты:
- Не принимают запросы
- Не влекут расходов
- Могут быть перезапущены в любое время
Удаление эндпоинта
Безвозвратное удаление эндпоинта:
- Нажми иконку удаления (корзину) на карточке развертывания
- Подтверди удаление в диалоговом окне
Удаление происходит мгновенно и является окончательным. Ты всегда можешь создать новый эндпоинт.
Использование эндпоинтов
Аутентификация
Каждое развертывание создается с использованием API-ключа из твоего аккаунта. Включай его в запросы:
Authorization: Bearer YOUR_API_KEYПрефикс API-ключа отображается в нижней части карточки развертывания для идентификации. Генерируй ключи в разделе API Keys.
Без ограничений по количеству запросов
На выделенные эндпоинты не распространяются лимиты Platform API. Запросы отправляются напрямую в твой выделенный сервис, поэтому пропускная способность ограничивается только конфигурацией CPU, памяти и масштабированием твоего эндпоинта. Это ключевое преимущество перед общим инференсом, где действует ограничение в 20 запросов/мин на каждый API ключ.
Пример запроса
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())Параметры запроса
| Параметр | Тип | По умолчанию | Диапазон | Описание |
|---|---|---|---|---|
file | файл | - | - | Файл изображения или видео (обязательно) |
conf | число с плавающей точкой | 0.25 | 0.01 – 1.0 | Минимальный порог уверенности |
iou | число с плавающей точкой | 0.7 | 0.0 – 0.95 | Порог NMS IoU |
imgsz | int | 640 | 32 – 1280 | Размер входного изображения в пикселях |
normalize | bool | false | - | Возвращать координаты ограничивающей рамки в диапазоне от 0 до 1 |
decimals | int | 5 | 0 – 10 | Точность знаков после запятой для значений координат |
source | строка | - | - | URL изображения или строка base64 (альтернатива file) |
Выделенные эндпоинты принимают как изображения, так и видео через параметр file.
- Форматы изображений (до 50 МБ): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
- Форматы видео (до 100 МБ): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV
Каждый кадр видео обрабатывается отдельно, и результаты возвращаются для каждого кадра. Ты также можешь передать публичный URL изображения или изображение в формате base64 через параметр source вместо file.
Формат ответа
Тот же, что и при общем инференсе, с добавлением полей, специфичных для конкретной задачи.
Ценообразование
Базовые выделенные эндпоинты бесплатны на всех тарифах. Конфигурации с более высокими ресурсами (больше vCPU, больше памяти, «теплый» запуск) в будущем будут использовать модель оплаты по мере использования.
- Используй масштабирование до нуля (по умолчанию), чтобы эндпоинты работали только во время получения запросов
- Устанавливай подходящее максимальное количество экземпляров для твоего трафика
- Отслеживай использование на панели мониторинга
Часто задаваемые вопросы (FAQ)
Сколько эндпоинтов я могу создать?
Лимиты эндпоинтов зависят от тарифа:
- Free: до 3 развертываний
- Pro: до 10 развертываний
- Enterprise: неограниченное количество развертываний
Каждая модель по-прежнему может быть развернута в нескольких регионах в рамках квоты твоего тарифа.
Могу ли я изменить регион после развертывания?
Нет, регионы фиксированы. Чтобы изменить регион:
- Удали существующий эндпоинт
- Создай новый эндпоинт в нужном регионе
Как настроить развертывание в нескольких регионах?
Для глобального охвата:
- Разверни модель в нескольких регионах
- Используй балансировщик нагрузки или DNS-маршрутизацию
- Направляй пользователей к ближайшему эндпоинту
Какое время «холодного» старта?
Время «холодного» старта зависит от размера модели и от того, кэширован ли контейнер в данном регионе. Типичные диапазоны:
| Сценарий | Холодный старт |
|---|---|
| Кэшированный контейнер | ~5-15 секунд |
| Первое развертывание/регион | ~15-45 секунд |
Проверка работоспособности использует тайм-аут 55 секунд, чтобы учесть самые медленные случаи «холодного» старта.
Могу ли я использовать пользовательские домены?
Пользовательские домены появятся в ближайшее время. В данный момент эндпоинты используют URL, сгенерированные платформой.