Выделенные конечные точки
Платформа Ultralytics обеспечивает развертывание моделей YOLO на выделенные конечные точки в 43 регионах мира. Каждая конечная точка представляет собой однопользовательский сервис с автомасштабированием, уникальным URL-адресом конечной точки и независимым мониторингом.

Создать конечную точку
Из вкладки "Развертывание"
Развернуть модель из ее Deploy вкладка:
- Перейдите к вашей модели
- Нажмите на вкладку Deploy
- Выберите регион из таблицы регионов (отсортировано по задержке от вашего местоположения)
- Нажмите Развернуть в строке региона
Имя развертывания генерируется автоматически из имени модели и города региона (например, yolo11n-iowa).
Со страницы "Развертывания"
Создайте развертывание из глобального Deploy страница на боковой панели:
- Нажмите Новое развертывание
- Выберите модель из селектора моделей
- Выберите регион с карты или из таблицы
- Опционально настройте имя развертывания и ресурсы
- Нажмите Развернуть модель

Жизненный цикл развертывания
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
Выбор региона
Выбирайте из 43 регионов по всему миру. Интерактивная карта регионов и таблица показывают:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- Развернутые регионы: Отмечены значком «Развернуто»
- Развертываемые регионы: Анимированный индикатор пульсации
- Двунаправленное выделение: Наведение курсора на карту выделяет строку таблицы, и наоборот.

Таблица регионов по модели Deploy вкладка включает:
| Столбец | Описание |
|---|---|
| Местоположение | Город и страна со значком флага |
| Зона | Идентификатор региона |
| Задержка | Измеренное время пинга (медиана из 3 пингов) |
| Расстояние | Расстояние от вашего местоположения в км |
| Действия | Кнопка развертывания или значок статуса "Развернуто" |
Новое диалоговое окно развертывания
Параметр New Deployment диалог (из глобального Deploy странице) показана более простая таблица регионов только со столбцами «Местоположение», «Задержка» и «Выбрать».
Выбирайте с умом
Выберите регион, ближайший к вашим пользователям, для минимальной задержки. Используйте кнопку Rescan, чтобы повторно измерить задержку из вашего текущего местоположения.
Доступные регионы
| Зона | Местоположение |
|---|---|
| us-central1 | Айова, США |
| us-east1 | Южная Каролина, США |
| us-east4 | Северная Вирджиния, США |
| us-east5 | Колумбус, США |
| us-south1 | Даллас, США |
| us-west1 | Орегон, США |
| us-west2 | Лос-Анджелес, США |
| us-west3 | Солт-Лейк-Сити, США |
| us-west4 | Лас-Вегас, США |
| northamerica-northeast1 | Монреаль, Канада |
| northamerica-northeast2 | Торонто, Канада |
| northamerica-south1 | Керетаро, Мексика |
| southamerica-east1 | Сан-Паулу, Бразилия |
| southamerica-west1 | Сантьяго, Чили |
| Зона | Местоположение |
|---|---|
| europe-west1 | Сент-Гислен, Бельгия |
| europe-west2 | Лондон, Великобритания |
| europe-west3 | Франкфурт, Германия |
| europe-west4 | Эмсхавен, Нидерланды |
| europe-west6 | Цюрих, Швейцария |
| europe-west8 | Милан, Италия |
| europe-west9 | Париж, Франция |
| europe-west10 | Берлин, Германия |
| europe-west12 | Турин, Италия |
| europe-north1 | Хамина, Финляндия |
| europe-north2 | Стокгольм, Швеция |
| europe-central2 | Варшава, Польша |
| europe-southwest1 | Мадрид, Испания |
| Зона | Местоположение |
|---|---|
| asia-east1 | Чжанхуа, Тайвань |
| asia-east2 | Коулун, Гонконг |
| asia-northeast1 | Токио, Япония |
| asia-northeast2 | Осака, Япония |
| asia-northeast3 | Сеул, Южная Корея |
| asia-south1 | Мумбаи, Индия |
| asia-south2 | Дели, Индия |
| asia-southeast1 | Джуронг-Уэст, Сингапур |
| asia-southeast2 | Джакарта, Индонезия |
| asia-southeast3 | Бангкок, Таиланд |
| australia-southeast1 | Сидней, Австралия |
| australia-southeast2 | Мельбурн, Австралия |
| Зона | Местоположение |
|---|---|
| africa-south1 | Йоханнесбург, Южная Африка |
| me-central1 | Доха, Катар |
| me-central2 | Даммам, Саудовская Аравия |
| me-west1 | Тель-Авив, Израиль |
Конфигурация конечной точки
Новое диалоговое окно развертывания
Параметр New Deployment диалог предоставляет:
| Настройка | Описание | По умолчанию |
|---|---|---|
| Модель | Выберите из завершенных моделей | - |
| Регион | Регион развертывания | - |
| Имя развертывания | Автоматически сгенерировано, редактируемо | - |
| Ядра CPU | Выделение CPU (1-8) | 1 |
| Память (ГБ) | Выделение памяти (1-32 ГБ) | 2 |

Настройки ресурсов доступны в раскрывающемся разделе Ресурсы. Развертывания по умолчанию используют масштабирование до нуля (минимальное количество экземпляров = 0, максимальное количество экземпляров = 1) — вы платите только за активное время инференса.
Автоматически сгенерированные имена
Имя развертывания автоматически генерируется из имени модели и города региона (например, yolo11n-iowa). Если вы снова развертываете ту же модель в том же регионе, добавляется числовой суффикс (например, yolo11n-iowa-2).
Вкладка "Развертывание" (Быстрое развертывание)
При развертывании из модели Deploy вкладке конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.
Управление конечными точками
Режимы просмотра
Список развертываний поддерживает три режима просмотра:
| Режим | Описание |
|---|---|
| Карточки | Подробные карточки с логами, примерами кода, панелью прогнозирования |
| Компактный | Сетка небольших карточек с ключевыми метриками |
| Таблица | Таблица данных с сортируемыми столбцами и поиском |

Карточка развертывания (Представление карточек)
Каждая карточка развертывания в режиме карточек показывает:
- Заголовок: Имя, флаг региона, значок статуса, кнопки запуска/остановки/удаления
- URL конечной точки: Копируемый URL со ссылкой на документацию API
- Метрики: Количество запросов (24 часа), задержка P95, частота ошибок
- Проверка работоспособности: Индикатор состояния в реальном времени с отображением задержки и ручным обновлением
- Вкладки:
Logs,CodeиPredict
Параметр Logs вкладка показывает недавние записи журнала с фильтрацией по уровню серьезности (Все / Ошибки). Эта Code вкладка показывает готовые к использованию примеры кода на Python, JavaScript и cURL с вашим фактическим URL-адресом конечной точки и ключом API. Эта Predict вкладка предоставляет встроенную панель прогнозирования для тестирования непосредственно на развертывании.
Статусы развертывания
| Статус | Описание |
|---|---|
| Создание | Развертывание настраивается |
| Развертывание | Контейнер запускается |
| Готово | Конечная точка активна и принимает запросы |
| Остановка | Конечная точка завершает работу |
| Остановлено | Конечная точка приостановлена (без списания средств) |
| Неудачно | Развертывание не удалось (см. сообщение об ошибке) |
URL конечной точки
Каждая конечная точка имеет уникальный URL-адрес, например:
https://predict-abc123.run.app

Нажмите кнопку копирования, чтобы скопировать URL-адрес. Нажмите значок документации, чтобы просмотреть автоматически сгенерированную документацию API для конечной точки.
Управление жизненным циклом
Управление состоянием конечной точки:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| Действие | Описание |
|---|---|
| Запустить | Возобновить работу остановленной конечной точки |
| Остановить | Приостановить работу конечной точки (без тарификации) |
| Удалить | Окончательно удалить конечную точку |
Остановить конечную точку
Остановите конечную точку, чтобы приостановить тарификацию:
- Нажмите значок паузы на карточке развертывания.
- Статус конечной точки меняется на "Останавливается", затем "Остановлена"
Остановленные конечные точки:
- Не принимают запросы
- Не тарифицируются
- Может быть перезапущен в любой момент
Удалить конечную точку
Безвозвратное удаление конечной точки:
- Нажмите значок удаления (корзины) на карточке развертывания.
- Подтвердите удаление в диалоговом окне
Необратимое действие
Удаление происходит немедленно и безвозвратно. Вы всегда можете создать новую конечную точку.
Использование конечных точек
Аутентификация
Каждое развертывание создается с использованием ключа API из вашей учетной записи. Включите его в запросы:
Authorization: Bearer YOUR_API_KEY
Префикс ключа API отображается в нижней части карточки развертывания для идентификации. Сгенерируйте ключи на странице API Keys.
Без ограничений по частоте запросов
Выделенные конечные точки не подпадают под ограничения скорости Platform API. Запросы направляются непосредственно в ваш выделенный сервис, поэтому пропускная способность ограничена только CPU, памятью и конфигурацией масштабирования вашей конечной точки. Это ключевое преимущество перед общим выводом, который ограничен 20 запросами/мин на каждый ключ API.
Пример запроса
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Параметры запроса
| Параметр | Тип | По умолчанию | Описание |
|---|---|---|---|
file | файла | - | Файл изображения (обязательно) |
conf | float | 0.25 | Минимальный порог достоверности |
iou | float | 0.7 | Порог IoU для NMS |
imgsz | int | 640 | Размер входного изображения |
normalize | строка | - | Вернуть нормализованные координаты |
Формат ответа
Аналогично общему выводу с полями, специфичными для задачи.
Цены
Выделенные конечные точки тарифицируются на основе:
| Компонент | Тариф |
|---|---|
| CPU | За секунду vCPU |
| Память | За ГБ-секунду |
| Запросы | За миллион запросов |
Оптимизация затрат
- Используйте масштабирование до нуля для конечных точек разработки
- Установите соответствующее максимальное количество экземпляров
- Отслеживайте использование на панели мониторинга Мониторинг
- Просмотрите расходы в Настройки > Оплата
Часто задаваемые вопросы
Сколько конечных точек я могу создать?
Лимиты конечных точек зависят от тарифа:
- Бесплатно: До 3 развертываний
- Про: До 10 развертываний
- Корпоративный: Неограниченное количество развертываний
Каждая модель по-прежнему может быть развернута в нескольких регионах в пределах квоты вашего плана.
Могу ли я изменить регион после развертывания?
Нет, регионы фиксированы. Чтобы изменить регионы:
- Удалите существующую конечную точку
- Создайте новую конечную точку в желаемом регионе
Как реализовать многорегиональное развертывание?
Для глобального охвата:
- Развертывание в нескольких регионах
- Используйте балансировщик нагрузки или маршрутизацию DNS
- Направляйте пользователей к ближайшей конечной точке
Каково время холодного старта?
Время холодного запуска зависит от размера модели и от того, кэширован ли контейнер уже в регионе. Типичные диапазоны:
| Сценарий | Холодный старт |
|---|---|
| Кэшированный контейнер | ~5-15 секунд |
| Первое развертывание/регион | ~15-45 секунд |
Проверка работоспособности использует тайм-аут в 55 секунд для учета холодных запусков в наихудшем сценарии.
Могу ли я использовать пользовательские домены?
Пользовательские домены скоро появятся. В настоящее время конечные точки используют URL-адреса, сгенерированные платформой.