Выделенные конечные точки
Ultralytics позволяет развертывать YOLO на выделенных конечных точках в 43 регионах мира. Каждая конечная точка представляет собой однопользовательский сервис с автомасштабированием, уникальным URL-адресом и независимым мониторингом.

Создать конечную точку
На вкладке «Развертывание»
Разверните модель из ее Deploy вкладка:
- Перейдите к вашей модели
- Нажмите на вкладку Deploy
- Выберите регион из таблицы регионов (отсортированной по задержке от вашего местоположения)
- Нажмите «Развернуть» в строке региона.
Имя развертывания автоматически генерируется на основе имени модели и города региона (например, yolo11n-iowa).
Со страницы «Развертывания»
Создать развертывание из глобального Deploy страница в боковой панели:
- Нажмите «Новое развертывание»
- Выберите модель из селектора моделей
- Выберите регион на карте или в таблице
- При желании настройте имя развертывания и ресурсы
- Нажмите «Развернуть модель»

Жизненный цикл развертывания
stateDiagram-v2
[*] --> Creating: Deploy
Creating --> Deploying: Container starting
Deploying --> Ready: Health check passed
Ready --> Stopping: Stop
Stopping --> Stopped: Stopped
Stopped --> Ready: Start
Ready --> [*]: Delete
Stopped --> [*]: Delete
Creating --> Failed: Error
Deploying --> Failed: Error
Failed --> [*]: Delete
Выбор региона
Выберите из 43 регионов по всему миру. Интерактивная карта регионов и таблица показывают:
- Region pins: Color-coded by latency (green < 100ms, yellow < 200ms, red > 200ms)
- Развернутые регионы: выделены значком «Развернуто»
- Развертывание регионов: анимированный индикатор импульса
- Двунаправленное выделение: при наведении курсора на карту выделяется строка таблицы и наоборот.

Таблица регионов в модели Deploy Вкладка включает:
| Столбец | Описание |
|---|---|
| Местоположение | Город и страна с флагом |
| Зона | Идентификатор региона |
| Задержка | Измеренное время пинга (медиана 3 пингов) |
| Расстояние | Расстояние от вашего местоположения в км |
| Действия | Кнопка «Развернуть» или значок статуса «Развернуто» |
Диалоговое окно «Новое развертывание»
Параметр New Deployment диалог (из глобального Deploy страница) показана более простая таблица регионов, содержащая только столбцы «Местоположение», «Задержка» и «Выбор».
Выбирайте с умом
Выберите регион, наиболее близкий к вашим пользователям, для минимальной задержки. Используйте кнопку «Повторно сканировать», чтобы повторно измерить задержку из вашего текущего местоположения.
Доступные регионы
| Зона | Местоположение |
|---|---|
| us-central1 | Айова, США |
| us-east1 | Южная Каролина, США |
| us-east4 | Северная Вирджиния, США |
| us-east5 | Колумбус, США |
| us-south1 | Даллас, США |
| us-west1 | Орегон, США |
| us-west2 | Лос-Анджелес, США |
| us-west3 | Солт-Лейк-Сити, США |
| us-west4 | Лас-Вегас, США |
| northamerica-northeast1 | Монреаль, Канада |
| northamerica-northeast2 | Торонто, Канада |
| севернаяамерика-южная1 | Керетаро, Мексика |
| southamerica-east1 | Сан-Паулу, Бразилия |
| southamerica-west1 | Сантьяго, Чили |
| Зона | Местоположение |
|---|---|
| europe-west1 | Сен-Гислен, Бельгия |
| europe-west2 | Лондон, Великобритания |
| europe-west3 | Франкфурт, Германия |
| europe-west4 | Эмсхавен, Нидерланды |
| europe-west6 | Цюрих, Швейцария |
| europe-west8 | Милан, Италия |
| europe-west9 | Париж, Франция |
| europe-west10 | Берлин, Германия |
| europe-west12 | Турин, Италия |
| europe-north1 | Хамина, Финляндия |
| европа-север2 | Стокгольм, Швеция |
| europe-central2 | Варшава, Польша |
| europe-southwest1 | Мадрид, Испания |
| Зона | Местоположение |
|---|---|
| asia-east1 | Чанхуа, Тайвань |
| asia-east2 | Коулун, Гонконг |
| asia-northeast1 | Токио, Япония |
| asia-northeast2 | Осака, Япония |
| asia-northeast3 | Сеул, Южная Корея |
| asia-south1 | Мумбаи, Индия |
| asia-south2 | Дели, Индия |
| asia-southeast1 | Джуронг-Уэст, Сингапур |
| asia-southeast2 | Джакарта, Индонезия |
| Юго-Восточная Азия3 | Бангкок, Таиланд |
| australia-southeast1 | Сидней, Австралия |
| australia-southeast2 | Мельбурн, Австралия |
| Зона | Местоположение |
|---|---|
| африка-юг1 | Йоханнесбург, Южная Африка |
| me-central1 | Доха, Катар |
| me-central2 | Даммам, Саудовская Аравия |
| me-west1 | Тель-Авив, Израиль |
Конфигурация конечной точки
Диалоговое окно «Новое развертывание»
Параметр New Deployment диалог предоставляет:
| Настройка | Описание | По умолчанию |
|---|---|---|
| Модель | Выберите из готовых моделей | - |
| Регион | Регион развертывания | - |
| Название развертывания | Автоматически сгенерированный, редактируемый | - |
| CPU | CPU (1-8) | 1 |
| Память (ГБ) | Распределение памяти (1–32 ГБ) | 2 |

Настройки ресурсов доступны в сворачиваемом разделе «Ресурсы ». По умолчанию для развертываний используется масштабирование до нуля (мин. количество экземпляров = 0, макс. количество экземпляров = 1) — вы платите только за активное время инференции.
Автоматически сгенерированные имена
Имя развертывания автоматически генерируется на основе имени модели и города региона (например, yolo11n-iowa). Если вы снова развернете ту же модель в том же регионе, будет добавлен числовой суффикс (например, yolo11n-iowa-2).
Вкладка «Развертывание» (быстрое развертывание)
При развертывании из модели Deploy На вкладке «Развертывание» конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) с включенной функцией масштабирования до нуля. Имя развертывания генерируется автоматически.
Управление конечными точками
Режимы просмотра
Список развертываний поддерживает три режима просмотра:
| Режим | Описание |
|---|---|
| Карты | Подробные карты с журналами, примерами кода, панелью прогнозирования |
| Компактный | Сетка из небольших карточек с ключевыми показателями |
| Таблица | Таблица данных с сортируемыми столбцами и поиском |

Карта развертывания (вид карт)
Каждая карта развертывания в окне просмотра карт отображает:
- Заголовок: имя, флаг региона, значок статуса, кнопки «Пуск/Стоп/Удалить»
- URL конечной точки: копируемый URL со ссылкой на документацию API
- Показатели: количество запросов (за 24 часа), задержка P95, коэффициент ошибок
- Проверка работоспособности: индикатор работоспособности в реальном времени с задержкой и ручным обновлением
- Вкладки:
Logs,CodeиPredict
Параметр Logs Вкладка «Журнал» отображает последние записи журнала с фильтрацией по степени серьезности (Все / Ошибки). Code Вкладка «Примеры кода» содержит готовые к использованию примеры кода на Python, JavaScript и cURL с вашим фактическим URL-адресом конечной точки и ключом API. Predict Вкладка «tab» предоставляет встроенную панель прогнозирования для тестирования непосредственно на развертывании.
Статусы развертывания
| Статус | Описание |
|---|---|
| Создание | Развертывание настраивается |
| Развертывание | Контейнер запускается |
| Готов | Конечная точка работает и принимает запросы |
| Остановка | Конечная точка выключается |
| Остановлен | Конечная точка приостановлена (без начисления платы) |
| Неудача | Развертывание не удалось (см. сообщение об ошибке) |
URL конечной точки
Каждая конечная точка имеет уникальный URL-адрес, например:
https://predict-abc123.run.app

Нажмите кнопку «Копировать», чтобы скопировать URL-адрес. Нажмите значок «Документы», чтобы просмотреть автоматически сгенерированную документацию API для конечной точки.
Управление жизненным циклом
Управление состоянием конечной точки:
graph LR
R[Ready] -->|Stop| S[Stopped]
S -->|Start| R
R -->|Delete| D[Deleted]
S -->|Delete| D
style R fill:#4CAF50,color:#fff
style S fill:#9E9E9E,color:#fff
style D fill:#F44336,color:#fff
| Действие | Описание |
|---|---|
| Запустить | Возобновить работу остановленной конечной точки |
| Остановить | Приостановить работу конечной точки (без тарификации) |
| Удалить | Окончательно удалить конечную точку |
Остановить конечную точку
Остановите конечную точку, чтобы приостановить тарификацию:
- Нажмите значок паузы на карте развертывания.
- Статус конечной точки меняется на «Остановка», а затем на «Остановлено».
Остановленные конечные точки:
- Не принимают запросы
- Не тарифицируются
- Может быть перезапущен в любой момент
Удалить конечную точку
Безвозвратное удаление конечной точки:
- Нажмите значок удаления (корзина) на карте развертывания.
- Подтвердите удаление в диалоговом окне
Необратимое действие
Удаление происходит немедленно и безвозвратно. Вы всегда можете создать новую конечную точку.
Использование конечных точек
Аутентификация
Каждое развертывание создается с помощью ключа API из вашей учетной записи. Включите его в запросы:
Authorization: Bearer YOUR_API_KEY
Префикс ключа API отображается в нижнем колонтитуле карты развертывания для идентификации. Сгенерируйте ключи в разделе «Ключи API».
Без ограничений по ставкам
Выделенные конечные точки не подпадают под ограничения скорости API платформы. Запросы поступают непосредственно в ваш выделенный сервис, поэтому пропускная способность ограничивается только конфигурацией CPU, памяти и масштабирования вашей конечной точки. Это ключевое преимущество по сравнению с общим выводом, скорость которого ограничена 20 запросами в минуту на один ключ API.
Пример запроса
import requests
# Deployment endpoint
url = "https://predict-abc123.run.app/predict"
# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}
# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
# Send image for inference
with open("image.jpg", "rb") as f:
response = requests.post(url, headers=headers, data=data, files={"file": f})
print(response.json())
// Build form data with image and parameters
const formData = new FormData();
formData.append("file", fileInput.files[0]);
formData.append("conf", "0.25");
formData.append("iou", "0.7");
formData.append("imgsz", "640");
// Send image for inference
const response = await fetch(
"https://predict-abc123.run.app/predict",
{
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
}
);
const result = await response.json();
console.log(result);
curl -X POST \
"https://predict-abc123.run.app/predict" \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@image.jpg" \
-F "conf=0.25" \
-F "iou=0.7" \
-F "imgsz=640"
Параметры запроса
| Параметр | Тип | По умолчанию | Описание |
|---|---|---|---|
file | файла | - | Файл изображения (обязательно) |
conf | float | 0.25 | Минимальный порог достоверности |
iou | float | 0.7 | Порог IoU для NMS |
imgsz | int | 640 | Размер входного изображения |
normalize | строка | - | Возврат нормализованных координат |
Формат ответа
Аналогично общему выводу с полями, специфичными для задачи.
Цены
Выделенные конечные точки тарифицируются на основе:
| Компонент | Тариф |
|---|---|
| CPU | За секунду vCPU |
| Память | За ГБ-секунду |
| Запросы | За миллион запросов |
Оптимизация затрат
- Используйте масштабирование до нуля для конечных точек разработки
- Установите соответствующее максимальное количество экземпляров
- Отслеживайте использование на панели мониторинга Мониторинг
- Проверьте расходы в разделе «Настройки» > «Биллинг».
Часто задаваемые вопросы
Сколько конечных точек я могу создать?
Ограничения конечных точек зависят от тарифного плана:
- Бесплатно: до 3 развертываний
- Плюс: до 10 развертываний
- Предприятие: неограниченное количество развертываний
Каждая модель по-прежнему может быть развернута в нескольких регионах в пределах квоты вашего плана.
Могу ли я изменить регион после развертывания?
Нет, регионы фиксированы. Чтобы изменить регионы:
- Удалите существующую конечную точку
- Создайте новую конечную точку в желаемом регионе
Как реализовать многорегиональное развертывание?
Для глобального охвата:
- Развертывание в нескольких регионах
- Используйте балансировщик нагрузки или маршрутизацию DNS
- Направляйте пользователей к ближайшей конечной точке
Каково время холодного старта?
Время холодного запуска зависит от размера модели и от того, кэширован ли контейнер в регионе. Типичные диапазоны:
| Сценарий | Холодный старт |
|---|---|
| Кэшированный контейнер | ~5–15 секунд |
| Первое развертывание/регион | ~15–45 секунд |
Проверка работоспособности использует 55-секундный таймаут, чтобы учесть худший случай холодного запуска.
Могу ли я использовать пользовательские домены?
Пользовательские домены скоро появятся. В настоящее время конечные точки используют URL-адреса, сгенерированные платформой.