Meet YOLO26: next-gen vision AI.

Link to this sectionВыделенные эндпоинты#

Ultralytics Platform позволяет развертывать модели YOLO на выделенных эндпоинтах в 43 регионах по всему миру. Каждый эндпоинт представляет собой однопользовательский сервис с возможностью масштабирования до нуля, уникальным URL-адресом и независимым мониторингом.

Вкладка развертывания модели на Ultralytics Platform с картой регионов и таблицей

Link to this sectionСоздать эндпоинт#

Link to this sectionИз вкладки Deploy#

Разверни модель на вкладке Deploy:

  1. Перейди к своей модели
  2. Нажми на вкладку Deploy
  3. Выбери регион на интерактивной карте мира — регионы окрашены в цвета в зависимости от задержки (latency) от твоего местоположения по градиенту от зеленого к красному (чем быстрее регион, тем он зеленее; чем медленнее, тем краснее)
  4. Нажми Deploy в строке выбранного региона

Имя развертывания генерируется автоматически на основе названия модели и города региона (например, yolo26n-iowa).

Link to this sectionСо страницы Deployments#

Создай развертывание на глобальной странице Deploy в боковой панели:

  1. Нажми New Deployment
  2. Выбери модель из селектора моделей
  3. Выбери регион на карте или в таблице
  4. Проверь автоматически сгенерированное имя развертывания (его можно изменить) и ресурсы по умолчанию
  5. Нажми Deploy Model

Диалоговое окно нового развертывания на Ultralytics Platform с селектором моделей и картой регионов

Link to this sectionЖизненный цикл развертывания#

stateDiagram-v2
    [*] --> Creating: Deploy
    Creating --> Deploying: Container starting
    Deploying --> Ready: Health check passed
    Ready --> Stopping: Stop
    Stopping --> Stopped: Stopped
    Stopped --> Ready: Start
    Ready --> [*]: Delete
    Stopped --> [*]: Delete
    Creating --> Failed: Error
    Deploying --> Failed: Error
    Failed --> [*]: Delete

Link to this sectionВыбор региона#

Выбирай из 43 регионов по всему миру. Интерактивная карта и таблица регионов отображают:

  • Маркеры регионов: цветовая кодировка по задержке на градиенте от зеленого к красному (быстрее — зеленее, медленнее — краснее)
  • Развернутые регионы: выделены значком "Deployed"
  • Регионы в процессе развертывания: анимированный индикатор пульсации
  • Двусторонняя подсветка: наведение курсора на карту подсвечивает строку в таблице, и наоборот

Таблица задержек регионов на вкладке Deploy в Ultralytics Platform, отсортированная по задержке

Таблица регионов на вкладке Deploy для модели включает:

СтолбецОписание
LocationГород и страна со значком флага
ZoneИдентификатор региона
ЗадержкаИзмеренное время пинга (медиана из 3 попыток)
DistanceРасстояние от твоего местоположения в км
ActionsКнопка Deploy или статус "Deployed"
Диалоговое окно нового развертывания

Диалоговое окно New Deployment (со страницы глобального Deploy) показывает упрощенную таблицу регионов только с колонками Location, Latency и Select.

Выбирай с умом

Выбери регион, который находится ближе всего к твоим пользователям, для минимизации задержки. Используй кнопку Rescan, чтобы заново измерить задержку из твоего текущего местоположения.

Link to this sectionДоступные регионы#

ZoneРасположение
us-central1Айова, США
us-east1Южная Каролина, США
us-east4Северная Вирджиния, США
us-east5Колумбус, США
us-south1Даллас, США
us-west1Орегон, США
us-west2Лос-Анджелес, США
us-west3Солт-Лейк-Сити, США
us-west4Лас-Вегас, США
northamerica-northeast1Монреаль, Канада
northamerica-northeast2Торонто, Канада
northamerica-south1Керетаро, Мексика
southamerica-east1Сан-Паулу, Бразилия
southamerica-west1Сантьяго, Чили

Link to this sectionКонфигурация конечной точки#

Link to this sectionДиалоговое окно нового развертывания#

Диалоговое окно New Deployment предоставляет следующее:

НастройкаОписаниеПо умолчанию
МодельВыбор из завершенных моделей-
РегионРегион развертывания-
Имя развертыванияАвтоматически сгенерировано, можно редактировать-
Ядра CPUФиксированное значение по умолчанию1
Память (ГБ)Фиксированное значение по умолчанию2

Ultralytics Platform New Deployment Dialog Resources Panel Expanded

Развертывания используют фиксированные значения по умолчанию: 1 CPU, 2 GiB оперативной памяти, minInstances = 0 и maxInstances = 1. Они масштабируются до нуля в режиме простоя, поэтому ты платишь только за активное время инференса.

Автоматически сгенерированные имена

Имя развертывания автоматически создается на основе названия модели и города региона (например, yolo26n-iowa). Если ты снова развернешь ту же модель в том же регионе, добавится числовой суффикс (например, yolo26n-iowa-2).

Link to this sectionВкладка Deploy (быстрое развертывание)#

При развертывании через вкладку Deploy модели конечные точки создаются с ресурсами по умолчанию (1 CPU, 2 ГБ памяти) и включенным масштабированием до нуля. Имя развертывания генерируется автоматически.

Link to this sectionУправление конечными точками#

Link to this sectionРежимы отображения#

Список развертываний поддерживает три режима просмотра:

РежимОписание
CardsКарточки с полной информацией, логами, примерами кода и панелью предсказаний
CompactСетка из небольших карточек с ключевыми метриками
TableТаблица с сортируемыми столбцами и поиском

Ultralytics Platform Deploy Tab Active Deployments Cards View

Link to this sectionКарточка развертывания (режим карточек)#

Каждая карточка развертывания в режиме карточек отображает:

  • Заголовок: имя, флаг региона, значок статуса, кнопки запуска/остановки/удаления
  • URL конечной точки: URL, который можно скопировать, со ссылкой на документацию API
  • Метрики: количество запросов (24ч), задержка P95, частота ошибок
  • Проверка работоспособности: индикатор состояния в реальном времени с задержкой и ручным обновлением
  • Вкладки: Logs, Code и Predict

Вкладка Logs показывает последние записи логов с фильтрацией по уровню критичности (Все / Ошибки). Вкладка Code показывает готовые к использованию примеры кода на Python, JavaScript и cURL с твоим актуальным URL конечной точки и API ключом. Вкладка Predict предоставляет встроенную панель предсказаний для тестирования прямо на развертывании.

Link to this sectionСтатусы развертывания#

СтатусОписание
СозданиеРазвертывание настраивается
РазвертываниеЗапуск контейнера
ГотовоКонечная точка активна и принимает запросы
ОстановкаКонечная точка завершает работу
ОстановленоКонечная точка на паузе (биллинг не идет)
FailedОшибка развертывания (см. сообщение об ошибке)

Link to this sectionURL конечной точки#

Каждая конечная точка имеет уникальный URL, например:

https://predict-abc123.run.app

Ultralytics Platform Deployment Card Endpoint Url With Copy Button

Нажми кнопку копирования, чтобы скопировать URL. Нажми значок документации, чтобы посмотреть автоматически сгенерированную API документацию для этой конечной точки.

Link to this sectionУправление жизненным циклом#

Управляй состоянием своей конечной точки:

graph LR
    R[Ready] -->|Stop| S[Stopped]
    S -->|Start| R
    R -->|Delete| D[Deleted]
    S -->|Delete| D

    style R fill:#4CAF50,color:#fff
    style S fill:#9E9E9E,color:#fff
    style D fill:#F44336,color:#fff
ДействиеОписание
ЗапускВозобновить работу остановленной конечной точки
СтопПриостановить работу конечной точки (биллинг не идет)
Delete (Удалить)Безвозвратно удалить конечную точку

Link to this sectionОстановить конечную точку#

Останови конечную точку, чтобы приостановить биллинг:

  1. Нажми значок паузы на карточке развертывания
  2. Статус конечной точки изменится на "Stopping", а затем на "Stopped"

Остановленные конечные точки:

  • Не принимают запросы
  • Не влекут расходов
  • Могут быть перезапущены в любое время

Link to this sectionУдалить конечную точку#

Безвозвратно удали конечную точку:

  1. Нажми значок удаления (корзина) на карточке развертывания
  2. Подтверди удаление в диалоговом окне
Необратимое действие

Удаление происходит мгновенно и безвозвратно. Ты всегда можешь создать новую конечную точку.

Link to this sectionИспользование конечных точек#

Link to this sectionАутентификация#

Каждое развертывание создается с использованием API ключа из твоего аккаунта. Включай его в запросы:

Authorization: Bearer YOUR_API_KEY

Префикс API ключа отображается в нижней части карточки развертывания для идентификации. Генерируй ключи в разделе API Keys.

Link to this sectionОтсутствие ограничений частоты запросов#

Запросы, отправленные напрямую на URL твоей выделенной конечной точки, не подпадают под ограничения частоты запросов Platform API — пропускная способность ограничена только конфигурацией CPU, памяти и масштабирования твоей конечной точки. (Запросы, проксируемые через Platform API, например, через внутрибраузерный тестер, по-прежнему используют стандартное ограничение в 20 запросов/мин на предсказание). Это ключевое преимущество перед shared inference, где установлено ограничение в 20 запросов/мин на API ключ.

Link to this sectionПример запроса#

import requests

# Deployment endpoint
url = "https://predict-abc123.run.app/predict"

# Headers with your deployment API key
headers = {"Authorization": "Bearer YOUR_API_KEY"}

# Inference parameters
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}

# Send image for inference
with open("image.jpg", "rb") as f:
    response = requests.post(url, headers=headers, data=data, files={"file": f})

print(response.json())

Link to this sectionПараметры запроса#

ПараметрТипПо умолчаниюДиапазонОписание
fileфайл--Файл изображения или видео (обязательно)
conffloat0.250.01 – 1.0Минимальный порог достоверности
ioufloat0.70.0 – 0.95Порог NMS IoU
imgszint64032 – 1280Размер входного изображения в пикселях
normalizeboolfalse-Возвращать координаты рамки в диапазоне 0–1
decimalsint50 – 10Десятичная точность для значений координат
sourcestring--URL изображения или строка base64 (альтернатива для file)
Видео-вывод

Выделенные эндпоинты принимают как изображения, так и видео через параметр file.

  • Форматы изображений (до 100 МБ): AVIF, BMP, DNG, HEIC, JP2, JPEG, JPG, MPO, PNG, TIF, TIFF, WEBP
  • Форматы видео (до 100 МБ): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV

Каждый кадр видео обрабатывается отдельно, а результаты возвращаются для каждого кадра. Ты также можешь передать публичный URL-адрес изображения или изображение в кодировке base64 через параметр source вместо file.

Link to this sectionФормат ответа#

То же самое, что и общий вывод с полями, специфичными для задачи.

Link to this sectionЦенообразование#

Базовые выделенные эндпоинты бесплатны на всех тарифных планах. Конфигурации с более высокими ресурсами (больше vCPU, больше памяти, «теплый» старт) в будущем будут использовать модель ценообразования на основе фактического использования.

Оптимизация затрат
  • Используй масштабирование до нуля (по умолчанию), чтобы эндпоинты работали только при получении запросов
  • Установи соответствующие максимальные экземпляры для своего трафика
  • Отслеживай использование на панели мониторинга

Link to this sectionFAQ#

Link to this sectionСколько эндпоинтов я могу создать?#

Лимиты эндпоинтов зависят от тарифного плана:

  • Free: до 3 развертываний
  • Pro: до 10 развертываний
  • Enterprise: неограниченное количество развертываний

Каждая модель по-прежнему может быть развернута в нескольких регионах в рамках квоты твоего тарифного плана.

Link to this sectionМогу ли я изменить регион после развертывания?#

Нет, регионы фиксированы. Чтобы изменить регион:

  1. Удали существующий эндпоинт
  2. Создай новый эндпоинт в нужном регионе

Link to this sectionКак мне настроить развертывание в нескольких регионах?#

Для глобального покрытия:

  1. Разверни модель в нескольких регионах
  2. Используй балансировщик нагрузки или DNS-маршрутизацию
  3. Направляй пользователей к ближайшему эндпоинту

Link to this sectionКаково время «холодного» старта?#

Время «холодного» старта зависит от размера модели и от того, кэширован ли уже контейнер в этом регионе. Типичные диапазоны:

СценарийХолодный старт
Кэшированный контейнер~5-15 секунд
Первое развертывание/регион~15-45 секунд

Для проверки работоспособности используется тайм-аут 55 секунд, чтобы учесть «холодный» старт в худшем случае.

Link to this sectionМогу ли я использовать собственные домены?#

Собственные домены появятся в ближайшее время. В настоящее время эндпоинты используют URL-адреса, генерируемые платформой.

Комментарии