Link to this sectionРазвертывание#

Q: В чем разница между общим и выделенным выводом?

| Функция | Общий | Выделенный | | ------------- | -------------------- | -------------------------------------------------------------------- | | Задержка | Переменная | Стабильная | | Стоимость | Бесплатно (включено) | Бесплатно (базовый), оплата по использованию (расширенный) | | Масштаб | Ограничен | Масштабирование до нуля, один инстанс | | Регионы | 3 | 42 | | URL | Общий | Пользовательская | | Частота | 20 зап./мин | 20 зап./мин через Platform; без ограничений по прямому URL эндпоинта |

Ultralytics Platform предоставляет комплексные опции развертывания моделей для запуска твоих моделей YOLO в продакшн. Тестируй модели с помощью инференса в браузере, развертывай их на выделенных эндпоинтах в 42 регионах по всему миру и отслеживай производительность в режиме реального времени.

Watch: Get Started with Ultralytics Platform - Deploy

Link to this sectionОбзор#

Раздел «Развертывание» помогает тебе:

Тестировать модели прямо в браузере на вкладке Predict
Развертывай на выделенных эндпоинтах в 42 глобальных регионах
Отслеживать метрики запросов, логи и проверки состояния
Масштабировать до нуля при простое (развертывания в настоящее время работают как один активный инстанс)

Карта мира на странице развертывания Ultralytics Platform с обзорными карточками

Link to this sectionВарианты развертывания#

Ultralytics Platform предлагает несколько путей развертывания:

Опция	Описание	Лучший выбор для
Вкладка Predict	Браузерный вывод с использованием изображений, веб-камеры и примеров	Разработка, валидация
Общий вывод (Shared Inference)	Мультитенантный сервис в 3 регионах	Легкое использование, тестирование
Выделенные эндпоинты	Однопользовательские сервисы в 42 регионах	Продакшн, низкая задержка

Link to this sectionРабочий процесс#

graph LR
    A[✅ Test]:::start --> B[⚙️ Configure]:::proc
    B --> C[🌐 Deploy]:::proc
    C --> D[📊 Monitor]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Этап	Описание
Test	Валидируй модель с помощью вкладки `Predict`
Настройка	Выбери регион и имя развертывания (развертывания используют фиксированные стандартные ресурсы)
Развертывание	Создай выделенный эндпоинт на вкладке `Deploy`
Мониторинг	Отслеживай запросы, задержку, ошибки и логи в разделе Мониторинг

Link to this sectionАрхитектура#

Link to this sectionОбщий вывод#

Сервис общего вывода работает в 3 ключевых регионах, автоматически направляя запросы в зависимости от региона твоих данных:

graph TB
    User[User Request]:::start --> API[Platform API]:::proc
    API --> Router{Region Router}:::decide
    Router -->|US users| US["US Predict Service<br/>Iowa"]:::out
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]:::out
    Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef decide fill:#FF9800,color:#fff
    classDef out fill:#9C27B0,color:#fff

Регион	Расположение
США	Айова, США
ЕС	Бельгия, Европа
Азиатско-Тихоокеанский регион	Тайвань, Азиатско-Тихоокеанский регион

Link to this sectionВыделенные эндпоинты#

Развертывай в 42 регионах по всему миру в Ultralytics Cloud:

Америка: 14 регионов
Европа: 13 регионов
Азиатско-Тихоокеанский регион: 12 регионов
Ближний Восток и Африка: 3 региона

Каждый эндпоинт — это сервис с одним клиентом, имеющий:

Стандартные ресурсы: 1 CPU, 2 GiB оперативной памяти, minInstances=0, maxInstances=1
Масштабирование до нуля при простое
Уникальный URL эндпоинта
Независимый мониторинг, логи и проверки состояния

Link to this sectionСтраница развертываний#

Получи доступ к странице глобальных развертываний из боковой панели в разделе Deploy. На этой странице отображаются:

Карта мира с метками развернутых регионов (интерактивная карта)
Обзорные карточки: Всего запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
Список развертываний с тремя режимами отображения: карточки, компактный и таблица
Кнопка Новое развертывание для создания эндпоинтов из любой завершенной модели

Обзорные карточки и список развертываний на странице развертывания Ultralytics Platform

Автоматический опрос

Обычно страница опрашивается каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос увеличивается до одного раза в 3 секунды для получения более быстрой обратной связи.

Link to this sectionКлючевые особенности#

Link to this sectionГлобальное покрытие#

Развертывай рядом со своими пользователями, используя 42 региона, охватывающих:

Северную Америку, Южную Америку
Европу, Ближний Восток, Африку
Азиатско-Тихоокеанский регион, Океанию

Link to this sectionПоведение при масштабировании#

Эндпоинты в настоящее время ведут себя следующим образом:

Масштабирование до нуля: Отсутствие затрат при простое (по умолчанию)
Один активный инстанс: параметр maxInstances в настоящее время ограничен значением 1 на всех тарифных планах

Экономия затрат

Масштабирование до нуля включено по умолчанию (минимум инстансов = 0). Ты платишь только за время активного вывода.

Link to this sectionНизкая задержка#

Выделенные эндпоинты обеспечивают:

Холодный запуск: ~5-15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
Теплый вывод: 50-200 мс (зависит от модели)
Региональная маршрутизация для оптимальной производительности

Link to this sectionПроверки состояния#

Каждое работающее развертывание включает автоматическую проверку состояния с:

Индикатором статуса в реальном времени (исправно/неисправно)
Отображением задержки отклика
Автоматической повторной попыткой при неисправности (опрос каждые 20 секунд)
Кнопкой ручного обновления

Link to this sectionБыстрый старт#

Разверни модель менее чем за 2 минуты:

Обучи или загрузи модель в проект
Перейди на вкладку Deploy модели
Выбери регион из таблицы задержек
Нажми Deploy — твой эндпоинт запущен

Быстрое развертывание

Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

После развертывания используй URL эндпоинта со своим ключом API, чтобы отправлять запросы на вывод из любого приложения.

Link to this sectionБыстрые ссылки#

Вывод: Тестируй модели в браузере
Эндпоинты: Развертывай выделенные эндпоинты
Мониторинг: Отслеживай производительность развертывания

Link to this sectionFAQ#

Link to this sectionВ чем разница между общим и выделенным выводом?#

Функция	Общий	Выделенный
Задержка	Переменная	Стабильная
Стоимость	Бесплатно (включено)	Бесплатно (базовый), оплата по использованию (расширенный)
Масштаб	Ограничен	Масштабирование до нуля, один инстанс
Регионы	3	42
URL	Общий	Пользовательская
Частота	20 зап./мин	20 зап./мин через Platform; без ограничений по прямому URL эндпоинта

Link to this sectionСколько времени занимает развертывание?#

Развертывание выделенного эндпоинта обычно занимает 1-2 минуты:

Извлечение образа (~30 с)
Запуск контейнера (~30 с)
Проверка работоспособности (~30 с)

Link to this sectionМогу ли я развернуть несколько моделей?#

Да, каждая модель может иметь несколько эндпоинтов в разных регионах. Количество развертываний ограничено тарифным планом: Free 3, Pro 10, Enterprise unlimited.

Link to this sectionЧто происходит, когда эндпоинт простаивает?#

Если включено масштабирование до нуля:

Эндпоинт сворачивается после периода неактивности
Первый запрос инициирует холодный старт
Последующие запросы выполняются быстро

Первые запросы после периода простоя инициируют холодный старт.

Участники

GLglenn-jocher¹⁵ RAraimbekovm¹ RIRizwanMunawar¹ SEsergiuwaxmann¹

Создано 14 янв. 2026 г.Обновлено 7 часов назад