Развертывание
Ultralytics Platform предоставляет широкие возможности развертывания для вывода твоих моделей YOLO в продакшн. Тестируй модели с помощью инференса в браузере, развертывай их на выделенных эндпоинтах в 43 регионах по всему миру и отслеживай производительность в реальном времени.
Watch: Get Started with Ultralytics Platform - Deploy
Обзор
Раздел «Развертывание» (Deployment) помогает тебе:
- Тестировать модели прямо в браузере с помощью вкладки
Predict - Развертывать на выделенных эндпоинтах в 43 регионах по всему миру
- Мониторить метрики запросов, логи и результаты проверок работоспособности
- Масштабировать до нуля при простое (сейчас развертывания запускают один активный инстанс)

Варианты развертывания
Ultralytics Platform предлагает несколько путей развертывания:
| Параметр | Описание | Лучше всего подходит для |
|---|---|---|
| Вкладка Predict | Инференс в браузере с использованием изображений, веб-камеры и примеров | Разработка, валидация |
| Общий инференс | Мультитенантный сервис в 3 регионах | Легкое использование, тестирование |
| Выделенные эндпоинты | Одиночные сервисы в 43 регионах | Продакшн, низкая задержка |
Рабочий процесс
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| Этап | Описание |
|---|---|
| Test | Проверь модель на вкладке Predict |
| Настройка | Выбери регион и имя развертывания (развертывания используют фиксированные стандартные ресурсы) |
| Развертывание | Создай выделенный эндпоинт на вкладке Deploy |
| Мониторинг | Отслеживай запросы, задержки, ошибки и логи в разделе Мониторинг |
Архитектура
Общий инференс
Сервис общего инференса работает в 3 ключевых регионах, автоматически направляя запросы в зависимости от региона твоих данных:
graph TB
User[User Request] --> API[Platform API]
API --> Router{Region Router}
Router -->|US users| US["US Predict Service<br/>Iowa"]
Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]
style User fill:#f5f5f5,color:#333
style API fill:#2196F3,color:#fff
style Router fill:#FF9800,color:#fff
style US fill:#4CAF50,color:#fff
style EU fill:#4CAF50,color:#fff
style AP fill:#4CAF50,color:#fff| Область | Расположение |
|---|---|
| США | Айова, США |
| ЕС | Бельгия, Европа |
| AP | Тайвань, Азиатско-Тихоокеанский регион |
Выделенные эндпоинты
Развертывай в 43 регионах по всему миру на Ultralytics Cloud:
- Америка: 14 регионов
- Европа: 13 регионов
- Азиатско-Тихоокеанский регион: 12 регионов
- Ближний Восток и Африка: 4 региона
Каждый эндпоинт — это отдельный сервис с:
- Стандартными ресурсами:
1 CPU,2 GiBпамяти,minInstances=0,maxInstances=1 - Масштабированием до нуля при простое
- Уникальным URL эндпоинта
- Независимым мониторингом, логами и проверками работоспособности
Страница развертываний
Переходи на глобальную страницу развертываний из бокового меню в разделе Deploy. На этой странице отображаются:
- Карта мира с отметками регионов развертывания (интерактивная карта)
- Обзорные карточки: Всего запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
- Список развертываний с тремя режимами просмотра: карточки, компактный и таблица
- Кнопка New Deployment для создания эндпоинтов из любой готовой модели

Обычно страница обновляется каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос учащается до одного раза в 3 секунды для получения более быстрой обратной связи.
Основные характеристики
Глобальное покрытие
Развертывай ближе к своим пользователям, используя 43 региона, охватывающие:
- Северную Америку, Южную Америку
- Европу, Ближний Восток, Африку
- Азиатско-Тихоокеанский регион, Океанию
Поведение при масштабировании
Эндпоинты в настоящее время ведут себя следующим образом:
- Масштабирование до нуля: отсутствие затрат при простое (по умолчанию)
- Один активный инстанс:
maxInstancesв настоящее время ограничен1на всех тарифных планах
Масштабирование до нуля включено по умолчанию (мин. инстансов = 0). Ты платишь только за время активного инференса.
Низкая задержка
Выделенные эндпоинты обеспечивают:
- Холодный старт: ~5-15 секунд (кешированный контейнер), до ~45 секунд (первое развертывание)
- Горячий инференс: 50-200 мс (зависит от модели)
- Региональная маршрутизация для оптимальной производительности
Проверки работоспособности
Каждое запущенное развертывание включает автоматическую проверку работоспособности с:
- Индикатором статуса в реальном времени (исправно/неисправно)
- Отображением задержки ответа
- Автоматической повторной попыткой при неисправности (опрос каждые 20 секунд)
- Кнопкой ручного обновления
Быстрый старт
Разверни модель менее чем за 2 минуты:
- Обучи или загрузи модель в проект
- Перейди на вкладку Deploy модели
- Выбери регион из таблицы задержек
- Нажми Deploy — твой эндпоинт готов к работе
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready
После развертывания используй URL эндпоинта со своим ключом API для отправки запросов на инференс из любого приложения.
Быстрые ссылки
- Инференс: Тестируй модели в браузере
- Эндпоинты: Развертывай выделенные эндпоинты
- Мониторинг: Отслеживай производительность развертывания
Часто задаваемые вопросы (FAQ)
В чем разница между общим и выделенным инференсом?
| Характеристика | Общий | Выделенная |
|---|---|---|
| Задержка | Переменная | Стабильная |
| Стоимость | Бесплатно (включено) | Бесплатно (базовый), оплата по мере использования (расширенный) |
| Масштаб | Ограничен | Масштабирование до нуля, один инстанс |
| Регионы | 3 | 43 |
| URL | Универсальный | Пользовательские |
| Частота | 20 зап/мин | Безлимитно |
Сколько времени занимает развертывание?
Развертывание выделенного эндпоинта обычно занимает 1-2 минуты:
- Скачивание образа (~30 с)
- Запуск контейнера (~30 с)
- Проверка работоспособности (~30 с)
Могу ли я развернуть несколько моделей?
Да, каждая модель может иметь несколько эндпоинтов в разных регионах. Количество развертываний ограничено тарифным планом: Free 3, Pro 10, Enterprise unlimited.
Что происходит, когда эндпоинт простаивает?
Если включено масштабирование до нуля:
- Эндпоинт масштабируется вниз после периода бездействия
- Первый запрос вызывает холодный старт
- Последующие запросы обрабатываются быстро
Первые запросы после периода простоя вызывают холодный старт.