Развертывание
Ultralytics Platform предоставляет комплексные возможности развертывания для внедрения ваших моделей YOLO в производство. Тестируйте модели с помощью инференса на основе браузера, развертывайте на выделенных конечных точках в 43 глобальных регионах и отслеживайте производительность в реальном времени.
Обзор
Раздел «Развертывание» поможет вам:
- Тест моделей непосредственно в браузере с помощью
Predictвкладка - Развертывать на выделенных конечных точках в 43 глобальных регионах
- Мониторинг: Отслеживайте метрики запросов, журналы и проверки работоспособности.
- Масштабирование автоматически в зависимости от трафика (включая масштабирование до нуля)

Варианты развертывания
Платформа Ultralytics предлагает несколько путей развертывания:
| Вариант | Описание | Лучше всего подходит для |
|---|---|---|
| Вкладка «Предсказать» | Инференс на основе браузера с использованием изображений, веб-камеры и примеров | Разработка, валидация |
| Общий вывод | Мультитенантный сервис в 3 регионах | Неинтенсивное использование, тестирование |
| Выделенные конечные точки | Однопользовательские сервисы в 43 регионах | Производство, низкая задержка |
Рабочий процесс
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Этап | Описание |
|---|---|
| Тест | Валидировать модель с помощью Predict вкладка |
| Настроить | Выберите регион, ресурсы и имя развертывания |
| Развертывание | Создайте выделенную конечную точку из Deploy вкладка |
| Мониторинг | Отслеживайте запросы, задержку, ошибки и логи в Мониторинге |
Архитектура
Общий вывод
Общий сервис инференса работает в 3 ключевых регионах, автоматически маршрутизируя запросы на основе вашего региона данных:
graph TB
User[User Request] --> API[Platform API]
API --> Router{Region Router}
Router -->|US users| US["US Predict Service<br/>Iowa"]
Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]
style User fill:#f5f5f5,color:#333
style API fill:#2196F3,color:#fff
style Router fill:#FF9800,color:#fff
style US fill:#4CAF50,color:#fff
style EU fill:#4CAF50,color:#fff
style AP fill:#4CAF50,color:#fff
| Регион | Местоположение |
|---|---|
| США | Айова, США |
| ЕС | Бельгия, Европа |
| AP | Гонконг, Азиатско-Тихоокеанский регион |
Выделенные конечные точки
Развертывание в 43 регионах по всему миру в Ultralytics Cloud:
- Америка: 14 регионов
- Европа: 13 регионов
- Азиатско-Тихоокеанский регион: 12 регионов
- Ближний Восток и Африка: 4 региона
Каждая конечная точка представляет собой однопользовательский сервис с:
- Выделенные вычислительные ресурсы (настраиваемые CPU и память)
- Автомасштабирование (масштабирование до нуля при простое)
- Уникальный URL конечной точки
- Независимый мониторинг, логи и проверки работоспособности
Страница развертываний
Доступ к странице глобальных развертываний из боковой панели в разделе Deploy. Эта страница показывает:
- Карта мира с отметками развернутых регионов (интерактивная карта)
- Карточки обзора: Общее количество запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
- Список развертываний с тремя режимами просмотра: карточки, компактный и таблица
- Новое развертывание: кнопка для создания конечных точек из любой завершенной модели

Автоматический опрос
Страница опрашивает каждые 30 секунд для обновления метрик. Когда развертывания находятся в переходном состоянии (создание, развертывание, остановка), частота опроса увеличивается до каждых 2-3 секунд для почти мгновенной обратной связи.
Основные характеристики
Глобальное покрытие
Развертывайте ближе к вашим пользователям в 43 регионах, охватывающих:
- Северная Америка, Южная Америка
- Европа, Ближний Восток, Африка
- Азиатско-Тихоокеанский регион, Океания
Автомасштабирование
Конечные точки масштабируются автоматически:
- Масштабирование до нуля: Отсутствие затрат в режиме простоя (по умолчанию)
- Масштабирование вверх: Автоматическая обработка пиковых нагрузок
Экономия затрат
Масштабирование до нуля включено по умолчанию (минимальное количество экземпляров = 0). Вы платите только за активное время инференса.
Низкая задержка
Выделенные конечные точки обеспечивают:
- Холодный запуск: ~5-15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
- Теплый вывод: 50-200 мс (зависит от модели)
- Региональная маршрутизация для оптимальной производительности
Проверки работоспособности
Каждое запущенное развертывание включает автоматическую проверку работоспособности с:
- Индикатор состояния в реальном времени (работоспособно/неработоспособно)
- Отображение задержки ответа
- Автоматический повтор при неработоспособности (опрос каждые 20 секунд)
- Кнопка ручного обновления
Быстрый старт
Развернуть модель менее чем за 2 минуты:
- Обучите или загрузите модель в проект
- Перейдите на вкладку Развертывание модели
- Выберите регион из таблицы задержек
- Нажмите Развернуть — ваша конечная точка активна
Быстрое развертывание
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready
После развертывания используйте URL конечной точки с вашим API-ключом для отправки запросов на вывод из любого приложения.
Быстрые ссылки
- Вывод: тестирование моделей в браузере
- Конечные точки: развертывание выделенных конечных точек
- Мониторинг: Отслеживайте производительность развертывания
Часто задаваемые вопросы
В чем разница между общим и выделенным выводом?
| Функциональность | Общие | Выделенные |
|---|---|---|
| Задержка | Переменная | Стабильная |
| Стоимость | Оплата за запрос | Оплата за время работы |
| Масштаб | Ограниченные | Настраиваемые |
| Регионы | 3 | 43 |
| URL | Общие | Пользовательский |
Сколько времени занимает развертывание?
Развертывание выделенной конечной точки обычно занимает 1-2 минуты:
- Загрузка образа (~30 с)
- Запуск контейнера (~30 с)
- Проверка работоспособности (~30 с)
Могу ли я развернуть несколько моделей?
Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в соответствии с вашим тарифным планом).
Что происходит, когда конечная точка простаивает?
При включенном масштабировании до нуля:
- Конечная точка масштабируется вниз после периода бездействия
- Первый запрос вызывает холодный старт
- Последующие запросы выполняются быстро
Первые запросы после периода простоя вызывают «холодный старт».