Развертывание
Ultralytics предоставляет комплексные возможности развертывания для внедрения ваших YOLO в производство. Тестируйте модели с помощью браузерного вывода, развертывайте их на выделенных конечных точках в 43 регионах мира и отслеживайте производительность в режиме реального времени.
Обзор
Раздел «Развертывание» поможет вам:
- Тест модели непосредственно в браузере с помощью
Predictвкладка - Развертывать на выделенных конечных точках в 43 глобальных регионах
- Мониторинг метрик запросов, журналов и проверок работоспособности
- Автоматическое масштабирование в зависимости от трафика (включая масштабирование до нуля)

Варианты развертывания
Платформа Ultralytics предлагает несколько путей развертывания:
| Вариант | Описание | Лучше всего подходит для |
|---|---|---|
| Вкладка «Прогноз» | Вывод на основе браузера с использованием изображений, веб-камеры и примеров | Разработка, валидация |
| Общий вывод | Мульти-тенантный сервис в 3 регионах | Неинтенсивное использование, тестирование |
| Выделенные конечные точки | Услуги для одного арендатора в 43 регионах | Производство, низкая задержка |
Рабочий процесс
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Этап | Описание |
|---|---|
| Тест | Проверить модель с помощью Predict вкладка |
| Настроить | Выберите регион, ресурсы и название развертывания |
| Развертывание | Создайте специальную конечную точку из Deploy вкладка |
| Мониторинг | Отслеживание запросов, задержек, ошибок и журналов в Мониторинге |
Архитектура
Общий вывод
Служба совместного вывода работает в 3 ключевых регионах, автоматически маршрутизируя запросы в зависимости от региона хранения ваших данных:
graph TB
User[User Request] --> API[Platform API]
API --> Router{Region Router}
Router -->|US users| US["US Predict Service<br/>Iowa"]
Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
Router -->|AP users| AP["AP Predict Service<br/>Hong Kong"]
style User fill:#f5f5f5,color:#333
style API fill:#2196F3,color:#fff
style Router fill:#FF9800,color:#fff
style US fill:#4CAF50,color:#fff
style EU fill:#4CAF50,color:#fff
style AP fill:#4CAF50,color:#fff
| Регион | Местоположение |
|---|---|
| США | Айова, США |
| ЕС | Бельгия, Европа |
| AP | Гонконг, Азиатско-Тихоокеанский регион |
Выделенные конечные точки
Разверните в 43 регионах по всему миру на Ultralytics :
- Америка: 14 регионов
- Европа: 13 регионов
- Азиатско-Тихоокеанский регион: 12 регионов
- Ближний Восток и Африка: 4 региона
Каждая конечная точка представляет собой однопользовательский сервис с:
- Выделенные вычислительные ресурсы (настраиваемый CPU память)
- Автоматическое масштабирование (масштабирование до нуля в режиме простоя)
- Уникальный URL конечной точки
- Независимый мониторинг, журналы и проверки работоспособности
Страница развертываний
Перейдите на страницу глобальных развертываний из боковой панели под Deploy. На этой странице показано:
- Карта мира с отмеченными регионами (интерактивная карта)
- Обзорные карты: общее количество запросов (24 часа), активные развертывания, частота ошибок (24 часа), задержка P95 (24 часа)
- Список развертываний с тремя режимами просмотра: карточки, компактный и таблица
- Новая кнопка «Развертывание» для создания конечных точек из любой завершенной модели

Автоматический опрос
Страница опрашивается каждые 30 секунд для обновления метрик. Когда развертывания находятся в переходном состоянии (создание, развертывание, остановка), опрос увеличивается до каждых 2-3 секунд для получения практически мгновенной обратной связи.
Основные характеристики
Глобальное покрытие
Развертывайте ближе к вашим пользователям в 43 регионах, охватывающих:
- Северная Америка, Южная Америка
- Европа, Ближний Восток, Африка
- Азиатско-Тихоокеанский регион, Океания
Автомасштабирование
Конечные точки масштабируются автоматически:
- Масштабирование до нуля: без затрат в режиме простоя (по умолчанию)
- Масштабирование: автоматическая обработка пиковых нагрузок
Экономия затрат
По умолчанию включена функция «Масштабирование до нуля» (мин. количество экземпляров = 0). Вы платите только за время активного вывода.
Низкая задержка
Выделенные конечные точки обеспечивают:
- Холодный запуск: ~5–15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
- Теплый вывод: 50-200 мс (зависит от модели)
- Региональная маршрутизация для оптимальной производительности
Проверка здоровья
Каждое развертывание включает автоматическую проверку работоспособности с помощью:
- Индикатор рабочего состояния (исправен/неисправен)
- Отображение задержки отклика
- Автоматическая повторная попытка при неисправности (опрос каждые 20 секунд)
- Кнопка ручного обновления
Быстрый старт
Разверните модель менее чем за 2 минуты:
- Обучить или загрузить модель в проект
- Перейдите на вкладку «Развертывание» модели.
- Выберите регион из таблицы задержек
- Нажмите «Развернуть» — ваша конечная точка запущена.
Быстрое развертывание
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready
После развертывания используйте URL-адрес конечной точки с вашим ключом API для отправки запросов на вывод из любого приложения.
Быстрые ссылки
- Вывод: тестирование моделей в браузере
- Конечные точки: развертывание выделенных конечных точек
- Мониторинг: Отслеживайте производительность развертывания
Часто задаваемые вопросы
В чем разница между общим и выделенным выводом?
| Функциональность | Общие | Выделенные |
|---|---|---|
| Задержка | Переменная | Стабильная |
| Стоимость | Оплата за запрос | Оплата за время работы |
| Масштаб | Ограниченные | Настраиваемые |
| Регионы | 3 | 43 |
| URL | Общие | Пользовательский |
Сколько времени занимает развертывание?
Развертывание выделенной конечной точки обычно занимает 1-2 минуты:
- Загрузка образа (~30 с)
- Запуск контейнера (~30 с)
- Проверка работоспособности (~30 с)
Могу ли я развернуть несколько моделей?
Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в соответствии с вашим тарифным планом).
Что происходит, когда конечная точка простаивает?
При включенном масштабировании до нуля:
- Конечная точка масштабируется вниз после периода бездействия
- Первый запрос вызывает холодный старт
- Последующие запросы выполняются быстро
Первые запросы после периода бездействия запускают холодный запуск.