Link to this sectionРазвертывание#
Ultralytics Platform предоставляет комплексные варианты развертывания для запуска твоих моделей YOLO в продакшн. Тестируй модели с помощью браузерного вывода, развертывай на выделенных эндпоинтах в 43 регионах мира и отслеживай производительность в режиме реального времени.
Watch: Get Started with Ultralytics Platform - Deploy
Link to this sectionОбзор#
Раздел «Развертывание» помогает тебе:
- Тестировать модели прямо в браузере на вкладке
Predict - Развертывать их на выделенных эндпоинтах в 43 регионах мира
- Отслеживать метрики запросов, логи и проверки состояния
- Масштабировать до нуля при простое (развертывания в настоящее время работают как один активный инстанс)

Link to this sectionВарианты развертывания#
Ultralytics Platform предлагает несколько путей развертывания:
| Опция | Описание | Лучший выбор для |
|---|---|---|
| Вкладка Predict | Браузерный вывод с использованием изображений, веб-камеры и примеров | Разработка, валидация |
| Общий вывод (Shared Inference) | Мультитенантный сервис в 3 регионах | Легкое использование, тестирование |
| Выделенные эндпоинты | Сервисы с одним клиентом в 43 регионах | Продакшн, низкая задержка |
Link to this sectionРабочий процесс#
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| Этап | Описание |
|---|---|
| Test | Валидируй модель с помощью вкладки Predict |
| Настройка | Выбери регион и имя развертывания (развертывания используют фиксированные стандартные ресурсы) |
| Развертывание | Создай выделенный эндпоинт на вкладке Deploy |
| Мониторинг | Отслеживай запросы, задержку, ошибки и логи в разделе Мониторинг |
Link to this sectionАрхитектура#
Link to this sectionОбщий вывод#
Сервис общего вывода работает в 3 ключевых регионах, автоматически направляя запросы в зависимости от региона твоих данных:
graph TB
User[User Request] --> API[Platform API]
API --> Router{Region Router}
Router -->|US users| US["US Predict Service<br/>Iowa"]
Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]
style User fill:#f5f5f5,color:#333
style API fill:#2196F3,color:#fff
style Router fill:#FF9800,color:#fff
style US fill:#4CAF50,color:#fff
style EU fill:#4CAF50,color:#fff
style AP fill:#4CAF50,color:#fff| Регион | Расположение |
|---|---|
| США | Айова, США |
| ЕС | Бельгия, Европа |
| Азиатско-Тихоокеанский регион | Тайвань, Азиатско-Тихоокеанский регион |
Link to this sectionВыделенные эндпоинты#
Развертывай в 43 регионах по всему миру в облаке Ultralytics Cloud:
- Америка: 14 регионов
- Европа: 13 регионов
- Азиатско-Тихоокеанский регион: 12 регионов
- Ближний Восток и Африка: 4 региона
Каждый эндпоинт — это сервис с одним клиентом, имеющий:
- Стандартные ресурсы:
1 CPU,2 GiBоперативной памяти,minInstances=0,maxInstances=1 - Масштабирование до нуля при простое
- Уникальный URL эндпоинта
- Независимый мониторинг, логи и проверки состояния
Link to this sectionСтраница развертываний#
Получи доступ к странице глобальных развертываний из боковой панели в разделе Deploy. На этой странице отображаются:
- Карта мира с метками развернутых регионов (интерактивная карта)
- Обзорные карточки: Всего запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
- Список развертываний с тремя режимами отображения: карточки, компактный и таблица
- Кнопка Новое развертывание для создания эндпоинтов из любой завершенной модели

Обычно страница опрашивается каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос увеличивается до одного раза в 3 секунды для получения более быстрой обратной связи.
Link to this sectionКлючевые особенности#
Link to this sectionГлобальное покрытие#
Развертывай рядом со своими пользователями в 43 регионах, охватывающих:
- Северную Америку, Южную Америку
- Европу, Ближний Восток, Африку
- Азиатско-Тихоокеанский регион, Океанию
Link to this sectionПоведение при масштабировании#
Эндпоинты в настоящее время ведут себя следующим образом:
- Масштабирование до нуля: Отсутствие затрат при простое (по умолчанию)
- Один активный инстанс: параметр
maxInstancesв настоящее время ограничен значением1на всех тарифных планах
Масштабирование до нуля включено по умолчанию (минимум инстансов = 0). Ты платишь только за время активного вывода.
Link to this sectionНизкая задержка#
Выделенные эндпоинты обеспечивают:
- Холодный запуск: ~5-15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
- Теплый вывод: 50-200 мс (зависит от модели)
- Региональная маршрутизация для оптимальной производительности
Link to this sectionПроверки состояния#
Каждое работающее развертывание включает автоматическую проверку состояния с:
- Индикатором статуса в реальном времени (исправно/неисправно)
- Отображением задержки отклика
- Автоматической повторной попыткой при неисправности (опрос каждые 20 секунд)
- Кнопкой ручного обновления
Link to this sectionБыстрый старт#
Разверни модель менее чем за 2 минуты:
- Обучи или загрузи модель в проект
- Перейди на вкладку Deploy модели
- Выбери регион из таблицы задержек
- Нажми Deploy — твой эндпоинт запущен
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready
После развертывания используй URL эндпоинта со своим ключом API, чтобы отправлять запросы на вывод из любого приложения.
Link to this sectionБыстрые ссылки#
- Вывод: Тестируй модели в браузере
- Эндпоинты: Развертывай выделенные эндпоинты
- Мониторинг: Отслеживай производительность развертывания
Link to this sectionFAQ#
Link to this sectionВ чем разница между общим и выделенным выводом?#
| Функция | Общий | Выделенный |
|---|---|---|
| Задержка | Переменная | Стабильная |
| Стоимость | Бесплатно (включено) | Бесплатно (базовый), оплата по использованию (расширенный) |
| Масштаб | Ограничен | Масштабирование до нуля, один инстанс |
| Регионы | 3 | 43 |
| URL | Общий | Пользовательский |
| Частота | 20 зап./мин | 20 зап./мин через Platform; без ограничений по прямому URL эндпоинта |
Link to this sectionСколько времени занимает развертывание?#
Развертывание выделенного эндпоинта обычно занимает 1-2 минуты:
- Извлечение образа (~30 с)
- Запуск контейнера (~30 с)
- Проверка работоспособности (~30 с)
Link to this sectionМогу ли я развернуть несколько моделей?#
Да, каждая модель может иметь несколько эндпоинтов в разных регионах. Количество развертываний ограничено тарифным планом: Free 3, Pro 10, Enterprise unlimited.
Link to this sectionЧто происходит, когда эндпоинт простаивает?#
Если включено масштабирование до нуля:
- Эндпоинт сворачивается после периода неактивности
- Первый запрос инициирует холодный старт
- Последующие запросы выполняются быстро
Первые запросы после периода простоя инициируют холодный старт.