Развертывание
Платформа Ultralytics предоставляет комплексные варианты развертывания для внедрения ваших моделей YOLO в производство. Тестируйте модели с помощью Inference API, развертывайте на выделенных конечных точках и отслеживайте производительность в реальном времени.
Обзор
Раздел «Развертывание» поможет вам:
- Тестировать модели непосредственно в браузере
- Развертывать на выделенных конечных точках в 43 глобальных регионах
- Отслеживать метрики запросов и журналы
- Масштабировать автоматически в зависимости от трафика
Варианты развертывания
Платформа Ultralytics предлагает несколько путей развертывания:
| Вариант | Описание | Лучше всего подходит для |
|---|---|---|
| Вкладка «Тест» | Браузерное тестирование вывода | Разработка, валидация |
| Общий API | Многопользовательский сервис вывода | Неинтенсивное использование, тестирование |
| Выделенные конечные точки | Однопользовательские производственные сервисы | Производство, низкая задержка |
Рабочий процесс
graph LR
A[✅ Test] --> B[⚙️ Configure]
B --> C[🌐 Deploy]
C --> D[📊 Monitor]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff
| Этап | Описание |
|---|---|
| Тест | Проверка модели с помощью sample_images |
| Настроить | Выбор региона и параметров масштабирования |
| Развертывание | Создание выделенной конечной точки |
| Мониторинг | track запросов, задержки и ошибок |
Архитектура
Общий вывод
Общий сервис вывода работает в 3 ключевых регионах:
| Регион | Местоположение |
|---|---|
| США | Айова, США |
| ЕС | Бельгия, Европа |
| AP | Тайвань, Азиатско-Тихоокеанский регион |
Запросы автоматически направляются в ваш регион данных.
Выделенные конечные точки
Развертывание в 43 регионах по всему миру:
- Америка: 15 регионов
- Европа: 12 регионов
- Азиатско-Тихоокеанский регион: 16 регионов
Каждая конечная точка представляет собой однопользовательский сервис с:
- Выделенные вычислительные ресурсы
- Автомасштабирование (от 0 до N экземпляров)
- Пользовательский URL
- Независимый мониторинг
Основные характеристики
Глобальное покрытие
Развертывайте ближе к вашим пользователям в 43 регионах, охватывающих:
- Северная Америка, Южная Америка
- Европа, Ближний Восток, Африка
- Азиатско-Тихоокеанский регион, Океания
Автомасштабирование
Конечные точки масштабируются автоматически:
- Масштабирование до нуля: без затрат в режиме простоя
- Масштабирование вверх: обработка пиковых нагрузок
- Настраиваемые лимиты: установка мин./макс. количества экземпляров
Низкая задержка
Выделенные конечные точки обеспечивают:
- Холодный старт: ~2-5 секунд
- Теплый вывод: 50-200 мс (зависит от модели)
- Региональная маршрутизация для оптимальной производительности
Быстрые ссылки
- Вывод: тестирование моделей в браузере
- Конечные точки: развертывание выделенных конечных точек
- Мониторинг: Отслеживайте производительность развертывания
Часто задаваемые вопросы
В чем разница между общим и выделенным выводом?
| Функциональность | Общие | Выделенные |
|---|---|---|
| Задержка | Переменная | Стабильная |
| Стоимость | Оплата за запрос | Оплата за время работы |
| Масштаб | Ограниченные | Настраиваемые |
| Регионы | 3 | 43 |
| URL | Общие | Пользовательский |
Сколько времени занимает развертывание?
Развертывание выделенной конечной точки обычно занимает 1-2 минуты:
- Загрузка образа (~30 с)
- Запуск контейнера (~30 с)
- Проверка работоспособности (~30 с)
Могу ли я развернуть несколько моделей?
Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в соответствии с вашим тарифным планом).
Что происходит, когда конечная точка простаивает?
При включенном масштабировании до нуля:
- Конечная точка масштабируется вниз после периода бездействия
- Первый запрос вызывает холодный старт
- Последующие запросы выполняются быстро
Чтобы избежать холодных стартов, установите минимальное количество экземпляров > 0.