Перейти к содержанию

Развертывание

Ultralytics предоставляет комплексные возможности развертывания для внедрения ваших YOLO в производство. Тестируйте модели с помощью API-интерфейса вывода, развертывайте их на выделенных конечных точках и отслеживайте производительность в режиме реального времени.

Обзор

Раздел «Развертывание» поможет вам:

  • Тестируйте модели прямо в браузере
  • Развертывание на выделенных конечных точках в 43 регионах мира
  • Мониторинг метрик запросов и журналов
  • Автоматическое масштабирование в зависимости от трафика

Варианты развертывания

Ultralytics предлагает несколько вариантов развертывания:

ВариантОписаниеЛучше всего подходит для
Вкладка «Тест»Тестирование вывода на основе браузераРазработка, валидация
Общий APIСлужба многопользовательского выводаЛегкое использование, тестирование
Выделенные конечные точкиПроизводственные услуги для одного клиентаПроизводство, низкая задержка

Рабочий процесс

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
ТестПроверить модель с помощью образцов изображений
НастроитьВыберите регион и параметры масштабирования
РазвернутьСоздать выделенную конечную точку
МониторОтслеживание запросов, задержек и ошибок

Архитектура

Совместное заключение

Служба совместного вывода работает в 3 ключевых регионах:

РегионМестоположение
СШАЦентральная часть США (Айова)
ЕСЗападный ЕС (Бельгия)
APАзиатско-Тихоокеанский регион (Гонконг)

Запросы автоматически направляются в ваш регион данных.

Выделенные конечные точки

Развертывание в 43 регионах по всему миру:

  • Америка: 15 регионов
  • Европа: 12 регионов
  • Азиатско-Тихоокеанский регион: 16 регионов

Каждая конечная точка представляет собой однопользовательский сервис со следующими характеристиками:

  • Выделенные вычислительные ресурсы
  • Автоматическое масштабирование (0–N экземпляров)
  • Пользовательский URL
  • Независимый мониторинг

Основные характеристики

Глобальное покрытие

Размещайте свои ресурсы ближе к пользователям с помощью 43 регионов, охватывающих:

  • Северная Америка, Южная Америка
  • Европа, Ближний Восток, Африка
  • Азиатско-Тихоокеанский регион, Океания

Автоматическое масштабирование

Конечные точки масштабируются автоматически:

  • Масштабирование до нуля: отсутствие затрат в режиме простоя
  • Масштабирование: обработка пиковых нагрузок
  • Настраиваемые ограничения: установка минимального/максимального количества экземпляров

Низкая задержка

Специализированные конечные точки обеспечивают:

  • Холодный запуск: ~2–5 секунд
  • Теплый вывод: 50–200 мс (зависит от модели)
  • Региональная маршрутизация для оптимальной производительности

Часто задаваемые вопросы

В чем разница между общим и выделенным выводом?

ФункциональностьОбщийСпециализированный
ЗадержкаПеременнаяПоследовательный
СтоимостьОплата за запросОплата за время безотказной работы
МасштабОграниченныйНастраиваемый
Регионы343
URLОбщийПользовательский

Сколько времени занимает развертывание?

Развертывание выделенного конечного устройства обычно занимает 1–2 минуты:

  1. Извлечение изображения (~30 с)
  2. Запуск контейнера (~30 с)
  3. Проверка работоспособности (~30 с)

Могу ли я развернуть несколько моделей?

Да, каждая модель может иметь несколько конечных точек в разных регионах. Общее количество конечных точек не ограничено (в зависимости от вашего тарифного плана).

Что происходит, когда конечная точка находится в режиме ожидания?

При включенной функции «Масштабирование до нуля»:

  • Конечная точка уменьшается после бездействия
  • Первый запрос запускает холодный запуск
  • Последующие запросы выполняются быстро

Чтобы избежать холодного запуска, установите минимальное количество экземпляров > 0.



📅 Создано 0 дней назад ✏️ Обновлено 0 дней назад
glenn-jocher

Комментарии