Meet YOLO26: next-gen vision AI.

Link to this sectionРазвертывание#

Ultralytics Platform предоставляет комплексные варианты развертывания для запуска твоих моделей YOLO в продакшн. Тестируй модели с помощью браузерного вывода, развертывай на выделенных эндпоинтах в 43 регионах мира и отслеживай производительность в режиме реального времени.



Watch: Get Started with Ultralytics Platform - Deploy

Link to this sectionОбзор#

Раздел «Развертывание» помогает тебе:

  • Тестировать модели прямо в браузере на вкладке Predict
  • Развертывать их на выделенных эндпоинтах в 43 регионах мира
  • Отслеживать метрики запросов, логи и проверки состояния
  • Масштабировать до нуля при простое (развертывания в настоящее время работают как один активный инстанс)

Карта мира на странице развертывания Ultralytics Platform с обзорными карточками

Link to this sectionВарианты развертывания#

Ultralytics Platform предлагает несколько путей развертывания:

ОпцияОписаниеЛучший выбор для
Вкладка PredictБраузерный вывод с использованием изображений, веб-камеры и примеровРазработка, валидация
Общий вывод (Shared Inference)Мультитенантный сервис в 3 регионахЛегкое использование, тестирование
Выделенные эндпоинтыСервисы с одним клиентом в 43 регионахПродакшн, низкая задержка

Link to this sectionРабочий процесс#

graph LR
    A[✅ Test] --> B[⚙️ Configure]
    B --> C[🌐 Deploy]
    C --> D[📊 Monitor]

    style A fill:#4CAF50,color:#fff
    style B fill:#2196F3,color:#fff
    style C fill:#FF9800,color:#fff
    style D fill:#9C27B0,color:#fff
ЭтапОписание
TestВалидируй модель с помощью вкладки Predict
НастройкаВыбери регион и имя развертывания (развертывания используют фиксированные стандартные ресурсы)
РазвертываниеСоздай выделенный эндпоинт на вкладке Deploy
МониторингОтслеживай запросы, задержку, ошибки и логи в разделе Мониторинг

Link to this sectionАрхитектура#

Link to this sectionОбщий вывод#

Сервис общего вывода работает в 3 ключевых регионах, автоматически направляя запросы в зависимости от региона твоих данных:

graph TB
    User[User Request] --> API[Platform API]
    API --> Router{Region Router}
    Router -->|US users| US["US Predict Service<br/>Iowa"]
    Router -->|EU users| EU["EU Predict Service<br/>Belgium"]
    Router -->|AP users| AP["AP Predict Service<br/>Taiwan"]

    style User fill:#f5f5f5,color:#333
    style API fill:#2196F3,color:#fff
    style Router fill:#FF9800,color:#fff
    style US fill:#4CAF50,color:#fff
    style EU fill:#4CAF50,color:#fff
    style AP fill:#4CAF50,color:#fff
РегионРасположение
СШААйова, США
ЕСБельгия, Европа
Азиатско-Тихоокеанский регионТайвань, Азиатско-Тихоокеанский регион

Link to this sectionВыделенные эндпоинты#

Развертывай в 43 регионах по всему миру в облаке Ultralytics Cloud:

  • Америка: 14 регионов
  • Европа: 13 регионов
  • Азиатско-Тихоокеанский регион: 12 регионов
  • Ближний Восток и Африка: 4 региона

Каждый эндпоинт — это сервис с одним клиентом, имеющий:

  • Стандартные ресурсы: 1 CPU, 2 GiB оперативной памяти, minInstances=0, maxInstances=1
  • Масштабирование до нуля при простое
  • Уникальный URL эндпоинта
  • Независимый мониторинг, логи и проверки состояния

Link to this sectionСтраница развертываний#

Получи доступ к странице глобальных развертываний из боковой панели в разделе Deploy. На этой странице отображаются:

  • Карта мира с метками развернутых регионов (интерактивная карта)
  • Обзорные карточки: Всего запросов (24ч), Активные развертывания, Частота ошибок (24ч), Задержка P95 (24ч)
  • Список развертываний с тремя режимами отображения: карточки, компактный и таблица
  • Кнопка Новое развертывание для создания эндпоинтов из любой завершенной модели

Обзорные карточки и список развертываний на странице развертывания Ultralytics Platform

Автоматический опрос

Обычно страница опрашивается каждые 15 секунд. Когда развертывания находятся в переходном состоянии (creating, deploying или stopping), опрос увеличивается до одного раза в 3 секунды для получения более быстрой обратной связи.

Link to this sectionКлючевые особенности#

Link to this sectionГлобальное покрытие#

Развертывай рядом со своими пользователями в 43 регионах, охватывающих:

  • Северную Америку, Южную Америку
  • Европу, Ближний Восток, Африку
  • Азиатско-Тихоокеанский регион, Океанию

Link to this sectionПоведение при масштабировании#

Эндпоинты в настоящее время ведут себя следующим образом:

  • Масштабирование до нуля: Отсутствие затрат при простое (по умолчанию)
  • Один активный инстанс: параметр maxInstances в настоящее время ограничен значением 1 на всех тарифных планах
Экономия затрат

Масштабирование до нуля включено по умолчанию (минимум инстансов = 0). Ты платишь только за время активного вывода.

Link to this sectionНизкая задержка#

Выделенные эндпоинты обеспечивают:

  • Холодный запуск: ~5-15 секунд (кэшированный контейнер), до ~45 секунд (первое развертывание)
  • Теплый вывод: 50-200 мс (зависит от модели)
  • Региональная маршрутизация для оптимальной производительности

Link to this sectionПроверки состояния#

Каждое работающее развертывание включает автоматическую проверку состояния с:

  • Индикатором статуса в реальном времени (исправно/неисправно)
  • Отображением задержки отклика
  • Автоматической повторной попыткой при неисправности (опрос каждые 20 секунд)
  • Кнопкой ручного обновления

Link to this sectionБыстрый старт#

Разверни модель менее чем за 2 минуты:

  1. Обучи или загрузи модель в проект
  2. Перейди на вкладку Deploy модели
  3. Выбери регион из таблицы задержек
  4. Нажми Deploy — твой эндпоинт запущен
Быстрое развертывание
Model → Deploy tab → Select region → Click Deploy → Endpoint URL ready

После развертывания используй URL эндпоинта со своим ключом API, чтобы отправлять запросы на вывод из любого приложения.

Link to this sectionБыстрые ссылки#

  • Вывод: Тестируй модели в браузере
  • Эндпоинты: Развертывай выделенные эндпоинты
  • Мониторинг: Отслеживай производительность развертывания

Link to this sectionFAQ#

Link to this sectionВ чем разница между общим и выделенным выводом?#

ФункцияОбщийВыделенный
ЗадержкаПеременнаяСтабильная
СтоимостьБесплатно (включено)Бесплатно (базовый), оплата по использованию (расширенный)
МасштабОграниченМасштабирование до нуля, один инстанс
Регионы343
URLОбщийПользовательский
Частота20 зап./мин20 зап./мин через Platform; без ограничений по прямому URL эндпоинта

Link to this sectionСколько времени занимает развертывание?#

Развертывание выделенного эндпоинта обычно занимает 1-2 минуты:

  1. Извлечение образа (~30 с)
  2. Запуск контейнера (~30 с)
  3. Проверка работоспособности (~30 с)

Link to this sectionМогу ли я развернуть несколько моделей?#

Да, каждая модель может иметь несколько эндпоинтов в разных регионах. Количество развертываний ограничено тарифным планом: Free 3, Pro 10, Enterprise unlimited.

Link to this sectionЧто происходит, когда эндпоинт простаивает?#

Если включено масштабирование до нуля:

  • Эндпоинт сворачивается после периода неактивности
  • Первый запрос инициирует холодный старт
  • Последующие запросы выполняются быстро

Первые запросы после периода простоя инициируют холодный старт.

Комментарии