Link to this sectionInference#
Ultralytics Platform предоставляет API для вывода (инференса) для тестирования обученных моделей. Используй вкладку Predict в браузере для быстрой проверки или REST API для программного доступа.

Link to this sectionВкладка Предсказание (Predict)#
У каждой модели есть вкладка Predict для вывода в браузере:
- Перейди к своей модели
- Нажми на вкладку Predict
- Загрузи изображение, воспользуйся примером или включи веб-камеру
- Смотри предсказания мгновенно с наложенными рамками объектов

Link to this sectionМетоды ввода#
Панель прогнозирования поддерживает несколько методов ввода:
| Метод | Описание |
|---|---|
| Загрузка изображения | Перетащи файл или кликни, чтобы загрузить изображение |
| Примеры изображений | Нажми на встроенные примеры (изображения из набора данных или стандартные) |
| Захват с веб-камеры | Прямая трансляция с камеры с захватом отдельных кадров |
graph LR
A[Upload Image] --> D[Auto-Inference]
B[Example Image] --> D
C[Webcam Capture] --> D
D --> E[Results + Overlays]
style D fill:#2196F3,color:#fff
style E fill:#4CAF50,color:#fffLink to this sectionЗагрузить изображение#
Перетащи или нажми для загрузки:
- Поддерживаемые форматы: JPEG, PNG, WebP, AVIF, HEIC, JP2, TIFF, BMP, DNG, MPO
- Максимальный размер: 10 МБ
- Автоматический инференс: Результаты появляются автоматически после загрузки
Панель прогнозирования автоматически запускает инференс, когда ты загружаешь изображение, выбираешь пример или захватываешь кадр с веб-камеры. Нажимать кнопку не нужно.
Link to this sectionПримеры изображений#
На панели прогнозирования отображаются примеры изображений из связанного набора данных твоей модели. Если набор данных не связан, используются стандартные примеры:
| Изображение | Контент |
|---|---|
bus.jpg | Уличная сцена с транспортными средствами |
zidane.jpg | Спортивная сцена с людьми |
Для моделей OBB вместо них отображаются снимки с воздуха, на которых запечатлены лодки и аэропорты.
Примеры изображений предварительно загружаются при открытии страницы, поэтому клик по примеру запускает инференс практически мгновенно, без ожидания скачивания.
Link to this sectionВеб-камера#
Нажми на карточку веб-камеры, чтобы запустить трансляцию:
- Предоставь разрешение на использование камеры, когда появится запрос
- Нажми на предварительный просмотр видео, чтобы захватить кадр
- Инференс автоматически запустится для захваченного кадра
- Нажми еще раз, чтобы перезапустить веб-камеру
Link to this sectionПросмотр результатов#
Результаты инференса отображают:
- Bounding boxes (граничные рамки) с метками классов в виде наложения SVG
- Оценки достоверности для каждого обнаружения
- Цвета классов из цветовой палитры твоего набора данных (или стандартной палитры Ultralytics)
- Разбивка по времени: Время предобработки, инференса, постобработки и работы сети

На панели результатов отображается:
| Поле | Описание |
|---|---|
| Список обнаружений | Каждое обнаружение с названием класса и уверенностью |
| Статистика скорости | Предобработка, инференс, постобработка, сеть (мс) |
| JSON-ответ | Необработанный API-ответ в блоке кода |
Link to this sectionПараметры инференса#
Настраивай поведение обнаружения с помощью параметров в раскрывающемся разделе Parameters:

| Параметр | Диапазон | По умолчанию | Описание |
|---|---|---|---|
| Уверенность (Confidence) | 0.01 – 1.0 | 0.25 | Минимальный порог достоверности |
| IoU | 0.0 – 0.95 | 0.7 | Порог NMS IoU |
| Размер изображения | 320, 640, 1280 (переключатель в UI) | 640 | Размер входного изображения (API принимает любое значение от 32 до 1280) |
Изменение любого параметра автоматически перезапускает инференс на текущем изображении с задержкой в 500 мс. Повторно загружать не нужно.
Link to this sectionПорог достоверности (Confidence Threshold)#
Фильтрация предсказаний по уверенности:
- Выше (0.5+): Меньше предсказаний, но они более точные
- Ниже (0.1-0.25): Больше предсказаний, возможен шум
- По умолчанию (0.25): Сбалансировано для большинства случаев использования
Link to this sectionПорог IoU#
Управление Non-Maximum Suppression (NMS):
- Выше (0.7+): Разрешить больше пересекающихся рамок
- Ниже (0.3-0.5): Более агрессивное объединение близко расположенных обнаружений
- По умолчанию (0.7): Сбалансированное поведение NMS для большинства случаев использования
Link to this sectionИнференс развертывания (Deployment Predict)#
Каждая запущенная выделенная конечная точка включает вкладку Predict прямо на карточке развертывания. Она использует сервис инференса самого развертывания, а не общий сервис прогнозирования, что позволяет тестировать развернутую конечную точку из браузера.
Link to this sectionREST API#
Программный доступ к инференсу:
Link to this sectionАутентификация#
Включай свой API-ключ в запросы:
Authorization: Bearer YOUR_API_KEYЧтобы запускать инференс из своих скриптов, блокнотов или приложений, укажи API-ключ. Сгенерируй его в разделе Settings > API Keys.
Link to this sectionЭндпоинт#
POST https://platform.ultralytics.com/api/models/{modelId}/predictLink to this sectionЗапрос#
import requests
url = "https://platform.ultralytics.com/api/models/MODEL_ID/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
files = {"file": open("image.jpg", "rb")}
data = {"conf": 0.25, "iou": 0.7, "imgsz": 640}
response = requests.post(url, headers=headers, files=files, data=data)
print(response.json())
Link to this sectionПараметры запроса#
| Параметр | Тип | По умолчанию | Диапазон | Описание |
|---|---|---|---|---|
file | файл | - | - | Файл изображения или видео (обязательно, если не задан параметр source) |
conf | float | 0.25 | 0.01 – 1.0 | Минимальный порог достоверности |
iou | float | 0.7 | 0.0 – 0.95 | Порог NMS IoU |
imgsz | int | 640 | 32 – 1280 | Размер входного изображения в пикселях |
normalize | bool | false | - | Возвращать координаты рамки в диапазоне 0–1 |
decimals | int | 5 | 0 – 10 | Десятичная точность для значений координат |
source | string | - | - | URL изображения или строка base64 (альтернатива для file) |
Link to this sectionОтвет#
{
"images": [
{
"shape": [1080, 1920],
"results": [
{
"class": 0,
"name": "person",
"confidence": 0.92,
"box": { "x1": 100, "y1": 50, "x2": 300, "y2": 400 }
},
{
"class": 2,
"name": "car",
"confidence": 0.87,
"box": { "x1": 400, "y1": 200, "x2": 600, "y2": 350 }
}
],
"speed": {
"preprocess": 1.2,
"inference": 12.5,
"postprocess": 2.3
}
}
],
"metadata": {
"imageCount": 1,
"functionTimeCall": 0.018,
"model": "model.pt",
"version": {
"ultralytics": "8.x.x",
"torch": "2.6.0",
"torchvision": "0.21.0",
"python": "3.13.0"
}
}
}
Link to this sectionПоля ответа#
| Поле | Тип | Описание |
|---|---|---|
images | массив | Список обработанных изображений |
images[].shape | массив | Размеры изображения [высота, ширина] |
images[].results | массив | Список обнаружений |
images[].results[].class | int | Индекс класса (целочисленный ID) |
images[].results[].name | string | Название класса |
images[].results[].confidence | float | Уверенность обнаружения (0-1) |
images[].results[].box | объект | Координаты ограничивающей рамки |
images[].speed | объект | Время обработки в миллисекундах |
metadata | объект | Метаданные запроса и информация о версии |
Link to this sectionОтветы, специфичные для задачи#
Формат ответа зависит от задачи:
{
"class": 0,
"name": "person",
"confidence": 0.92,
"box": {"x1": 100, "y1": 50, "x2": 300, "y2": 400}
}Link to this sectionБиллинг#
Общий инференс (вкладка Predict и эндпоинт /api/models/{id}/predict) включен без дополнительной оплаты во все тарифные планы. Плата за каждый запрос для общего инференса отсутствует.
Для производственных задач, требующих более высокой пропускной способности, разверни выделенный эндпоинт.
Link to this sectionОграничения частоты запросов#
Для общего инференса установлено ограничение частоты запросов: 20 запросов/мин на API-ключ. При превышении лимита API возвращает 429 с заголовком Retry-After. Ознакомься с полным справочником лимитов запросов для всех категорий эндпоинтов.
Разверни выделенный эндпоинт для неограниченного инференса без лимитов по частоте, предсказуемой пропускной способности и стабильно низкого времени отклика. Для локального инференса изучи руководство по режиму Predict.
Link to this sectionОбработка ошибок#
Типичные ответы об ошибках:
| Код | Сообщение | Решение |
|---|---|---|
| 400 | Недопустимое изображение | Проверь формат файла |
| 401 | Неавторизован | Проверь API-ключ |
| 404 | Модель не найдена | Проверь ID модели |
| 429 | Лимит запросов превышен | Подожди и повтори попытку или используй выделенный эндпоинт для неограниченной пропускной способности |
| 500 | Ошибка сервера | Повторить запрос |
| 503 | Сервис недоступен | Сервис прогнозирования запускается или недоступен; подожди немного и повтори попытку |
Link to this sectionFAQ#
Link to this sectionМожно ли запустить инференс на видео?#
Оба метода инференса принимают видеофайлы:
- Выделенные эндпоинты напрямую принимают видеофайлы. Поддерживаемые форматы (до 100 МБ): ASF, AVI, GIF, M4V, MKV, MOV, MP4, MPEG, MPG, TS, WEBM, WMV. Каждый кадр обрабатывается индивидуально, и результаты возвращаются для каждого кадра. Подробности см. в разделе выделенные эндпоинты.
- Общий инференс (
/api/models/{id}/predict) использует тот же сервис прогнозирования и принимает те же форматы видео. Однако вкладка Predict в браузере в UI позволяет загружать только изображения — используй REST API напрямую или выделенный эндпоинт для видеопотоков. Общий эндпоинт также ограничен 20 запросами/мин, поэтому для интенсивных видеозадач лучше использовать выделенные эндпоинты.
Link to this sectionКак получить аннотированное изображение?#
API возвращает предсказания в формате JSON. Для визуализации:
- Используй предсказания, чтобы отрисовать рамки локально
- Используй метод
plot()от Ultralytics:
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
results = model("image.jpg")
results[0].save("annotated.jpg")Смотри документацию по режиму Predict для получения полного API результатов и опций визуализации.
Link to this sectionКаков максимальный размер изображения?#
- Лимит загрузки: 10 МБ
- Рекомендуется: <5 МБ для быстрого инференса
- Автоизменение размера: изображения масштабируются до выбранного параметра
Image Size
Большие изображения автоматически изменяются в размере с сохранением соотношения сторон.
Link to this sectionМогу ли я запустить пакетный инференс?#
Текущий API обрабатывает по одному изображению за запрос. Для пакетной обработки:
- Отправляй параллельные запросы
- Используй выделенный эндпоинт для более высокой пропускной способности
- Рассмотри возможность локального инференса для больших пакетов
import concurrent.futures
import requests
url = "https://predict-abc123.run.app/predict"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
images = ["img1.jpg", "img2.jpg", "img3.jpg"]
def predict(image_path):
with open(image_path, "rb") as f:
return requests.post(url, headers=headers, files={"file": f}).json()
with concurrent.futures.ThreadPoolExecutor(max_workers=4) as executor:
results = list(executor.map(predict, images))