Облачное обучение

Облачное обучение Ultralytics Platform предлагает запуск тренировки на облачных GPU одним нажатием, делая обучение моделей доступным без сложной настройки. Тренируй модели YOLO с потоковой передачей метрик в реальном времени и автоматическим сохранением чекпоинтов.

graph LR
    A[Configure] --> B[Start Training]
    B --> C[Provision GPU]
    C --> D[Download Dataset]
    D --> E[Train]
    E --> F[Stream Metrics]
    F --> G[Save Checkpoints]
    G --> H[Complete]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style E fill:#9C27B0,color:#fff
    style H fill:#4CAF50,color:#fff

Окно настройки обучения

Запусти обучение из пользовательского интерфейса платформы, нажав New Model на странице любого проекта (или Train на странице набора данных). Окно обучения имеет две вкладки: Cloud Training и Local Training.

Ultralytics Platform Training Dialog Cloud Tab

Шаг 1: Выбери базовую модель

Выбери одну из официальных моделей YOLO26 или используй свои собственные обученные модели:

КатегорияОписание
OfficialВсе 25 моделей YOLO26 (5 размеров x 5 задач)
Your ModelsТвои готовые модели для дообучения

Официальные модели организованы по типу задачи (Detect, Segment, Pose, OBB, Classify) с размерами от nano до xlarge.

Шаг 2: Выбери набор данных

Выбери набор данных для обучения (см. Datasets):

ОпцияОписание
OfficialКураторские наборы данных от Ultralytics
Your DatasetsНаборы данных, которые ты загрузил
Требования к набору данных

Наборы данных должны быть в статусе ready, иметь как минимум 1 изображение в обучающей выборке, 1 изображение в валидационной или тестовой выборке и хотя бы 1 размеченное изображение.

Несоответствие задач

Предупреждение о несоответствии задач появится, если тип задачи модели (например, detect) не совпадает с типом задачи набора данных (например, segment). Обучение не начнется, если ты продолжишь с несовпадающими задачами. Убедись, что и модель, и набор данных используют один и тот же тип задачи, как описано в руководствах по задачам.

Шаг 3: Настрой параметры

Установи основные параметры обучения:

ПараметрОписаниеПо умолчанию
EpochsКоличество итераций обучения100
Batch SizeКоличество примеров за итерацию-1 (автоматически)
Image SizeРазрешение входных данных (выпадающий список 320/416/512/640/1280, любое кратное 32 от 32 до 4096 в YAML-редакторе)640
Run NameНеобязательное имя для запуска обученияauto

Шаг 4: Расширенные настройки (опционально)

Разверни Advanced Settings, чтобы получить доступ к полному YAML-редактору параметров с более чем 40 настройками обучения, организованными по группам (см. справочник конфигурации):

ГруппаПараметры
Скорость обученияlr0, lrf, momentum, weight_decay, warmup_epochs, warmup_momentum, warmup_bias_lr
Optimizerauto (по умолчанию), SGD, MuSGD, Adam, AdamW, NAdam, RAdam, RMSProp, Adamax
Loss Weightsbox, cls, dfl, pose, kobj, label_smoothing
Color Augmentationhsv_h, hsv_s, hsv_v
Geometric Augment.degrees, translate, scale, shear, perspective
Flip & Mix Augment.flipud, fliplr, mosaic, mixup, copy_paste
Training Controlpatience, seed, deterministic, amp, cos_lr, close_mosaic, save_period
Datasetfraction, freeze, single_cls, rect, multi_scale, resume

Параметры зависят от задачи (например, copy_paste отображается только для задач сегментации, pose/kobj — только для поз). Значок Modified появляется, когда значения отличаются от стандартных, и ты можешь сбросить все до значений по умолчанию с помощью кнопки сброса.

Пример: настройка аугментации для небольших наборов данных

Для небольших наборов данных (<1000 изображений) увеличь аугментацию, чтобы уменьшить переобучение:

mosaic: 1.0       # Keep mosaic on
mixup: 0.3        # Add mixup blending
copy_paste: 0.3   # Add copy-paste (segment only)
fliplr: 0.5       # Horizontal flip
degrees: 10.0     # Slight rotation
scale: 0.9        # Aggressive scaling

Шаг 5: Выбери GPU (вкладка Cloud)

Выбери свой GPU из облака Ultralytics:

Ultralytics Platform Training Dialog Gpu Selector And Cost

GPUПоколениеVRAMСтоимость/часЛучший выбор для
RTX 2000 AdaAda16 ГБ$0.24Небольшие наборы данных, тестирование
RTX A4500Ampere20 ГБ$0.25Наборы данных малого и среднего размера
RTX 4000 AdaAda20 ГБ$0.26Средние наборы данных
RTX A5000Ampere24 ГБ$0.27Средние наборы данных
L4Ada24 ГБ$0.39Оптимизировано для инференса
A40Ampere48 ГБ$0.44Большие размеры батчей
RTX 3090Ampere24 ГБ$0.46Общее обучение
RTX A6000Ampere48 ГБ$0.49Большие модели
RTX PRO 4500Blackwell32 ГБ$0.64Отличное соотношение цены и производительности
RTX 4090Ada24 ГБ$0.69Лучшее соотношение цены и производительности
RTX 6000 AdaAda48 ГБ$0.77Обучение на больших батчах
L40SAda48 ГБ$0.86Обучение на больших батчах
RTX 5090Blackwell32 ГБ$0.99Последнее потребительское поколение
L40Ada48 ГБ$0.99Большие модели
A100 PCIeAmpere80 ГБ$1.39Промышленное обучение
A100 SXMAmpere80 ГБ$1.49Промышленное обучение
RTX PRO 6000Blackwell96 ГБ$1.89Рекомендуемый стандарт
H100 PCIeHopper80 ГБ$2.39Высокопроизводительное обучение
H100 SXMHopper80 ГБ$2.99Самое быстрое обучение
H100 NVLHopper94 ГБ$3.07Максимальная производительность
H200 NVLHopper143 ГБ$3.39Максимальный объем памяти
H200 SXMHopper141 ГБ$3.99Максимальная производительность
B200Blackwell180 ГБ$5.49Большие модели (Pro+)
B300Blackwell288 ГБ$7.39Крупнейшие модели (Pro+)
Выбор GPU
  • RTX PRO 6000: 96 ГБ Blackwell, рекомендуемый выбор по умолчанию для большинства задач
  • A100 SXM: 80 ГБ HBM2e — отличный выбор для больших размеров батчей или более крупных моделей
  • H100 PCIe / H100 SXM / H100 NVL: 80–94 ГБ Hopper для обучения, чувствительного ко времени (доступно на всех тарифах)
  • H200 NVL / H200 SXM: 141–143 ГБ Hopper для высоконагруженных задач с большим объемом памяти (доступно на всех тарифах)
  • B200 / B300: 180–288 ГБ NVIDIA Blackwell для передовых рабочих нагрузок — требует подписки Pro или Enterprise

В окне отображается твой текущий balance и кнопка Top Up. Ориентировочная стоимость и длительность рассчитываются на основе твоей конфигурации (размер модели, количество изображений в наборе, эпохи, скорость GPU).

Шаг 6: Начни обучение

Нажми Start Training, чтобы запустить задачу. Платформа:

  1. Выделяет экземпляр GPU
  2. Загружает твой набор данных
  3. Начинает процесс обучения
  4. Передает метрики в режиме реального времени

Жизненный цикл задачи обучения

Задачи обучения проходят через следующие статусы:

СтатусОписание
PendingЗадача отправлена, ожидание выделения GPU
StartingGPU выделен, идет загрузка данных и модели
RunningОбучение в процессе, метрики поступают в реальном времени
CompletedОбучение успешно завершено
FailedОбучение прервано с ошибкой (подробности смотри в логах консоли)
CancelledОбучение было отменено пользователем
Бесплатные кредиты

Новые аккаунты получают приветственные бонусы — 5$ для личных электронных почт и 25$ для корпоративных. Проверь свой баланс в разделе Settings > Billing.

Ultralytics Platform Training Progress With Charts

Мониторинг обучения

Следи за прогрессом обучения в реальном времени на вкладке Train страницы модели:

Подвкладка Графики

Ultralytics Platform Model Training Live Charts

МетрикаОписание
LossФункция потерь при обучении и валидации
mAPСредняя точность (Mean Average Precision)
PrecisionПравильные положительные предсказания
RecallОбнаруженные истинные метки (ground truths)

Подвкладка Консоль

Вывод консоли в реальном времени с поддержкой ANSI-цветов, прогресс-барами и обнаружением ошибок.

Подвкладка Система

Мониторинг использования GPU, памяти, температуры, CPU и диска в реальном времени.

Чекпоинты

После завершения обучения лучшая модель (best.pt, чекпоинт с наивысшим показателем mAP) загружается на платформу и становится доступной для скачивания, экспорта и развертывания.

Отмена обучения

Нажми Cancel Training на странице модели, чтобы остановить запущенную задачу:

  • Вычислительный инстанс завершает работу
  • Списание кредитов прекращается
  • Лучший чекпоинт остается доступным, если он был достигнут до отмены

Удаленное обучение

graph LR
    A[Local GPU] --> B[Train]
    B --> C[ultralytics Package]
    C --> D[Stream Metrics]
    D --> E[Platform Dashboard]

    style A fill:#FF9800,color:#fff
    style C fill:#2196F3,color:#fff
    style E fill:#4CAF50,color:#fff

Обучай на своем собственном оборудовании, передавая метрики на платформу в режиме реального времени.

Требования к версии пакета

Для интеграции с платформой требуется ultralytics>=8.4.35. Более старые версии НЕ будут работать с платформой.

pip install -U ultralytics

Настройка API Key

  1. Перейди в Settings > API Keys
  2. Создай новый ключ (платформа также автоматически создает его при открытии вкладки Local Training)
  3. Установи переменную окружения:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"

Обучение с потоковой передачей

Используй параметры project и name для потоковой передачи метрик:

yolo train model=yolo26n.pt data=coco.yaml epochs=100 \
  project=username/my-project name=experiment-1

Вкладка Local Training в диалоговом окне обучения содержит предварительно настроенную команду с твоим API key, выбранными параметрами и расширенными аргументами.

Использование наборов данных платформы

Обучай с наборами данных, хранящимися на платформе, используя формат URI ul://:

yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100 \
  project=username/my-project name=exp1

Формат URI ul:// автоматически загружает и настраивает твой набор данных. Модель автоматически привязывается к набору данных на платформе (см. Использование наборов данных платформы).

Биллинг

Стоимость обучения зависит от использования GPU:

Оценка стоимости

Перед началом обучения платформа оценивает общую стоимость, выполняя:

  1. Оценку секунд на эпоху на основе размера набора данных, сложности модели, размера изображения, размера батча и скорости GPU
  2. Расчет общего времени обучения путем умножения секунд на эпоху на количество эпох с добавлением времени на запуск
  3. Вычисление примерной стоимости исходя из общего количества часов обучения, умноженного на почасовую ставку GPU

Факторы, влияющие на стоимость:

ФакторВлияние
Размер набора данныхБольше изображений = дольше время обучения (базовый уровень: ~2.8 с вычислений на 1000 изображений на RTX 4090)
Размер моделиБолее крупные модели (m, l, x) обучаются медленнее, чем (n, s)
Количество эпохПрямой множитель времени обучения
Image SizeУвеличение imgsz повышает вычислительную нагрузку: 320px=0.25x, 640px=1.0x (база), 1280px=4.0x
Batch SizeБолее крупные батчи эффективнее (batch 32 = ~0.85x времени, batch 8 = ~1.2x времени относительно базы 16)
Скорость GPUБолее быстрые GPU сокращают время обучения (например, H100 SXM = ~3.4x быстрее, чем RTX 4090)
Время на запускДо 5 минут на инициализацию инстанса, загрузку данных и прогрев (масштабируется с размером набора данных)

Примеры стоимости

Оценки

Оценки стоимости являются приблизительными и зависят от многих факторов. В диалоговом окне обучения отображается оценка в реальном времени до начала обучения.

СценарийGPUПримерная стоимость
500 изображений, YOLO26n, 50 эпохRTX 4090~$0.50
1000 изображений, YOLO26n, 100 эпохRTX PRO 6000~$5
5000 изображений, YOLO26s, 100 эпохH100 SXM~$23

Процесс биллинга

graph LR
    A[Estimate Cost] --> B[Balance Check]
    B --> C[Train]
    C --> D[Charge Actual Runtime]

    style A fill:#2196F3,color:#fff
    style B fill:#FF9800,color:#fff
    style C fill:#9C27B0,color:#fff
    style D fill:#4CAF50,color:#fff

Процесс биллинга облачного обучения:

  1. Оценка: стоимость рассчитывается до начала обучения
  2. Проверка баланса: наличие кредитов проверяется перед запуском
  3. Обучение: задача выполняется на выбранном GPU
  4. Списание: итоговая стоимость основана на фактическом времени работы
Защита потребителя

Биллинг отслеживает фактическое использование вычислительных ресурсов, включая частично выполненные задачи, которые были отменены. Ты не платишь за неудачные запуски обучения.

Биллинг по статусу задачи

СтатусСписано?
CompletedДа — за фактическое время работы GPU
CancelledДа — время работы GPU с момента запуска до отмены
FailedНет — неудачные запуски не тарифицируются
ЗавислоЧастично — списывается только фактическое время обучения
Нет списаний при ошибках

Если обучение завершилось с ошибкой из-за конфигурации, нехватки памяти или другого сбоя, списания не происходит. Оплачивается только успешное время работы GPU. Зависшие задачи (нет активности 4+ часа) автоматически завершаются, и плата взимается только за время, когда GPU активно обучал, а не за время простоя.

Способы оплаты

МетодОписание
Баланс аккаунтаПредоплаченные кредиты
Оплата за задачуСписание после завершения задачи
Минимальный баланс

Для начала обучения требуется положительный баланс и достаточное количество кредитов для покрытия предполагаемой стоимости задачи.

Просмотр расходов на обучение

После обучения смотри подробные расходы на вкладке Billing:

  • Разбивка затрат по эпохам
  • Общее время работы GPU
  • Скачать отчет о расходах

Детали биллинга обучения на платформе Ultralytics

Советы по обучению

Выбор подходящего размера модели

МодельПараметрыЛучший выбор для
YOLO26n2.4MРеальное время, edge-устройства
YOLO26s9.5MБаланс скорости и точности
YOLO26m20.4MБолее высокая точность
YOLO26l24.8MПродакшн точность
YOLO26x55.7MМаксимальная точность

Оптимизация времени обучения

Стратегии экономии
  1. Начни с малого: протестируй на 10-20 эпохах на бюджетном GPU, чтобы убедиться, что набор данных и конфигурация работают правильно
  2. Используй подходящий GPU: RTX PRO 6000 хорошо справляется с большинством рабочих нагрузок
  3. Проверь набор данных: исправь проблемы с разметкой до начала платного обучения
  4. Мониторь на ранних этапах: отмени обучение, если лосс вышел на плато — ты платишь только за использованное время вычислений

Устранение неполадок

ПроблемаРешение
Обучение зависло на 0%Проверь формат набора данных, попробуй еще раз
Недостаточно памятиУменьши размер пакета или используй более мощный GPU
Низкая точностьУвеличь количество эпох, проверь качество данных
Обучение идет медленноРассмотри возможность использования более быстрого GPU
Ошибка несовпадения задачУбедись, что задачи модели и набора данных совпадают

FAQ

Сколько времени занимает обучение?

Время обучения зависит от:

  • Размер набора данных
  • Размер модели
  • Количества эпох
  • Выбранный GPU

Типичное время (1000 изображений, 100 эпох):

МодельRTX PRO 6000A100 SXM
YOLO26n~20 мин~15 мин
YOLO26m~40 мин~30 мин
YOLO26x~80 мин~60 мин
Приблизительное время

Время обучения является приблизительным и зависит от сложности набора данных, настроек аугментации и размера пакета. Используй оценку стоимости в диалоговом окне обучения для более точных прогнозов.

Могу ли я запустить обучение на ночь?

Да, обучение будет продолжаться до завершения. Ты получишь уведомление, когда процесс закончится. Убедись, что на твоем счете достаточно средств для обучения на основе эпох.

Что произойдет, если у меня закончатся кредиты?

Если баланс кредитов достигнет нуля во время обучения, процесс продолжится до завершения, а твой баланс станет отрицательным. Это гарантирует, что задача обучения не будет прервана в процессе выполнения.

После завершения обучения тебе нужно будет пополнить баланс, чтобы он стал положительным, прежде чем запускать новые задачи. Твоя готовая модель, контрольные точки и все артефакты обучения полностью сохраняются независимо от баланса.

Отрицательный баланс

Отрицательный баланс препятствует только запуску новых задач обучения. Существующие развертывания и другие функции платформы продолжают работать в штатном режиме. Добавь кредиты через Settings > Billing или включи auto top-up, чтобы избежать прерываний.

Что будет, если обучение стоит дороже, чем прогнозировалось?

Оценки стоимости являются приблизительными — фактическое время обучения может варьироваться из-за таких факторов, как скорость загрузки данных, прогрев GPU и сходимость модели. Если фактическая стоимость превышает оценку, твой баланс может стать отрицательным (см. выше). Платформа не останавливает обучение на основе оценки.

Для управления расходами:

  • Отслеживай прогресс обучения в реальном времени и при необходимости заверши его досрочно
  • Включи auto top-up для автоматического пополнения кредитов
  • Начинай с коротких запусков (меньше эпох), чтобы оценить результат

Могу ли я использовать собственные аргументы обучения?

Да, разверни раздел Advanced Settings в диалоговом окне обучения, чтобы получить доступ к YAML-редактору с более чем 40 настраиваемыми параметрами. Значения, отличные от стандартных, включаются в команды обучения как в облаке, так и локально.

YAML-редактор также поддерживает импорт конфигураций из предыдущих запусков обучения:

  • Скопировать из существующей модели: На странице любой завершенной модели в карточке Training Configuration есть кнопка Copy as JSON. Скопируй JSON и вставь его прямо в YAML-редактор — он автоматически распознает формат JSON и импортирует все параметры.
  • Вставить YAML или JSON: Вставь любую корректную конфигурацию обучения в формате YAML или JSON в редактор. Параметры проверяются автоматически, значения вне допустимого диапазона корректируются, а при необходимости отображаются предупреждения.
  • Перетаскивание файлов: Перетащи файл .yaml или .json прямо в редактор для импорта параметров.

Ultralytics Platform Training Dialog Copy Training Config JSON

Это позволяет легко воспроизводить или изменять предыдущие конфигурации обучения, не вводя каждый параметр вручную.

Могу ли я запустить обучение со страницы набора данных?

Да, кнопка Train на страницах набора данных открывает диалоговое окно обучения с уже выбранным и заблокированным набором данных. Затем ты выбираешь проект и модель, чтобы начать обучение.

Справочник параметров обучения

ПараметрТипПо умолчаниюДиапазонОписание
epochsint1001-10000Количество эпох обучения
batchint-1 (автоматически)-1 to 512Размер пакета (-1 = автоподбор под доступную VRAM)
imgszint64032-4096Размер входного изображения
patienceint1001-1000Количество эпох без улучшений до ранней остановки
seedint00-2147483647Случайное зерно для воспроизводимости
deterministicboolTrue-Детерминированный режим обучения
ampboolTrue-Автоматическая смешанная точность
close_mosaicint100-50Отключить мозаику в последних N эпохах
save_periodint-1-1-100Сохранять контрольную точку каждые N эпох
workersint80-64Потоки загрузчика данных
cacheselectfalseram/disk/falseКэшировать изображения
Параметры для конкретных задач

Некоторые параметры применяются только к определенным задачам:

  • Только для задач детектирования (detect, segment, pose, OBB — кроме classify): box, dfl, degrees, translate, shear, perspective, mosaic, mixup, close_mosaic
  • Только для segment: copy_paste
  • Только для pose: pose (вес функции потерь), kobj (objectness ключевых точек)

Комментарии