Link to this sectionНаборы данных#

Q: Как работает хранилище?

Ultralytics Platform использует Content-Addressable Storage (CAS) для эффективного хранения: Deduplication: Идентичные изображения, загруженные разными пользователями, хранятся только один раз; Integrity: Хеширование XXH3-128 обеспечивает целостность данных; Efficiency: Сокращает расходы на хранение и ускоряет обработку; Regional: Данные остаются в выбранном тобой регионе (US, EU или AP)

Датасеты Ultralytics Platform предоставляют удобное решение для управления твоими данными для обучения. После загрузки платформа автоматически обрабатывает изображения, разметку и статистику. Датасет готов к обучению сразу после завершения обработки при условии, что в нем есть как минимум одно изображение в разделе train, как минимум одно изображение в разделе val или test, хотя бы одно размеченное изображение и суммарно не менее двух изображений.

Link to this sectionЗагрузить датасет#

Ultralytics Platform принимает данные в различных форматах для обеспечения гибкости работы.

У тебя уже есть данные в другом месте?

Если у тебя уже есть датасеты в Ultralytics HUB или Roboflow, используй Integrations, чтобы импортировать их напрямую — ручной экспорт или повторная загрузка не нужны. Данные в Google Cloud Storage, Amazon S3 или Azure Blob Storage можно использовать на месте с помощью Cloud storage. Корпоративные рабочие пространства могут использовать On Premise для индексации и обучения на локальных данных без отправки пикселей на Platform.

Link to this sectionПоддерживаемые форматы#

Формат	Расширения	Примечания	Макс. размер
JPEG	`.jpg`, `.jpeg`	Самые популярные, рекомендуемые	50 МБ
PNG	`.png`	Поддерживает прозрачность	50 МБ
WebP	`.webp`	Современный формат, хорошая степень сжатия	50 МБ
BMP	`.bmp`	Без сжатия	50 МБ
TIFF	`.tiff`, `.tif`	Высокое качество	50 МБ
HEIC	`.heic`	Фото с iPhone	50 МБ
AVIF	`.avif`	Формат нового поколения	50 МБ
JP2	`.jp2`	JPEG 2000	50 МБ
DNG	`.dng`	Raw (необработанные) с камер	50 МБ
MPO	`.mpo`	Multi-picture object (объект с несколькими изображениями)	50 МБ

Link to this sectionПоддержка кодеков в браузере#

Одного расширения файла недостаточно: видео может не загрузиться, если твой браузер не поддерживает его контейнер или кодек.

Используй H.264 MP4

Видео H.264 в контейнере MP4 имеет самую широкую поддержку в основных браузерах и является самым безопасным выбором. Если видео не загружается, перекодируй его с помощью FFmpeg:

ffmpeg -i input.mov \
  -c:v libx264 -pix_fmt yuv420p \
  -c:a aac -movflags +faststart \
  output.mp4

Какие видеокодеки работают

Это кодеки, которые обычно декодируют Chromium-based браузеры. Safari и Firefox могут отличаться, поэтому не воспринимай значения Да/Нет ниже как универсальную поддержку браузерами:

Кодек	Декодируется в Chrome	Примечания
H.264 (AVC)	Да	Рекомендуется — самая широкая поддержка браузерами
VP8, VP9, AV1	Да	Без лицензионных отчислений; часто встречаются в WebM и MKV
HEVC (H.265)	Только аппаратно	Только на устройствах с декодером HEVC
ProRes, MPEG-2, DivX/Xvid, MJPEG, …	Нет	Перекодируй в H.264

Link to this sectionПодготовка датасета#

Платформа поддерживает форматы Ultralytics YOLO, COCO, Ultralytics NDJSON и загрузку необработанных (без разметки) данных:

Используй стандартную структуру папок YOLO с файлом data.yaml:

my-dataset/
├── images/
│   ├── train/
│   │   ├── img001.jpg
│   │   └── img002.jpg
│   └── val/
│       ├── img003.jpg
│       └── img004.jpg
├── labels/
│   ├── train/
│   │   ├── img001.txt
│   │   └── img002.txt
│   └── val/
│       ├── img003.txt
│       └── img004.txt
└── data.yaml

YAML-файл определяет конфигурацию твоего датасета:

# data.yaml
path: .
train: images/train
val: images/val

names:
    0: person
    1: car
    2: dog

Загрузка необработанных данных

Raw (необработанные): Загружай изображения без разметки (без меток). Это удобно, если ты планируешь размечать их прямо на платформе, используя редактор разметки.

Плоская структура папок

Ты также можешь загружать изображения без явных папок для разделения на обучающую/валидационную выборки. Платформа учитывает активную цель разбивки при загрузке, а для датасетов не связанных с классификацией, может автоматически создать валидационную выборку из части обучающего набора, если информация о разбиении не была предоставлена. Ты всегда сможешь переназначить изображения позже с помощью массового перемещения по выборкам или перераспределения выборок.

Автоматическое определение формата

Формат определяется автоматически: датасеты с файлом data.yaml, содержащим ключи names, train или val, распознаются как YOLO. Датасеты с JSON-файлами COCO (содержащими массивы images, annotations и categories) распознаются как COCO. Экспортированные файлы .ndjson импортируются как Ultralytics NDJSON. Датасеты, состоящие только из изображений без разметки, обрабатываются как raw.

Подробности по форматам для конкретных задач см. в разделе поддерживаемые задачи и в Обзоре датасетов.

Link to this sectionПроцесс загрузки#

Перейди в Datasets в боковой панели
Нажми New Dataset или перетащи файлы в область загрузки
Выбери тип задачи (см. поддерживаемые задачи)
Добавь название и опциональное описание
Установи видимость (публичная или приватная) и выбери лицензию (см. доступные лицензии)
Нажми Create & Upload (или Create Dataset, если создаешь пустой датасет)

Диалоговое окно выбора задачи при загрузке датасета в Ultralytics Platform

После загрузки платформа обрабатывает твои данные через многоэтапный конвейер:

graph LR
    A[Upload]:::start --> B[Validate]:::proc
    B --> C[Normalize]:::proc
    C --> D[Thumbnail]:::proc
    D --> E[Parse Labels]:::proc
    E --> F[Statistics]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Валидация: Проверка формата и размера
Нормализация: Большие изображения меняют размер (макс. 4096px, мин. сторона 28px)
Миниатюры: Создаются превью в формате WebP размером 256px
Парсинг разметки: Извлекается разметка в форматах YOLO и COCO
Статистика: Вычисляются распределения классов и размеры изображений

Индикатор прогресса загрузки датасета в Ultralytics Platform

Валидация перед загрузкой

Ты можешь проверить свой датасет локально перед загрузкой:

from ultralytics.data.utils import check_det_dataset

check_det_dataset("path/to/data.yaml")

Требования к размеру изображений

Изображения должны быть не менее 28px по своей короткой стороне. Изображения меньшего размера отклоняются при обработке. Изображения, превышающие 4096px по своей длинной стороне, автоматически масштабируются с сохранением соотношения сторон.

Link to this sectionОбзор изображений#

Просматривай изображения своего датасета в различных макетах.

Открой панель Clustering из панели инструментов галереи, чтобы изучить свой датасет в виде интерактивной 2D-диаграммы рассеяния.

Вид	Описание
Сетка	Сетка миниатюр с наложенной разметкой (по умолчанию)
Compact	Уменьшенные миниатюры для быстрого просмотра
Table	Список с миниатюрой, именем файла, размерами, размером в байтах, выборкой, классами и количеством меток

Вид галереи датасета в Ultralytics Platform в виде сетки с разметкой

Link to this sectionСортировка и фильтрация#

Изображения можно сортировать и фильтровать для эффективного просмотра:

Сортировать	Описание
Новые / Старые	Порядок загрузки / создания
Имя А-Я / Я-А	Имя файла по алфавиту
Высота ↑/↓	Высота изображения в пикселях
Ширина ↑/↓	Ширина изображения в пикселях
Размер ↑/↓	Размер файла на диске
Аннотации ↑/↓	Количество аннотаций на изображение

Большие наборы данных

Для наборов данных, содержащих более 100 000 изображений, сортировка по имени / размеру / ширине / высоте отключена для поддержания быстродействия галереи. Сортировка по дате добавления (самые новые, самые старые) и по количеству аннотаций по-прежнему доступна.

Поиск неразмеченных изображений

Используй фильтр Annotations, установив его в значение Unannotated, чтобы быстро найти изображения, требующие аннотирования. Это особенно полезно для больших наборов данных, если ты хочешь отслеживать прогресс разметки.

Link to this sectionПолноэкранный просмотрщик#

Нажми на любое изображение, чтобы открыть полноэкранный просмотрщик с помощью:

Навигация: клавиши со стрелками или миниатюры для просмотра
Метаданные: имя файла, размеры, метка сплита, количество аннотаций
Аннотации: переключение видимости слоя аннотаций
Распределение классов: количество разметок по классам с цветовыми индикаторами
Редактирование: вход в режим аннотирования для добавления или изменения разметок
Загрузка: скачивание исходного файла изображения
Удаление: удаление изображения из набора данных
Масштабирование: Cmd/Ctrl+Scroll, Cmd/Ctrl++ или Cmd/Ctrl+= для приближения, и Cmd/Ctrl+- для отдаления
Сброс вида: Cmd/Ctrl + 0 или кнопка сброса, чтобы подогнать изображение под размер окна просмотра
Панорамирование: удерживай Space и перетаскивай курсор для перемещения по холсту при увеличении
Пиксельный вид: включение пиксельного рендеринга для детального изучения

Полноэкранный просмотрщик наборов данных платформы Ultralytics с панелью метаданных

Link to this sectionФильтр по сплиту#

Фильтрация изображений по их сплиту в наборе данных:

Split	Цель
Обучение	Используется для обучения модели
Val	Используется для валидации во время обучения
Test	Используется для финальной оценки

Link to this sectionКластеризация#

Панель Clustering проецирует твой набор данных на интерактивную 2D-диаграмму рассеяния, где визуально похожие изображения расположены близко друг к другу. Используй ее, чтобы выявлять кластеры, находить дубликаты и выбросы, а также изучать распределение сплитов или классов в твоих данных, не покидая галерею. Открой ее с помощью значка диаграммы рассеяния на панели инструментов галереи на любой странице набора данных.

Кластеризация наборов данных платформы Ultralytics в пустом состоянии

Link to this sectionЗапуск анализа#

Запуск анализа:

Открой набор данных и нажми на значок диаграммы рассеяния на панели инструментов галереи
Нажми Analyze Dataset
Дождись завершения работы индикатора выполнения — результаты появятся на той же панели

Анализ выполняется в фоновом режиме и может занять несколько минут в зависимости от размера твоего набора данных. Ты можешь закрыть панель или покинуть страницу и вернуться позже.

Link to this sectionВизуализация#

После завершения анализа на панели появится 2D-диаграмма всех проанализированных изображений. Фильтры галереи (сплит, класс, размеченные/неразмеченные) делают неактивные точки полупрозрачными, чтобы ты мог сосредоточиться на нужном подмножестве.

Диаграмма рассеяния кластеризации наборов данных платформы Ultralytics

Link to this sectionРаскраска по#

Измени способ окрашивания точек данных с помощью выпадающего меню Color by на панели инструментов. Переключай режимы просмотра в любое время — диаграмма мгновенно перекрасится, чтобы ты мог увидеть, как сплиты, классы или свойства изображений распределены по кластерам:

Опция	Затенение
Splits	Train / Val / Test
Classes	Первый класс аннотации на каждом изображении
Width	Ширина изображения
Height	Высота изображения
Size	Размер файла
Аннотации	Количество аннотаций на изображение

Цветовые режимы кластеризации наборов данных платформы Ultralytics

Link to this sectionВыделение лассо#

Нарисуй произвольную область, чтобы выделить точки на диаграмме. Галерея отфильтрует изображения, соответствующие выделению, чтобы ты мог просмотреть, переразметить, переместить или удалить их, используя обычные операции с изображениями.

Очистить выделение

Чип над диаграммой показывает количество выделенных точек — нажми на ×, чтобы сбросить лассо и вернуться к полному просмотру галереи.

Link to this sectionПанорамирование и масштабирование#

Навигация по большим диаграммам рассеяния прямо с помощью мыши и клавиатуры:

Ввод	Действие
Scroll (колесико мыши)	Панорамирование диаграммы в 2D
Cmd/Ctrl+Scroll	Приближение или отдаление относительно курсора
Удерживание Space	Переключение в режим перетаскивания (панорамирования)

Link to this sectionПовторный анализ#

Если набор данных изменился после анализа, владельцы и редакторы увидят кнопку Re-analyze в верхней части панели.

Нажми Re-analyze, чтобы заново вычислить эмбеддинги и 2D-проекцию с нуля.

Link to this sectionВкладки набора данных#

Каждая страница набора данных может отображать до шести вкладок в зависимости от состояния набора данных и твоих прав доступа:

Link to this sectionВкладка Images#

Вид по умолчанию, показывающий галерею изображений с наложенными аннотациями. Поддерживаются режимы сетки, компактный и табличный. Перетаскивай файлы сюда, чтобы добавить больше изображений.

Link to this sectionВкладка Classes#

Эта вкладка появляется, когда в наборе данных есть изображения.

Управляй классами аннотаций для своего набора данных:

Гистограмма классов: гистограмма, показывающая количество аннотаций по каждому классу с переключателем линейной/логарифмической шкалы
Таблица классов: сортируемая таблица с возможностью поиска, содержащая названия классов, количество меток и количество изображений.
Редактирование названий классов: нажми на любое название класса, чтобы изменить его прямо в таблице.
Редактирование цветов классов: нажми на образец цвета, чтобы изменить цвет класса.
Добавление нового класса: используй поле ввода в нижней части, чтобы добавить классы.

Гистограмма и таблица вкладки классов наборов данных платформы Ultralytics

Логарифмическая шкала для несбалансированных наборов данных

Если в твоем наборе данных присутствует дисбаланс классов (например, 10 000 аннотаций «человек», но только 50 «велосипед»), используй переключатель Log Scale на гистограмме классов для наглядной визуализации всех классов.

Link to this sectionВкладка «Графики»#

Эта вкладка появляется, когда в наборе данных есть изображения.

Автоматическая статистика, рассчитанная для твоего набора данных:

График	Описание
Распределение по выборкам	Кольцевая диаграмма количества изображений и процентов размеченных данных для выборок train/val/test.
Популярные классы	Кольцевая диаграмма 10 наиболее частых классов аннотаций.
Размеры изображений	Гистограмма распределения ширины и высоты изображений (наложенные друг на друга) со средним значением.
Точек на экземпляр	Количество вершин полигона или ключевых точек на одну аннотацию (сегментация/поза).
Расположение аннотаций	2D-теплокарта центральных позиций ограничивающих прямоугольников (bbox).
Размер файлов изображений	Гистограмма распределения размеров файлов изображений.
Форматы изображений	Распределение исходных форматов изображений (JPG, PNG и т.д.).
Размеры ограничивающих прямоугольников	Гистограмма ширины и высоты ограничивающих прямоугольников (наложенные друг на друга).
Объектов на изображение	Гистограмма количества аннотаций на одно изображение.
Размеры изображений 2D	2D-теплокарта ширины и высоты с направляющими линиями соотношения сторон.

Сетка статистики вкладки графиков наборов данных платформы Ultralytics

Кэширование статистики

Статистика кэшируется на 5 минут. Изменения в аннотациях отобразятся после того, как срок действия кэша истечет.

Полноэкранные теплокарты

Нажми кнопку развертывания на любой теплокарте, чтобы просмотреть ее в полноэкранном режиме. Это обеспечивает более крупный и детализированный вид — полезно для понимания пространственных закономерностей в больших наборах данных.

Link to this sectionВкладка «Модели»#

Просматривай все модели, обученные на этом наборе данных, в таблице с возможностью поиска:

Столбец	Описание
Имя	Название модели со ссылкой
Проект	Родительский проект с иконкой
Версия	Неизменяемая версия датасета, используемая для обучения, если таковая имеется
Статус	Бейдж статуса обучения
Задача	Тип задачи YOLO
Эпохи	Лучшая эпоха / общее количество эпох
mAP50-95	Средняя точность (Mean average precision)
mAP50	mAP при IoU 0.50
Создано	Дата создания

Таблица обученных моделей на вкладке моделей наборов данных платформы Ultralytics

Link to this sectionВкладка «Ошибки»#

Эта вкладка появляется только в том случае, если один или несколько файлов не прошли обработку.

Изображения, которые не прошли обработку, перечислены здесь с:

Баннер ошибки: общее количество изображений с ошибками и рекомендации
Таблица ошибок: имя файла, понятное описание ошибки, советы по исправлению и миниатюра для предпросмотра
Распространенные ошибки включают поврежденные файлы, неподдерживаемые форматы, слишком маленькие изображения (минимум 28px) и неподдерживаемые цветовые режимы

Ошибки обработки на вкладке ошибок наборов данных платформы Ultralytics

Распространенные ошибки обработки

Ошибка	Причина	Исправление
Невозможно прочитать файл изображения	Поврежденный или неподдерживаемый формат	Экспортируй повторно из графического редактора
Неполный или поврежденный файл	Файл был усечен во время передачи	Скачай исходный файл повторно
Изображение слишком маленькое	Минимальный размер стороны меньше 28px	Используй исходные изображения более высокого разрешения
Неподдерживаемый цветовой режим	Цветовой режим CMYK или индексированные цвета	Конвертируй в режим RGB

Link to this sectionВкладка «Версии»#

Создавай неизменяемые NDJSON-снимки твоего набора данных для воспроизводимого обучения. Каждая версия фиксирует количество изображений, количество классов, количество аннотаций и размер файла на момент создания.

Столбец	Описание
Версия	Номер версии (v1, v2, ...)
Описание	Описание, предоставленное пользователем (редактируемое)
Изображения	Количество изображений на момент создания снимка
Классы	Количество классов на момент создания снимка
Аннотации	Количество аннотаций на момент создания снимка
Размер	Размер файла экспорта NDJSON
Создано	Время создания версии

Чтобы создать версию:

Открой вкладку Версии
При необходимости введи описание (например, «Добавлено 500 изображений для обучения» или «Исправлены ошибки в разметке классов»)
Нажми + New Version
Новая версия появится в таблице
Скачивай версию отдельно из таблицы при необходимости

Каждая версия нумеруется последовательно (v1, v2, v3...) и хранится постоянно. Ты можешь скачать любую предыдущую версию в любое время из таблицы версий.

Сохранение версии во время обучения

Включи Save Dataset Version в диалоговом окне облачного обучения, чтобы привязать модель к конкретному датасету, который использовался для обучения. Платформа повторно использует подходящую версию, если содержимое датасета не изменилось, и создает новую версию только тогда, когда это происходит.

Только готовые наборы данных

Создание версии доступно после того, как набор данных перейдет в статус ready.

Когда создавать версии

Создавай версию до и после внесения значительных изменений в свой набор данных — добавления изображений, исправления аннотаций или перебалансировки выборок. Это позволит тебе сравнивать производительность моделей для разных состояний набора данных.

Размер файла NDJSON

Указан размер файла экспорта NDJSON, который содержит URL-адреса изображений и аннотации, а не сами изображения. Фактические данные изображений хранятся отдельно и доступны через подписанные URL.

Link to this sectionЭкспортировать набор данных#

Экспортируй набор данных для использования в автономном режиме с помощью загрузки NDJSON из заголовка набора данных или вкладки «Версии».

Для экспорта:

Нажми кнопку Download (иконка загрузки) в заголовке набора данных
Скачивай текущий снимок NDJSON напрямую
Используй вкладку Versions, если тебе нужен неизменяемый пронумерованный снимок, который можно скачать повторно позже

Ultralytics Platform Datasets Export Ndjson Download

Формат NDJSON хранит по одному JSON-объекту на строку. Первая строка содержит метаданные набора данных, за которой следует по одной строке на каждое изображение:

{"type": "dataset", "task": "detect", "name": "my-dataset", "description": "...", "bytes": 12345678, "url": "https://platform.ultralytics.com/...", "class_names": {"0": "person", "1": "car"}, "version": 1, "created_at": "2026-01-15T10:00:00Z", "updated_at": "2026-02-20T14:30:00Z"}
{"type": "image", "file": "img001.jpg", "url": "https://...", "width": 640, "height": 480, "split": "train", "annotations": {"boxes": [[0, 0.5, 0.5, 0.2, 0.3]]}}
{"type": "image", "file": "img002.jpg", "url": "https://...", "width": 1280, "height": 720, "split": "val"}

Подписанные URL

URL-адреса изображений в экспортированном файле NDJSON являются подписанными и действительны в течение 7 дней. Если тебе нужны свежие URL-адреса, повторно экспортируй набор данных или создай новую версию.

Смотри полную спецификацию в документации по формату Ultralytics NDJSON.

Link to this sectionОперации с изображениями#

Link to this sectionБыстрые действия#

Нажми правой кнопкой мыши на любое изображение в режиме Grid или Compact, чтобы получить доступ к быстрым действиям:

Действие	Описание
Move to Split (Переместить в выборку)	Переназначь изображение в выборку Train, Val или Test
Скачивание	Скачай исходный файл изображения
Delete (Удалить)	Удали изображение из набора данных

Одиночные и массовые операции

Контекстное меню изображения работает с одним изображением. Для массовых операций с несколькими изображениями используй представление Table с выбором через флажки.

Link to this sectionМассовое перемещение в выборку#

Переназначь выбранные изображения в другую выборку внутри того же набора данных:

Переключись в режим Table
Выбери изображения с помощью флажков
Нажми правой кнопкой мыши, чтобы открыть контекстное меню
Выбери Move to split > Train, Validation или Test

Ты также можешь перетаскивать изображения на вкладки фильтра выборки в режиме сетки.

Организация выборок Train/Val

Загрузи все изображения в один набор данных, а затем используй массовое перемещение в выборку для распределения подмножеств на обучающую, валидационную и тестовую выборки.

Link to this sectionПерераспределение выборок#

Перераспредели все изображения между обучающей, валидационной и тестовой выборками, используя пользовательские коэффициенты:

Нажми на панель выборки в панели инструментов набора данных, чтобы открыть диалоговое окно Redistribute Splits
Настрой процентное соотношение выборок, используя любой из методов ниже
Изучи динамический предварительный просмотр количества изображений, чтобы подтвердить распределение
Нажми Apply, чтобы случайным образом переназначить все изображения в соответствии с твоими процентами

Ultralytics Platform Datasets Split Redistribution Dialog

Диалоговое окно предоставляет три способа установки целевых коэффициентов выборки:

Метод	Описание
Drag (Перетаскивание)	Перетаскивай маркеры между цветными сегментами для визуальной настройки границ выборки
Type (Ввод)	Отредактируй процентное значение для любой выборки (остальные две автоматически пересчитаются пропорционально)
Auto (Авто)	Один клик для мгновенной установки соотношения 80/20 для обучающей/валидационной выборок при значении 0% для тестовой

Динамический предварительный просмотр точно показывает, сколько изображений попадет в каждую выборку, прежде чем ты применишь изменения.

Быстрая выборка 80/20

Нажми кнопку Auto, чтобы мгновенно установить рекомендуемое соотношение 80/20 для обучающей/валидационной выборок. Это наиболее распространенное соотношение для обучения.

Link to this sectionМассовое удаление#

Удали несколько изображений за раз:

Выбери изображения в режиме таблицы
Нажми правой кнопкой мыши и выбери Delete
Подтверди удаление

Link to this sectionURI набора данных#

Ссылайся на наборы данных Platform, используя формат URI ul:// (см. Использование наборов данных Platform):

ul://username/datasets/dataset-slug

Ты также можешь напрямую вставить веб-ссылку на датасет или модель (например, https://platform.ultralytics.com/username/datasets/dataset-slug); она автоматически преобразуется в URI ul://. Передача списка датасетов позволяет дообучить одну базовую модель на каждом из них по очереди, например model.train(data=["ul://username/datasets/a", "ul://username/datasets/b"]).

Используй этот URI для обучения моделей из любого места:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Обучай где угодно с данными Platform

URI ul:// работает в любой среде:

Локальная машина: обучай на своем оборудовании, данные скачиваются автоматически
Google Colab: получай доступ к своим наборам данных Platform в ноутбуках
Удаленные серверы: обучай на облачных виртуальных машинах с полным доступом к набору данных

Link to this sectionДоступные лицензии#

Platform поддерживает следующие лицензии для наборов данных:

Лицензия	Тип
Нет	Лицензия не выбрана
CC0-1.0	Общественное достояние
CC-BY-2.5	Разрешительная
CC-BY-4.0	Разрешительная
CC-BY-SA-4.0	Копилефт
CC-BY-NC-4.0	Некоммерческая
CC-BY-NC-SA-4.0	Копилефт
CC-BY-ND-4.0	Без производных работ
CC-BY-NC-ND-4.0	Некоммерческая
Apache-2.0	Разрешительная
MIT	Разрешительная
AGPL-3.0	Копилефт
GPL-3.0	Копилефт
Только для исследований	Ограниченная
Другое	Пользовательская

Лицензии Copyleft

При клонировании набора данных с лицензией copyleft (AGPL-3.0, GPL-3.0, CC-BY-SA-4.0, CC-BY-NC-SA-4.0) клон наследует эту лицензию, а переключатель лицензий блокируется.

Link to this sectionНастройки видимости#

Контролируй, кто может видеть твой набор данных:

Настройка	Описание
Private (Частный)	Только ты можешь получить доступ
Public (Публичный)	Любой желающий может посмотреть на странице Explore

Видимость устанавливается при создании набора данных в диалоговом окне New Dataset с помощью переключателя. Публичные наборы данных видны на странице Explore.

Link to this sectionРедактирование набора данных#

Метаданные набора данных редактируются непосредственно на странице набора данных — диалоговое окно не требуется:

Name: Нажми на имя набора данных, чтобы отредактировать его. Изменения сохраняются автоматически при потере фокуса или нажатии Enter.
Description: Нажми на описание (или заполнитель "Add a description..."), чтобы отредактировать его. Изменения сохраняются автоматически.
Task type: Нажми на значок задачи, чтобы выбрать другой тип задачи.
License: Нажми на селектор лицензии, чтобы изменить лицензию набора данных.

Изменение типа задачи

Каждое изображение хранит аннотации для всех типов задач вместе. Изменение типа задачи набора данных контролирует, какие аннотации видны в редакторе и включены в экспорт и обучение. Аннотации для других типов задач сохраняются в базе данных и появляются снова, когда ты переключаешься обратно.

Link to this sectionКлонирование набора данных#

При просмотре публичного набора данных, который тебе не принадлежит, нажми Clone Dataset, чтобы создать копию в своей рабочей области. Клон включает все изображения, аннотации и определения классов. Если оригинальный набор данных имеет лицензию copyleft, клон наследует её, и выбор лицензии будет заблокирован.

Link to this sectionОтметить и поделиться#

Star: Нажми кнопку со звездочкой, чтобы добавить набор данных в закладки. Количество отметок звездочкой видно всем пользователям.
Share: Для публичных наборов данных нажми кнопку «поделиться», чтобы скопировать ссылку или отправить её в социальные сети.

Link to this sectionУдалить набор данных#

Удаление набора данных, который тебе больше не нужен:

Открой меню действий набора данных
Нажми Delete
Подтверди действие в диалоговом окне: "Это переместит [name] в корзину. Ты сможешь восстановить его в течение 30 дней."

Корзина и восстановление

Удаленные наборы данных перемещаются в корзину, а не удаляются навсегда. Ты можешь восстановить их в течение 30 дней через Settings > Trash.

Link to this sectionОбучение на наборе данных#

Начни обучение прямо из своего набора данных:

Нажми New Model на странице набора данных
Выбери проект или создай новый
Настрой параметры обучения
Запусти обучение

graph LR
    A[Dataset]:::start --> B[New Model]:::proc
    B --> C[Select Project]:::proc
    C --> D[Configure]:::proc
    D --> E[Start Training]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff

Подробности см. в Cloud Training.

Link to this sectionFAQ#

Link to this sectionЧто происходит с моими данными после загрузки?#

Твои данные обрабатываются и хранятся в выбранном регионе (US, EU или AP). Изображения:

Проверяются на формат и размер
Отклоняются, если минимальный размер менее 28px
Нормализуются, если размер превышает 4096px (с сохранением соотношения сторон; кодируются для оптимизированного хранения)
Хранятся с использованием контентно-адресуемого хранилища (CAS) с хешированием XXH3-128
Миниатюры создаются в формате WebP размером 256px для быстрого просмотра

Link to this sectionКак работает хранилище?#

Ultralytics Platform использует Content-Addressable Storage (CAS) для эффективного хранения:

Deduplication: Идентичные изображения, загруженные разными пользователями, хранятся только один раз
Integrity: Хеширование XXH3-128 обеспечивает целостность данных
Efficiency: Сокращает расходы на хранение и ускоряет обработку
Regional: Данные остаются в выбранном тобой регионе (US, EU или AP)

Link to this sectionМожно ли добавить изображения в существующий набор данных?#

Да, перетащи файлы на страницу набора данных или используй кнопку загрузки, чтобы добавить дополнительные изображения. Новая статистика будет вычислена автоматически.

Link to this sectionКак перемещать изображения между сплитами?#

Используй функцию массового перемещения в сплит:

Выбери изображения в режиме таблицы
Нажми правой кнопкой мыши и выбери Move to split
Выбери целевой сплит (Train, Validation или Test)

Link to this sectionКакие форматы меток поддерживаются?#

Ultralytics Platform поддерживает метки YOLO, COCO JSON, Ultralytics NDJSON и загрузку необработанных изображений:

Один .txt файл на изображение с нормализованными координатами (диапазон 0-1):

Задача	Формат	Пример
Обнаружение	`class cx cy w h`	`0 0.5 0.5 0.2 0.3`
Сегментация	`class x1 y1 x2 y2 ...`	`0 0.1 0.1 0.9 0.1 0.9 0.9`
Поза	`class cx cy w h kx1 ky1 v1 ...`	`0 0.5 0.5 0.2 0.3 0.6 0.7 2`
OBB	`class x1 y1 x2 y2 x3 y3 x4 y4`	`0 0.1 0.1 0.9 0.1 0.9 0.9 0.1 0.9`
Классификация	Структура каталогов	`train/cats/`, `train/dogs/`

Флаги видимости поз: 0=не размечено, 1=размечено, но перекрыто, 2=размечено и видно.

Link to this sectionМогу ли я аннотировать один и тот же набор данных для нескольких типов задач?#

Да. Каждое изображение хранит аннотации для всех 6 типов задач (detect, segment, semantic, pose, OBB, classify) вместе. Ты можешь переключать активный тип задачи набора данных в любое время без потери существующих аннотаций. В редакторе отображаются, а также включаются в экспорт и обучение, только аннотации, соответствующие активному типу задачи — аннотации для других задач сохраняются и появляются снова при переключении обратно.

Участники

GLglenn-jocher²⁴ SEsergiuwaxmann⁵ LAlaodouya³ T-t-hakobyan² MYmykolaxboiko¹ LALaughing-q¹

Создано 14 янв. 2026 г.Обновлено 7 часов назад