Link to this sectionПодготовка данных#
Подготовка данных — это основа успешных моделей computer vision. Ultralytics Platform предоставляет комплексные инструменты для управления данными для обучения: от загрузки и разметки до анализа.
Watch: Get Started with Ultralytics Platform - Data
Link to this sectionОбзор#
Раздел «Данные» в Ultralytics Platform помогает тебе:
- Загружать изображения, видео и файлы датасетов (ZIP, TAR, включая
.tar.gz/.tgz, NDJSON) - Размечать с помощью ручных инструментов рисования и интеллектуальной разметки на базе SAM — выбери SAM 2.1 или новый SAM 3
- Анализировать свои данные с помощью статистики и визуализаций
- Экспортировать в формате NDJSON для локального обучения

Link to this sectionРабочий процесс#
graph LR
A[Upload] --> B[Annotate]
B --> C[Analyze]
C --> D[Train]
style A fill:#4CAF50,color:#fff
style B fill:#2196F3,color:#fff
style C fill:#FF9800,color:#fff
style D fill:#9C27B0,color:#fff| Этап | Описание |
|---|---|
| Загрузка | Импортируй изображения, видео или архивы с автоматической обработкой |
| Аннотирование | Размечай данные ручными инструментами для всех 6 типов задач или используй SAM-разметку для задач detect, segment, semantic и OBB |
| Анализ | Просматривай распределение классов, пространственные тепловые карты и статистику размеров |
| Экспорт | Скачивай в формате NDJSON для автономного использования |
Link to this sectionПоддерживаемые задачи#
Ultralytics Platform поддерживает все 6 типов задач YOLO:
| Задача | Описание | Инструмент разметки |
|---|---|---|
| Detect | Детекция объектов с помощью ограничивающих рамок | Инструмент «Прямоугольник» |
| Segment | Сегментация экземпляров с помощью масок пикселей | Инструмент «Полигон» |
| Semantic | Семантическая сегментация с областями пикселей для каждого класса | Инструмент «Полигон» |
| Pose | Оценка ключевых точек со встроенными и пользовательскими шаблонами скелетов | Инструмент «Ключевые точки» |
| OBB | Ориентированные ограничивающие рамки для повернутых объектов | Инструмент «Ориентированная рамка» |
| Classify | Классификация на уровне изображения | Выбор класса |
Тип задачи устанавливается при создании датасета и определяет, какие инструменты разметки будут доступны. Ты можешь изменить его позже в заголовке датасета, но несовместимая разметка не будет отображаться после переключения.
Link to this sectionОсновные функции#
Link to this sectionУмное хранилище#
Ultralytics Platform использует контентно-адресуемое хранилище (CAS) для эффективного управления данными:
- Дедупликация: Идентичные изображения сохраняются только один раз с помощью хеширования XXH3-128
- Целостность: Адресация на основе хешей обеспечивает целостность данных
- Эффективность: Оптимизированное хранение и быстрая обработка
Link to this sectionURI датасетов#
Ссылайся на датасеты, используя формат URI ul:// (см. Использование датасетов платформы):
yolo train data=ul://username/datasets/my-datasetЭто позволяет проводить обучение на датасетах платформы с любого компьютера, где настроен твой API key.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)Link to this sectionВерсионирование датасетов#
Создавай неизменяемые NDJSON-снимки твоего датасета для воспроизводимого обучения. Каждая версия фиксирует количество изображений, классов и разметок на момент создания. См. Вкладка версий для получения подробной информации.
Link to this sectionВкладки датасетов#
Страницы датасетов могут отображать до шести вкладок в зависимости от состояния датасета и твоих прав доступа:
| Вкладка | Описание |
|---|---|
| Изображения | Просматривай изображения в виде сетки, компактном или табличном виде с наложенной разметкой |
| Классы | Просматривай и редактируй названия классов, цвета и количество меток для каждого класса |
| Графики | Автоматическая статистика: распределение по выборкам, количество классов, тепловые карты |
| Модели | Модели, обученные на этом датасете, с метриками и статусом |
| Версии | Создавай и скачивай неизменяемые NDJSON-снимки для воспроизводимого обучения |
| Ошибки | Изображения, обработка которых не удалась, с описанием ошибок и рекомендациями по исправлению |
Classes and Charts appear when the dataset has images. Errors appears only when processing failures exist. Versions appears for owners, or for non-owners when versions already exist.
Link to this sectionКластеризация#
Исследуй свой датасет как интерактивную 2D-диаграмму рассеяния, где визуально похожие изображения находятся рядом — это полезно для поиска кластеров, дубликатов и выбросов, а также для проверки распределения выборок или классов по твоим данным. Выдели лассо область графика, чтобы отфильтровать галерею до этих изображений. См. Кластеризация для подробностей.
Link to this sectionСтатистика и визуализация#
The Charts tab provides automatic analysis including:
- Распределение выборок: Кольцевая диаграмма количества изображений для train/val/test
- Топ классов: Кольцевая диаграмма наиболее частых классов разметки
- Размеры изображений: Гистограмма распределения ширины и высоты изображений (в пикселях)
- Точек на экземпляр: Распределение количества вершин полигона или ключевых точек (для датасетов segment/pose)
- Расположение разметки: 2D тепловая карта позиций центров ограничивающих рамок
- Размеры изображений 2D: 2D тепловая карта ширины относительно высоты с направляющими линиями соотношения сторон
Link to this sectionБыстрые ссылки#
- Датасеты: Загружай, управляй и экспортируй свои данные для обучения
- Разметка: Размечай данные с помощью ручных и ИИ-инструментов
- Облачное обучение: Обучай модели на своих размеченных датасетах
- URI датасета: Используй URI
ul://для обучения из любого места
Link to this sectionFAQ#
Link to this sectionКакие форматы файлов поддерживаются для загрузки?#
Ultralytics Platform поддерживает:
Изображения: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (макс. 50 МБ каждое)
Видео: MP4, WebM, MOV, AVI, MKV, M4V (макс. 1 ГБ, кадры извлекаются с частотой 1 FPS, макс. 100 кадров)
Файлы датасетов: Архивы ZIP или TAR, включая .tar.gz и .tgz (макс. 10 ГБ на тарифе Free, 20 ГБ на Pro, 50 ГБ на Enterprise), содержащие изображения с опциональными метками в формате YOLO, а также экспорты NDJSON
Link to this sectionКаков максимальный размер датасета?#
Лимиты хранилища зависят от твоего тарифного плана:
| Тариф | Лимит хранилища |
|---|---|
| Free | 100 ГБ |
| Pro | 500 ГБ |
| Enterprise | Безлимитно |
Лимиты на отдельные файлы: Изображения 50 МБ, видео 1 ГБ, датасеты 10 ГБ на Free / 20 ГБ на Pro / 50 ГБ на Enterprise
Link to this sectionМогу ли я использовать свои датасеты платформы для локального обучения?#
Да! Используй формат URI датасета для локального обучения:
export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100Или экспортируй свой датасет в формате NDJSON для полностью автономного обучения.