Meet YOLO26: next-gen vision AI.

Link to this sectionПодготовка данных#

Подготовка данных — это основа успешных моделей компьютерного зрения. Ultralytics Platform предоставляет комплексные инструменты для управления данными для обучения: от загрузки и аннотирования до анализа.



Watch: Get Started with Ultralytics Platform - Data

Link to this sectionОбзор#

Раздел Data в Ultralytics Platform помогает тебе:

  • Загружать изображения, видео и файлы датасетов (ZIP, TAR, включая .tar.gz/.tgz, NDJSON)
  • Аннотировать с помощью инструментов ручной разметки и умной маркировки на базе SAM — выбирай между SAM 2.1 или новым SAM 3
  • Анализировать свои данные с помощью статистики и визуализаций
  • Экспортировать данные в формате NDJSON для локального обучения

Обзор данных в боковой панели Ultralytics Platform

Link to this sectionРабочий процесс#

graph LR
    A[Upload]:::start --> B[Annotate]:::proc
    B --> C[Analyze]:::proc
    C --> D[Train]:::out

    classDef start fill:#4CAF50,color:#fff
    classDef proc fill:#2196F3,color:#fff
    classDef out fill:#9C27B0,color:#fff
ЭтапОписание
ЗагрузкаИмпортируй изображения, видео или архивы с автоматической обработкой
РазметкаРазмечай данные с помощью ручных инструментов для всех 6 типов задач или используй аннотацию SAM для детекции, сегментации, семантической сегментации и OBB
АнализПросматривай распределение классов, пространственные тепловые карты и статистику размеров
ЭкспортСкачивай в формате NDJSON для оффлайн-использования

Link to this sectionПоддерживаемые задачи#

Ultralytics Platform поддерживает все 6 типов задач YOLO:

ЗадачаОписаниеИнструмент аннотирования
DetectДетекция объектов с ограничивающими рамками (BBox)Инструмент прямоугольника
SegmentСегментация экземпляров с пиксельными маскамиИнструмент многоугольника
SemanticСемантическая сегментация с пиксельными областями по классамИнструмент многоугольника
PoseОценка ключевых точек с помощью встроенных и пользовательских шаблонов скелетаИнструмент ключевых точек
OBBОриентированные ограничивающие рамки для повернутых объектовИнструмент ориентированной рамки
ClassifyКлассификация на уровне изображенияВыбор класса
Выбор типа задачи

Тип задачи устанавливается при создании датасета и определяет доступные инструменты аннотирования. Ты можешь изменить его позже через селектор задач в заголовке датасета, но несовместимые аннотации не будут отображаться после переключения.

Link to this sectionКлючевые особенности#

Link to this sectionУмное хранилище#

Ultralytics Platform использует контентно-адресуемое хранилище (CAS) для эффективного управления данными:

  • Дедупликация: Идентичные изображения хранятся только один раз благодаря хешированию XXH3-128
  • Целостность: Адресация на основе хешей гарантирует целостность данных
  • Эффективность: Оптимизированное хранение и быстрая обработка

Link to this sectionURI датасетов#

Ссылайся на датасеты, используя формат URI ul:// (см. Использование датасетов платформы):

yolo train data=ul://username/datasets/my-dataset

Это позволяет обучать модели на датасетах платформы с любого компьютера, где настроен твой API ключ.

Использование данных платформы из Python
from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.train(data="ul://username/datasets/my-dataset", epochs=100)

Link to this sectionВерсионирование датасетов#

Создавай неизменяемые снимки (снапшоты) NDJSON твоего датасета для воспроизводимого обучения. Каждая версия фиксирует количество изображений, классов и аннотаций на момент создания. Подробности см. во вкладке «Версии».

Link to this sectionВкладки набора данных#

Страницы датасетов могут содержать до шести вкладок в зависимости от состояния датасета и твоих прав доступа:

ВкладкаОписание
ИзображенияПросматривай изображения в виде сетки, компактного списка или таблицы с наложенными аннотациями
ClassesПросматривай и редактируй названия классов, цвета и количество меток для каждого класса
ГрафикиАвтоматическая статистика: распределение по выборкам (split), количество классов, тепловые карты
МоделиМодели, обученные на этом датасете, с метриками и статусом
ВерсииСоздавай и скачивай неизменяемые снимки NDJSON для воспроизводимого обучения
ОшибкиИзображения, обработка которых не удалась, с описанием ошибок и инструкциями по их исправлению

Вкладки Classes (Классы) и Charts (Графики) появляются, когда в датасете есть изображения. Errors (Ошибки) появляется только при наличии сбоев в обработке. Versions (Версии) доступна для владельцев или для пользователей с доступом, если версии уже существуют.

Link to this sectionКластеризация#

Исследуй датасет как интерактивную 2D-диаграмму рассеяния, где визуально похожие изображения расположены близко друг к другу. Это полезно для поиска кластеров, дубликатов и выбросов, а также для проверки распределения выборок или классов по данным. Выдели область на графике инструментом «лассо», чтобы отфильтровать галерею до этих изображений. Подробности см. в разделе Кластеризация.

Link to this sectionСтатистика и визуализация#

Вкладка Charts предоставляет автоматический анализ, включая:

  • Распределение выборок (Split Distribution): Круговая диаграмма количества изображений в обучающей, валидационной и тестовой выборках
  • Топ классов: Круговая диаграмма наиболее часто встречающихся классов аннотаций
  • Размеры изображений: Гистограмма распределения ширины и высоты изображений (в пикселях)
  • Точки на экземпляр: Распределение количества вершин многоугольника или ключевых точек (для датасетов сегментации или поз)
  • Расположение аннотаций: 2D тепловая карта расположения центров ограничивающих рамок
  • Размеры изображений 2D: 2D тепловая карта ширины относительно высоты с направляющими линиями соотношения сторон

Link to this sectionБыстрые ссылки#

Link to this sectionFAQ#

Link to this sectionКакие форматы файлов поддерживаются для загрузки?#

Ultralytics Platform поддерживает:

Изображения: JPEG, PNG, WebP, BMP, TIFF, HEIC, AVIF, JP2, DNG, MPO (макс. 50 МБ каждое)

Видео: MP4, WebM, MOV, MKV, M4V (макс. 1 ГБ, кадры извлекаются с частотой 1 FPS, максимум 100 кадров)

Файлы датасетов: Архивы ZIP или TAR, включая .tar.gz и .tgz (макс. 10 ГБ на Free, 20 ГБ на Pro, 50 ГБ на Enterprise), содержащие изображения с опциональными метками в формате YOLO, а также экспорт NDJSON

Link to this sectionКаков максимальный размер датасета?#

Лимиты хранилища зависят от твоего тарифного плана:

Тарифный планЛимит хранилища
Бесплатно100 ГБ
Pro500 ГБ
EnterpriseБез ограничений

Лимиты на отдельный файл: изображения 50 МБ, видео 1 ГБ, датасеты 10 ГБ на Free / 20 ГБ на Pro / 50 ГБ на Enterprise

Link to this sectionМогу ли я использовать датасеты платформы для локального обучения?#

Да! Используй формат URI датасета для локального обучения:

export ULTRALYTICS_API_KEY="YOUR_API_KEY"
yolo train model=yolo26n.pt data=ul://username/datasets/my-dataset epochs=100

Или экспортируй свой датасет в формате NDJSON для полностью оффлайн обучения.

Комментарии