Краткое руководство по началу работы: NVIDIA DGX Spark с Ultralytics YOLO26

Q: How do I deploy Ultralytics YOLO26 on NVIDIA DGX Spark?

Развертывание Ultralytics YOLO26 на NVIDIA DGX Spark просто. Вы можете использовать предварительно собранный образ Docker для быстрой настройки или вручную установить необходимые пакеты. Подробные шаги для каждого подхода можно найти в разделах «Быстрый старт с Docker» и «Начало работы с нативной установкой».

Q: Can I use the same Docker image for DGX Spark and Jetson AGX Thor?

Да! Образ Docker ultralytics/ultralytics:latest-nvidia-arm64 поддерживает как NVIDIA DGX Spark (с DGX OS), так и Jetson AGX Thor (с JetPack 7.0), поскольку оба используют архитектуру ARM64 с CUDA 13 и аналогичными программными стеками.

Это исчерпывающее руководство содержит подробное описание развертывания Ultralytics YOLO26 на NVIDIA DGX Spark, компактном настольном суперкомпьютере с ИИ от NVIDIA. Кроме того, в нем представлены результаты сравнительных тестов производительности, демонстрирующие возможности YOLO26 на этой мощной системе.

Обзор рабочей станции NVIDIA Spark AI

Примечание

Это руководство было протестировано с NVIDIA DGX Spark Founders Edition, работающим под управлением DGX OS на базе Ubuntu. Ожидается, что оно будет работать с последними выпусками DGX OS.

Что такое NVIDIA DGX Spark?

NVIDIA DGX Spark — это компактный настольный суперкомпьютер для ИИ, работающий на базе суперчипа NVIDIA GB10 Grace Blackwell. Он обеспечивает до 1 петафлопса вычислительной производительности ИИ с точностью FP4, что делает его идеальным для разработчиков, исследователей и специалистов по данным, которым требуются мощные возможности ИИ в настольном форм-факторе.

Ключевые характеристики

Характеристики	Подробности
Производительность ИИ	До 1 PFLOP (FP4)
GPU	Архитектура NVIDIA Blackwell с тензорными ядрами 5-го поколения, ядрами RT 4-го поколения
CPU	20-ядерный процессор Arm (10 Cortex-X925 + 10 Cortex-A725)
Память	128 ГБ унифицированной системной памяти LPDDR5x, 256-битный интерфейс, 4266 МГц, пропускная способность 273 ГБ/с
Хранилище	1 ТБ или 4 ТБ NVMe M.2 с самошифрованием
Сетевые возможности	1x RJ-45 (10 GbE), ConnectX-7 Smart NIC, Wi-Fi 7, Bluetooth 5.4
Интерфейсы	4x USB Type-C, 1x HDMI 2.1a, многоканальный звук HDMI
Обработка видео	1x NVENC, 1x NVDEC

DGX OS

NVIDIA DGX OS — это специализированный дистрибутив Linux, который обеспечивает стабильную, протестированную и поддерживаемую основу операционной системы для запуска приложений ИИ, машинного обучения и аналитики на системах DGX. Он включает:

Надежная основа Linux, оптимизированная для рабочих нагрузок ИИ
Предварительно настроенные драйверы и системные параметры для оборудования NVIDIA
Обновления безопасности и возможности обслуживания системы
Совместимость с более широкой программной экосистемой NVIDIA

DGX OS придерживается регулярного графика выпуска обновлений, которые обычно предоставляются два раза в год (примерно в феврале и августе), с дополнительными исправлениями безопасности между основными выпусками.

Панель управления DGX

DGX Spark поставляется со встроенной панелью управления DGX, которая предоставляет:

Мониторинг системы в реальном времени: Обзор текущих операционных метрик системы
Обновления системы: Возможность применять обновления непосредственно из панели управления
Настройки системы: Изменение имени устройства и других конфигураций
Интегрированный JupyterLab: Доступ к локальным Jupyter Notebooks для разработки

Интерфейс панели управления NVIDIA

Доступ к панели управления

ЛокальноУдаленно через SSHУдаленно через NVIDIA Sync

Нажмите кнопку «Показать приложения» в левом нижнем углу рабочего стола Ubuntu, затем выберите «DGX Dashboard», чтобы открыть его в браузере.

# Open an SSH tunnel
ssh -L 11000:localhost:11000 username@spark-abcd.local

# Then open in browser
# http://localhost:11000

После подключения через NVIDIA Sync нажмите кнопку «DGX Dashboard», чтобы открыть панель управления по адресу http://localhost:11000.

Интегрированный JupyterLab

Панель управления включает интегрированный экземпляр JupyterLab, который автоматически создает виртуальное окружение и устанавливает рекомендуемые пакеты при запуске. Каждой учетной записи пользователя назначается выделенный порт для доступа к JupyterLab.

Быстрый старт с Docker

Самый быстрый способ начать работу с Ultralytics YOLO26 на NVIDIA DGX Spark — это запуск с использованием предварительно собранных образов Docker. Тот же образ Docker, который поддерживает Jetson AGX Thor (JetPack 7.0), работает на DGX Spark с DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

После этого перейдите к разделу «Использование TensorRT на NVIDIA DGX Spark».

Начало с собственной установки

Для нативной установки без Docker выполните следующие шаги.

Установка пакета Ultralytics

Здесь мы установим пакет Ultralytics на DGX Spark с опциональными зависимостями, чтобы мы могли экспортировать модели PyTorch в другие форматы. Мы сосредоточимся в основном на экспорте в NVIDIA TensorRT, поскольку TensorRT обеспечит максимальную производительность DGX Spark.

Обновите список пакетов, установите pip и обновите до последней версии
```
sudo apt update
sudo apt install python3-pip -y
pip install -U pip
```
Установите ultralytics пакет pip с необязательными зависимостями
```
pip install ultralytics[export]
```
Перезагрузите устройство
```
sudo reboot
```

Установка PyTorch и Torchvision

Вышеуказанная установка Ultralytics установит Torch и Torchvision. Однако эти пакеты, установленные через pip, могут быть не полностью оптимизированы для архитектуры ARM64 DGX Spark с CUDA 13. Поэтому мы рекомендуем устанавливать версии, совместимые с CUDA 13:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130

Информация

При запуске PyTorch 2.9.1 на NVIDIA DGX Spark вы можете столкнуться со следующим UserWarning при инициализации CUDA (например, при запуске yolo checks, yolo predict, и т.д.):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Это предупреждение можно безопасно игнорировать. Для постоянного решения этой проблемы было отправлено исправление в PyTorch PR #164590, которое будет включено в выпуск PyTorch 2.10.

Установите `onnxruntime-gpu`

Параметр onnxruntime-gpu пакет, размещенный в PyPI, не имеет aarch64 бинарные файлы для систем ARM64. Поэтому нам нужно вручную установить этот пакет. Этот пакет необходим для некоторых видов экспорта.

Здесь мы скачаем и установим onnxruntime-gpu 1.24.0 с Python3.12 поддержкой.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

Использование TensorRT на NVIDIA DGX Spark

Среди всех форматов экспорта моделей, поддерживаемых Ultralytics, TensorRT обеспечивает высочайшую производительность инференса на NVIDIA DGX Spark, что делает его нашей главной рекомендацией для развертываний. Инструкции по настройке и расширенному использованию см. в нашем специальном руководстве по интеграции TensorRT.

Преобразование модели в TensorRT и запуск вывода

Модель YOLO26n в формате PyTorch преобразуется в TensorRT для выполнения инференса с экспортированной моделью.

Пример

PythonCLI

from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")

# Export a YOLO26n PyTorch model to TensorRT format
yolo export model=yolo26n.pt format=engine # creates 'yolo26n.engine'

# Run inference with the exported model
yolo predict model=yolo26n.engine source='https://ultralytics.com/images/bus.jpg'

Примечание

Посетите страницу экспорта, чтобы получить доступ к дополнительным аргументам при экспорте моделей в различные форматы.

Тесты NVIDIA DGX Spark YOLO11

Бенчмарки YOLO11 были проведены командой Ultralytics на нескольких форматах моделей, измеряя скорость и точность: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Бенчмарки были запущены на NVIDIA DGX Spark с точностью FP32 и размером входного изображения по умолчанию 640.

Подробная сравнительная таблица

В таблице ниже представлены результаты бенчмарков для пяти различных моделей (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) в различных форматах, показывающие статус, размер, метрику mAP50-95(B) и время инференса для каждой комбинации.

Производительность

YOLO11nYOLO11sYOLO11mYOLO11lYOLO11x

Формат	Статус	Размер на диске (МБ)	mAP50-95(B)	Время инференса (мс/изобр.)
PyTorch	✅	5.4	0.5071	2.67
TorchScript	✅	10.5	0.5083	2.62
ONNX	✅	10.2	0.5074	5.92
OpenVINO	✅	10.4	0.5058	14.95
TensorRT (FP32)	✅	12.8	0.5085	1.95
TensorRT (FP16)	✅	7.0	0.5068	1.01
TensorRT (INT8)	✅	18.6	0.4880	1.62
TF SavedModel	✅	25.7	0.5076	36.39
TF GraphDef	✅	10.3	0.5076	41.06
TF Lite	✅	10.3	0.5075	64.36
MNN	✅	10.1	0.5075	12.14
NCNN	✅	10.2	0.5041	12.31
ExecuTorch	✅	10.2	0.5075	27.61

Формат	Статус	Размер на диске (МБ)	mAP50-95(B)	Время инференса (мс/изобр.)
PyTorch	✅	18.4	0.5767	5.38
TorchScript	✅	36.5	0.5781	5.48
ONNX	✅	36.3	0.5784	8.17
OpenVINO	✅	36.4	0.5809	27.12
TensorRT (FP32)	✅	39.8	0.5783	3.59
TensorRT (FP16)	✅	20.1	0.5800	1.85
TensorRT (INT8)	✅	17.5	0.5664	1.88
TF SavedModel	✅	90.8	0.5782	66.63
TF GraphDef	✅	36.3	0.5782	71.67
TF Lite	✅	36.3	0.5782	187.36
MNN	✅	36.2	0.5775	27.05
NCNN	✅	36.2	0.5806	26.26
ExecuTorch	✅	36.2	0.5782	54.73

Формат	Статус	Размер на диске (МБ)	mAP50-95(B)	Время инференса (мс/изобр.)
PyTorch	✅	38.8	0.6254	11.14
TorchScript	✅	77.3	0.6304	12.00
ONNX	✅	76.9	0.6304	13.83
OpenVINO	✅	77.1	0.6284	62.44
TensorRT (FP32)	✅	79.9	0.6305	6.96
TensorRT (FP16)	✅	40.6	0.6313	3.14
TensorRT (INT8)	✅	26.6	0.6204	3.30
TF SavedModel	✅	192.4	0.6306	139.85
TF GraphDef	✅	76.9	0.6306	146.76
TF Lite	✅	76.9	0.6306	568.18
MNN	✅	76.8	0.6306	67.67
NCNN	✅	76.8	0.6308	60.49
ExecuTorch	✅	76.9	0.6306	120.37

Формат	Статус	Размер на диске (МБ)	mAP50-95(B)	Время инференса (мс/изобр.)
PyTorch	✅	49.0	0.6366	13.95
TorchScript	✅	97.6	0.6399	15.67
ONNX	✅	97.0	0.6399	16.62
OpenVINO	✅	97.3	0.6377	78.80
TensorRT (FP32)	✅	99.2	0.6407	8.86
TensorRT (FP16)	✅	50.8	0.6350	3.85
TensorRT (INT8)	✅	32.5	0.6224	4.52
TF SavedModel	✅	242.7	0.6409	187.45
TF GraphDef	✅	97.0	0.6409	193.92
TF Lite	✅	97.0	0.6409	728.61
MNN	✅	96.9	0.6369	85.21
NCNN	✅	96.9	0.6373	77.62
ExecuTorch	✅	97.0	0.6409	153.56

Формат	Статус	Размер на диске (МБ)	mAP50-95(B)	Время инференса (мс/изобр.)
PyTorch	✅	109.3	0.6992	23.19
TorchScript	✅	218.1	0.6900	25.75
ONNX	✅	217.5	0.6900	27.43
OpenVINO	✅	217.8	0.6872	149.44
TensorRT (FP32)	✅	222.7	0.6902	13.87
TensorRT (FP16)	✅	111.1	0.6883	6.19
TensorRT (INT8)	✅	62.9	0.6793	6.62
TF SavedModel	✅	543.9	0.6900	335.10
TF GraphDef	✅	217.5	0.6900	348.86
TF Lite	✅	217.5	0.6900	1578.66
MNN	✅	217.3	0.6874	168.95
NCNN	✅	217.4	0.6901	132.13
ExecuTorch	✅	217.4	0.6900	297.17

Протестировано с Ultralytics 8.3.249

Воспроизведение наших результатов

Чтобы воспроизвести вышеуказанные тесты Ultralytics для всех форматов экспорта, запустите этот код:

Пример

PythonCLI

from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
yolo benchmark model=yolo26n.pt data=coco128.yaml imgsz=640

Обратите внимание, что результаты бенчмаркинга могут варьироваться в зависимости от точной аппаратной и программной конфигурации системы, а также от текущей загрузки системы во время выполнения бенчмарков. Для получения наиболее надежных результатов используйте набор данных с большим количеством изображений, например, data='coco.yaml' (5000 изображений для проверки).

Обновления системы (Founders Edition)

Поддержание актуальности вашей DGX Spark Founders Edition критически важно для производительности и безопасности. NVIDIA предлагает два основных метода обновления системной ОС, драйверов и прошивки.

Использование панели управления DGX (рекомендуется)

The DGX Dashboard — это рекомендуемый способ выполнения системных обновлений, обеспечивающий совместимость. Он позволяет:

Просмотр доступных системных обновлений
Установка исправлений безопасности и системных обновлений
Управление обновлениями драйверов и прошивки NVIDIA

Ручные обновления системы

Для опытных пользователей обновления могут быть выполнены вручную через терминал:

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot

Предупреждение

Перед выполнением обновлений убедитесь, что ваша система подключена к стабильному источнику питания и вы создали резервные копии важных данных.

Следующие шаги

Для дальнейшего изучения и поддержки см. документацию Ultralytics YOLO26.

Часто задаваемые вопросы

Как развернуть Ultralytics YOLO26 на NVIDIA DGX Spark?

Развертывание Ultralytics YOLO26 на NVIDIA DGX Spark не представляет сложности. Вы можете использовать предварительно собранный образ Docker для быстрой настройки или вручную установить необходимые пакеты. Подробные шаги для каждого подхода можно найти в разделах Быстрый старт с Docker и Начало работы с нативной установкой.

Какую производительность можно ожидать от YOLO26 на NVIDIA DGX Spark?

Модели YOLO26 демонстрируют отличную производительность на DGX Spark благодаря суперчипу GB10 Grace Blackwell. Формат TensorRT обеспечивает наилучшую производительность инференса. Конкретные результаты сравнительных тестов для различных размеров и форматов моделей приведены в разделе Подробная сравнительная таблица.

Почему мне следует использовать TensorRT для YOLO26 на DGX Spark?

TensorRT настоятельно рекомендуется для развертывания моделей YOLO26 на DGX Spark благодаря его оптимальной производительности. Он ускоряет инференс, используя возможности GPU Blackwell, обеспечивая максимальную эффективность и скорость. Подробнее см. в разделе Использование TensorRT на NVIDIA DGX Spark.

Как DGX Spark соотносится с устройствами Jetson для YOLO26?

DGX Spark предлагает значительно большую вычислительную мощность, чем устройства Jetson, с производительностью ИИ до 1 PFLOP и 128 ГБ унифицированной памяти, по сравнению с 2070 TFLOPS и 128 ГБ памяти Jetson AGX Thor. DGX Spark разработан как настольный суперкомпьютер для ИИ, в то время как устройства Jetson — это встраиваемые системы, оптимизированные для развертывания на периферии.

Могу ли я использовать один и тот же образ Docker для DGX Spark и Jetson AGX Thor?

Да! Образ ultralytics/ultralytics:latest-nvidia-arm64 Docker поддерживает как NVIDIA DGX Spark (с DGX OS), так и Jetson AGX Thor (с JetPack 7.0), поскольку оба используют архитектуру ARM64 с CUDA 13 и аналогичными программными стеками.

📅 Создано 1 месяц назад ✏️ Обновлено 1 месяц назад

Краткое руководство по началу работы: NVIDIA DGX Spark с Ultralytics YOLO26

Что такое NVIDIA DGX Spark?

Ключевые характеристики

DGX OS

Панель управления DGX

Доступ к панели управления

Быстрый старт с Docker

Начало с собственной установки

Установка пакета Ultralytics

Установка PyTorch и Torchvision

Установите `onnxruntime-gpu`

Использование TensorRT на NVIDIA DGX Spark

Преобразование модели в TensorRT и запуск вывода

Тесты NVIDIA DGX Spark YOLO11

Подробная сравнительная таблица

Воспроизведение наших результатов

Рекомендации по использованию NVIDIA DGX Spark

Обновления системы (Founders Edition)

Использование панели управления DGX (рекомендуется)

Ручные обновления системы

Следующие шаги

Часто задаваемые вопросы

Как развернуть Ultralytics YOLO26 на NVIDIA DGX Spark?

Какую производительность можно ожидать от YOLO26 на NVIDIA DGX Spark?

Почему мне следует использовать TensorRT для YOLO26 на DGX Spark?

Как DGX Spark соотносится с устройствами Jetson для YOLO26?

Могу ли я использовать один и тот же образ Docker для DGX Spark и Jetson AGX Thor?

Комментарии

Краткое руководство по началу работы: NVIDIA DGX Spark с Ultralytics YOLO26

Что такое NVIDIA DGX Spark?

Ключевые характеристики

DGX OS

Панель управления DGX

Доступ к панели управления

Быстрый старт с Docker

Начало с собственной установки

Установка пакета Ultralytics

Установка PyTorch и Torchvision

Установите onnxruntime-gpu

Использование TensorRT на NVIDIA DGX Spark

Преобразование модели в TensorRT и запуск вывода

Тесты NVIDIA DGX Spark YOLO11

Подробная сравнительная таблица

Воспроизведение наших результатов

Рекомендации по использованию NVIDIA DGX Spark

Обновления системы (Founders Edition)

Использование панели управления DGX (рекомендуется)

Ручные обновления системы

Следующие шаги

Часто задаваемые вопросы

Как развернуть Ultralytics YOLO26 на NVIDIA DGX Spark?

Какую производительность можно ожидать от YOLO26 на NVIDIA DGX Spark?

Почему мне следует использовать TensorRT для YOLO26 на DGX Spark?

Как DGX Spark соотносится с устройствами Jetson для YOLO26?

Могу ли я использовать один и тот же образ Docker для DGX Spark и Jetson AGX Thor?

Комментарии

Установите `onnxruntime-gpu`