Link to this sectionКраткое руководство: NVIDIA DGX Spark с Ultralytics YOLO26#
Это подробное руководство содержит пошаговое описание развертывания Ultralytics YOLO26 на NVIDIA DGX Spark — компактном настольном суперкомпьютере NVIDIA для задач ИИ. Кроме того, в нем представлены результаты тестирования производительности, демонстрирующие возможности YOLO26 на этой мощной системе.
Это руководство было протестировано с использованием NVIDIA DGX Spark Founders Edition под управлением DGX OS на базе Ubuntu. Ожидается, что оно будет работать и с последними выпусками DGX OS.
Link to this sectionЧто такое NVIDIA DGX Spark?#
NVIDIA DGX Spark — это компактный настольный суперкомпьютер для ИИ, работающий на базе суперчипа NVIDIA GB10 Grace Blackwell. Он обеспечивает производительность до 1 петафлопса в вычислениях ИИ при точности FP4, что делает его идеальным решением для разработчиков, исследователей и специалистов по анализу данных, которым необходимы мощные вычислительные ресурсы в настольном форм-факторе.
Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference
Link to this sectionОсновные технические характеристики#
| Характеристика | Детали |
|---|---|
| Производительность ИИ | До 1 PFLOP (FP4) |
| GPU | Архитектура NVIDIA Blackwell с тензорными ядрами 5-го поколения и RT-ядрами 4-го поколения |
| CPU | 20-ядерный процессор Arm (10 Cortex-X925 + 10 Cortex-A725) |
| Память | 128 ГБ объединенной системной памяти LPDDR5x, 256-битный интерфейс, 4266 МГц, пропускная способность 273 ГБ/с |
| Хранилище | 1 ТБ или 4 ТБ NVMe M.2 с аппаратным шифрованием |
| Сеть | 1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4 |
| Подключения | 4x USB Type-C, 1x HDMI 2.1a, многоканальный звук по HDMI |
| Обработка видео | 1x NVENC, 1x NVDEC |
Link to this sectionDGX OS#
NVIDIA DGX OS — это специализированный дистрибутив Linux, предоставляющий стабильную, протестированную и поддерживаемую операционную систему в качестве основы для запуска приложений ИИ, машинного обучения и аналитики на системах DGX. Она включает:
- Надежную основу Linux, оптимизированную для рабочих нагрузок ИИ
- Предварительно настроенные драйверы и системные параметры для оборудования NVIDIA
- Возможности обновлений безопасности и обслуживания системы
- Совместимость с более широкой экосистемой программного обеспечения NVIDIA
DGX OS выпускается по регулярному графику: обновления обычно выходят дважды в год (около февраля и августа), а между основными выпусками предоставляются дополнительные исправления безопасности.
Link to this sectionПанель управления DGX#
DGX Spark поставляется со встроенной панелью управления DGX, которая обеспечивает:
- Мониторинг системы в реальном времени: обзор текущих операционных метрик системы
- Обновления системы: возможность применять обновления прямо из панели управления
- Системные настройки: изменение имени устройства и других конфигураций
- Интегрированный JupyterLab: доступ к локальным Jupyter Notebooks для разработки
Link to this sectionДоступ к панели управления#
Нажми кнопку "Show Apps" в левом нижнем углу рабочего стола Ubuntu, затем выбери "DGX Dashboard", чтобы открыть ее в браузере.
Панель управления включает интегрированный экземпляр JupyterLab, который при запуске автоматически создает виртуальное окружение и устанавливает рекомендуемые пакеты. Каждой учетной записи пользователя назначается выделенный порт для доступа к JupyterLab.
Link to this sectionКраткое начало работы с Docker#
Самый быстрый способ начать работу с Ultralytics YOLO26 на NVIDIA DGX Spark — это использовать предварительно собранные образы Docker. Тот же образ Docker, который поддерживает Jetson AGX Thor (JetPack 7.0), работает и на DGX Spark с DGX OS.
t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $tПосле завершения перейди к разделу Использование TensorRT на NVIDIA DGX Spark.
Link to this sectionНачало работы с нативной установкой#
Для нативной установки без Docker выполни следующие действия.
Link to this sectionУстановка пакета Ultralytics#
Здесь мы установим пакет Ultralytics на DGX Spark с дополнительными зависимостями, чтобы можно было экспортировать модели PyTorch в другие форматы. Мы сосредоточимся в основном на экспорте в NVIDIA TensorRT, так как TensorRT позволит нам получить максимальную производительность от DGX Spark.
-
Обнови список пакетов, установи pip и обнови его до последней версии
sudo apt update sudo apt install python3-pip -y pip install -U pip -
Установи pip-пакет
ultralyticsс дополнительными зависимостямиpip install ultralytics[export] -
Перезагрузи устройство
sudo reboot
Link to this sectionУстановка PyTorch и Torchvision#
Установка ultralytics выше установит Torch и Torchvision. Однако эти пакеты, установленные через pip, могут быть не полностью оптимизированы для архитектуры ARM64 DGX Spark с CUDA 13. Поэтому мы рекомендуем устанавливать версии, совместимые с CUDA 13:
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130При запуске PyTorch 2.9.1 на NVIDIA DGX Spark ты можешь столкнуться со следующим UserWarning при инициализации CUDA (например, при запуске yolo checks, yolo predict и т. д.):
UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)Это предупреждение можно смело игнорировать. Чтобы исправить это навсегда, в PyTorch был отправлен PR #164590, который будет включен в релиз PyTorch 2.10.
Link to this sectionУстановка onnxruntime-gpu#
Пакет onnxruntime-gpu, размещенный в PyPI, не имеет бинарных файлов aarch64 для систем ARM64. Поэтому нам нужно установить этот пакет вручную. Этот пакет необходим для некоторых видов экспорта.
Здесь мы скачаем и установим onnxruntime-gpu 1.24.0 с поддержкой Python3.12.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whlLink to this sectionИспользование TensorRT на NVIDIA DGX Spark#
Среди всех форматов экспорта моделей, поддерживаемых Ultralytics, TensorRT предлагает самую высокую производительность вывода на NVIDIA DGX Spark, что делает его нашей главной рекомендацией для развертываний. Инструкции по настройке и расширенному использованию см. в нашем специальном руководстве по интеграции TensorRT.
Link to this sectionПреобразование модели в TensorRT и запуск вывода#
Модель YOLO26n в формате PyTorch преобразуется в TensorRT для запуска вывода с экспортированной моделью.
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo26n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")Посети страницу экспорта, чтобы получить доступ к дополнительным аргументам при экспорте моделей в различные форматы
Link to this sectionБенчмарки YOLO11 на NVIDIA DGX Spark#
Бенчмарки YOLO11 были выполнены командой Ultralytics для нескольких форматов моделей с измерением скорости и точности: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Бенчмарки запускались на NVIDIA DGX Spark при точности FP32 со стандартным размером входного изображения 640.
Link to this sectionПодробная сравнительная таблица#
В таблице ниже представлены результаты тестирования пяти различных моделей (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) в различных форматах, что дает нам статус, размер, метрику mAP50-95(B) и время вывода для каждой комбинации.
| Формат | Статус | Размер на диске (МБ) | mAP50-95(B) | Время вывода (мс/из) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.4 | 0.5071 | 2.67 |
| TorchScript | ✅ | 10.5 | 0.5083 | 2.62 |
| ONNX | ✅ | 10.2 | 0.5074 | 5.92 |
| OpenVINO | ✅ | 10.4 | 0.5058 | 14.95 |
| TensorRT (FP32) | ✅ | 12.8 | 0.5085 | 1.95 |
| TensorRT (FP16) | ✅ | 7.0 | 0.5068 | 1.01 |
| TensorRT (INT8) | ✅ | 18.6 | 0.4880 | 1.62 |
| TF SavedModel | ✅ | 25.7 | 0.5076 | 36.39 |
| TF GraphDef | ✅ | 10.3 | 0.5076 | 41.06 |
| TF Lite | ✅ | 10.3 | 0.5075 | 64.36 |
| MNN | ✅ | 10.1 | 0.5075 | 12.14 |
| NCNN | ✅ | 10.2 | 0.5041 | 12.31 |
| ExecuTorch | ✅ | 10.2 | 0.5075 | 27.61 |
Протестировано с помощью Ultralytics 8.3.249
Link to this sectionВоспроизведение наших результатов#
Чтобы воспроизвести вышеуказанные тесты Ultralytics для всех форматов экспорта, запусти этот код:
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)Обрати внимание, что результаты тестирования могут различаться в зависимости от конфигурации оборудования и программного обеспечения системы, а также от текущей нагрузки на систему во время проведения тестов. Для получения наиболее достоверных результатов используй набор данных с большим количеством изображений, например data='coco.yaml' (5000 изображений для валидации).
Link to this sectionРекомендации для NVIDIA DGX Spark#
При использовании NVIDIA DGX Spark следуй нескольким рекомендациям, чтобы обеспечить максимальную производительность при работе с YOLO26.
-
Мониторинг производительности системы
Используй инструменты мониторинга NVIDIA для отслеживания загрузки GPU и CPU:
nvidia-smi -
Оптимизация использования памяти
Благодаря 128 ГБ объединенной памяти DGX Spark может обрабатывать большие размеры пакетов (batch sizes) и модели. Подумай об увеличении размера пакета для повышения пропускной способности:
from ultralytics import YOLO model = YOLO("yolo26n.engine") results = model.predict(source="path/to/images", batch=16) -
Используй TensorRT с FP16 или INT8
Для достижения наилучшей производительности экспортируй модели с использованием точности FP16 или INT8:
yolo export model=yolo26n.pt format=engine half=True # FP16 yolo export model=yolo26n.pt format=engine int8=True # INT8
Link to this sectionОбновления системы (Founders Edition)#
Поддержание актуальной версии DGX Spark Founders Edition критически важно для производительности и безопасности. NVIDIA предоставляет два основных метода обновления ОС системы, драйверов и прошивки.
Link to this sectionИспользование DGX Dashboard (рекомендуется)#
DGX Dashboard — это рекомендуемый способ выполнения системных обновлений, гарантирующий совместимость. Он позволяет:
- Просматривать доступные обновления системы
- Устанавливать патчи безопасности и системные обновления
- Управлять обновлениями драйверов и прошивки NVIDIA
Link to this sectionОбновления системы вручную#
Для продвинутых пользователей обновления можно выполнять вручную через терминал:
sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo rebootПеред выполнением обновлений убедись, что твоя система подключена к стабильному источнику питания, а важные данные скопированы.
Link to this sectionДальнейшие шаги#
Для получения дополнительной информации и поддержки ознакомься с документацией Ultralytics YOLO26.
Link to this sectionFAQ#
Link to this sectionКак развернуть Ultralytics YOLO26 на NVIDIA DGX Spark?#
Развертывание Ultralytics YOLO26 на NVIDIA DGX Spark выполняется просто. Ты можешь использовать готовый образ Docker для быстрой настройки или установить необходимые пакеты вручную. Подробные инструкции для каждого подхода можно найти в разделах Quick Start with Docker и Start with Native Installation.
Link to this sectionКакую производительность я могу ожидать от YOLO26 на NVIDIA DGX Spark?#
Модели YOLO26 обеспечивают отличную производительность на DGX Spark благодаря суперчипу GB10 Grace Blackwell. Формат TensorRT обеспечивает наилучшую производительность логического вывода. Ознакомься с разделом Detailed Comparison Table для получения конкретных результатов тестов для разных размеров и форматов моделей.
Link to this sectionПочему мне следует использовать TensorRT для YOLO26 на DGX Spark?#
TensorRT настоятельно рекомендуется для развертывания моделей YOLO26 на DGX Spark из-за своей оптимальной производительности. Он ускоряет логический вывод, используя возможности GPU Blackwell, что обеспечивает максимальную эффективность и скорость. Узнай больше в разделе Use TensorRT on NVIDIA DGX Spark.
Link to this sectionКак DGX Spark соотносится с устройствами Jetson при работе с YOLO26?#
DGX Spark предлагает производительность ИИ до 1 ПФЛОПС и 128 ГБ объединенной памяти, в то время как Jetson AGX Thor обладает 2070 ТФЛОПС и 128 ГБ памяти. DGX Spark спроектирован как настольный ИИ-суперкомпьютер, тогда как устройства Jetson — это встраиваемые системы, оптимизированные для развертывания на периферии (edge).
Link to this sectionМогу ли я использовать один и тот же образ Docker для DGX Spark и Jetson AGX Thor?#
Да! Образ Docker ultralytics/ultralytics:latest-nvidia-arm64 поддерживает как NVIDIA DGX Spark (с DGX OS), так и Jetson AGX Thor (с JetPack 7.0), поскольку оба устройства используют архитектуру ARM64 с CUDA 13 и схожими программными стеками.