Meet YOLO26: next-gen vision AI.

Link to this sectionКраткое руководство: NVIDIA DGX Spark с Ultralytics YOLO26#

Это подробное руководство содержит пошаговое описание развертывания Ultralytics YOLO26 на NVIDIA DGX Spark — компактном настольном суперкомпьютере NVIDIA для задач ИИ. Кроме того, в нем представлены результаты тестирования производительности, демонстрирующие возможности YOLO26 на этой мощной системе.

NVIDIA DGX Spark AI workstation overview

Примечание

Это руководство было протестировано с использованием NVIDIA DGX Spark Founders Edition под управлением DGX OS на базе Ubuntu. Ожидается, что оно будет работать и с последними выпусками DGX OS.

Link to this sectionЧто такое NVIDIA DGX Spark?#

NVIDIA DGX Spark — это компактный настольный суперкомпьютер для ИИ, работающий на базе суперчипа NVIDIA GB10 Grace Blackwell. Он обеспечивает производительность до 1 петафлопса в вычислениях ИИ при точности FP4, что делает его идеальным решением для разработчиков, исследователей и специалистов по анализу данных, которым необходимы мощные вычислительные ресурсы в настольном форм-факторе.



Watch: How to Get up to 1000 FPS with Ultralytics YOLO26 on NVIDIA DGX Spark | TensorRT & Batch Inference

Link to this sectionОсновные технические характеристики#

ХарактеристикаДетали
Производительность ИИДо 1 PFLOP (FP4)
GPUАрхитектура NVIDIA Blackwell с тензорными ядрами 5-го поколения и RT-ядрами 4-го поколения
CPU20-ядерный процессор Arm (10 Cortex-X925 + 10 Cortex-A725)
Память128 ГБ объединенной системной памяти LPDDR5x, 256-битный интерфейс, 4266 МГц, пропускная способность 273 ГБ/с
Хранилище1 ТБ или 4 ТБ NVMe M.2 с аппаратным шифрованием
Сеть1x RJ-45 (10 GbE), Smart NIC ConnectX-7, Wi-Fi 7, Bluetooth 5.4
Подключения4x USB Type-C, 1x HDMI 2.1a, многоканальный звук по HDMI
Обработка видео1x NVENC, 1x NVDEC

Link to this sectionDGX OS#

NVIDIA DGX OS — это специализированный дистрибутив Linux, предоставляющий стабильную, протестированную и поддерживаемую операционную систему в качестве основы для запуска приложений ИИ, машинного обучения и аналитики на системах DGX. Она включает:

  • Надежную основу Linux, оптимизированную для рабочих нагрузок ИИ
  • Предварительно настроенные драйверы и системные параметры для оборудования NVIDIA
  • Возможности обновлений безопасности и обслуживания системы
  • Совместимость с более широкой экосистемой программного обеспечения NVIDIA

DGX OS выпускается по регулярному графику: обновления обычно выходят дважды в год (около февраля и августа), а между основными выпусками предоставляются дополнительные исправления безопасности.

Link to this sectionПанель управления DGX#

DGX Spark поставляется со встроенной панелью управления DGX, которая обеспечивает:

  • Мониторинг системы в реальном времени: обзор текущих операционных метрик системы
  • Обновления системы: возможность применять обновления прямо из панели управления
  • Системные настройки: изменение имени устройства и других конфигураций
  • Интегрированный JupyterLab: доступ к локальным Jupyter Notebooks для разработки

NVIDIA DGX management dashboard interface

Link to this sectionДоступ к панели управления#

Нажми кнопку "Show Apps" в левом нижнем углу рабочего стола Ubuntu, затем выбери "DGX Dashboard", чтобы открыть ее в браузере.

Интегрированный JupyterLab

Панель управления включает интегрированный экземпляр JupyterLab, который при запуске автоматически создает виртуальное окружение и устанавливает рекомендуемые пакеты. Каждой учетной записи пользователя назначается выделенный порт для доступа к JupyterLab.

Link to this sectionКраткое начало работы с Docker#

Самый быстрый способ начать работу с Ultralytics YOLO26 на NVIDIA DGX Spark — это использовать предварительно собранные образы Docker. Тот же образ Docker, который поддерживает Jetson AGX Thor (JetPack 7.0), работает и на DGX Spark с DGX OS.

t=ultralytics/ultralytics:latest-nvidia-arm64
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia --gpus all $t

После завершения перейди к разделу Использование TensorRT на NVIDIA DGX Spark.

Link to this sectionНачало работы с нативной установкой#

Для нативной установки без Docker выполни следующие действия.

Link to this sectionУстановка пакета Ultralytics#

Здесь мы установим пакет Ultralytics на DGX Spark с дополнительными зависимостями, чтобы можно было экспортировать модели PyTorch в другие форматы. Мы сосредоточимся в основном на экспорте в NVIDIA TensorRT, так как TensorRT позволит нам получить максимальную производительность от DGX Spark.

  1. Обнови список пакетов, установи pip и обнови его до последней версии

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. Установи pip-пакет ultralytics с дополнительными зависимостями

    pip install ultralytics[export]
  3. Перезагрузи устройство

    sudo reboot

Link to this sectionУстановка PyTorch и Torchvision#

Установка ultralytics выше установит Torch и Torchvision. Однако эти пакеты, установленные через pip, могут быть не полностью оптимизированы для архитектуры ARM64 DGX Spark с CUDA 13. Поэтому мы рекомендуем устанавливать версии, совместимые с CUDA 13:

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130
Информация

При запуске PyTorch 2.9.1 на NVIDIA DGX Spark ты можешь столкнуться со следующим UserWarning при инициализации CUDA (например, при запуске yolo checks, yolo predict и т. д.):

UserWarning: Found GPU0 NVIDIA GB10 which is of cuda capability 12.1.
Minimum and Maximum cuda capability supported by this version of PyTorch is (8.0) - (12.0)

Это предупреждение можно смело игнорировать. Чтобы исправить это навсегда, в PyTorch был отправлен PR #164590, который будет включен в релиз PyTorch 2.10.

Link to this sectionУстановка onnxruntime-gpu#

Пакет onnxruntime-gpu, размещенный в PyPI, не имеет бинарных файлов aarch64 для систем ARM64. Поэтому нам нужно установить этот пакет вручную. Этот пакет необходим для некоторых видов экспорта.

Здесь мы скачаем и установим onnxruntime-gpu 1.24.0 с поддержкой Python3.12.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

Link to this sectionИспользование TensorRT на NVIDIA DGX Spark#

Среди всех форматов экспорта моделей, поддерживаемых Ultralytics, TensorRT предлагает самую высокую производительность вывода на NVIDIA DGX Spark, что делает его нашей главной рекомендацией для развертываний. Инструкции по настройке и расширенному использованию см. в нашем специальном руководстве по интеграции TensorRT.

Link to this sectionПреобразование модели в TensorRT и запуск вывода#

Модель YOLO26n в формате PyTorch преобразуется в TensorRT для запуска вывода с экспортированной моделью.

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Примечание

Посети страницу экспорта, чтобы получить доступ к дополнительным аргументам при экспорте моделей в различные форматы

Link to this sectionБенчмарки YOLO11 на NVIDIA DGX Spark#

Бенчмарки YOLO11 были выполнены командой Ultralytics для нескольких форматов моделей с измерением скорости и точности: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Бенчмарки запускались на NVIDIA DGX Spark при точности FP32 со стандартным размером входного изображения 640.

Link to this sectionПодробная сравнительная таблица#

В таблице ниже представлены результаты тестирования пяти различных моделей (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) в различных форматах, что дает нам статус, размер, метрику mAP50-95(B) и время вывода для каждой комбинации.

Производительность
ФорматСтатусРазмер на диске (МБ)mAP50-95(B)Время вывода (мс/из)
PyTorch5.40.50712.67
TorchScript10.50.50832.62
ONNX10.20.50745.92
OpenVINO10.40.505814.95
TensorRT (FP32)12.80.50851.95
TensorRT (FP16)7.00.50681.01
TensorRT (INT8)18.60.48801.62
TF SavedModel25.70.507636.39
TF GraphDef10.30.507641.06
TF Lite10.30.507564.36
MNN10.10.507512.14
NCNN10.20.504112.31
ExecuTorch10.20.507527.61

Протестировано с помощью Ultralytics 8.3.249

Link to this sectionВоспроизведение наших результатов#

Чтобы воспроизвести вышеуказанные тесты Ultralytics для всех форматов экспорта, запусти этот код:

Пример
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Benchmark YOLO26n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

Обрати внимание, что результаты тестирования могут различаться в зависимости от конфигурации оборудования и программного обеспечения системы, а также от текущей нагрузки на систему во время проведения тестов. Для получения наиболее достоверных результатов используй набор данных с большим количеством изображений, например data='coco.yaml' (5000 изображений для валидации).

Link to this sectionРекомендации для NVIDIA DGX Spark#

При использовании NVIDIA DGX Spark следуй нескольким рекомендациям, чтобы обеспечить максимальную производительность при работе с YOLO26.

  1. Мониторинг производительности системы

    Используй инструменты мониторинга NVIDIA для отслеживания загрузки GPU и CPU:

    nvidia-smi
  2. Оптимизация использования памяти

    Благодаря 128 ГБ объединенной памяти DGX Spark может обрабатывать большие размеры пакетов (batch sizes) и модели. Подумай об увеличении размера пакета для повышения пропускной способности:

    from ultralytics import YOLO
    
    model = YOLO("yolo26n.engine")
    results = model.predict(source="path/to/images", batch=16)
  3. Используй TensorRT с FP16 или INT8

    Для достижения наилучшей производительности экспортируй модели с использованием точности FP16 или INT8:

    yolo export model=yolo26n.pt format=engine half=True # FP16
    yolo export model=yolo26n.pt format=engine int8=True # INT8

Link to this sectionОбновления системы (Founders Edition)#

Поддержание актуальной версии DGX Spark Founders Edition критически важно для производительности и безопасности. NVIDIA предоставляет два основных метода обновления ОС системы, драйверов и прошивки.

Link to this sectionИспользование DGX Dashboard (рекомендуется)#

DGX Dashboard — это рекомендуемый способ выполнения системных обновлений, гарантирующий совместимость. Он позволяет:

  • Просматривать доступные обновления системы
  • Устанавливать патчи безопасности и системные обновления
  • Управлять обновлениями драйверов и прошивки NVIDIA

Link to this sectionОбновления системы вручную#

Для продвинутых пользователей обновления можно выполнять вручную через терминал:

sudo apt update
sudo apt dist-upgrade
sudo fwupdmgr refresh
sudo fwupdmgr upgrade
sudo reboot
Предупреждение

Перед выполнением обновлений убедись, что твоя система подключена к стабильному источнику питания, а важные данные скопированы.

Link to this sectionДальнейшие шаги#

Для получения дополнительной информации и поддержки ознакомься с документацией Ultralytics YOLO26.

Link to this sectionFAQ#

Link to this sectionКак развернуть Ultralytics YOLO26 на NVIDIA DGX Spark?#

Развертывание Ultralytics YOLO26 на NVIDIA DGX Spark выполняется просто. Ты можешь использовать готовый образ Docker для быстрой настройки или установить необходимые пакеты вручную. Подробные инструкции для каждого подхода можно найти в разделах Quick Start with Docker и Start with Native Installation.

Link to this sectionКакую производительность я могу ожидать от YOLO26 на NVIDIA DGX Spark?#

Модели YOLO26 обеспечивают отличную производительность на DGX Spark благодаря суперчипу GB10 Grace Blackwell. Формат TensorRT обеспечивает наилучшую производительность логического вывода. Ознакомься с разделом Detailed Comparison Table для получения конкретных результатов тестов для разных размеров и форматов моделей.

Link to this sectionПочему мне следует использовать TensorRT для YOLO26 на DGX Spark?#

TensorRT настоятельно рекомендуется для развертывания моделей YOLO26 на DGX Spark из-за своей оптимальной производительности. Он ускоряет логический вывод, используя возможности GPU Blackwell, что обеспечивает максимальную эффективность и скорость. Узнай больше в разделе Use TensorRT on NVIDIA DGX Spark.

Link to this sectionКак DGX Spark соотносится с устройствами Jetson при работе с YOLO26?#

DGX Spark предлагает производительность ИИ до 1 ПФЛОПС и 128 ГБ объединенной памяти, в то время как Jetson AGX Thor обладает 2070 ТФЛОПС и 128 ГБ памяти. DGX Spark спроектирован как настольный ИИ-суперкомпьютер, тогда как устройства Jetson — это встраиваемые системы, оптимизированные для развертывания на периферии (edge).

Link to this sectionМогу ли я использовать один и тот же образ Docker для DGX Spark и Jetson AGX Thor?#

Да! Образ Docker ultralytics/ultralytics:latest-nvidia-arm64 поддерживает как NVIDIA DGX Spark (с DGX OS), так и Jetson AGX Thor (с JetPack 7.0), поскольку оба устройства используют архитектуру ARM64 с CUDA 13 и схожими программными стеками.

Комментарии