Link to this sectionРуководство по быстрому старту: NVIDIA Jetson с Ultralytics YOLO26#
Это полное руководство предоставляет подробную инструкцию по развертыванию Ultralytics YOLO26 на устройствах NVIDIA Jetson. Кроме того, здесь представлены показатели производительности, демонстрирующие возможности YOLO26 на этих компактных и мощных устройствах.
Мы обновили это руководство с учетом новейшего NVIDIA Jetson AGX Thor Developer Kit, который обеспечивает до 2070 FP4 TFLOPS вычислительной мощности ИИ и 128 ГБ памяти при настраиваемом энергопотреблении от 40 Вт до 130 Вт. Он обеспечивает в 7.5 раз большую вычислительную мощность ИИ, чем NVIDIA Jetson AGX Orin, с в 3.5 раза лучшей энергоэффективностью для бесперебойной работы самых популярных моделей ИИ.
Watch: How to use Ultralytics YOLO26 on NVIDIA Jetson Devices

Данное руководство протестировано на NVIDIA Jetson AGX Thor Developer Kit (Jetson T5000) с последней стабильной версией JetPack JP7.0, NVIDIA Jetson AGX Orin Developer Kit (64GB) с версией JetPack JP6.2, NVIDIA Jetson Orin Nano Super Developer Kit с версией JetPack JP6.1, Seeed Studio reComputer J4012, который основан на NVIDIA Jetson Orin NX 16GB с версией JetPack JP6.0 / JP5.1.3 и Seeed Studio reComputer J1020 v2, который основан на NVIDIA Jetson Nano 4GB с версией JetPack JP4.6.1. Ожидается, что оно будет работать на всей линейке оборудования NVIDIA Jetson, включая новейшие и устаревшие устройства.
Link to this sectionЧто такое NVIDIA Jetson?#
NVIDIA Jetson — это серия встраиваемых вычислительных плат, предназначенных для внедрения ускоренных вычислений ИИ (искусственного интеллекта) на периферийные устройства. Эти компактные и мощные устройства построены на базе архитектуры GPU NVIDIA и могут запускать сложные алгоритмы ИИ и модели deep learning прямо на устройстве, без опоры на ресурсы cloud computing. Платы Jetson часто используются в робототехнике, автономных транспортных средствах, промышленной автоматизации и других приложениях, где ИИ-вывод должен выполняться локально с низкой задержкой и высокой эффективностью. Кроме того, эти платы основаны на архитектуре ARM64 и работают с более низким энергопотреблением по сравнению с традиционными GPU-вычислительными устройствами.
Link to this sectionСравнение серии NVIDIA Jetson#
NVIDIA Jetson AGX Thor — это последняя итерация семейства NVIDIA Jetson на базе архитектуры NVIDIA Blackwell, которая обеспечивает значительно улучшенную производительность ИИ по сравнению с предыдущими поколениями. В таблице ниже сравниваются некоторые устройства Jetson в этой экосистеме.
| Jetson AGX Thor(T5000) | Jetson AGX Orin 64GB | Jetson Orin NX 16GB | Jetson Orin Nano Super | Jetson AGX Xavier | Jetson Xavier NX | Jetson Nano | |
|---|---|---|---|---|---|---|---|
| Производительность ИИ | 2070 TFLOPS | 275 TOPS | 100 TOPS | 67 TOPS | 32 TOPS | 21 TOPS | 472 GFLOPS |
| GPU | 2560-ядерный GPU на архитектуре NVIDIA Blackwell с 96 тензорными ядрами | 2048-ядерный GPU на архитектуре NVIDIA Ampere с 64 тензорными ядрами | 1024-ядерный GPU на архитектуре NVIDIA Ampere с 32 тензорными ядрами | 1024-ядерный GPU на архитектуре NVIDIA Ampere с 32 тензорными ядрами | 512-ядерный GPU на архитектуре NVIDIA Volta с 64 тензорными ядрами | 384-ядерный GPU на архитектуре NVIDIA Volta™ с 48 тензорными ядрами | 128-ядерный GPU на архитектуре NVIDIA Maxwell™ |
| Макс. частота GPU | 1.57 GHz | 1.3 GHz | 918 MHz | 1020 MHz | 1377 MHz | 1100 MHz | 921MHz |
| CPU | 14-ядерный Arm® Neoverse®-V3AE 64-битный CPU 1МБ L2 + 16МБ L3 | 12-ядерный NVIDIA Arm® Cortex A78AE v8.2 64-битный CPU 3МБ L2 + 6МБ L3 | 8-ядерный NVIDIA Arm® Cortex A78AE v8.2 64-битный CPU 2МБ L2 + 4МБ L3 | 6-ядерный Arm® Cortex®-A78AE v8.2 64-битный CPU 1.5МБ L2 + 4МБ L3 | 8-ядерный NVIDIA Carmel Arm®v8.2 64-битный CPU 8МБ L2 + 4МБ L3 | 6-ядерный NVIDIA Carmel Arm®v8.2 64-битный CPU 6МБ L2 + 4МБ L3 | Четырехъядерный процессор Arm® Cortex®-A57 MPCore |
| Макс. частота CPU | 2.6 GHz | 2.2 GHz | 2.0 GHz | 1.7 GHz | 2.2 GHz | 1.9 GHz | 1.43GHz |
| Память | 128ГБ 256-бит LPDDR5X 273ГБ/с | 64ГБ 256-бит LPDDR5 204.8ГБ/с | 16ГБ 128-бит LPDDR5 102.4ГБ/с | 8ГБ 128-бит LPDDR5 102 ГБ/с | 32ГБ 256-бит LPDDR4x 136.5ГБ/с | 8ГБ 128-бит LPDDR4x 59.7ГБ/с | 4ГБ 64-бит LPDDR4 25.6ГБ/с |
Для получения более подробной сравнительной таблицы, пожалуйста, посетите раздел Compare Specifications на официальной странице NVIDIA Jetson.
Link to this sectionЧто такое NVIDIA JetPack?#
NVIDIA JetPack SDK, обеспечивающий работу модулей Jetson, является наиболее комплексным решением. Он предоставляет полноценную среду разработки для создания сквозных ускоренных ИИ-приложений и сокращает время выхода на рынок. JetPack включает в себя Jetson Linux с загрузчиком, ядро Linux, среду рабочего стола Ubuntu и полный набор библиотек для ускорения вычислений на GPU, мультимедиа, графики и computer vision. Он также содержит примеры, документацию и инструменты разработки как для хост-компьютера, так и для комплекта разработчика, а также поддерживает SDK более высокого уровня, такие как DeepStream для потоковой видеоаналитики, Isaac для робототехники и Riva для диалогового ИИ.
Link to this sectionПрошивка JetPack на NVIDIA Jetson#
Первый шаг после получения устройства NVIDIA Jetson — прошивка NVIDIA JetPack на устройство. Существует несколько способов прошивки устройств NVIDIA Jetson.
- Если у тебя есть официальный комплект разработчика NVIDIA, например Jetson AGX Thor Developer Kit, ты можешь скачать образ и подготовить загрузочную USB-флешку для прошивки JetPack на встроенный SSD.
- Если у тебя есть официальный комплект разработчика NVIDIA, например Jetson Orin Nano Developer Kit, ты можешь скачать образ и подготовить SD-карту с JetPack для загрузки устройства.
- Если у тебя любой другой комплект разработчика NVIDIA, ты можешь прошить JetPack на устройство с помощью SDK Manager.
- Если у тебя устройство Seeed Studio reComputer J4012, ты можешь прошить JetPack на встроенный SSD, а если у тебя устройство Seeed Studio reComputer J1020 v2, ты можешь прошить JetPack на eMMC/SSD.
- Если у тебя есть любое другое стороннее устройство на базе модуля NVIDIA Jetson, рекомендуется следовать инструкции по прошивке через командную строку.
Для методов 1, 4 и 5 выше, после прошивки системы и загрузки устройства, пожалуйста, введи "sudo apt update && sudo apt install nvidia-jetpack -y" в терминале устройства, чтобы установить все необходимые оставшиеся компоненты JetPack.
Link to this sectionПоддержка JetPack в зависимости от устройства Jetson#
В таблице ниже показаны версии NVIDIA JetPack, поддерживаемые различными устройствами NVIDIA Jetson.
| JetPack 4 | JetPack 5 | JetPack 6 | JetPack 7 | |
|---|---|---|---|---|
| Jetson Nano | ✅ | ❌ | ❌ | ❌ |
| Jetson TX2 | ✅ | ❌ | ❌ | ❌ |
| Jetson Xavier NX | ✅ | ✅ | ❌ | ❌ |
| Jetson AGX Xavier | ✅ | ✅ | ❌ | ❌ |
| Jetson AGX Orin | ❌ | ✅ | ✅ | ❌ |
| Jetson Orin NX | ❌ | ✅ | ✅ | ❌ |
| Jetson Orin Nano | ❌ | ✅ | ✅ | ❌ |
| Jetson AGX Thor | ❌ | ❌ | ❌ | ✅ |
Link to this sectionБыстрый старт с Docker#
Самый быстрый способ начать работу с Ultralytics YOLO26 на NVIDIA Jetson — запустить готовые Docker-образы для Jetson. Сверься с таблицей выше и выбери версию JetPack в соответствии с тем устройством Jetson, которое у тебя есть.
t=ultralytics/ultralytics:latest-jetson-jetpack4
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia $tПосле этого переходи к разделу Use TensorRT on NVIDIA Jetson.
Link to this sectionНачало с нативной установки#
Для нативной установки без Docker, пожалуйста, обратись к шагам ниже.
Link to this sectionЗапуск на JetPack 7.0#
Link to this sectionУстановка пакета Ultralytics#
Здесь мы установим пакет Ultralytics на Jetson с дополнительными зависимостями, чтобы мы могли экспортировать модели PyTorch в другие форматы. Мы сосредоточимся в основном на экспорте NVIDIA TensorRT, поскольку TensorRT гарантирует, что мы получим максимальную производительность от устройств Jetson.
-
Обнови список пакетов, установи pip и обнови его до последней версии
sudo apt update sudo apt install python3-pip -y pip install -U pip -
Установи pip-пакет
ultralyticsс дополнительными зависимостямиpip install ultralytics[export] -
Перезагрузи устройство
sudo reboot
Link to this sectionУстановка PyTorch и Torchvision#
Вышеуказанная установка ultralytics установит Torch и Torchvision. Однако эти 2 пакета, установленные через pip, несовместимы для работы на Jetson AGX Thor, который поставляется с JetPack 7.0 и CUDA 13. Поэтому нам нужно установить их вручную.
Установи torch и torchvision в соответствии с JP7.0
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130Link to this sectionУстанови onnxruntime-gpu#
Пакет onnxruntime-gpu, размещенный в PyPI, не имеет aarch64 бинарных файлов для Jetson. Поэтому нам нужно установить этот пакет вручную. Этот пакет необходим для некоторых видов экспорта.
Здесь мы скачаем и установим onnxruntime-gpu 1.24.0 с поддержкой Python3.12.
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whlLink to this sectionЗапуск на JetPack 6.1#
Link to this sectionУстановка пакета Ultralytics#
Здесь мы установим пакет Ultralytics на Jetson с дополнительными зависимостями, чтобы мы могли экспортировать модели PyTorch в другие форматы. Мы сосредоточимся в основном на экспорте NVIDIA TensorRT, поскольку TensorRT гарантирует, что мы получим максимальную производительность от устройств Jetson.
-
Обнови список пакетов, установи pip и обнови его до последней версии
sudo apt update sudo apt install python3-pip -y pip install -U pip -
Установи pip-пакет
ultralyticsс дополнительными зависимостямиpip install ultralytics[export] -
Перезагрузи устройство
sudo reboot
Link to this sectionУстановка PyTorch и Torchvision#
Указанная выше установка Ultralytics установит Torch и Torchvision. Однако эти два пакета, установленные через pip, несовместимы с платформой Jetson, которая основана на архитектуре ARM64. Поэтому нам нужно вручную установить предварительно собранный pip-wheel PyTorch и скомпилировать или установить Torchvision из исходного кода.
Установи torch 2.10.0 и torchvision 0.25.0 в соответствии с JP6.1
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torch-2.10.0-cp310-cp310-linux_aarch64.whl
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torchvision-0.25.0-cp310-cp310-linux_aarch64.whlПосети страницу PyTorch для Jetson, чтобы получить доступ ко всем версиям PyTorch для разных версий JetPack. Для получения более подробного списка совместимости PyTorch и Torchvision посети страницу совместимости PyTorch и Torchvision.
Установи cuDSS, чтобы исправить проблему с зависимостями для torch 2.10.0
wget https://developer.download.nvidia.com/compute/cudss/0.7.1/local_installers/cudss-local-tegra-repo-ubuntu2204-0.7.1_0.7.1-1_arm64.deb
sudo dpkg -i cudss-local-tegra-repo-ubuntu2204-0.7.1_0.7.1-1_arm64.deb
sudo cp /var/cudss-local-tegra-repo-ubuntu2204-0.7.1/cudss-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudssLink to this sectionУстанови onnxruntime-gpu#
Пакет onnxruntime-gpu, размещенный в PyPI, не имеет aarch64 бинарных файлов для Jetson. Поэтому нам нужно установить этот пакет вручную. Этот пакет необходим для некоторых видов экспорта.
Ты можешь найти все доступные пакеты onnxruntime-gpu — организованные по версии JetPack, версии Python и другим деталям совместимости — в матрице совместимости ONNX Runtime для Jetson Zoo.
Для JetPack 6 с поддержкой Python 3.10 ты можешь установить onnxruntime-gpu 1.23.0:
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.23.0-cp310-cp310-linux_aarch64.whlВ качестве альтернативы, для onnxruntime-gpu 1.20.0:
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.20.0-cp310-cp310-linux_aarch64.whlLink to this sectionЗапуск на JetPack 5.1.2#
Link to this sectionУстановка пакета Ultralytics#
Здесь мы установим пакет Ultralytics на Jetson с дополнительными зависимостями, чтобы мы могли экспортировать модели PyTorch в другие форматы. Мы в основном сосредоточимся на экспорте в NVIDIA TensorRT, потому что TensorRT позволит нам получить максимальную производительность от устройств Jetson.
-
Обнови список пакетов, установи pip и обнови его до последней версии
sudo apt update sudo apt install python3-pip -y pip install -U pip -
Установи pip-пакет
ultralyticsс дополнительными зависимостямиpip install ultralytics[export] -
Перезагрузи устройство
sudo reboot
Link to this sectionУстановка PyTorch и Torchvision#
Указанная выше установка Ultralytics установит Torch и Torchvision. Однако эти два пакета, установленные через pip, несовместимы с платформой Jetson, которая основана на архитектуре ARM64. Поэтому нам нужно вручную установить предварительно собранный pip-wheel PyTorch и скомпилировать или установить Torchvision из исходного кода.
-
Удали текущие версии PyTorch и Torchvision
pip uninstall torch torchvision -
Установи
torch 2.1.0иtorchvision 0.16.2в соответствии с JP5.1.2pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torchvision-0.16.2+c6f3977-cp38-cp38-linux_aarch64.whl
Посети страницу PyTorch для Jetson, чтобы получить доступ ко всем версиям PyTorch для разных версий JetPack. Для получения более подробного списка совместимости PyTorch и Torchvision посети страницу совместимости PyTorch и Torchvision.
Link to this sectionУстанови onnxruntime-gpu#
Пакет onnxruntime-gpu, размещенный в PyPI, не имеет aarch64 бинарных файлов для Jetson. Поэтому нам нужно установить этот пакет вручную. Этот пакет необходим для некоторых видов экспорта.
Ты можешь найти все доступные пакеты onnxruntime-gpu — организованные по версии JetPack, версии Python и другим деталям совместимости — в матрице совместимости ONNX Runtime для Jetson Zoo. Здесь мы скачаем и установим onnxruntime-gpu 1.17.0 с поддержкой Python3.8.
wget https://nvidia.box.com/shared/static/zostg6agm00fb6t5uisw51qi6kpcuwzd.whl -O onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
pip install onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whlonnxruntime-gpu автоматически вернет версию NumPy к последней. Поэтому нам нужно переустановить NumPy на 1.23.5, чтобы исправить проблему, выполнив:
pip install numpy==1.23.5
Link to this sectionИспользование TensorRT на NVIDIA Jetson#
Среди всех форматов экспорта моделей, поддерживаемых Ultralytics, TensorRT обеспечивает наивысшую производительность вывода на устройствах NVIDIA Jetson, что делает его нашей основной рекомендацией для развертывания на Jetson. Инструкции по настройке и расширенное использование см. в нашем специальном руководстве по интеграции TensorRT.
Link to this sectionПреобразование модели в TensorRT и запуск вывода#
Модель YOLO26n в формате PyTorch преобразуется в TensorRT для выполнения вывода с использованием экспортированной модели.
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT
model.export(format="engine") # creates 'yolo26n.engine'
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")Посети страницу экспорта, чтобы узнать о дополнительных аргументах при экспорте моделей в различные форматы
Link to this sectionИспользование ускорителя глубокого обучения NVIDIA (DLA)#
Ускоритель глубокого обучения NVIDIA (DLA) — это специализированный аппаратный компонент, встроенный в устройства NVIDIA Jetson, который оптимизирует вывод глубокого обучения для повышения энергоэффективности и производительности. Разгружая GPU от задач (освобождая его для более интенсивных процессов), DLA позволяет моделям работать с меньшим энергопотреблением, сохраняя при этом высокую пропускную способность, что идеально подходит для встроенных систем и приложений ИИ реального времени.
Следующие устройства Jetson оснащены оборудованием DLA:
| Устройство Jetson | Ядра DLA | Макс. частота DLA |
|---|---|---|
| Серия Jetson AGX Orin | 2 | 1.6 ГГц |
| Jetson Orin NX 16GB | 2 | 614 МГц |
| Jetson Orin NX 8GB | 1 | 614 МГц |
| Серия Jetson AGX Xavier | 2 | 1.4 ГГц |
| Серия Jetson Xavier NX | 2 | 1.1 ГГц |
from ultralytics import YOLO
# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")
# Export the model to TensorRT with DLA enabled (only works with FP16 or INT8)
model.export(format="engine", device="dla:0", half=True) # dla:0 or dla:1 corresponds to the DLA cores
# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")
# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")При использовании экспорта DLA некоторые слои могут не поддерживаться для запуска на DLA, и выполнение перейдет на GPU. Этот откат может увеличить задержку и повлиять на общую производительность вывода. Поэтому DLA в первую очередь не предназначен для уменьшения задержки вывода по сравнению с TensorRT, работающим полностью на GPU. Напротив, его основная цель — увеличить пропускную способность и повысить энергоэффективность.
Link to this sectionТесты производительности NVIDIA Jetson YOLO11/ YOLO26#
Тесты YOLO11/ YOLO26 были проведены командой Ultralytics на 11 различных форматах моделей для измерения скорости и точности: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Тесты проводились на NVIDIA Jetson AGX Thor Developer Kit, NVIDIA Jetson AGX Orin Developer Kit (64GB), NVIDIA Jetson Orin Nano Super Developer Kit и Seeed Studio reComputer J4012 на базе устройства Jetson Orin NX 16GB с точностью FP32 precision и стандартным размером входного изображения 640.
Link to this sectionГрафики сравнения#
Несмотря на то, что все экспорты моделей работают на NVIDIA Jetson, в приведенную ниже сравнительную таблицу мы включили только PyTorch, TorchScript, TensorRT, поскольку они используют GPU на Jetson и гарантированно дают наилучшие результаты. Все остальные экспорты используют только CPU, и производительность у них не такая высокая, как у этих трех. Ты можешь найти тесты для всех экспортов в разделе после этой таблицы.
Link to this sectionNVIDIA Jetson AGX Thor Developer Kit#
Link to this sectionNVIDIA Jetson AGX Orin Developer Kit (64GB)#
Link to this sectionNVIDIA Jetson Orin Nano Super Developer Kit#
Link to this sectionNVIDIA Jetson Orin NX 16GB#
Link to this sectionПодробные сравнительные таблицы#
Нижеприведенная таблица представляет результаты тестов для пяти различных моделей (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) в 11 различных форматах (PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch), показывая нам статус, размер, метрику mAP50-95(B) и время вывода для каждой комбинации.
Link to this sectionNVIDIA Jetson AGX Thor Developer Kit#
| Формат | Статус | Размер на диске (МБ) | mAP50-95(B) | Время вывода (мс/из) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.3 | 0.4798 | 7.39 |
| TorchScript | ✅ | 9.8 | 0.4789 | 4.21 |
| ONNX | ✅ | 9.5 | 0.4767 | 6.58 |
| OpenVINO | ✅ | 10.1 | 0.4794 | 17.50 |
| TensorRT (FP32) | ✅ | 13.9 | 0.4791 | 1.90 |
| TensorRT (FP16) | ✅ | 7.6 | 0.4797 | 1.39 |
| TensorRT (INT8) | ✅ | 6.5 | 0.4273 | 1.52 |
| TF SavedModel | ✅ | 25.7 | 0.4764 | 47.24 |
| TF GraphDef | ✅ | 9.5 | 0.4764 | 45.98 |
| TF Lite | ✅ | 9.9 | 0.4764 | 182.04 |
| MNN | ✅ | 9.4 | 0.4784 | 21.83 |
Протестировано с Ultralytics 8.4.7
Время вывода не включает предварительную/пост-обработку.
Link to this sectionNVIDIA Jetson AGX Orin Developer Kit (64GB)#
| Формат | Статус | Размер на диске (МБ) | mAP50-95(B) | Время вывода (мс/из) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.3 | 0.4790 | 11.58 |
| TorchScript | ✅ | 9.8 | 0.4770 | 4.60 |
| ONNX | ✅ | 9.5 | 0.4770 | 9.87 |
| OpenVINO | ✅ | 9.6 | 0.4820 | 28.80 |
| TensorRT (FP32) | ✅ | 11.5 | 0.0450 | 4.18 |
| TensorRT (FP16) | ✅ | 7.9 | 0.0450 | 2.62 |
| TensorRT (INT8) | ✅ | 5.4 | 0.4640 | 2.30 |
| TF SavedModel | ✅ | 24.6 | 0.4760 | 71.10 |
| TF GraphDef | ✅ | 9.5 | 0.4760 | 70.02 |
| TF Lite | ✅ | 9.9 | 0.4760 | 227.94 |
| MNN | ✅ | 9.4 | 0.4760 | 32.46 |
| NCNN | ✅ | 9.3 | 0.4810 | 29.93 |
Протестировано с Ultralytics 8.4.32
Время вывода не включает предварительную/пост-обработку.
Link to this sectionNVIDIA Jetson Orin Nano Super Developer Kit#
| Формат | Статус | Размер на диске (МБ) | mAP50-95(B) | Время вывода (мс/из) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.3 | 0.4790 | 15.60 |
| TorchScript | ✅ | 9.8 | 0.4770 | 12.60 |
| ONNX | ✅ | 9.5 | 0.4760 | 15.76 |
| OpenVINO | ✅ | 9.6 | 0.4820 | 56.23 |
| TensorRT (FP32) | ✅ | 11.3 | 0.4770 | 7.53 |
| TensorRT (FP16) | ✅ | 8.1 | 0.4800 | 4.57 |
| TensorRT (INT8) | ✅ | 5.3 | 0.4490 | 3.80 |
| TF SavedModel | ✅ | 24.6 | 0.4760 | 118.33 |
| TF GraphDef | ✅ | 9.5 | 0.4760 | 116.30 |
| TF Lite | ✅ | 9.9 | 0.4760 | 286.00 |
| MNN | ✅ | 9.4 | 0.4760 | 68.77 |
| NCNN | ✅ | 9.3 | 0.4810 | 47.50 |
Протестировано с Ultralytics 8.4.33
Время вывода не включает предварительную/пост-обработку.
Link to this sectionNVIDIA Jetson Orin NX 16GB#
| Формат | Статус | Размер на диске (МБ) | mAP50-95(B) | Время вывода (мс/из) |
|---|---|---|---|---|
| PyTorch | ✅ | 5.3 | 0.4799 | 13.90 |
| TorchScript | ✅ | 9.8 | 0.4787 | 11.60 |
| ONNX | ✅ | 9.5 | 0.4763 | 14.18 |
| OpenVINO | ✅ | 9.6 | 0.4819 | 40.19 |
| TensorRT (FP32) | ✅ | 11.4 | 0.4770 | 7.01 |
| TensorRT (FP16) | ✅ | 8.0 | 0.4789 | 4.13 |
| TensorRT (INT8) | ✅ | 5.5 | 0.4489 | 3.49 |
| TF SavedModel | ✅ | 24.6 | 0.4764 | 92.34 |
| TF GraphDef | ✅ | 9.5 | 0.4764 | 92.06 |
| TF Lite | ✅ | 9.9 | 0.4764 | 254.43 |
| MNN | ✅ | 9.4 | 0.4760 | 48.55 |
| NCNN | ✅ | 9.3 | 0.4805 | 34.31 |
Протестировано с Ultralytics 8.4.33
Время вывода не включает предварительную/пост-обработку.
Изучи больше тестов производительности от Seeed Studio, работающих на различных версиях оборудования NVIDIA Jetson.
Link to this sectionВоспроизведи наши результаты#
Чтобы воспроизвести приведенные выше тесты производительности Ultralytics для всех форматов экспорта, запусти этот код:
from ultralytics import YOLO
# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")
# Benchmark YOLO11n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)Обрати внимание, что результаты тестирования могут варьироваться в зависимости от конкретной конфигурации аппаратного и программного обеспечения системы, а также от текущей нагрузки на систему во время проведения тестов. Для получения наиболее надежных результатов используй набор данных с большим количеством изображений, например data='coco.yaml' (5000 изображений для валидации).
Link to this sectionРекомендации по работе с NVIDIA Jetson#
При работе с NVIDIA Jetson есть несколько рекомендаций, которые помогут тебе добиться максимальной производительности при запуске YOLO26 на NVIDIA Jetson.
-
Включи режим максимальной производительности (MAX Power Mode)
Включение MAX Power Mode на Jetson гарантирует, что все ядра CPU и GPU будут задействованы.
sudo nvpmodel -m 0 -
Включи Jetson Clocks
Включение Jetson Clocks гарантирует, что все ядра CPU и GPU будут работать на максимальной частоте.
sudo jetson_clocks -
Установи приложение Jetson Stats
Ты можешь использовать приложение jetson stats для мониторинга температуры компонентов системы и проверки других деталей системы, таких как загрузка CPU, GPU, RAM, изменение режимов питания, установка максимальных частот, проверка информации о JetPack.
sudo apt update sudo pip install jetson-stats sudo reboot jtop
Link to this sectionСоветы по оптимизации памяти для NVIDIA Jetson#
Доступная память часто является ограничивающим фактором на устройствах Jetson, особенно на вариантах с меньшим объемом памяти, таких как Jetson Orin Nano (8 ГБ) или Orin NX 8 ГБ. Приведенные ниже советы — это практические изменения с низким уровнем риска, которые в совокупности могут освободить несколько сотен мегабайт и позволить тебе запускать более крупные модели YOLO или поддерживать дополнительные параллельные рабочие нагрузки. Полное описание см. в блоге NVIDIA по максимизации эффективности памяти для запуска более крупных моделей на NVIDIA Jetson.
Link to this section1. Переключись на загрузку без графического интерфейса (Headless/No-GUI)#
Если твой Jetson подключен по SSH или работает как промышленное устройство без монитора, отключение среды рабочего стола и графического сервера может освободить до 865 МБ ОЗУ:
sudo systemctl set-default multi-user.target
sudo rebootЧтобы восстановить рабочий стол позже:
sudo systemctl set-default graphical.target
sudo rebootLink to this section2. Отключи неиспользуемые системные службы#
Несущественные фоновые службы (Bluetooth, менеджеры сетевых подключений, неиспользуемые аппаратные демоны) потребляют около 32 МБ суммарно. Просмотри активные службы и отключи всё, что не требуется для твоей задачи:
# List running services
systemctl list-units --type=service --state=running
# Disable a service
sudo systemctl disable SERVICE_NAMELink to this section3. Профилируй использование памяти#
Перед оптимизацией определи, какие процессы действительно потребляют ОЗУ. procrank сортирует процессы по PSS (Proportional Set Size), что отражает истинный объем памяти, занимаемый процессом, более точно, чем RSS (Resident Set Size — общий объем физических страниц RAM, отображаемых процессом, включая страницы, общие с другими процессами):
git clone https://github.com/csimmonds/procrank_linux.git
cd procrank_linux && make
sudo ./procrankДля просмотра выделения памяти GPU и NvMap (CUDA/видеоконвейер) для каждого процесса:
sudo cat /sys/kernel/debug/nvmap/iovmm/clientsLink to this section4. Запускай инференс в промышленной среде без графического вывода#
Для конвейеров инференса, где не требуется просмотр в реальном времени, отключение компонентов, связанных с дисплеем (Tiler, OSD, DisplaySink), может сэкономить более 200 МБ только на конвейере. При использовании Ultralytics YOLO отключи визуализатор и записывай результаты на диск:
from ultralytics import YOLO
model = YOLO("yolo11n.engine")
# show=False prevents any display window; save=True writes annotated output to disk
results = model.predict(source="video.mp4", show=False, save=True)Link to this sectionСуммарный эффект#
| Оптимизация | Прибл. сэкономленная память |
|---|---|
| Отключение графического интерфейса рабочего стола | ~865 МБ |
| Отключение неиспользуемых системных служб | ~32 МБ |
| Конвейер инференса без отображения (без монитора) | ~200+ МБ |
| Итого (легкие улучшения) | ~1 ГБ+ |
Комбинирование этих изменений особенно ценно при использовании моделей TensorRT INT8 на устройствах с ограниченным объемом памяти — это может стать решающим фактором, позволяющим или не позволяющим уместить более крупный вариант модели в память.
Link to this sectionДальнейшие шаги#
Для дополнительного обучения и поддержки обратись к документации Ultralytics YOLO26.
Link to this sectionFAQ#
Link to this sectionКак развернуть Ultralytics YOLO26 на устройствах NVIDIA Jetson?#
Развертывание Ultralytics YOLO26 на устройствах NVIDIA Jetson — это простой процесс. Сначала прошей свое устройство Jetson с помощью NVIDIA JetPack SDK. Затем либо используй готовый Docker-образ для быстрой настройки, либо вручную установи необходимые пакеты. Подробные шаги для каждого подхода можно найти в разделах Быстрый старт с Docker и Старт с нативной установкой.
Link to this sectionКаких показателей производительности можно ожидать от моделей YOLO11 на устройствах NVIDIA Jetson?#
Модели YOLO11 прошли тестирование на различных устройствах NVIDIA Jetson, показав значительное улучшение производительности. Например, формат TensorRT обеспечивает наилучшую скорость вывода. Таблица в разделе Подробные сравнительные таблицы дает исчерпывающий обзор показателей производительности, таких как mAP50-95 и время вывода для разных форматов моделей.
Link to this sectionПочему стоит использовать TensorRT для развертывания YOLO26 на NVIDIA Jetson?#
TensorRT настоятельно рекомендуется для развертывания моделей YOLO26 на NVIDIA Jetson из-за оптимальной производительности. Он ускоряет вывод, используя возможности GPU Jetson, что обеспечивает максимальную эффективность и скорость. Узнай больше о том, как конвертировать модели в TensorRT и запускать вывод, в разделе Использование TensorRT на NVIDIA Jetson.
Link to this sectionКак установить PyTorch и Torchvision на NVIDIA Jetson?#
Чтобы установить PyTorch и Torchvision на NVIDIA Jetson, сначала удали любые существующие версии, которые могли быть установлены через pip. Затем вручную установи совместимые версии PyTorch и Torchvision для архитектуры ARM64 устройства Jetson. Подробные инструкции для этого процесса приведены в разделе Установка PyTorch и Torchvision.
Link to this sectionКакие есть лучшие практики для максимизации производительности на NVIDIA Jetson при использовании YOLO26?#
Чтобы максимизировать производительность на NVIDIA Jetson с помощью YOLO26, следуй этим лучшим практикам:
- Включи режим MAX Power Mode, чтобы использовать все ядра CPU и GPU.
- Включи Jetson Clocks, чтобы все ядра работали на максимальной частоте.
- Установи приложение Jetson Stats для отслеживания системных метрик.
Команды и дополнительные сведения см. в разделе Лучшие практики при использовании NVIDIA Jetson.
Link to this sectionКак освободить память на NVIDIA Jetson для запуска более крупных моделей YOLO?#
Доступная оперативная память часто становится «бутылочным горлышком» на устройствах Jetson с малым объемом памяти. Три простых действия, которые вместе могут освободить более 1 ГБ:
- Переключись на загрузку без графической оболочки (
sudo systemctl set-default multi-user.target), чтобы отключить настольный GUI (~865 МБ экономии). - Отключи неиспользуемые службы, такие как Bluetooth или менеджеры сетевых соединений (~32 МБ экономии).
- Запускай вывод без отображения, установив
show=Falseв своем вызовеpredictYOLO, что позволит избежать выделения памяти для конвейера отображения (~200+ МБ экономии).
Используй procrank для профилирования использования оперативной памяти каждым процессом и sudo cat /sys/kernel/debug/nvmap/iovmm/clients для проверки выделения памяти GPU. Полную информацию смотри в разделе Советы по оптимизации памяти.
Link to this sectionПочему мой экспорт TensorRT INT8 отключает end2end на JetPack 6?#
В TensorRT 10.3.0, поставляемом с JetPack 6, есть известная проблема, которая препятствует сборке движка INT8, когда включен параметр end2end=True. Когда Ultralytics обнаруживает эту комбинацию, он автоматически отключает ветку end2end, чтобы гарантировать успешный экспорт.
Чтобы восстановить экспорт end2end INT8, обнови TensorRT до более новой версии (например, 10.7.0+):
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/arm64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get install -y tensorrtПосле обновления перезапусти экспорт. Более подробную информацию смотри в GitHub issue #23841.