Hızlı Başlangıç Kılavuzu: Ultralytics YOLO26 ile NVIDIA Jetson

Bu kapsamlı kılavuz, Ultralytics YOLO26'nın NVIDIA Jetson cihazlarına nasıl kurulacağına dair ayrıntılı bir yol haritası sunar. Ayrıca, YOLO26'nın bu küçük ve güçlü cihazlardaki yeteneklerini göstermek için performans karşılaştırmaları içerir.

Yeni ürün desteği

Bu kılavuzu, 2070 FP4 TFLOPS'a kadar yapay zeka işlem gücü ve 40 W ile 130 W arasında yapılandırılabilir güç tüketimi ile 128 GB bellek sunan en yeni NVIDIA Jetson AGX Thor Developer Kit ile güncelledik. Bu kit, en popüler yapay zeka modellerini sorunsuz bir şekilde çalıştırmak için NVIDIA Jetson AGX Orin'den 7,5 kat daha yüksek yapay zeka işlem gücü ve 3,5 kat daha iyi enerji verimliliği sağlar.



Watch: How to use Ultralytics YOLO26 on NVIDIA Jetson Devices
NVIDIA Jetson Ecosystem
Not

This guide has been tested with NVIDIA Jetson AGX Thor Developer Kit (Jetson T5000) running the latest stable JetPack release of JP7.0, NVIDIA Jetson AGX Orin Developer Kit (64GB) running JetPack release of JP6.2, NVIDIA Jetson Orin Nano Super Developer Kit running JetPack release of JP6.1, Seeed Studio reComputer J4012 which is based on NVIDIA Jetson Orin NX 16GB running JetPack release of JP6.0/ JetPack release of JP5.1.3 and Seeed Studio reComputer J1020 v2 which is based on NVIDIA Jetson Nano 4GB running JetPack release of JP4.6.1. It is expected to work across all the NVIDIA Jetson hardware lineup, including the latest and legacy devices.

NVIDIA Jetson nedir?

NVIDIA Jetson is a series of embedded computing boards designed to bring accelerated AI (artificial intelligence) computing to edge devices. These compact and powerful devices are built around NVIDIA's GPU architecture and can run complex AI algorithms and deep learning models directly on the device, without relying on cloud computing resources. Jetson boards are often used in robotics, autonomous vehicles, industrial automation, and other applications where AI inference needs to be performed locally with low latency and high efficiency. Additionally, these boards are based on the ARM64 architecture and run at lower power compared to traditional GPU computing devices.

NVIDIA Jetson Serisi Karşılaştırması

NVIDIA Jetson AGX Thor, önceki nesillere kıyasla yapay zeka performansında önemli ölçüde artış sağlayan NVIDIA Blackwell mimarisi tabanlı NVIDIA Jetson ailesinin en son sürümüdür. Aşağıdaki tablo, ekosistemdeki bazı Jetson cihazlarını karşılaştırmaktadır.

Jetson AGX Thor(T5000)Jetson AGX Orin 64GBJetson Orin NX 16GBJetson Orin Nano SuperJetson AGX XavierJetson Xavier NXJetson Nano
Yapay Zeka Performansı2070 TFLOPS275 TOPS100 TOPS67 TOPS32 TOPS21 TOPS472 GFLOPS
GPU96 Tensor Çekirdekli 2560 çekirdekli NVIDIA Blackwell mimarisi GPU64 Tensor Çekirdekli 2048 çekirdekli NVIDIA Ampere mimarisi GPU32 Tensor Çekirdekli 1024 çekirdekli NVIDIA Ampere mimarisi GPU32 Tensor Çekirdekli 1024 çekirdekli NVIDIA Ampere mimarisi GPU64 Tensor Çekirdekli 512 çekirdekli NVIDIA Volta mimarisi GPU48 Tensor Çekirdekli 384 çekirdekli NVIDIA Volta™ mimarisi GPU128 çekirdekli NVIDIA Maxwell™ mimarisi GPU
GPU Maksimum Frekansı1.57 GHz1.3 GHz918 MHz1020 MHz1377 MHz1100 MHz921 MHz
CPU14 çekirdekli Arm® Neoverse®-V3AE 64-bit CPU 1MB L2 + 16MB L312 çekirdekli NVIDIA Arm® Cortex A78AE v8.2 64-bit CPU 3MB L2 + 6MB L38 çekirdekli NVIDIA Arm® Cortex A78AE v8.2 64-bit CPU 2MB L2 + 4MB L36 çekirdekli Arm® Cortex®-A78AE v8.2 64-bit CPU 1.5MB L2 + 4MB L38 çekirdekli NVIDIA Carmel Arm®v8.2 64-bit CPU 8MB L2 + 4MB L36 çekirdekli NVIDIA Carmel Arm®v8.2 64-bit CPU 6MB L2 + 4MB L3Dört Çekirdekli Arm® Cortex®-A57 MPCore işlemci
CPU Maksimum Frekansı2.6 GHz2.2 GHz2.0 GHz1.7 GHz2.2 GHz1.9 GHz1.43 GHz
Bellek128GB 256-bit LPDDR5X 273GB/s64GB 256-bit LPDDR5 204.8GB/s16GB 128-bit LPDDR5 102.4GB/s8GB 128-bit LPDDR5 102 GB/s32GB 256-bit LPDDR4x 136.5GB/s8GB 128-bit LPDDR4x 59.7GB/s4GB 64-bit LPDDR4 25.6GB/s

Daha ayrıntılı bir karşılaştırma tablosu için lütfen resmi NVIDIA Jetson sayfası üzerindeki Özellikleri Karşılaştır bölümünü ziyaret et.

NVIDIA JetPack nedir?

Jetson modüllerine güç veren NVIDIA JetPack SDK, en kapsamlı çözümdür ve uçtan uca hızlandırılmış yapay zeka uygulamaları oluşturmak için eksiksiz bir geliştirme ortamı sağlar, ayrıca pazara sunma süresini kısaltır. JetPack; önyükleyici, Linux çekirdeği, Ubuntu masaüstü ortamı içeren Jetson Linux'u ve GPU bilgi işlemi, multimedya, grafik ve bilgisayarlı görü hızlandırması için eksiksiz bir kütüphane seti sunar. Ayrıca hem ana bilgisayar hem de geliştirici kiti için örnekler, belgeler ve geliştirici araçları içerir ve video analitiği için DeepStream, robotik için Isaac ve konuşma tabanlı yapay zeka için Riva gibi daha üst düzey SDK'ları destekler.

NVIDIA Jetson'a JetPack yükleme

Bir NVIDIA Jetson cihazını eline aldığında yapman gereken ilk adım, cihazı NVIDIA JetPack ile flaşlamaktır. NVIDIA Jetson cihazlarını flaşlamanın birkaç farklı yolu vardır.

  1. Jetson AGX Thor Developer Kit gibi resmi bir NVIDIA Geliştirme Kiti'ne sahipsen, bir görüntü indirip JetPack'i dahil edilen SSD'ye flaşlamak için önyüklenebilir bir USB bellek hazırlayabilirsin.
  2. Jetson Orin Nano Developer Kit gibi resmi bir NVIDIA Geliştirme Kiti'ne sahipsen, bir görüntü indirip cihazı başlatmak için JetPack yüklü bir SD kart hazırlayabilirsin.
  3. Başka bir NVIDIA Geliştirme Kiti'ne sahipsen, SDK Manager'ı kullanarak JetPack'i cihaza flaşlayabilirsin.
  4. Bir Seeed Studio reComputer J4012 cihazına sahipsen, dahili SSD'ye JetPack flaşlayabilirsin ve eğer bir Seeed Studio reComputer J1020 v2 cihazına sahipsen, eMMC/SSD üzerine JetPack flaşlayabilirsin.
  5. NVIDIA Jetson modülü tarafından desteklenen başka bir üçüncü taraf cihaza sahipsen, komut satırı ile flaşlama yöntemini izlemen önerilir.
Not

Yukarıdaki 1, 4 ve 5 numaralı yöntemler için, sistemi flaşlayıp cihazı başlattıktan sonra gerekli tüm JetPack bileşenlerini yüklemek için cihaz terminaline "sudo apt update && sudo apt install nvidia-jetpack -y" komutunu gir.

Jetson Cihazına Göre JetPack Desteği

Aşağıdaki tablo, farklı NVIDIA Jetson cihazları tarafından desteklenen NVIDIA JetPack sürümlerini vurgulamaktadır.

JetPack 4JetPack 5JetPack 6JetPack 7
Jetson Nano
Jetson TX2
Jetson Xavier NX
Jetson AGX Xavier
Jetson AGX Orin
Jetson Orin NX
Jetson Orin Nano
Jetson AGX Thor

Docker ile Hızlı Başlangıç

NVIDIA Jetson üzerinde Ultralytics YOLO26 ile başlamanın en hızlı yolu, Jetson için önceden oluşturulmuş docker görüntüleri ile çalıştırmaktır. Yukarıdaki tabloya başvur ve sahip olduğun Jetson cihazına uygun JetPack sürümünü seç.

t=ultralytics/ultralytics:latest-jetson-jetpack4
sudo docker pull $t && sudo docker run -it --ipc=host --runtime=nvidia $t

Bu işlem tamamlandıktan sonra, NVIDIA Jetson'da TensorRT Kullanımı bölümüne atla.

Yerel Kurulumla Başla

Docker olmadan yerel bir kurulum için lütfen aşağıdaki adımları izle.

JetPack 7.0 üzerinde çalıştırma

Ultralytics Paketini Yükle

Burada, PyTorch modellerini diğer farklı formatlara dışa aktarabilmek için isteğe bağlı bağımlılıklarla birlikte Jetson üzerine Ultralytics paketini kuracağız. Öncelikle NVIDIA TensorRT dışa aktarmalarına odaklanacağız çünkü TensorRT, Jetson cihazlarından maksimum performansı almamızı sağlayacaktır.

  1. Paket listesini güncelle, pip'i yükle ve en son sürüme yükselt

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. İsteğe bağlı bağımlılıklarla ultralytics pip paketini yükle

    pip install ultralytics[export]
  3. Cihazı yeniden başlat

    sudo reboot

PyTorch ve Torchvision'ı Yükle

Yukarıdaki ultralytics kurulumu, Torch ve Torchvision'ı kuracaktır. Ancak, pip aracılığıyla kurulan bu iki paket, JetPack 7.0 ve CUDA 13 ile gelen Jetson AGX Thor üzerinde çalışmak için uyumlu değildir. Bu nedenle, bunları manuel olarak kurmamız gerekiyor.

JP7.0'a göre torch ve torchvision kur

pip install torch torchvision --index-url https://download.pytorch.org/whl/cu130

onnxruntime-gpu yükle

PyPI'da barındırılan onnxruntime-gpu paketi, Jetson için aarch64 ikili dosyalarına sahip değildir. Bu yüzden bu paketi manuel olarak kurmamız gerekiyor. Bu paket, bazı dışa aktarma işlemleri için gereklidir.

Here we will download and install onnxruntime-gpu 1.24.0 with Python3.12 support.

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.24.0-cp312-cp312-linux_aarch64.whl

JetPack 6.1 üzerinde çalıştırma

Ultralytics Paketini Yükle

Burada, PyTorch modellerini diğer farklı formatlara dışa aktarabilmek için isteğe bağlı bağımlılıklarla birlikte Jetson üzerine Ultralytics paketini kuracağız. Öncelikle NVIDIA TensorRT dışa aktarmalarına odaklanacağız çünkü TensorRT, Jetson cihazlarından maksimum performansı almamızı sağlayacaktır.

  1. Paket listesini güncelle, pip'i yükle ve en son sürüme yükselt

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. İsteğe bağlı bağımlılıklarla ultralytics pip paketini yükle

    pip install ultralytics[export]
  3. Cihazı yeniden başlat

    sudo reboot

PyTorch ve Torchvision'ı Yükle

Yukarıdaki ultralytics kurulumu, Torch ve Torchvision'ı kuracaktır. Ancak, pip aracılığıyla kurulan bu iki paket, ARM64 mimarisine dayalı Jetson platformu ile uyumlu değildir. Bu nedenle, önceden oluşturulmuş bir PyTorch pip tekerleğini manuel olarak kurmamız ve Torchvision'ı kaynaktan derlememiz veya kurmamız gerekiyor.

JP6.1'e göre torch 2.10.0 ve torchvision 0.25.0 kur

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torch-2.10.0-cp310-cp310-linux_aarch64.whl
pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torchvision-0.25.0-cp310-cp310-linux_aarch64.whl
Not

Farklı JetPack sürümleri için tüm PyTorch sürümlerine erişmek üzere Jetson için PyTorch sayfası sayfasını ziyaret et. PyTorch ve Torchvision uyumluluğu hakkında daha ayrıntılı bir liste için PyTorch ve Torchvision uyumluluk sayfası sayfasını ziyaret et.

Install cuDSS to fix a dependency issue with torch 2.10.0

wget https://developer.download.nvidia.com/compute/cudss/0.7.1/local_installers/cudss-local-tegra-repo-ubuntu2204-0.7.1_0.7.1-1_arm64.deb
sudo dpkg -i cudss-local-tegra-repo-ubuntu2204-0.7.1_0.7.1-1_arm64.deb
sudo cp /var/cudss-local-tegra-repo-ubuntu2204-0.7.1/cudss-*-keyring.gpg /usr/share/keyrings/
sudo apt-get update
sudo apt-get -y install cudss

onnxruntime-gpu yükle

PyPI'da barındırılan onnxruntime-gpu paketi, Jetson için aarch64 ikili dosyalarına sahip değildir. Bu yüzden bu paketi manuel olarak kurmamız gerekiyor. Bu paket, bazı dışa aktarma işlemleri için gereklidir.

JetPack sürümü, Python sürümü ve diğer uyumluluk ayrıntılarına göre düzenlenmiş tüm mevcut onnxruntime-gpu paketlerini Jetson Zoo ONNX Runtime uyumluluk matrisi sayfasında bulabilirsin.

Python 3.10 desteğine sahip JetPack 6 için onnxruntime-gpu 1.23.0 sürümünü kurabilirsin:

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.23.0-cp310-cp310-linux_aarch64.whl

Alternatif olarak, onnxruntime-gpu 1.20.0 için:

pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/onnxruntime_gpu-1.20.0-cp310-cp310-linux_aarch64.whl

JetPack 5.1.2 üzerinde çalıştırma

Ultralytics Paketini Yükle

Burada, PyTorch modellerini diğer farklı formatlara dışa aktarabilmek için isteğe bağlı bağımlılıklarla birlikte Jetson üzerine Ultralytics paketini kuracağız. Öncelikle NVIDIA TensorRT dışa aktarmalarına odaklanacağız çünkü TensorRT, Jetson cihazlarından maksimum performansı almamızı sağlayacaktır.

  1. Paket listesini güncelle, pip'i yükle ve en son sürüme yükselt

    sudo apt update
    sudo apt install python3-pip -y
    pip install -U pip
  2. İsteğe bağlı bağımlılıklarla ultralytics pip paketini yükle

    pip install ultralytics[export]
  3. Cihazı yeniden başlat

    sudo reboot

PyTorch ve Torchvision'ı Yükle

Yukarıdaki ultralytics kurulumu, Torch ve Torchvision'ı kuracaktır. Ancak, pip aracılığıyla kurulan bu iki paket, ARM64 mimarisine dayalı Jetson platformu ile uyumlu değildir. Bu nedenle, önceden oluşturulmuş bir PyTorch pip tekerleğini manuel olarak kurmamız ve Torchvision'ı kaynaktan derlememiz veya kurmamız gerekiyor.

  1. Halihazırda kurulu olan PyTorch ve Torchvision'ı kaldır

    pip uninstall torch torchvision
  2. JP5.1.2'ye göre torch 2.1.0 ve torchvision 0.16.2 kur

    pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl
    pip install https://github.com/ultralytics/assets/releases/download/v0.0.0/torchvision-0.16.2+c6f3977-cp38-cp38-linux_aarch64.whl
Not

Farklı JetPack sürümleri için tüm PyTorch sürümlerine erişmek üzere Jetson için PyTorch sayfası sayfasını ziyaret et. PyTorch ve Torchvision uyumluluğu hakkında daha ayrıntılı bir liste için PyTorch ve Torchvision uyumluluk sayfası sayfasını ziyaret et.

onnxruntime-gpu yükle

PyPI'da barındırılan onnxruntime-gpu paketi, Jetson için aarch64 ikili dosyalarına sahip değildir. Bu yüzden bu paketi manuel olarak kurmamız gerekiyor. Bu paket, bazı dışa aktarma işlemleri için gereklidir.

You can find all available onnxruntime-gpu packages—organized by JetPack version, Python version, and other compatibility details—in the Jetson Zoo ONNX Runtime compatibility matrix. Here we will download and install onnxruntime-gpu 1.17.0 with Python3.8 support.

wget https://nvidia.box.com/shared/static/zostg6agm00fb6t5uisw51qi6kpcuwzd.whl -O onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
pip install onnxruntime_gpu-1.17.0-cp38-cp38-linux_aarch64.whl
Not

onnxruntime-gpu, NumPy sürümünü otomatik olarak en son sürüme döndürecektir. Bu yüzden bir sorunu gidermek için NumPy'ı aşağıdaki komutla 1.23.5 sürümüne yeniden yüklememiz gerekiyor:

pip install numpy==1.23.5

NVIDIA Jetson üzerinde TensorRT kullan

Ultralytics tarafından desteklenen tüm model dışa aktarma formatları arasında TensorRT, NVIDIA Jetson cihazlarında en yüksek çıkarım performansını sunar, bu nedenle Jetson dağıtımları için en iyi önerimizdir. Kurulum talimatları ve gelişmiş kullanım için özel TensorRT entegrasyon kılavuzumuza göz at.

Modeli TensorRT'ye Dönüştür ve Çıkarımı Çalıştır

PyTorch formatındaki YOLO26n modeli, dışa aktarılan model ile çıkarım çalıştırmak için TensorRT'ye dönüştürülür.

Örnek
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT
model.export(format="engine")  # creates 'yolo26n.engine'

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Not

Modelleri farklı model formatlarına dışa aktarırken ek argümanlara erişmek için Dışa Aktarma sayfasına git

NVIDIA Derin Öğrenme Hızlandırıcısı (DLA) kullan

NVIDIA Derin Öğrenme Hızlandırıcısı (DLA), NVIDIA Jetson cihazlarına yerleşik, derin öğrenme çıkarımını enerji verimliliği ve performans için optimize eden özel bir donanım bileşenidir. Görevleri GPU'dan alarak (onu daha yoğun işlemler için serbest bırakarak), DLA modellerin daha düşük güç tüketimiyle çalışmasını sağlarken yüksek iş hacmini korur; bu da gömülü sistemler ve gerçek zamanlı yapay zeka uygulamaları için idealdir.

Aşağıdaki Jetson cihazları DLA donanımı ile donatılmıştır:

Jetson CihazıDLA ÇekirdekleriDLA Maksimum Frekansı
Jetson AGX Orin Serisi21.6 GHz
Jetson Orin NX 16GB2614 MHz
Jetson Orin NX 8GB1614 MHz
Jetson AGX Xavier Serisi21.4 GHz
Jetson Xavier NX Serisi21.1 GHz
Örnek
from ultralytics import YOLO

# Load a YOLO26n PyTorch model
model = YOLO("yolo26n.pt")

# Export the model to TensorRT with DLA enabled (only works with FP16 or INT8)
model.export(format="engine", device="dla:0", half=True)  # dla:0 or dla:1 corresponds to the DLA cores

# Load the exported TensorRT model
trt_model = YOLO("yolo26n.engine")

# Run inference
results = trt_model("https://ultralytics.com/images/bus.jpg")
Not

DLA dışa aktarımlarını kullanırken, bazı katmanlar DLA üzerinde çalışmak için desteklenmeyebilir ve yürütme için GPU'ya geri dönebilir. Bu geri dönüş ek gecikmeye neden olabilir ve genel çıkarım performansını etkileyebilir. Bu nedenle DLA, tamamen GPU üzerinde çalışan TensorRT'ye kıyasla çıkarım gecikmesini azaltmak için birincil olarak tasarlanmamıştır. Bunun yerine temel amacı, iş hacmini artırmak ve enerji verimliliğini iyileştirmektir.

NVIDIA Jetson YOLO11/ YOLO26 Karşılaştırmaları

YOLO11/ YOLO26 karşılaştırmaları, hız ve doğruluğu ölçmek için 11 farklı model formatında Ultralytics ekibi tarafından çalıştırıldı: PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch. Karşılaştırmalar, NVIDIA Jetson AGX Thor Developer Kit, NVIDIA Jetson AGX Orin Developer Kit (64GB), NVIDIA Jetson Orin Nano Super Developer Kit ve Jetson Orin NX 16GB cihazı tarafından desteklenen Seeed Studio reComputer J4012 üzerinde, 640 varsayılan giriş görsel boyutu ve FP32 hassasiyeti ile çalıştırıldı.

Karşılaştırma Grafikleri

Tüm model dışa aktarımları NVIDIA Jetson üzerinde çalışsa da, aşağıdaki karşılaştırma grafiğine yalnızca PyTorch, TorchScript, TensorRT formatlarını dahil ettik çünkü bunlar Jetson üzerindeki GPU'dan yararlanır ve en iyi sonuçları vermeleri garantidir. Diğer tüm dışa aktarımlar yalnızca CPU'yu kullanır ve performansları yukarıdaki üçü kadar iyi değildir. Tüm dışa aktarmalara ait karşılaştırmaları bu grafikten sonraki bölümde bulabilirsin.

NVIDIA Jetson AGX Thor Developer Kit

Jetson AGX Thor Benchmarks
Benchmarked with Ultralytics 8.3.226

NVIDIA Jetson AGX Orin Developer Kit (64GB)

Jetson AGX Orin Benchmarks
Benchmarked with Ultralytics 8.4.32

NVIDIA Jetson Orin Nano Super Developer Kit

Jetson Orin Nano Super Benchmarks
Benchmarked with Ultralytics 8.4.33

NVIDIA Jetson Orin NX 16GB

Jetson Orin NX 16GB Benchmarks
Benchmarked with Ultralytics 8.4.33

Detaylı Karşılaştırma Tabloları

Aşağıdaki tablo, 11 farklı formatta (PyTorch, TorchScript, ONNX, OpenVINO, TensorRT, TF SavedModel, TF GraphDef, TF Lite, MNN, NCNN, ExecuTorch) beş farklı modelin (YOLO11n, YOLO11s, YOLO11m, YOLO11l, YOLO11x) karşılaştırma sonuçlarını sunarak her kombinasyon için durumu, boyutu, mAP50-95(B) metriğini ve çıkarım süresini verir.

NVIDIA Jetson AGX Thor Developer Kit

Performans
FormatDurumDisk boyutu (MB)mAP50-95(B)Çıkarım süresi (ms/görüntü)
PyTorch5.30.47987.39
TorchScript9.80.47894.21
ONNX9.50.47676.58
OpenVINO10.10.479417.50
TensorRT (FP32)13.90.47911.90
TensorRT (FP16)7.60.47971.39
TensorRT (INT8)6.50.42731.52
TF SavedModel25.70.476447.24
TF GraphDef9.50.476445.98
TF Lite9.90.4764182.04
MNN9.40.478421.83

Ultralytics 8.4.7 ile test edilmiştir

Not

Çıkarım süresine ön/son işleme dahil değildir.

NVIDIA Jetson AGX Orin Developer Kit (64GB)

Performans
FormatDurumDisk boyutu (MB)mAP50-95(B)Çıkarım süresi (ms/görüntü)
PyTorch5.30.479011.58
TorchScript9.80.47704.60
ONNX9.50.47709.87
OpenVINO9.60.482028.80
TensorRT (FP32)11.50.04504.18
TensorRT (FP16)7.90.04502.62
TensorRT (INT8)5.40.46402.30
TF SavedModel24.60.476071.10
TF GraphDef9.50.476070.02
TF Lite9.90.4760227.94
MNN9.40.476032.46
NCNN9.30.481029.93

Ultralytics 8.4.32 ile kıyaslandı

Not

Çıkarım süresine ön/son işleme dahil değildir.

NVIDIA Jetson Orin Nano Super Developer Kit

Performans
FormatDurumDisk boyutu (MB)mAP50-95(B)Çıkarım süresi (ms/görüntü)
PyTorch5.30.479015.60
TorchScript9.80.477012.60
ONNX9.50.476015.76
OpenVINO9.60.482056.23
TensorRT (FP32)11.30.47707.53
TensorRT (FP16)8.10.48004.57
TensorRT (INT8)5.30.44903.80
TF SavedModel24.60.4760118.33
TF GraphDef9.50.4760116.30
TF Lite9.90.4760286.00
MNN9.40.476068.77
NCNN9.30.481047.50

Ultralytics 8.4.33 ile kıyaslandı

Not

Çıkarım süresine ön/son işleme dahil değildir.

NVIDIA Jetson Orin NX 16GB

Performans
FormatDurumDisk boyutu (MB)mAP50-95(B)Çıkarım süresi (ms/görüntü)
PyTorch5.30.479913.90
TorchScript9.80.478711.60
ONNX9.50.476314.18
OpenVINO9.60.481940.19
TensorRT (FP32)11.40.47707.01
TensorRT (FP16)8.00.47894.13
TensorRT (INT8)5.50.44893.49
TF SavedModel24.60.476492.34
TF GraphDef9.50.476492.06
TF Lite9.90.4764254.43
MNN9.40.476048.55
NCNN9.30.480534.31

Ultralytics 8.4.33 ile kıyaslandı

Not

Çıkarım süresine ön/son işleme dahil değildir.

Farklı NVIDIA Jetson donanım sürümleri üzerinde çalışan Seeed Studio'nun diğer kıyaslama çalışmalarını keşfet.

Sonuçlarımızı Yeniden Oluştur

Yukarıdaki Ultralytics kıyaslama sonuçlarını tüm dışa aktarma formatlarında yeniden oluşturmak için bu kodu çalıştır:

Örnek
from ultralytics import YOLO

# Load a YOLO11n PyTorch model
model = YOLO("yolo11n.pt")

# Benchmark YOLO11n speed and accuracy on the COCO128 dataset for all export formats
results = model.benchmark(data="coco128.yaml", imgsz=640)

Kıyaslama sonuçlarının, sistemin donanım ve yazılım yapılandırmasına ve testlerin çalıştırıldığı sıradaki sistem yüküne bağlı olarak değişebileceğini unutma. En güvenilir sonuçlar için çok sayıda görüntü içeren bir veri seti kullan, örneğin data='coco.yaml' (5000 doğrulama görüntüsü).

NVIDIA Jetson Kullanırken En İyi Uygulamalar

NVIDIA Jetson kullanırken, YOLO26 çalıştıran NVIDIA Jetson cihazında maksimum performansı elde etmek için izlemen gereken birkaç en iyi uygulama bulunmaktadır.

  1. MAX Güç Modunu Etkinleştir

    Jetson üzerinde MAX Güç Modunu etkinleştirmek, tüm CPU ve GPU çekirdeklerinin açık olmasını sağlayacaktır.

    sudo nvpmodel -m 0
  2. Jetson Saatlerini Etkinleştir

    Jetson Saatlerini etkinleştirmek, tüm CPU ve GPU çekirdeklerinin maksimum frekansta çalışmasını sağlayacaktır.

    sudo jetson_clocks
  3. Jetson Stats Uygulamasını Kur

    Sistem bileşenlerinin sıcaklıklarını izlemek ve CPU, GPU, RAM kullanımını görüntülemek, güç modlarını değiştirmek, maksimum saat hızlarını ayarlamak, JetPack bilgilerini kontrol etmek gibi diğer sistem detaylarını görmek için jetson stats uygulamasını kullanabilirsin.

    sudo apt update
    sudo pip install jetson-stats
    sudo reboot
    jtop
Jetson Stats

NVIDIA Jetson için Bellek Optimizasyonu İpuçları

Mevcut bellek, özellikle Jetson Orin Nano (8 GB) veya Orin NX 8 GB gibi düşük belleğe sahip varyantlarda Jetson cihazlarında genellikle sınırlayıcı faktördür. Aşağıdaki ipuçları, toplu olarak birkaç yüz megabayt boş alan açmanı ve daha büyük YOLO modelleri çalıştırmanı veya ek paralel iş yüklerini desteklemeni sağlayacak pratik ve düşük riskli değişikliklerdir. Kapsamlı bir inceleme için Jetson üzerinde bellek verimliliğini en üst düzeye çıkarma hakkındaki NVIDIA blog yazısına göz atabilirsin.

Headless (GUI'siz) Önyüklemeye Geç

Jetson cihazın SSH üzerinden bağlıysa veya ekran takılı olmadan bir üretim cihazı olarak çalışıyorsa, masaüstü ortamını ve görüntü sunucusunu kaldırmak 865 MB'a kadar RAM tasarrufu sağlayabilir:

sudo systemctl set-default multi-user.target
sudo reboot

Masaüstünü daha sonra geri yüklemek için:

sudo systemctl set-default graphical.target
sudo reboot

Kullanılmayan Sistem Hizmetlerini Devre Dışı Bırak

Temel olmayan arka plan hizmetleri (Bluetooth, bağlantı yöneticileri, kullanılmayan donanım arka plan programları) toplamda yaklaşık 32 MB tüketir. Etkin hizmetleri listele ve dağıtımının gerektirmediği her şeyi devre dışı bırak:

# List running services
systemctl list-units --type=service --state=running

# Disable a service
sudo systemctl disable <service-name>

Bellek Kullanımını Profille

Optimize etmeden önce, hangi süreçlerin aslında RAM tükettiğini belirle. procrank, süreçleri PSS'ye (Orantılı Set Boyutu) göre sıralar; bu, diğer süreçlerle paylaşılan sayfalar da dahil olmak üzere bir süreç tarafından eşlenen toplam fiziksel RAM sayfaları olan RSS'den (Yerleşik Set Boyutu) daha doğru bir şekilde gerçek süreç başına bellek ayak izini yansıtır:

git clone https://github.com/csimmonds/procrank_linux.git
cd procrank_linux && make
sudo ./procrank

Süreç başına GPU ve NvMap (CUDA/video hattı) tahsislerini görmek için:

sudo cat /sys/kernel/debug/nvmap/iovmm/clients

Üretimde Ekran Olmadan Çıkarım Çalıştır

Canlı önizleme gereksinimi olmayan çıkarım hatları için, ekranla ilgili bileşenleri (Tiler, OSD, DisplaySink) devre dışı bırakmak, sadece hat üzerinden 200+ MB tasarruf sağlayabilir. Ultralytics YOLO ile görüntüleyiciyi baskıla ve sonuçları bunun yerine diske yaz:

Örnek
from ultralytics import YOLO

model = YOLO("yolo11n.engine")

# show=False prevents any display window; save=True writes annotated output to disk
results = model.predict(source="video.mp4", show=False, save=True)

Kümülatif Etki

OptimizasyonYaklaşık Tasarruf Edilen Bellek
Masaüstü GUI'yi devre dışı bırak~865 MB
Kullanılmayan işletim sistemi hizmetlerini devre dışı bırak~32 MB
Headless çıkarım hattı (ekran yok)~200+ MB
Toplam (kolay kazanımlar)~1 GB+

Bu değişiklikleri birleştirmek, özellikle bellek kısıtlı cihazlarda TensorRT INT8 modellerini hedeflerken değerlidir; bu, daha büyük bir model varyantının belleğe sığıp sığmaması arasındaki farkı yaratabilir.

Sonraki Adımlar

Daha fazla öğrenme ve destek için Ultralytics YOLO26 Dokümanlarına bak.

SSS

NVIDIA Jetson cihazlarında Ultralytics YOLO26'yı nasıl dağıtabilirim?

Ultralytics YOLO26'yı NVIDIA Jetson cihazlarında dağıtmak basit bir işlemdir. İlk olarak, Jetson cihazına NVIDIA JetPack SDK'sını yükle. Ardından, hızlı kurulum için önceden oluşturulmuş bir Docker imajı kullan veya gerekli paketleri manuel olarak yükle. Her yaklaşım için ayrıntılı adımlar Docker ile Hızlı Başlangıç ve Yerel Kurulumla Başla bölümlerinde bulunabilir.

NVIDIA Jetson cihazlarında YOLO11 modellerinden hangi performans kıyaslamalarını bekleyebilirim?

YOLO11 modelleri, çeşitli NVIDIA Jetson cihazlarında önemli performans iyileştirmeleri göstererek kıyaslanmıştır. Örneğin, TensorRT formatı en iyi çıkarım performansını sağlar. Ayrıntılı Karşılaştırma Tabloları bölümündeki tablo, mAP50-95 gibi performans metriklerinin ve farklı model formatlarındaki çıkarım süresinin kapsamlı bir görünümünü sunar.

NVIDIA Jetson üzerinde YOLO26 dağıtımı için neden TensorRT kullanmalıyım?

TensorRT, optimum performansı nedeniyle NVIDIA Jetson üzerinde YOLO26 modellerini dağıtmak için şiddetle önerilir. Jetson'ın GPU yeteneklerinden yararlanarak çıkarımı hızlandırır ve maksimum verimlilik ile hız sağlar. TensorRT'ye nasıl dönüştürüleceği ve çıkarımın nasıl çalıştırılacağı hakkında daha fazla bilgiyi NVIDIA Jetson üzerinde TensorRT Kullanımı bölümünde öğrenebilirsin.

NVIDIA Jetson'a PyTorch ve Torchvision'ı nasıl kurabilirim?

NVIDIA Jetson'a PyTorch ve Torchvision'ı kurmak için önce pip aracılığıyla yüklenmiş olabilecek mevcut sürümleri kaldır. Ardından, Jetson'ın ARM64 mimarisiyle uyumlu PyTorch ve Torchvision sürümlerini manuel olarak yükle. Bu süreç için ayrıntılı talimatlar PyTorch ve Torchvision'ı Kur bölümünde verilmiştir.

YOLO26 kullanırken NVIDIA Jetson'da performansı en üst düzeye çıkarmak için en iyi uygulamalar nelerdir?

YOLO26 ile NVIDIA Jetson'da performansı en üst düzeye çıkarmak için şu en iyi uygulamaları izle:

  1. Tüm CPU ve GPU çekirdeklerini kullanmak için MAX Güç Modunu etkinleştir.
  2. Tüm çekirdekleri maksimum frekanslarında çalıştırmak için Jetson Saatlerini etkinleştir.
  3. Sistem metriklerini izlemek için Jetson Stats uygulamasını kur.

Komutlar ve ek ayrıntılar için NVIDIA Jetson Kullanırken En İyi Uygulamalar bölümüne başvur.

Daha büyük YOLO modelleri çalıştırmak için NVIDIA Jetson'da belleği nasıl boşaltabilirim?

Mevcut RAM, düşük belleğe sahip Jetson cihazlarında genellikle darboğazdır. Birlikte 1 GB'tan fazla bellek kurtarabilen üç kolay yöntem:

  1. Headless önyüklemeye geç (sudo systemctl set-default multi-user.target), masaüstü GUI'sini ortadan kaldırır (~865 MB tasarruf).
  2. Bluetooth veya bağlantı yöneticileri gibi kullanılmayan hizmetleri devre dışı bırak (~32 MB tasarruf).
  3. Run inference without a display by setting show=False in your YOLO predict call, which avoids allocating display pipeline memory (~200+ MB saved).

Süreç başına RAM kullanımını profillemek için procrank kullan ve GPU tahsislerini incelemek için sudo cat /sys/kernel/debug/nvmap/iovmm/clients komutunu kullan. Tam ayrıntılar için Bellek Optimizasyonu İpuçları bölümüne bak.

TensorRT INT8 dışa aktarımım JetPack 6 üzerinde neden end2end'i devre dışı bırakıyor?

JetPack 6 ile birlikte gelen TensorRT 10.3.0, end2end=True etkinleştirildiğinde INT8 motor yapılarını engelleyen bilinen bir soruna sahiptir. Ultralytics bu kombinasyonu algıladığında, dışa aktarmanın başarılı olmasını sağlamak için end2end dalını otomatik olarak devre dışı bırakır.

end2end INT8 dışa aktarımlarını geri yüklemek için TensorRT'yi daha yeni bir sürüme (örneğin, 10.7.0+) yükselt:

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/arm64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt-get update
sudo apt-get install -y tensorrt

Yükseltme işleminden sonra dışa aktarmanı tekrar çalıştır. Daha fazla ayrıntı için GitHub issue #23841 sayfasına bak.

Yorumlar