Link to this sectionUltralytics YOLO Modelleri için Qualcomm QNN Dışa Aktarımı#

Bilgisayarlı görü modellerini Qualcomm Snapdragon cihazlarında çalıştırmak, Qualcomm AI Engine Direct (QNN) çalışma zamanı için optimize edilmiş bir model formatı gerektirir. Ultralytics YOLO modellerini QNN formatına dışa aktarmak; milyarlarca cep telefonu, dizüstü bilgisayar, otomotiv sistemi ve IoT cihazında bulunan Snapdragon CPU, Adreno GPU ve Hexagon NPU donanımlarında hızlandırılmış, cihaz üzerinde çıkarım yapmanı sağlar. Bu kılavuz, YOLO'yu Qualcomm QNN'e nasıl dışa aktaracağını ve Snapdragon donanımı üzerinde hızlı, düşük güç tüketen çıkarım için nasıl dağıtacağını anlatır.

Resmi mobil uygulamalarla YOLO'yu hemen bugün Snapdragon NPU'larında çalıştır.

Resmi Ultralytics Flutter plugin, tüm yedi YOLO26 görevi boyunca gerçek zamanlı kamera çıkarımı ve tekli görsel tahmini için isteğe bağlı QNN desteği sağlar. Ekleni README belgesinde açıklandığı gibi QNN çalışma zamanını etkinleştir ve onun ONNX Runtime bağımlılığını ekle. iOS dağıtımı için Ultralytics YOLO iOS SDK ve CoreML integration sayfasına göz at.

Resmi mobil girdi boyutları

Sınıflandırma modellerini imgsz=224 ile dışarı aktar. Algılama, bölümleme, anlamsal, derinlik, poz ve OBB modellerini imgsz=640 ile dışarı aktar. Bu 224/640 standardı, resmi QNN, LiteRT ve CoreML mobil varlıkları tarafından paylaşılır. Tüm yedi nano görev için hemen çalıştırılabilir v73 ve v81 varlıkları yolo-flutter-app v0.6.6 release içinde yayınlanmıştır.

Link to this sectionQualcomm QNN nedir?#

Qualcomm QNN on-device inference

Qualcomm AI Engine Direct — yaygın olarak QNN olarak adlandırılan ve Qualcomm AI Runtime (QAIRT) SDK'nın bir parçası olarak dağıtılan — Snapdragon işlemcileri için Qualcomm'un düşük seviyeli çıkarım yığınıdır. Snapdragon CPU, Adreno GPU ve modern Snapdragon SoC'lerin içindeki özel neural network işleme birimi (NPU) olan Hexagon Tensor Processor'ı (HTP) hedefleyen, arka uça özgü kütüphanelere sahip birleşik bir API sağlar. QNN, geliştiricilere bu Snapdragon yapay zeka hızlandırıcılarına tam yığın erişimi sunar ve daha eski olan Snapdragon Neural Processing Engine (SNPE) SDK'nın modern halefidir. Snapdragon 8 Gen 2, 8 Gen 3 ve 8 Elite mobil platformlarında, Snapdragon X dizüstü bilgisayarlarında ve otomotiv ile XR ürünlerinde cihaz içi yapay zekayı güçlendirir.

Link to this sectionNeden Qualcomm QNN'e Dışa Aktarmalısın?#

Snapdragon, dünyada en yaygın kullanılan mobil hesaplama platformudur. Ultralytics YOLO'yu Qualcomm QNN formatına dışa aktarmak, bu cihazlardaki özel yapay zeka donanımını etkinleştirir:

Hexagon NPU hızlandırması: YOLO'yu Hexagon Tensor Processor üzerinde çalıştırmak, CPU çıkarımına göre çok daha yüksek verim ve daha düşük güç tüketimi sağlar; bu, gerçek zamanlı çıkarım ve Snapdragon üzerinde sürekli açık bilgisayarlı görü uygulamaları için idealdir.
Cihaz üzerinde ve çevrimdışı: QNN çıkarımı tamamen Snapdragon cihaz üzerinde çalışır, böylece bulut bağlantısına gerek kalmaz, gecikme süresi düşük tutulur ve veriler asla cihazdan ayrılmaz.
Kuantize verimlilik: QNN dışa aktarımı, YOLO'yu Hexagon NPU'nun tercih ettiği doğruluk/performans dengesi olan 16-bit aktivasyonlu INT8 ağırlıklarına kuantize eder; bu da model boyutunu küçültür ve pil ile çalışan donanımlarda saniyedeki kare sayısını (FPS) en üst düzeye çıkarır.
Tek format, birçok cihaz: Tek bir Qualcomm QNN dışa aktarımı; Snapdragon 8 Gen 2, 8 Gen 3, 8 Elite aileleri ve ötesindeki Snapdragon CPU, Adreno GPU ve Hexagon NPU donanımlarını hedefler.
Üretime hazır Qualcomm AI yığını: QNN (Qualcomm AI Engine Direct / QAIRT), Qualcomm'un güncel, aktif olarak desteklenen cihaz içi AI çalışma zamanıdır ve SNPE için önerilen yedek parçadır.

Link to this sectionQNN Dışa Aktarma Formatı#

Ultralytics, YOLO modellerini ONNX Runtime QNN Execution Provider (QAIRT kütüphanelerini içeren pip ile kurulabilen onnxruntime-qnn paketi) kullanarak yerel olarak QNN'e derler. Dışa aktarıcı, modelini ONNX formatına dönüştürür, 16-bit aktivasyonlar ve INT8 ağırlıklarıyla (Hexagon NPU için önerilen denge) kalibrasyon verilerini kullanarak kuantize eder, ardından bağlam ikili (context-binary) önbelleğe alma etkinleştirilmiş bir ONNX Runtime oturumu başlatır. Bu işlem, kuantize edilmiş grafiği <model>_qnn.onnx içinde gömülü bir QNN bağlam ikilisine derler. Herhangi bir Qualcomm hesabı, buluta yükleme veya ayrı bir SDK indirmesi gerekmez.

Modelleri Qualcomm barındırmalı Snapdragon cihazlarında derleyip profillendiren ve bir Qualcomm hesabı gerektiren bulut tabanlı Qualcomm AI Hub aksine, Ultralytics QNN dışa aktarımı tamamen kendi makinenizde tek bir export(format="qnn", imgsz=640) çağrısıyla (sınıflandırma için imgsz=224) çalışır. Kaydolma, yükleme sınırları veya sıra bekleme süreleri olmadan aynı QNN/QAIRT çalışma zamanı hedefini — Snapdragon CPU, Adreno GPU ve Hexagon NPU — elde edersin ve bu, standart YOLO dışa aktarım iş akışına doğrudan entegre olur.

Dışa aktarılan *_qnn.onnx dosyası kendi kendine yetebilir durumdadır: QNN bağlam ikilisini ve sınıf isimleri, görüntü boyutu, görev gibi ONNX meta verilerini içinde barındırır.

Link to this sectionQNN Modellerinin Temel Özellikleri#

Kuantizasyon: Model, Hexagon NPU'nun önerilen doğruluk/performans dengesi olan ONNX Runtime QNN QDQ akışı ve bir kalibrasyon veri seti ile 16-bit aktivasyonlara ve INT8 ağırlıklarına kuantize edilir. Model kuantizasyonu hakkında daha fazla bilgi edin.
Tamamen Yerel Derleme: Bağlam ikilisi tamamen kendi ana bilgisayarında oluşturulur; Qualcomm hesabı, API anahtarı veya buluta yükleme gerekmez.
Tam Snapdragon Hızlandırması: Hexagon NPU (HTP), Adreno GPU veya CPU üzerinde tek bir birleşik çalışma zamanı aracılığıyla çıkarım yap.
Geniş Cihaz Erişimi: Telefonlarda, PC'lerde (Windows on Snapdragon), otomotiv, XR ve gömülü ürünlerde kullanılan çok çeşitli Snapdragon platformlarını hedefle.
Önceden Derlenmiş Bağlam İkilisi: Bağlam ikilisiyle dağıtım yapmak, cihaz üzerindeki grafik derleme işlemini en aza indirerek hedef cihazdaki model yükleme gecikmesini azaltır.
Kendi Kendine Yeten Çıktı: Dışa aktarılan ONNX dosyası, sorunsuz bir dağıtım için önceden derlenmiş QNN bağlam ikilisini ve meta verileri içerir.

Link to this sectionÖlçülen Performans#

Link to this sectionAndroid Telefon#

Donanım: 12 GB LPDDR5X belleğe ve Android 16 / API 36'ya sahip Xiaomi 17. 3 nm Snapdragon 8 Elite Gen 5 (SM8850), 8 çekirdekli bir Qualcomm Oryon CPU'ya (4,6 GHz'e kadar 2 Prime çekirdek ve 3,62 GHz'e kadar 6 Performans çekirdeği), Adreno GPU'ya ve Hexagon NPU'ya (HTP v81) sahiptir.

Model	Görev	boyut ^(piksel)	CPU ^{w8a32 LiteRT (ms)}	GPU ^{w8a32 LiteRT (ms)}	NPU ^{QNN W8A16 (ms)}
YOLO26n	Algıla	640	52.2 ^{1.8 / 48.1 / 2.4}	15.8 ^{2.3 / 8.9 / 4.6}	10.7 ^{1.8 / 6.7 / 2.2}
YOLO26n-seg	Segment	640	73.4 ^{1.8 / 65.6 / 6.0}	33.2 ^{1.8 / 23.8 / 7.6}	17.4 ^{1.8 / 9.9 / 5.7}
YOLO26n-sem	Anlamsal	640	61.2 ^{1.8 / 51.1 / 8.3}	34.2 ^{1.8 / 24.0 / 8.3}	11.5 ^{1.8 / 7.1 / 2.6}
YOLO26n-depth	Depth	640	124.4 ^{1.9 / 115.1 / 7.4}	23.0 ^{1.8 / 13.5 / 7.7}	35.2 ^{1.8 / 26.1 / 7.3}
YOLO26n-cls	Sınıflandır	224	4.4 ^{0.4 / 4.0 / 0.0}	3.1 ^{0.8 / 2.1 / 0.2}	1.2 ^{0.6 / 0.6 / 0.0}
YOLO26n-pose	Pose	640	57.4 ^{1.8 / 53.8 / 1.8}	16.6 ^{2.7 / 10.1 / 3.9}	10.9 ^{1.8 / 7.0 / 2.0}
YOLO26n-obb	OBB	640	50.3 ^{1.8 / 47.2 / 1.4}	11.7 ^{1.8 / 7.8 / 2.0}	8.6 ^{1.8 / 5.7 / 1.1}

Speed values are single-image burst latencies — the mean of 15 runs after 3 warmup runs on bus.jpg, measured with the Flutter plugin's 0.6.10 on-device benchmark harness and the standardized v0.6.6 assets. Backend order rotated between tasks in one sequential sweep. Native logs confirmed that every CPU row used LiteRT CPU/XNNPACK, every GPU row delegated the complete graph to LiteRT OpenCL (LITERT_CL), and every NPU row used the QNN Hexagon HTP backend.
Ayrıntılı kıyaslama kaydı Flutter performance doc içindedir.
Diğer Android cihazları LiteRT integration içinde ve Apple cihazları CoreML integration içinde karşılaştır.

Link to this sectionWindows on Snapdragon Dizüstü Bilgisayar#

Bu geçmiş taramada standartlaştırılmamış ön v73 QNN ikilileri kullanıldı; anlamsal ve OBB 1024px girdiler kullandı. Bu, 32 GB belleğe ve Windows 11'e sahip bir Lenovo dizüstü bilgisayarda çalıştırıldı. Snapdragon X Elite (X1E78100) 12 çekirdekli bir Qualcomm Oryon CPU, Adreno GPU ve Hexagon NPU'ya (HTP v73) sahiptir; tam Lenovo modeli kaydedilmemiştir. Bu Windows-on-Snapdragon karşılaştırması, çoğu masaüstü geliştiricisinin başlangıç noktası olan yerel PyTorch FP32 CPU taban çizgisini, ONNX Runtime QNN Hexagon HTP yoluyla karşılaştırır. Her hücre, altında raporlanan ön işleme / çıkarım / son işleme süreleriyle birlikte tam model.predict() duvar saati süresini gösterir; toplam, bu üç aşamanın dışındaki çerçeve ek yükünü içerebilir. CPU sayıları PyTorch FP32 (torch==2.10.0+cpu) ve NPU sayıları ONNX Runtime QNN'dir (onnxruntime-qnn==2.2.0, INT8 ağırlıklar / 16 bit aktivasyonlar).

Model	Görev	boyut ^(piksel)	CPU ^{PT FP32 (ms)}	NPU Hexagon ^{QNN W8A16 (ms)}
YOLO26n	Algıla	640	91.4 ^{4.3 / 75.2 / 0.1}	27.2 ^{4.9 / 19.4 / 0.9}
YOLO26n-seg	Segment	640	138.8 ^{4.5 / 127.1 / 2.8}	34.3 ^{5.0 / 24.0 / 5.1}
YOLO26n-sem	Anlamsal	1024	295.8 ^{9.1 / 189.2 / 94.8}	133.0 ^{8.8 / 37.4 / 83.9}
YOLO26n-cls	Sınıflandır	224	15.4 ^{3.0 / 9.8 / 0.0}	11.7 ^{2.7 / 5.5 / 0.0}
YOLO26n-pose	Pose	640	109.6 ^{4.6 / 102.9 / 0.2}	28.9 ^{5.3 / 23.3 / 0.6}
YOLO26n-obb	OBB	1024	267.8 ^{8.1 / 254.6 / 0.1}	64.8 ^{8.9 / 54.7 / 0.6}

Speed values are single-image burst latencies — the mean of 100 runs after 10 warmup runs on bus.jpg, measured with time.perf_counter() around the full model.predict() call on a thermally rested device (ultralytics==8.4.67, Python 3.12.10).
Hexagon NPU, 640-1024 px görevlerinde (algılama ~3.4x) PyTorch CPU temel hattından yaklaşık 2-4 kat daha hızlı çalışır; sabit ön işleme yükünün küçük iş yüküne baskın geldiği 224 px sınıflandırıcıda ise bu fark ~1.3x seviyesine daralır.

Link to this sectionDesteklenen Görevler#

QNN dışa aktarımı, YOLO26 semantik segmentasyon dahil olmak üzere her model ailesinde mevcut olan standart görev kümesini destekler.

Görev	Desteklenen
Nesne Tespiti	✅
Örnek Segmentasyonu	✅
Anlamsal Segmentasyon	✅
Poz Tahmini	✅
OBB Detection	✅
Sınıflandırma	✅
Derinlik Tahmini	✅

Link to this sectionQNN'e Dışa Aktarma: YOLO Modelini Dönüştürme#

Bir Ultralytics YOLO modelini Snapdragon donanımı üzerinde dağıtmak için QNN formatına dışa aktar. Bağlam ikilisi, name argümanı ile seçtiğin bir hedef Hexagon Tensor Processor (HTP) mimarisi için tamamlanır; bu, RKNN dışa aktarımında bir çipi hedeflemek için kullanılan argümanla aynıdır.

Link to this sectionDesteklenen HTP Mimarileri#

Hedef mimariyi name aracılığıyla ilet (örneğin name="73"). Geçerli değerler:

`name`	Hexagon HTP	Snapdragon platformu
`68`	v68	Snapdragon 888
`69`	v69	Snapdragon 8 Gen 1 / 8+ Gen 1
`73`	v73	Snapdragon 8 Gen 2, X Elite (varsayılan)
`75`	v75	Snapdragon 8 Gen 3
`79`	v79	Snapdragon 8 Elite
`81`	v81	Snapdragon 8 Elite Gen 5

Platform desteği

QNN dışa aktarımı onnxruntime-qnn paketini kullanır. Önceden derlenmiş tekerlekler (wheels) Windows (x64 ve ARM64) ve Linux ARM64 (aarch64) için yayınlanmıştır; Linux x86-64 üzerinde ONNX Runtime'ı --use_qnn ile kaynaktan derle (önceden derlenmiş tekerlek yayınlanmamıştır ve macOS desteklenen bir QNN ana bilgisayarı değildir). QNN bağlam ikilisi oluşturma işlemi bir x64 ana bilgisayarda — Windows x64 veya Linux x86-64 — çalışır ve dışa aktarma adımı için Snapdragon cihazı gerektirmez.

Link to this sectionKurulum#

Gerekli paketleri kurmak için şunu çalıştır:

Kurulum

# Install the required package for YOLO
pip install ultralytics

ONNX Runtime QNN Execution Provider'ı sağlayan ve QAIRT kütüphanelerini içeren onnxruntime-qnn paketi ilk dışa aktarmada otomatik olarak kurulur. Kurulum süreciyle ilgili ayrıntılı talimatlar ve en iyi uygulamalar için Ultralytics Kurulum kılavuzumuza göz at. YOLO için gerekli paketleri kurarken herhangi bir sorunla karşılaşırsan, çözümler ve ipuçları için Yaygın Sorunlar kılavuzumuza danış.

Link to this sectionKullanım#

QNN formatı Dışa Aktarma, Tahmin ve Doğrulama modlarını destekler. Çıkarım ve doğrulama, ONNX Runtime'ın QNN Execution Provider'ı (dışa aktarma için kullanılan onnxruntime-qnn paketinin aynısı) aracılığıyla Qualcomm Snapdragon donanımı üzerinde çalışır. Modelini dışa aktar, ardından çıkarım yapmak veya doğruluğunu kontrol etmek için dışa aktarılan modeli bir Snapdragon cihazına yükle.

Dışa Aktar (Export)

from ultralytics import YOLO

# Load a YOLO26 model
model = YOLO("yolo26n.pt")

# Export to Qualcomm QNN format (INT8, enforced automatically), targeting an HTP architecture via 'name'
# 'name' can be one of 68, 69, 73, 75, 79, 81 (Snapdragon 888, 8 Gen 1, 8 Gen 2, 8 Gen 3, 8 Elite, 8 Elite Gen 5)
model.export(format="qnn", name="73", imgsz=640)  # use imgsz=224 for classification

Tahmin Et (Predict)

from ultralytics import YOLO

# Load the exported QNN model (on a Snapdragon device with onnxruntime-qnn)
model = YOLO("yolo26n_qnn.onnx")

# Run inference
results = model("https://ultralytics.com/images/bus.jpg")

Doğrula

from ultralytics import YOLO

# Load the exported QNN model (on a Snapdragon device with onnxruntime-qnn)
model = YOLO("yolo26n_qnn.onnx")

# Validate accuracy on the COCO8 dataset
metrics = model.val(data="coco8.yaml")

Link to this sectionDışa Aktarma Argümanları#

Argüman	Tip	Varsayılan	Açıklama
`format`	`str`	`'qnn'`	Dışa aktarılan model için hedef format; Qualcomm QNN çalışma zamanı ile uyumluluğu tanımlar.
`imgsz`	`int` veya `tuple`	`640`	Model girdisi için istenen görüntü boyutu. Kare görüntüler için bir tam sayı veya `(height, width)` şeklinde bir demet olabilir.
`batch`	`int`	`1`	Oluşturulan QNN bağlam ikilisinin içine işlenen dışa aktarma modeli yığın (batch) boyutunu belirler.
`name`	`str`	`'73'`	Hedef Hexagon HTP mimari sürümü: `68`, `69`, `73`, `75`, `79` veya `81` (Snapdragon 888, 8 Gen 1, 8 Gen 2, 8 Gen 3, 8 Elite, 8 Elite Gen 5). Bağlam ikilisi bu mimari için tamamlanır.
`quantize`	`int` veya `str`	`'w8a16'`/auto	Kuantizasyon hassasiyeti. QNN HTP dışa aktarımı, 16-bit aktivasyonlarla INT8 ağırlıklarına (`'w8a16'`) kuantize edilir ve belirtilmediği takdirde otomatik olarak etkinleştirilir. Kullanımdan kaldırılan `half`/`int8` bayraklarının yerini alır.
`simplify`	`bool`	`True`	`onnxslim` ile ara ONNX grafiğini basitleştirir.
`opset`	`int`	`None`	Ara ONNX grafiği için ONNX opset sürümünü belirtir. Ayarlanmazsa, desteklenen en son sürümü kullanır.
`data`	`str`	`'coco8.yaml'`	INT8 kalibrasyonu için kullanılan veri seti yapılandırma dosyası. Kalibrasyon görüntüsü kaynağını belirtir.
`fraction`	`float`	`1.0`	INT8 kuantizasyonu için kullanılacak kalibrasyon veri setinin oranı.
`device`	`str`	`None`	ONNX dışa aktarma adımı için cihazı belirler: GPU (`device=0`) veya CPU (`device=cpu`).

Precision

QNN export quantizes the model to 16-bit activations and INT8 weights — the recommended accuracy/performance balance for the Hexagon NPU — using the ONNX Runtime QDQ quantization flow with calibration images from data. quantize='w8a16' is enforced automatically.

Dışa aktarma süreci hakkında daha fazla ayrıntı için dışa aktarma hakkındaki Ultralytics dokümantasyon sayfasına git.

Link to this sectionÇıktı Yapısı#

Başarılı bir dışa aktarmadan sonra, kendi kendine yeten bir ONNX dosyası oluşturulur:

yolo26n_qnn.onnx   # ONNX wrapping the precompiled QNN context binary and metadata

yolo26n_qnn.onnx dosyası QNN bağlam ikilisini gömer ve Snapdragon cihazındaki QNN Execution Provider ile ONNX Runtime tarafından yüklenir. Ayrıca sınıf isimleri, görüntü boyutu ve görev gibi model meta verilerini ONNX metadata_props içinde taşır.

Link to this sectionDışa Aktarılan YOLO QNN Modellerini Dağıtma#

QNN modelleri Qualcomm Snapdragon donanımı üzerinde çalışır, bu da cihaz üzerinde model dağıtımını kolaylaştırır. onnxruntime-qnn yüklü bir Snapdragon cihazında, dışa aktarılan modeli doğrudan Ultralytics API ile çalıştır (yolo predict/yolo val, yukarıdaki Kullanım bölümüne bak) — Ultralytics, bağlam ikilisini ONNX Runtime QNN Execution Provider aracılığıyla yükler ve HTP (NPU), GPU veya CPU arka ucunu seçer.

Özel iş akışları için bağlam ikilisi ONNX dosyasını doğrudan ONNX Runtime ile de yükleyebilirsin. onnxruntime-qnn bir eklenti Execution Provider'dır, bu yüzden çalışma zamanında kaydettir:

import onnxruntime as ort
import onnxruntime_qnn as qnn_ep

# On the Snapdragon device, register the QNN plugin EP and select its device(s)
ort.register_execution_provider_library("QNNExecutionProvider", qnn_ep.get_library_path())
devices = [d for d in ort.get_ep_devices() if d.ep_name == "QNNExecutionProvider"]

options = ort.SessionOptions()
options.add_provider_for_devices(devices, {"backend_path": qnn_ep.get_qnn_htp_path()})
session = ort.InferenceSession("yolo26n_qnn.onnx", sess_options=options)
input_info = session.get_inputs()[0]
outputs = session.run(None, {input_info.name: input_tensor})  # input_tensor: float32 NHWC

QNN bağlam ikilisi önceden derlendiği için oturum, cihaz üzerinde grafiği yeniden derlemeden hızlı bir şekilde yüklenir.

Link to this sectionÖnerilen İş Akışı#

Modelini Ultralytics Eğitim Modu kullanarak Eğit
Desteklenen bir platformda model.export(format="qnn", imgsz=640) kullanarak QNN formatına Dışarı Aktar (sınıflandırma için imgsz=224 kullan)
Dışa aktarılan *_qnn.onnx dosyasını Snapdragon cihazına Dağıt
HTP, GPU veya CPU arka ucunu seçerek ONNX Runtime ve QNN Execution Provider ile çıkarım Çalıştır

Link to this sectionGerçek Dünya Uygulamaları#

Qualcomm Snapdragon donanımı üzerinde çalışan YOLO modelleri, çok çeşitli uç yapay zeka uygulamaları için oldukça uygundur:

Akıllı telefonlar: Kamera ve fotoğraf uygulamalarında NPU hızlandırması ile gerçek zamanlı nesne algılama ve sahne anlama.
Windows on Snapdragon: Copilot+ PC'lerde buluta ihtiyaç duymadan cihaz üzerinde bilgisayarlı görü.
Otomotiv: Snapdragon Digital Chassis platformlarında sürücü izleme, yolcu algılama ve ADAS özellikleri.
XR ve Giyilebilir Cihazlar: AR/VR başlıkları ve akıllı gözlükler için düşük güçlü, düşük gecikmeli algılama.
IoT ve Robotik: Snapdragon destekli kameralar, dronlar ve gömülü sistemlerde verimli görü çıkarımı.

Link to this sectionÖzet#

Bu kılavuzda, Ultralytics YOLO modellerini ONNX Runtime QNN Execution Provider ile yerel olarak Qualcomm QNN formatına nasıl dışa aktaracağını öğrendin. Dışa aktarma hattı, modelini ONNX'e dönüştürür ve ardından ana bilgisayarında bir QNN bağlam ikilisine derler — Qualcomm hesabı veya bulut gerekmez — QNN/QAIRT çalışma zamanı aracılığıyla Snapdragon CPU, Adreno GPU ve Hexagon NPU donanımı için optimize edilmiş bir *_qnn.onnx dosyası üretir.

Ultralytics YOLO ve Qualcomm'un cihaz içi AI yığınının kombinasyonu, geniş Snapdragon ekosisteminde gelişmiş bilgisayarlı görü iş yüklerini çalıştırmak için etkili bir çözüm sunar.

Diğer cihaz içi ve mobil dağıtım hedefleri için ilgili ONNX, CoreML, NCNN, LiteRT, ExecuTorch, RKNN, Sony IMX500 ve TensorRT dışa aktarma kılavuzlarına göz at. Dağıtımdan önce formatları karşılaştırmak için Benchmark modu kullan. Tüm formatların ve seçeneklerin tam listesi için Export modu belgelerini ve integrations guide page sayfasını ziyaret et.

Link to this sectionSSS#

Link to this sectionUltralytics YOLO modelimi QNN formatına nasıl dışa aktarırım?#

Modelini export(format="qnn", imgsz=640) (sınıflandırma için imgsz=224) veya eşdeğer CLI argümanlarıyla dışarı aktarabilirsin. Dışa aktarım önce bir ONNX modeli oluşturur, ardından bunu ONNX Runtime QNN Execution Provider kullanarak yerel olarak bir QNN bağlam ikilisine derler. onnxruntime-qnn paketi ilk dışa aktarımda otomatik olarak yüklenir.

Örnek

from ultralytics import YOLO

model = YOLO("yolo26n.pt")
model.export(format="qnn", imgsz=640)  # use imgsz=224 for classification

Link to this sectionQualcomm hesabına veya bulut erişimine ihtiyacım var mı?#

Hayır. QNN dışa aktarımı, QAIRT kütüphanelerini içeren onnxruntime-qnn paketi kullanılarak tamamen yerel bilgisayarında çalışır. Hiçbir Qualcomm hesabı, API anahtarı veya ağ erişimi gerekmez.

Link to this sectionUltralytics QNN dışa aktarımı, Qualcomm AI Hub ile nasıl karşılaştırılır?#

Qualcomm AI Hub, modelleri barındırılan Snapdragon cihazlarında derlemek, profillemek ve kıyaslamak için Qualcomm'un bulut hizmetidir ve bir Qualcomm hesabı gerektirir. Ultralytics QNN dışa aktarımı aynı QNN/QAIRT çalışma zamanını (Snapdragon CPU, Adreno GPU ve Hexagon NPU) hedefler ancak bağlam ikilisini ONNX Runtime QNN Execution Provider ile yerel olarak derler — hesap, yükleme veya bekleme süresi yoktur. Standart YOLO dışa aktarma iş akışı içinde doğrudan bir .pt modelinden Snapdragon'a hazır bir yapıya geçmenin en hızlı yoludur.

Link to this sectionHangi platformlarda dışa aktarma yapabilirim?#

onnxruntime-qnn Windows (x64 ve ARM64) ve Linux ARM64 (aarch64) için önceden derlenmiş tekerlekler sunar; Linux x86-64 üzerinde ONNX Runtime'ı --use_qnn ile kaynaktan derle (önceden derlenmiş tekerlek yayınlanmamıştır ve macOS desteklenen bir QNN ana bilgisayarı değildir). Bağlam ikilisi oluşturma işlemi bir x64 ana bilgisayarda — Windows x64 veya Linux x86-64 — çalışır ve fiziksel bir Snapdragon cihazı gerektirmez.

Link to this sectionYOLO'yu Qualcomm Snapdragon NPU'sunda nasıl çalıştırırım?#

model.export(format="qnn", imgsz=640) (sınıflandırma için imgsz=224) ile dışarı aktar, elde edilen yolo26n_qnn.onnx dosyasını Snapdragon cihazına kopyala ve yolo predict model=yolo26n_qnn.onnx source=image.jpg (veya yolo val) komutunu çalıştır. Ultralytics, bağlam ikilisini ONNX Runtime QNN Execution Provider aracılığıyla yükler ve Hexagon NPU üzerinde çalıştırır — bkz. Deploying Exported YOLO QNN Models.

Link to this sectionQNN ve SNPE arasındaki fark nedir?#

QNN (Qualcomm AI Engine Direct, QAIRT SDK'nın bir parçası), Qualcomm'un mevcut çıkarım yığınıdır ve eski Snapdragon Neural Processing Engine (SNPE) SDK'sı için önerilen yedek parçadır. Yeni dağıtımlar QNN'i hedeflemelidir.

Link to this sectionQNN modelini `yolo predict` ve `yolo val` ile çalıştırabilir miyim?#

Evet, onnxruntime-qnn yüklü bir Qualcomm Snapdragon cihazında — YOLO("yolo26n_qnn.onnx"), bağlam ikilisini QNN Execution Provider aracılığıyla yükler ve predict/val işlemlerini diğer herhangi bir format gibi çalıştırır. QNN donanımı olmayan bir x86 ana bilgisayarında model, bağlam ikilisi Snapdragon NPU'sunu hedeflediği için yürütülemez.

Link to this sectionQNN dışa aktarımının çıktısı nedir?#

The export creates a self-contained context-binary ONNX file (e.g., yolo26n_qnn.onnx) with class names, image size, task, and other model metadata embedded in ONNX metadata_props.

Katkıda Bulunanlar

GLglenn-jocher¹² AMamanharshx¹ AMambitious-octopus¹ ONonuralpszr¹ RAraimbekovm¹ SHShuaiLYU¹

Oluşturulma 2 ay önceGüncellenme 9 saat önce