Meet YOLO26: next-gen vision AI.

Link to this sectionVergleichende Analyse der YOLO26-Bereitstellungsoptionen#

Link to this sectionEinführung#

Du hast auf deiner Reise mit YOLO26 schon viel erreicht. Du hast fleißig Daten gesammelt, sie sorgfältig annotiert und Zeit investiert, um dein eigenes YOLO26-Modell zu trainieren und rigoros zu bewerten. Jetzt ist es an der Zeit, dein Modell für deine spezifische Anwendung, deinen Anwendungsfall oder dein Projekt einzusetzen. Doch eine entscheidende Entscheidung steht vor dir: Wie exportierst und implementierst du dein Modell effektiv?



Watch: How to Choose the Best Ultralytics YOLO26 Deployment Format for Your Project | TensorRT | OpenVINO 🚀

Dieser Leitfaden führt dich durch die Bereitstellungsoptionen von YOLO26 und zeigt dir die wesentlichen Faktoren, die du bei der Wahl der richtigen Option für dein Projekt berücksichtigen musst.

Link to this sectionSo wählst du die richtige Bereitstellungsoption für dein YOLO26-Modell aus#

Wenn es Zeit ist, dein YOLO26-Modell bereitzustellen, ist die Auswahl eines geeigneten Exportformats sehr wichtig. Wie in der Ultralytics YOLO26 Modes-Dokumentation dargelegt, ermöglicht dir die model.export()-Funktion, dein trainiertes Modell in eine Vielzahl von Formaten zu konvertieren, die auf unterschiedliche Umgebungen und Leistungsanforderungen zugeschnitten sind.

Das ideale Format hängt vom beabsichtigten Einsatzkontext deines Modells ab und erfordert eine Abwägung zwischen Geschwindigkeit, Hardwarebeschränkungen und Integrationsaufwand. Für eine verwaltete Bereitstellung ohne manuellen Export bietet die Ultralytics Platform einsatzbereite Inference Endpoints mit automatischer Skalierung über 43 globale Regionen hinweg. Im nächsten Abschnitt sehen wir uns jede Exportoption genauer an, um zu verstehen, wann welche Wahl die richtige ist.

Link to this sectionDie Bereitstellungsoptionen von YOLO26#

Lass uns die verschiedenen Bereitstellungsoptionen von YOLO26 durchgehen. Für eine detaillierte Anleitung zum Exportprozess besuche die Ultralytics-Dokumentationsseite zum Export.

Link to this sectionPyTorch#

PyTorch ist eine Open-Source-Bibliothek für maschinelles Lernen, die häufig für Anwendungen in den Bereichen Deep Learning und künstliche Intelligenz verwendet wird. Sie bietet ein hohes Maß an Flexibilität und Geschwindigkeit, was sie zu einem Favoriten bei Forschern und Entwicklern gemacht hat.

  • Performance-Benchmarks: PyTorch ist bekannt für seine Benutzerfreundlichkeit und Flexibilität, was im Vergleich zu anderen, spezialisierteren und optimierteren Frameworks zu einem leichten Kompromiss bei der reinen Performance führen kann.
  • Kompatibilität und Integration: Bietet hervorragende Kompatibilität mit verschiedenen Datenwissenschafts- und Machine-Learning-Bibliotheken in Python.
  • Community-Support und Ökosystem: Eine der lebendigsten Communities mit umfangreichen Ressourcen für das Lernen und die Fehlerbehebung.
  • Fallstudien: Häufig in Forschungsprototypen verwendet; viele wissenschaftliche Arbeiten beziehen sich auf Modelle, die in PyTorch bereitgestellt wurden.
  • Wartung und Updates: Regelmäßige Updates mit aktiver Entwicklung und Unterstützung für neue Funktionen.
  • Sicherheitsaspekte: Regelmäßige Patches für Sicherheitsprobleme, wobei die Sicherheit jedoch weitgehend von der allgemeinen Umgebung abhängt, in der es bereitgestellt wird.
  • Hardwarebeschleunigung: Unterstützt CUDA für GPU-Beschleunigung, was für die Beschleunigung des Modelltrainings und der Inferenz unerlässlich ist.

Link to this sectionTorchScript#

TorchScript erweitert die Funktionen von PyTorch, indem es den Export von Modellen ermöglicht, die in einer C++-Runtime-Umgebung ausgeführt werden können. Dies macht es für Produktionsumgebungen geeignet, in denen kein Python verfügbar ist.

  • Performance-Benchmarks: Kann eine verbesserte Performance gegenüber nativem PyTorch bieten, insbesondere in Produktionsumgebungen.
  • Kompatibilität und Integration: Entwickelt für einen nahtlosen Übergang von PyTorch zu C++-Produktionsumgebungen, wobei einige fortgeschrittene Funktionen möglicherweise nicht perfekt übersetzt werden.
  • Community-Support und Ökosystem: Profitiert von der großen Community von PyTorch, hat jedoch einen engeren Kreis an spezialisierten Entwicklern.
  • Fallstudien: Weit verbreitet in industriellen Umgebungen, in denen der Performance-Overhead von Python ein Engpass ist.
  • Wartung und Updates: Wird parallel zu PyTorch mit konsistenten Updates gepflegt.
  • Sicherheitsaspekte: Bietet verbesserte Sicherheit, da Modelle in Umgebungen ohne vollständige Python-Installationen ausgeführt werden können.
  • Hardwarebeschleunigung: Erbt die CUDA-Unterstützung von PyTorch und gewährleistet eine effiziente GPU-Auslastung.

Link to this sectionONNX#

Der Open Neural Network Exchange (ONNX) ist ein Format, das die Interoperabilität von Modellen über verschiedene Frameworks hinweg ermöglicht, was bei der Bereitstellung auf verschiedenen Plattformen entscheidend sein kann.

  • Performance-Benchmarks: ONNX-Modelle können je nach spezifischer Runtime, auf der sie bereitgestellt werden, eine variable Performance aufweisen.
  • Kompatibilität und Integration: Hohe Interoperabilität über mehrere Plattformen und Hardware hinweg aufgrund seiner framework-agnostischen Natur.
  • Community-Support und Ökosystem: Wird von vielen Organisationen unterstützt, was zu einem breiten Ökosystem und einer Vielzahl von Tools zur Optimierung führt.
  • Fallstudien: Wird häufig verwendet, um Modelle zwischen verschiedenen Machine-Learning-Frameworks zu verschieben, was seine Flexibilität demonstriert.
  • Wartung und Updates: Als offener Standard wird ONNX regelmäßig aktualisiert, um neue Operationen und Modelle zu unterstützen.
  • Sicherheitsaspekte: Wie bei jedem plattformübergreifenden Tool ist es wichtig, sichere Praktiken in der Konvertierungs- und Bereitstellungspipeline sicherzustellen.
  • Hardwarebeschleunigung: Mit ONNX Runtime können Modelle verschiedene Hardware-Optimierungen nutzen.

Link to this sectionOpenVINO#

OpenVINO ist ein Intel-Toolkit, das entwickelt wurde, um die Bereitstellung von Deep-Learning-Modellen auf Intel-Hardware zu erleichtern und die Performance und Geschwindigkeit zu verbessern.

  • Performance-Benchmarks: Speziell für Intel-CPUs, GPUs und VPUs optimiert und bietet signifikante Performance-Schübe auf kompatibler Hardware.
  • Kompatibilität und Integration: Funktioniert am besten innerhalb des Intel-Ökosystems, unterstützt aber auch eine Reihe anderer Plattformen.
  • Community-Support und Ökosystem: Unterstützt durch Intel, mit einer soliden Nutzerbasis, insbesondere im Bereich Computer Vision.
  • Fallstudien: Oft in IoT- und Edge Computing-Szenarien eingesetzt, in denen Intel-Hardware weit verbreitet ist.
  • Wartung und Updates: Intel aktualisiert OpenVINO regelmäßig, um die neuesten Deep-Learning-Modelle und Intel-Hardware zu unterstützen.
  • Sicherheitsaspekte: Bietet robuste Sicherheitsfunktionen, die für den Einsatz in sensiblen Anwendungen geeignet sind.
  • Hardwarebeschleunigung: Zugeschnitten auf die Beschleunigung auf Intel-Hardware durch Nutzung dedizierter Befehlssätze und Hardwarefunktionen.

Weitere Details zur Bereitstellung mit OpenVINO findest du in der Ultralytics-Integrationsdokumentation: Intel OpenVINO Export.

Link to this sectionTensorRT#

TensorRT ist ein Hochleistungs-Inferenz-Optimierer und eine Runtime für Deep Learning von NVIDIA, ideal für Anwendungen, die Geschwindigkeit und Effizienz erfordern.

  • Performance-Benchmarks: Liefert erstklassige Performance auf NVIDIA-GPUs mit Unterstützung für Hochgeschwindigkeits-Inferenz.
  • Kompatibilität und Integration: Am besten für NVIDIA-Hardware geeignet, mit begrenzter Unterstützung außerhalb dieser Umgebung.
  • Community-Support und Ökosystem: Starkes Support-Netzwerk durch NVIDIAs Entwicklerforen und Dokumentation.
  • Fallstudien: Weit verbreitet in Branchen, die Echtzeit-Inferenz für Video- und Bilddaten erfordern.
  • Wartung und Updates: NVIDIA wartet TensorRT mit häufigen Updates, um die Performance zu verbessern und neue GPU-Architekturen zu unterstützen.
  • Sicherheitsaspekte: Wie viele Produkte von NVIDIA liegt ein starker Fokus auf Sicherheit, wobei die Details jedoch von der Bereitstellungsumgebung abhängen.
  • Hardwarebeschleunigung: Exklusiv für NVIDIA-GPUs entwickelt, was tiefe Optimierung und Beschleunigung ermöglicht.

Weitere Informationen zur TensorRT-Bereitstellung findest du im TensorRT-Integrationsleitfaden.

Link to this sectionCoreML#

CoreML ist das Machine-Learning-Framework von Apple, das für die Performance auf dem Gerät im Apple-Ökosystem optimiert ist, einschließlich iOS, macOS, watchOS und tvOS.

  • Performance-Benchmarks: Optimiert für die Performance auf dem Gerät bei Apple-Hardware mit minimalem Batterieverbrauch.
  • Kompatibilität und Integration: Exklusiv für das Apple-Ökosystem, bietet einen optimierten Workflow für iOS- und macOS-Anwendungen.
  • Community-Support und Ökosystem: Starke Unterstützung von Apple und einer engagierten Entwickler-Community mit umfangreicher Dokumentation und Tools.
  • Fallstudien: Häufig in Anwendungen verwendet, die Machine-Learning-Funktionen auf dem Gerät bei Apple-Produkten erfordern.
  • Wartung und Updates: Wird von Apple regelmäßig aktualisiert, um die neuesten Fortschritte im Bereich Machine Learning und Apple-Hardware zu unterstützen.
  • Sicherheitsaspekte: Profitiert von Apples Fokus auf Privatsphäre und Datensicherheit.
  • Hardwarebeschleunigung: Nutzt Apples Neural Engine und GPU in vollem Umfang für beschleunigte Machine-Learning-Aufgaben.

Link to this sectionTF SavedModel#

TF SavedModel ist das Format von TensorFlow zum Speichern und Bereitstellen von Machine-Learning-Modellen, das besonders für skalierbare Serverumgebungen geeignet ist.

  • Performance-Benchmarks: Bietet skalierbare Performance in Serverumgebungen, insbesondere bei Verwendung mit TensorFlow Serving.
  • Kompatibilität und Integration: Breite Kompatibilität im gesamten TensorFlow-Ökosystem, einschließlich Cloud- und Enterprise-Server-Bereitstellungen.
  • Community-Support und Ökosystem: Großer Community-Support aufgrund der Popularität von TensorFlow, mit einer Vielzahl von Tools für Bereitstellung und Optimierung.
  • Fallstudien: Umfangreicher Einsatz in Produktionsumgebungen zur Bereitstellung von Deep-Learning-Modellen im großen Maßstab.
  • Wartung und Updates: Wird von Google und der TensorFlow-Community unterstützt, was regelmäßige Updates und neue Funktionen gewährleistet.
  • Sicherheitsaspekte: Die Bereitstellung mit TensorFlow Serving beinhaltet robuste Sicherheitsfunktionen für Anwendungen auf Unternehmensebene.
  • Hardwarebeschleunigung: Unterstützt verschiedene Hardwarebeschleunigungen durch die Backends von TensorFlow.

Link to this sectionTF GraphDef#

TF GraphDef ist ein TensorFlow-Format, das das Modell als Graph darstellt, was für Umgebungen vorteilhaft ist, in denen ein statischer Berechnungsgraph erforderlich ist.

  • Performance-Benchmarks: Bietet stabile Performance für statische Berechnungsgraphen, mit Fokus auf Konsistenz und Zuverlässigkeit.
  • Kompatibilität und Integration: Integriert sich leicht in die Infrastruktur von TensorFlow, ist jedoch weniger flexibel als SavedModel.
  • Community-Support und Ökosystem: Gute Unterstützung durch das TensorFlow-Ökosystem mit vielen Ressourcen zur Optimierung statischer Graphen.
  • Fallstudien: Nützlich in Szenarien, in denen ein statischer Graph erforderlich ist, wie beispielsweise in bestimmten eingebetteten Systemen.
  • Wartung und Updates: Regelmäßige Updates parallel zu den Kern-Updates von TensorFlow.
  • Sicherheitsaspekte: Gewährleistet eine sichere Bereitstellung mit den etablierten Sicherheitspraktiken von TensorFlow.
  • Hardwarebeschleunigung: Kann die Hardwarebeschleunigungsoptionen von TensorFlow nutzen, wenn auch nicht so flexibel wie SavedModel.

Erfahre mehr über TF GraphDef in unserem TF GraphDef-Integrationsleitfaden.

Link to this sectionTF Lite#

TF Lite ist die Lösung von TensorFlow für Machine Learning auf mobilen und eingebetteten Geräten und bietet eine leichtgewichtige Bibliothek für Inferenz auf dem Gerät.

  • Performance-Benchmarks: Entwickelt für Geschwindigkeit und Effizienz auf mobilen und eingebetteten Geräten.
  • Kompatibilität und Integration: Kann aufgrund seiner leichtgewichtigen Natur auf einer Vielzahl von Geräten verwendet werden.
  • Community-Support und Ökosystem: Unterstützt von Google, verfügt über eine robuste Community und eine wachsende Anzahl an Ressourcen für Entwickler.
  • Fallstudien: Beliebt in mobilen Anwendungen, die eine Inferenz auf dem Gerät mit minimalem Platzbedarf erfordern.
  • Wartung und Updates: Wird regelmäßig aktualisiert, um die neuesten Funktionen und Optimierungen für mobile Geräte zu erhalten.
  • Sicherheitsaspekte: Bietet eine sichere Umgebung für die Ausführung von Modellen auf Endbenutzergeräten.
  • Hardwarebeschleunigung: Unterstützt eine Vielzahl von Hardwarebeschleunigungsoptionen, einschließlich GPU und DSP.

Link to this sectionTF Edge TPU#

TF Edge TPU wurde für schnelles, effizientes Computing auf Googles Edge TPU-Hardware entwickelt, perfekt für IoT-Geräte, die Echtzeitverarbeitung erfordern.

  • Performance-Benchmarks: Speziell optimiert für schnelles, effizientes Computing auf Googles Edge TPU-Hardware.
  • Kompatibilität und Integration: Funktioniert ausschließlich mit TensorFlow Lite-Modellen auf Edge TPU-Geräten.
  • Community-Support und Ökosystem: Wachsende Unterstützung mit Ressourcen von Google und Drittanbietern.
  • Fallstudien: Wird in IoT-Geräten und Anwendungen verwendet, die Echtzeitverarbeitung mit geringer Latenz erfordern.
  • Wartung und Updates: Kontinuierliche Verbesserung, um die Möglichkeiten neuer Edge TPU-Hardware-Releases zu nutzen.
  • Sicherheitsaspekte: Integriert sich in Googles robuste Sicherheit für IoT- und Edge-Geräte.
  • Hardwarebeschleunigung: Maßgeschneidert, um die Vorteile von Google Coral-Geräten voll auszuschöpfen.

Link to this sectionHailo HEF#

Hailo HEF ist ein kompiliertes ausführbares Format für Hailo-KI-Beschleuniger, einschließlich Hailo-8-, Hailo-8L- und Hailo-15-Geräten. Ultralytics YOLO-Erkennungsmodelle werden zuerst in ONNX exportiert und dann mit dem externen Hailo Dataflow Compiler zu HEF kompiliert. HEF ist kein direktes Ultralytics-Exportziel; vergleiche für unterstützte Edge-Beschleunigungs-Workflows zuerst Axelera AI und DeepX.

  • Performance-Benchmarks: Hängt von der Hailo-Hardware, der Hailo SDK-Version, dem Modellskript, der NMS-Konfiguration und den Kalibrierungsdaten ab.
  • Kompatibilität und Integration: Nur für eingebettete Systeme mit Hailo-Technologie, industrielle Gateways und Raspberry Pi AI Kit-Bereitstellungen.
  • Community-Support und Ökosystem: Unterstützt durch Hailo Developer Zone, HailoRT, TAPPAS und das Hailo Model Zoo.
  • Fallstudien: Nützlich für Echtzeit-Objekterkennung auf Kameras, Robotik, Zugangskontrolle, Smart-City-Anwendungen und industrielle Inspektionsgeräte.
  • Wartung und Updates: Abhängig von Hailo SDK, Firmware und Model-Zoo-Updates für neue Beschleuniger-Targets.
  • Sicherheitsaspekte: Unterstützt lokale Inferenz auf dem Gerät, wobei die Daten am Edge verbleiben.
  • Hardwarebeschleunigung: Nutzt Hailo NPU-Ausführung durch kompilierte HEF-Artefakte.

Für einen Schritt-für-Schritt-Workflow, siehe den Hailo-Integrationsleitfaden.

Link to this sectionTF.js#

TensorFlow.js (TF.js) ist eine Bibliothek, die Machine-Learning-Funktionen direkt in den Browser bringt und Webentwicklern sowie Nutzern gleichermaßen völlig neue Möglichkeiten eröffnet. Sie ermöglicht die Integration von Machine-Learning-Modellen in Webanwendungen, ohne dass eine Back-End-Infrastruktur erforderlich ist.

  • Performance-Benchmarks: Ermöglicht Machine Learning direkt im Browser mit angemessener Leistung, abhängig vom Client-Gerät.
  • Kompatibilität und Integration: Hohe Kompatibilität mit Webtechnologien, was eine einfache Integration in Webanwendungen ermöglicht.
  • Community-Support und Ökosystem: Unterstützung durch eine Community von Web- und Node.js-Entwicklern mit einer Vielzahl von Tools zur Bereitstellung von ML-Modellen in Browsern.
  • Fallstudien: Ideal für interaktive Webanwendungen, die von clientseitigem Machine Learning profitieren, ohne dass serverseitige Verarbeitung erforderlich ist.
  • Wartung und Updates: Wird vom TensorFlow-Team mit Beiträgen der Open-Source-Community gepflegt.
  • Sicherheitsaspekte: Läuft innerhalb des sicheren Kontexts des Browsers und nutzt das Sicherheitsmodell der Webplattform.
  • Hardwarebeschleunigung: Die Leistung kann mit webbasierten APIs verbessert werden, die auf Hardwarebeschleunigung wie WebGL zugreifen.

Link to this sectionPaddlePaddle#

PaddlePaddle ist ein Open-Source Deep-Learning-Framework, das von Baidu entwickelt wurde. Es ist darauf ausgelegt, sowohl für Forscher effizient als auch für Entwickler einfach zu bedienen zu sein. Es ist besonders in China populär und bietet spezialisierte Unterstützung für die chinesische Sprachverarbeitung.

  • Performance-Benchmarks: Bietet konkurrenzfähige Leistung mit Fokus auf Benutzerfreundlichkeit und Skalierbarkeit.
  • Kompatibilität und Integration: Gut integriert in das Ökosystem von Baidu und unterstützt eine breite Palette an Anwendungen.
  • Community-Support und Ökosystem: Während die globale Community kleiner ist, wächst sie rasant, insbesondere in China.
  • Fallstudien: Häufig in chinesischen Märkten verwendet und von Entwicklern, die nach Alternativen zu anderen großen Frameworks suchen.
  • Wartung und Updates: Regelmäßig aktualisiert mit Fokus auf die Bedienung chinesischsprachiger KI-Anwendungen und -Dienste.
  • Sicherheitsaspekte: Legt Wert auf Datenschutz und Sicherheit, angepasst an chinesische Daten-Governance-Standards.
  • Hardwarebeschleunigung: Unterstützt verschiedene Hardwarebeschleunigungen, einschließlich Baidus eigener Kunlun-Chips.

Link to this sectionMNN#

MNN ist ein hocheffizientes und leichtgewichtiges Deep-Learning-Framework. Es unterstützt die Inferenz und das Training von Deep-Learning-Modellen und bietet branchenführende Leistung für Inferenz und Training auf dem Gerät. Darüber hinaus wird MNN auch auf eingebetteten Geräten, wie z. B. im IoT, eingesetzt.

  • Performance-Benchmarks: Hohe Leistung für Mobilgeräte mit exzellenter Optimierung für ARM-Systeme.
  • Kompatibilität und Integration: Funktioniert gut mit mobilen und eingebetteten ARM-Systemen sowie X86-64 CPU-Architekturen.
  • Community-Support und Ökosystem: Unterstützt durch die Community für mobiles und eingebettetes Machine Learning.
  • Fallstudien: Ideal für Anwendungen, die effiziente Leistung auf mobilen Systemen erfordern.
  • Wartung und Updates: Regelmäßig gepflegt, um eine hohe Leistung auf Mobilgeräten sicherzustellen.
  • Sicherheitsaspekte: Bietet Sicherheitsvorteile auf dem Gerät, indem Daten lokal gehalten werden.
  • Hardwarebeschleunigung: Optimiert für ARM-CPUs und GPUs für maximale Effizienz.

Link to this sectionNCNN#

NCNN ist ein hochperformantes Framework für die Inferenz neuronaler Netze, das für die mobile Plattform optimiert ist. Es zeichnet sich durch seine Leichtgewichtigkeit und Effizienz aus, wodurch es besonders gut für mobile und eingebettete Geräte mit begrenzten Ressourcen geeignet ist.

  • Performance-Benchmarks: Hochgradig für mobile Plattformen optimiert und bietet effiziente Inferenz auf ARM-basierten Geräten.
  • Kompatibilität und Integration: Geeignet für Anwendungen auf Mobiltelefonen und eingebetteten Systemen mit ARM-Architektur.
  • Community-Support und Ökosystem: Unterstützt durch eine Nischen- aber aktive Community, die sich auf mobile und eingebettete ML-Anwendungen konzentriert.
  • Fallstudien: Bevorzugt für mobile Anwendungen, bei denen Effizienz und Geschwindigkeit auf Android und anderen ARM-basierten Systemen kritisch sind.
  • Wartung und Updates: Kontinuierlich verbessert, um die hohe Leistung auf einer Reihe von ARM-Geräten aufrechtzuerhalten.
  • Sicherheitsaspekte: Konzentriert sich auf die lokale Ausführung auf dem Gerät und nutzt die inhärente Sicherheit der Verarbeitung auf dem Gerät.
  • Hardwarebeschleunigung: Maßgeschneidert für ARM-CPUs und GPUs mit spezifischen Optimierungen für diese Architekturen.

Link to this sectionVergleichende Analyse der YOLO26-Bereitstellungsoptionen#

Die folgende Tabelle bietet einen Überblick über die verschiedenen Bereitstellungsoptionen, die für YOLO26-Modelle verfügbar sind, und hilft dir dabei, basierend auf mehreren kritischen Kriterien zu beurteilen, welche am besten zu deinen Projektanforderungen passt. Einen detaillierten Blick auf das Format jeder Bereitstellungsoption findest du auf der Ultralytics-Dokumentationsseite zu Exportformaten.

BereitstellungsoptionPerformance-BenchmarksKompatibilität und IntegrationCommunity-Support und ÖkosystemFallstudienWartung und UpdatesSicherheitsaspekteHardwarebeschleunigung
PyTorchGute Flexibilität; kann auf Kosten der reinen Leistung gehenExzellent mit Python-BibliothekenUmfangreiche Ressourcen und CommunityForschung und PrototypenRegelmäßige, aktive EntwicklungAbhängig von der BereitstellungsumgebungCUDA-Unterstützung für GPU-Beschleunigung
TorchScriptBesser für die Produktion geeignet als PyTorchReibungsloser Übergang von PyTorch zu C++Spezialisiert, aber begrenzter als PyTorchIndustrie, in der Python ein Flaschenhals istKonsistente Updates mit PyTorchVerbesserte Sicherheit ohne vollständiges PythonErbt CUDA-Unterstützung von PyTorch
ONNXVariabel je nach RuntimeHoch über verschiedene Frameworks hinwegBreites Ökosystem, von vielen Organisationen unterstütztFlexibilität über ML-Frameworks hinwegRegelmäßige Updates für neue OperationenStelle sichere Konvertierungs- und Bereitstellungspraktiken sicherVerschiedene Hardware-Optimierungen
OpenVINOOptimiert für Intel-HardwareAm besten innerhalb des Intel-ÖkosystemsSolide im Bereich Computer VisionIoT und Edge mit Intel-HardwareRegelmäßige Updates für Intel-HardwareRobuste Funktionen für sensible AnwendungenMaßgeschneidert für Intel-Hardware
TensorRTSpitzenklasse auf NVIDIA-GPUsAm besten für NVIDIA-HardwareStarkes Netzwerk durch NVIDIAEchtzeit-Video- und BildinferenzHäufige Updates für neue GPUsBetonung auf SicherheitEntwickelt für NVIDIA-GPUs
CoreMLOptimiert für Apple-Hardware auf dem GerätExklusiv für das Apple-ÖkosystemStarker Apple- und Entwickler-SupportML auf Apple-Produkten direkt auf dem GerätRegelmäßige Apple-UpdatesFokus auf Datenschutz und SicherheitApple Neural Engine und GPU
TF SavedModelSkalierbar in ServerumgebungenBreite Kompatibilität im TensorFlow-ÖkosystemGroße Unterstützung aufgrund der Popularität von TensorFlowModellbereitstellung in großem MaßstabRegelmäßige Updates durch Google und die CommunityRobuste Funktionen für UnternehmenVerschiedene Hardwarebeschleunigungen
TF GraphDefStabil für statische BerechnungsgraphenIntegriert sich gut in die TensorFlow-InfrastrukturRessourcen zur Optimierung statischer GraphenSzenarien, die statische Graphen erfordernUpdates zusammen mit TensorFlow CoreEtablierte TensorFlow-SicherheitspraktikenTensorFlow-Beschleunigungsoptionen
TF LiteGeschwindigkeit und Effizienz auf Mobil-/Embedded-GerätenBreites Spektrum an GeräteunterstützungRobuste Community, unterstützt durch GoogleMobile Anwendungen mit minimalem PlatzbedarfNeueste Funktionen für MobilgeräteSichere Umgebung auf EndbenutzergerätenGPU und DSP unter anderen
TF Edge TPUOptimiert für Googles Edge TPU-HardwareExklusiv für Edge TPU-GeräteWächst mit Google und Ressourcen von DrittanbieternIoT-Geräte, die Echtzeitverarbeitung erfordernVerbesserungen für neue Edge TPU-HardwareGoogles robuste IoT-SicherheitSpeziell entwickelt für Google Coral
Hailo HEFHardwarespezifisch und extern kompiliertHailo-Geräte und Raspberry Pi AI KitHailo Developer Zone und Model ZooBestehende Hailo-BereitstellungenHailo SDK und Firmware-UpdatesInferenz auf dem Gerät hält Daten lokalHailo NPU mittels HEF-Artefakten
TF.jsAngemessene Performance im BrowserHoch bei WebtechnologienUnterstützung für Web- und Node.js-EntwicklerInteraktive WebanwendungenBeiträge des TensorFlow-Teams und der CommunitySicherheitsmodell der WebplattformErweitert mit WebGL und anderen APIs
PaddlePaddleWettbewerbsfähig, einfach zu bedienen und skalierbarBaidu-Ökosystem, breite AnwendungsunterstützungSchnell wachsend, besonders in ChinaChinesischer Markt und SprachverarbeitungFokus auf chinesische KI-AnwendungenBetont Datenschutz und SicherheitEinschließlich der Kunlun-Chips von Baidu
MNNHochleistung für mobile Geräte.Mobile und eingebettete ARM-Systeme sowie X86-64 CPUMobile/Embedded ML-CommunityEffizienz mobiler SystemeHochleistungswartung auf MobilgerätenVorteile der Sicherheit auf dem GerätOptimierungen für ARM-CPUs und GPUs
NCNNOptimiert für mobile ARM-basierte GeräteMobile und eingebettete ARM-SystemeNischenorientierte, aber aktive Mobile/Embedded ML-CommunityEffizienz von Android- und ARM-SystemenHochleistungswartung auf ARMVorteile der Sicherheit auf dem GerätOptimierungen für ARM-CPUs und GPUs

Diese vergleichende Analyse gibt dir einen Überblick auf hoher Ebene. Für die Bereitstellung ist es wichtig, die spezifischen Anforderungen und Einschränkungen deines Projekts zu berücksichtigen und die detaillierte Dokumentation sowie die für jede Option verfügbaren Ressourcen zu konsultieren.

Link to this sectionCommunity und Support#

Wenn du mit YOLO26 beginnst, kann eine hilfreiche Community und Unterstützung einen bedeutenden Unterschied machen. Hier erfährst du, wie du dich mit anderen verbindest, die deine Interessen teilen, und die Hilfe bekommst, die du benötigst.

Link to this sectionEngagiere dich in der breiteren Community#

  • GitHub Discussions: Das YOLO26 Repository auf GitHub hat einen "Discussions"-Bereich, in dem du Fragen stellen, Probleme melden und Verbesserungen vorschlagen kannst.
  • Ultralytics Discord Server: Ultralytics hat einen Discord Server, auf dem du dich mit anderen Nutzern und Entwicklern austauschen kannst.

Link to this sectionOffizielle Dokumentation und Ressourcen#

  • Ultralytics YOLO26 Docs: Die offizielle Dokumentation bietet einen umfassenden Überblick über YOLO26 sowie Anleitungen zu Installation, Verwendung und Fehlerbehebung.

Diese Ressourcen helfen dir, Herausforderungen zu meistern und über die neuesten Trends und Best Practices in der YOLO26-Community auf dem Laufenden zu bleiben.

Link to this sectionFazit#

In diesem Leitfaden haben wir die verschiedenen Bereitstellungsoptionen für YOLO26 untersucht. Wir haben auch die wichtigen Faktoren besprochen, die bei der Auswahl zu berücksichtigen sind. Diese Optionen ermöglichen es dir, dein Modell für verschiedene Umgebungen und Leistungsanforderungen anzupassen, wodurch es für reale Anwendungen geeignet ist.

Vergiss nicht, dass die YOLO26- und Ultralytics-Community eine wertvolle Hilfsquelle ist. Vernetze dich mit anderen Entwicklern und Experten, um einzigartige Tipps und Lösungen zu erhalten, die du vielleicht nicht in der regulären Dokumentation findest. Suche weiter nach Wissen, erkunde neue Ideen und teile deine Erfahrungen.

Link to this sectionFAQ#

Link to this sectionWelche Bereitstellungsoptionen stehen für YOLO26 auf verschiedenen Hardwareplattformen zur Verfügung?#

Ultralytics YOLO26 unterstützt verschiedene Bereitstellungsformate, die jeweils für spezifische Umgebungen und Hardwareplattformen konzipiert sind. Zu den wichtigsten Formaten gehören:

  • PyTorch für Forschung und Prototyping, mit hervorragender Python-Integration.
  • TorchScript für Produktionsumgebungen, in denen Python nicht verfügbar ist.
  • ONNX für plattformübergreifende Kompatibilität und Hardwarebeschleunigung.
  • OpenVINO für optimierte Leistung auf Intel-Hardware.
  • TensorRT für Hochgeschwindigkeits-Inferenz auf NVIDIA-GPUs.

Jedes Format hat seine einzigartigen Vorteile. Eine detaillierte Anleitung findest du in unserer Dokumentation zum Exportprozess.

Link to this sectionWie kann ich die Inferenzgeschwindigkeit meines YOLO26-Modells auf einer Intel-CPU verbessern?#

Um die Inferenzgeschwindigkeit auf Intel-CPUs zu verbessern, kannst du dein YOLO26-Modell mit dem Intel OpenVINO-Toolkit bereitstellen. OpenVINO bietet signifikante Leistungssteigerungen durch die Optimierung von Modellen zur effizienten Nutzung von Intel-Hardware.

  1. Konvertiere dein YOLO26-Modell mit der Funktion model.export() in das OpenVINO-Format.
  2. Befolge die detaillierte Einrichtungsanleitung in der Intel OpenVINO Export-Dokumentation.

Für weitere Einblicke lies unseren Blogbeitrag.

Link to this sectionKann ich YOLO26-Modelle auf Mobilgeräten bereitstellen?#

Ja, YOLO26-Modelle können auf Mobilgeräten unter Verwendung von TensorFlow Lite (TF Lite) für Android- und iOS-Plattformen bereitgestellt werden. TF Lite ist für mobile und eingebettete Geräte konzipiert und bietet eine effiziente Inferenz auf dem Gerät.

Beispiel
# Export command for TFLite format
model.export(format="tflite")

Weitere Details zur Bereitstellung von Modellen auf Mobilgeräten findest du in unserem TF Lite-Integrationsleitfaden.

Link to this sectionWelche Faktoren sollte ich bei der Wahl eines Bereitstellungsformats für mein YOLO26-Modell berücksichtigen?#

Bei der Wahl eines Bereitstellungsformats für YOLO26 solltest du folgende Faktoren berücksichtigen:

  • Leistung: Einige Formate wie TensorRT bieten außergewöhnliche Geschwindigkeiten auf NVIDIA-GPUs, während OpenVINO für Intel-Hardware optimiert ist.
  • Kompatibilität: ONNX bietet eine breite Kompatibilität über verschiedene Plattformen hinweg.
  • Integrationsaufwand: Formate wie CoreML oder TF Lite sind maßgeschneidert für spezifische Ökosysteme wie iOS bzw. Android.
  • Community-Support: Formate wie PyTorch und TensorFlow verfügen über umfangreiche Community-Ressourcen und Support.

Für eine vergleichende Analyse siehe unsere Dokumentation zu Exportformaten.

Link to this sectionWie kann ich YOLO26-Modelle in einer Webanwendung bereitstellen?#

Um YOLO26-Modelle in einer Webanwendung bereitzustellen, kannst du TensorFlow.js (TF.js) verwenden, das es ermöglicht, Machine Learning-Modelle direkt im Browser auszuführen. Dieser Ansatz eliminiert die Notwendigkeit einer Backend-Infrastruktur und bietet Echtzeitleistung.

  1. Exportiere das YOLO26-Modell in das TF.js-Format.
  2. Integriere das exportierte Modell in deine Webanwendung.

Für Schritt-für-Schritt-Anleitungen siehe unseren Leitfaden zur TensorFlow.js-Integration.

Kommentare