Meet YOLO26: next-gen vision AI.

Link to this sectionSo definierst du Ziele für dein Computer-Vision-Projekt#

Um ein Computer-Vision-Projekt zu definieren, verfasse ein Problem-Statement, das das Kernproblem, den Umfang, die Stakeholder und die Einschränkungen benennt; setze messbare, zeitgebundene Ziele; und ordne das Problem der Computer-Vision-Aufgabe zu, die deine Modell-, Datensatz- und Bereitstellungsentscheidungen bestimmt. Dieser Leitfaden führt dich mit einem Praxisbeispiel durch jeden Schritt.



Watch: How to define Computer Vision Project's Goal | Problem Statement and VisionAI Tasks Connection 🚀

Einen Überblick über den gesamten Workflow von der Datensammlung bis zur Bereitstellung findest du in unserem Leitfaden zu den wichtigsten Schritten in einem Computer-Vision-Projekt.

Link to this sectionSo schreibst du ein Computer-Vision-Problem-Statement#

Ein klares Problem-Statement ist der erste wichtige Schritt zur Findung der effektivsten Lösung. Es besteht aus vier Teilen:

  • Identifiziere das Kernproblem: Bestimme die spezifische Herausforderung, die dein Computer-Vision-Projekt lösen soll.
  • Bestimme den Umfang: Definiere die Grenzen deines Problems.
  • Berücksichtige Endbenutzer und Stakeholder: Identifiziere, wer von der Lösung betroffen sein wird.
  • Analysiere Projektanforderungen und -beschränkungen: Bewerte die verfügbaren Ressourcen (Zeit, Budget, Personal) und identifiziere alle technischen oder regulatorischen Einschränkungen.

Link to this sectionBeispiel für eine geschäftliche Problemstellung#

Stell dir ein Computer-Vision-Projekt vor, bei dem du die Geschwindigkeit von Fahrzeugen schätzen möchtest, die auf einer Autobahn fahren. Das Kernproblem ist, dass aktuelle Methoden zur Geschwindigkeitsüberwachung aufgrund veralteter Radarsysteme und manueller Prozesse ineffizient und fehleranfällig sind. Das Projekt zielt darauf ab, ein Echtzeit-Computer-Vision-System zu entwickeln, das veraltete Geschwindigkeitsschätzung-Systeme ersetzen kann.

Vehicle speed estimation on a highway using Ultralytics YOLO

Zu den primären Benutzern gehören Verkehrsbehörden und Strafverfolgungsbehörden, während sekundäre Stakeholder Verkehrsplaner und die Öffentlichkeit sind, die von sichereren Straßen profitiert. Zu den wichtigsten Anforderungen gehören die Bewertung von Budget, Zeit und Personal sowie die Berücksichtigung technischer Bedürfnisse wie hochauflösende Kameras und Echtzeit-Datenverarbeitung. Darüber hinaus müssen regulatorische Einschränkungen hinsichtlich Datenschutz und Datensicherheit berücksichtigt werden.

Link to this sectionMessbare Ziele setzen#

Das Setzen messbarer Ziele ist der Schlüssel zum Erfolg eines Computer-Vision-Projekts. Effektive Ziele folgen den SMART-Kriterien:

KriteriumWas es bedeutet
SpezifischDefiniere klare und detaillierte Ziele.
MessbarStelle sicher, dass die Ziele quantifizierbar sind.
ErreichbarSetze realistische Ziele innerhalb deiner Möglichkeiten.
RelevantRichte die Ziele auf deine gesamten Projektziele aus.
ZeitgebundenSetze Fristen für jedes Ziel.

Für das Beispiel der Geschwindigkeitsmessung auf Autobahnen könnten SMART-Ziele wie folgt lauten:

  • Erreichung von mindestens 95 % Genauigkeit bei der Geschwindigkeitserkennung innerhalb von sechs Monaten, unter Verwendung eines Datensatzes von 10.000 Fahrzeugbildern.
  • Das System sollte in der Lage sein, Echtzeit-Video-Feeds mit 30 Bildern pro Sekunde und minimaler Verzögerung zu verarbeiten.

Durch das Setzen spezifischer und quantifizierbarer Ziele kannst du den Fortschritt effektiv verfolgen, Verbesserungsbereiche identifizieren und sicherstellen, dass das Projekt auf Kurs bleibt.

Link to this sectionSo wählst du die richtige Computer-Vision-Aufgabe#

Dein Problem-Statement hilft dir zu konzeptualisieren, welche Computer-Vision-Aufgabe dein Problem lösen kann. Zu den beliebtesten Aufgaben gehören Bildklassifizierung, Objekterkennung und Bildsegmentierung – siehe die Ultralytics Aufgaben-Seite für einen detaillierten Vergleich.

Comparison of image classification, object detection, and image segmentation outputs

Wenn dein Problem beispielsweise die Überwachung von Fahrzeuggeschwindigkeiten auf einer Autobahn ist, ist die relevante Aufgabe Objektverfolgung. Verfolgung ist geeignet, da sie jedes Fahrzeug über Videoframes hinweg mit einer persistenten ID verfolgt, was für die Geschwindigkeitsberechnung erforderlich ist.

YOLO object tracking of vehicles on a highway with persistent track IDs

Andere Aufgaben sind für sich allein weniger geeignet. Objekterkennung lokalisiert beispielsweise Fahrzeuge in jedem Frame, behält aber die Identität jedes Fahrzeugs nicht über Frames hinweg bei – und ohne diese Identität kann das System Bewegungen über die Zeit nicht messen. Sobald du die passende Computer-Vision-Aufgabe identifiziert hast, leitet sie mehrere kritische Aspekte deines Projekts, wie Modellauswahl, Datensatzvorbereitung und Ansätze für das Modelltraining.

Link to this sectionWas kommt zuerst: Modell, Daten oder Trainingsansatz?#

Die Reihenfolge von Modellauswahl, Datensatzvorbereitung und Trainingsansatz hängt von den Spezifika deines Projekts ab:

Deine SituationStarte mitBeispiel
Gut definiertes Problem und ZieleModellauswahlWähle für ein Verkehrsüberwachungssystem, das Fahrzeuggeschwindigkeiten schätzt, ein Objektverfolgungsmodell, sammle und annotiere Autobahnvideos und trainiere dann mit Techniken für die Echtzeit-Videoverarbeitung.
Einzigartige oder begrenzte DatenDatensatzvorbereitungAnnotiere bei einem Gesichtserkennungssystem mit kleinem Datensatz zuerst die Daten, wähle dann ein Modell, das gut mit begrenzten Daten funktioniert – wie ein vortrainiertes Modell für Transfer Learning – und plane Datenaugmentation, um den Datensatz zu erweitern.
Experimentieren ist entscheidend (Forschung)TrainingsansatzExperimentiere bei einem Projekt, das neue Methoden zur Erkennung von Fertigungsfehlern erforscht, zuerst mit einer kleinen Datenteilmenge. Sobald du eine vielversprechende Technik gefunden hast, wähle ein auf diese Ergebnisse zugeschnittenes Modell und bereite einen umfassenden Datensatz vor.

Wenn du mit Daten beginnst, vereinfacht die Ultralytics Platform die Organisation, Annotation und das Training von Datensätzen im Verlauf deines Projekts.

Link to this sectionWie Bereitstellungsoptionen dein Projekt beeinflussen#

Bereitstellungsoptionen für Modelle haben kritische Auswirkungen auf die Leistung deines Computer-Vision-Projekts, beziehe sie also von Anfang an mit ein. Die Bereitstellungsumgebung muss die Rechenlast deines Modells bewältigen können:

BereitstellungsoptionAm besten geeignet fürBeispieltechnologien
Edge-GeräteSmartphones und IoT-Geräte mit begrenzten Rechenressourcen; leichtgewichtige ModelleTensorFlow Lite, ONNX Runtime
Cloud-ServerKomplexe Modelle mit höherem Rechenbedarf; Hardware, die mit dem Projekt skaliertAWS, Google Cloud, Azure
On-Premise-ServerHohe Anforderungen an Datenschutz und Sicherheit; volle Kontrolle über Daten und InfrastrukturSelbstverwaltete GPU-Server
Hybride LösungenAbwägung von Leistung gegenüber Kosten und Latenz; Edge-Verarbeitung plus Cloud-AnalyseKombination von Edge-Runtimes und Cloud-Plattformen

Jede Option bietet unterschiedliche Vorteile und Herausforderungen, und die Wahl hängt von spezifischen Projektanforderungen wie Leistung, Kosten und Sicherheit ab.

Link to this sectionFazit#

Ein erfolgreiches Computer-Vision-Projekt beginnt mit einem klaren Problem-Statement, messbaren SMART-Zielen und der richtigen Computer-Vision-Aufgabe für die Arbeit – diese Entscheidungen leiten alles, was folgt, von der Modellauswahl bis zur Bereitstellung. Lerne als nächsten Schritt, wie man Daten sammelt und annotiert, oder diskutiere dein Projekt mit anderen Entwicklern auf GitHub und dem Ultralytics Discord-Server.

Link to this sectionFAQ#

Link to this sectionWie definiere ich ein klares Problem-Statement für mein Computer-Vision-Projekt?#

Ein klares Problem-Statement benennt das Kernproblem, das dein Projekt löst, seinen Umfang, die Endnutzer und Stakeholder sowie deine Ressourcen- und Regulierungsbeschränkungen. Arbeite diese vier Teile nacheinander durch und validiere die Aussage dann mit den Stakeholdern, bevor du technische Entscheidungen triffst. Siehe So schreibst du ein Computer-Vision-Problem-Statement für den vollständigen Ablauf und ein Praxisbeispiel.

Link to this sectionWie wähle ich die richtige Computer-Vision-Aufgabe für mein Problem?#

Passe den Output, den dein Problem benötigt, an die Aufgabe an, die ihn erzeugt: ein einzelnes Label pro Bild deutet auf Bildklassifizierung hin, Objektpositionen auf Objekterkennung, Pixelebene-Grenzen auf Bildsegmentierung und über Video-Frames hinweg beibehaltene Identitäten auf Objektverfolgung. Die Überwachung von Fahrzeuggeschwindigkeiten erfordert beispielsweise Verfolgung, da die Geschwindigkeit aus der Bewegung jedes Fahrzeugs über die Zeit berechnet wird. Siehe die Ultralytics Aufgaben-Seite für alle unterstützten Aufgaben.

Link to this sectionWie setze ich effektive messbare Ziele für mein Computer-Vision-Projekt?#

Verwende die SMART-Kriterien: Spezifisch, Messbar, Erreichbar, Relevant und Zeitgebunden. Zum Beispiel: „Erreiche 95 % Genauigkeit bei der Geschwindigkeitserkennung innerhalb von sechs Monaten unter Verwendung eines Datensatzes von 10.000 Fahrzeugbildern.“ Dieser Ansatz hilft, den Fortschritt zu verfolgen und Bereiche für Verbesserungen zu identifizieren. Lies mehr über das Setzen messbarer Ziele.

Link to this sectionKann ein vortrainiertes Modell Klassen behalten, die es vor dem benutzerdefinierten Training kannte?#

Nein, vortrainierte Modelle "erinnern" sich nicht im traditionellen Sinne an Klassen. Sie lernen Muster aus massiven Datensätzen, und während des benutzerdefinierten Trainings (Fine-Tuning) werden diese Muster für deine spezifische Aufgabe angepasst. Die Kapazität des Modells ist begrenzt, und die Konzentration auf neue Informationen kann einige frühere Erkenntnisse überschreiben.

Overview of transfer learning from a pretrained model to a custom model

Wenn du die Klassen verwenden möchtest, auf denen das Modell vortrainiert wurde, ist ein praktischer Ansatz die Verwendung von zwei Modellen: Eines behält die ursprüngliche Leistung bei, das andere wird für deine spezifische Aufgabe feinabgestimmt. Auf diese Weise kannst du die Ausgaben beider Modelle kombinieren. Es gibt andere Optionen wie das Einfrieren von Schichten, die Verwendung des vortrainierten Modells als Feature-Extraktor und aufgabenspezifische Verzweigungen, aber dies sind komplexere Lösungen und erfordern mehr Fachwissen.

Link to this sectionWie beeinflussen Bereitstellungsoptionen mein Computer-Vision-Projekt?#

Bereitstellungsoptionen bestimmen, welche Modellgrößen und Formate praktikabel sind, daher formen sie dein Projekt von Anfang an. Edge-Geräte benötigen leichtgewichtige Modelle, die über Formate und Runtimes wie TensorFlow Lite oder ONNX Runtime bereitgestellt werden, Cloud-Server verarbeiten komplexe Modelle auf skalierbarer Hardware, On-Premise-Server bieten volle Datenkontrolle für datenschutzsensitive Projekte und hybride Setups gleichen beide aus. Vergleiche sie in der Tabelle der Bereitstellungsoptionen oder siehe den Leitfaden zu Bereitstellungsoptionen für Modelle für Details.

Link to this sectionWas sind die häufigsten Herausforderungen bei der Definition eines Computer-Vision-Problems?#

Zu den häufigsten Herausforderungen gehören:

  • Vage oder zu breit gefasste Problemstellungen.
  • Unrealistische Ziele.
  • Mangelnde Abstimmung der Stakeholder.
  • Unzureichendes Verständnis technischer Einschränkungen.
  • Unterschätzung der Datenanforderungen.

Gehe diese Herausforderungen durch gründliche anfängliche Recherche, klare Kommunikation mit Stakeholdern und iterative Verfeinerung des Problem-Statements und der Ziele an. Für den vollständigen Projekt-Workflow siehe die wichtigsten Schritte in einem Computer-Vision-Projekt.

Kommentare