Zum Inhalt springen

Ein Leitfaden zur Modellprüfung

Einführung

Nachdem Sie Ihr Modell trainiert und evaluiert haben, ist es an der Zeit, es zu testen. Beim Testen eines Modells wird beurteilt, wie gut es sich in realen Szenarien bewährt. Beim Testen werden Faktoren wie Genauigkeit, Zuverlässigkeit, Fairness und Nachvollziehbarkeit der Entscheidungen des Modells berücksichtigt. Ziel ist es, sicherzustellen, dass das Modell wie beabsichtigt funktioniert, die erwarteten Ergebnisse liefert und zum Gesamtziel Ihrer Anwendung oder Ihres Projekts passt.



Beobachten: How to Test Machine Learning Models | Avoid Data Leakage in Computer Vision 🚀

Die Modellprüfung ist der Modellbewertung sehr ähnlich, aber es handelt sich um zwei unterschiedliche Schritte in einem Computer-Vision-Projekt. Bei der Modellevaluierung wird die Genauigkeit des Modells anhand von Metriken und Diagrammen bewertet. Beim Testen eines Modells wird hingegen überprüft, ob das gelernte Verhalten des Modells den Erwartungen entspricht. In diesem Leitfaden werden wir Strategien zum Testen Ihrer Computer-Vision-Modelle untersuchen.

Modellprüfung vs. Modellbewertung

Lassen Sie uns zunächst anhand eines Beispiels den Unterschied zwischen Modellbewertung und -prüfung verstehen.

Angenommen, Sie haben ein Computer-Vision-Modell zur Erkennung von Katzen und Hunden trainiert und möchten dieses Modell in einer Tierhandlung zur Überwachung der Tiere einsetzen. In der Phase der Modellevaluierung verwenden Sie einen beschrifteten Datensatz, um Kennzahlen wie Genauigkeit, Präzision, Wiedererkennung und F1-Score zu berechnen. Das Modell könnte beispielsweise eine Genauigkeit von 98 % bei der Unterscheidung zwischen Katzen und Hunden in einem bestimmten Datensatz haben.

Nach der Bewertung testen Sie das Modell anhand von Bildern aus einer Zoohandlung, um zu sehen, wie gut es Katzen und Hunde unter verschiedenen und realistischen Bedingungen identifiziert. Sie prüfen, ob das Modell Katzen und Hunde korrekt zuordnen kann, wenn sie sich bewegen, bei unterschiedlichen Lichtverhältnissen oder wenn sie teilweise durch Gegenstände wie Spielzeug oder Möbel verdeckt sind. Beim Modelltest wird geprüft, ob sich das Modell außerhalb der kontrollierten Evaluierungsumgebung wie erwartet verhält.

Vorbereitungen für Modellversuche

Computer-Vision-Modelle lernen aus Datensätzen, indem sie Muster erkennen, Vorhersagen treffen und ihre Leistung bewerten. Diese Datensätze werden in der Regel in Trainings- und Testdatensätze unterteilt, um reale Bedingungen zu simulieren. Anhand der Trainingsdaten lernt das Modell, während die Testdaten die Genauigkeit des Modells überprüfen.

Bevor Sie Ihr Modell testen, sollten Sie zwei Punkte beachten:

  • Realistische Darstellung: Die zuvor ungesehenen Testdaten sollten den Daten ähnlich sein, die das Modell bei seiner Einführung verarbeiten muss. Dies trägt dazu bei, ein realistisches Bild von den Fähigkeiten des Modells zu erhalten.
  • Ausreichende Größe: Der Testdatensatz muss groß genug sein, um zuverlässige Erkenntnisse über die Leistung des Modells zu liefern.

Testen Ihres Computer Vision Modells

Im Folgenden finden Sie die wichtigsten Schritte zum Testen Ihres Bildverarbeitungsmodells und zum Verständnis seiner Leistung.

  • Vorhersagen ausführen: Verwenden Sie das Modell, um Vorhersagen für den Testdatensatz zu treffen.
  • Vorhersagen vergleichen: Prüfen Sie, wie gut die Vorhersagen des Modells mit den tatsächlichen Beschriftungen übereinstimmen (Ground Truth).
  • Berechnen Sie Leistungsmetriken: Berechnen Sie Metriken wie Genauigkeit, Präzision, Recall und F1-Score, um die Stärken und Schwächen des Modells zu verstehen. Bei den Tests geht es darum, wie diese Metriken die Leistung in der Praxis widerspiegeln.
  • Ergebnisse visualisieren: Erstellen Sie visuelle Hilfsmittel wie Konfusionsmatrizen und ROC-Kurven. Diese helfen Ihnen, bestimmte Bereiche zu erkennen, in denen das Modell in der Praxis möglicherweise nicht gut funktioniert.

Anschließend können die Testergebnisse ausgewertet werden:

  • Falsch klassifizierte Bilder: Identifizieren und überprüfen Sie Bilder, die das Modell falsch klassifiziert hat, um zu verstehen, wo der Fehler liegt.
  • Fehleranalyse: Führen Sie eine gründliche Fehleranalyse durch, um die Arten von Fehlern (z. B. falsch-positive vs. falsch-negative) und ihre möglichen Ursachen zu verstehen.
  • Verzerrungen und Fairness: Prüfen Sie, ob die Vorhersagen des Modells verzerrt sind. Vergewissern Sie sich, dass das Modell in verschiedenen Teilmengen der Daten gleich gut funktioniert, insbesondere wenn es sensible Attribute wie Ethnie, Geschlecht oder Alter enthält.

Testen Sie Ihr YOLO11 Modell

Um Ihr YOLO11 Modell zu testen, können Sie den Validierungsmodus verwenden. Dies ist ein einfacher Weg, um die Stärken des Modells und die Bereiche, die verbessert werden müssen, zu verstehen. Außerdem müssen Sie Ihren Testdatensatz für YOLO11 richtig formatieren. Weitere Einzelheiten zur Verwendung des Validierungsmodus finden Sie auf der Seite Modellvalidierung.

Verwendung von YOLO11 zur Vorhersage auf mehreren Testbildern

Wenn Sie Ihr trainiertes YOLO11 Modell an mehreren in einem Ordner gespeicherten Bildern testen möchten, können Sie dies ganz einfach in einem Durchgang tun. Anstatt den Validierungsmodus zu verwenden, der in der Regel dazu dient, die Leistung des Modells auf einem Validierungssatz zu bewerten und detaillierte Metriken bereitzustellen, möchten Sie vielleicht nur die Vorhersagen für alle Bilder in Ihrem Testsatz sehen. Hierfür können Sie den Vorhersagemodus verwenden.

Unterschied zwischen Validierungs- und Prognosemodus

  • Validierungsmodus: Wird verwendet, um die Leistung des Modells zu bewerten, indem Vorhersagen mit bekannten Kennzeichnungen (Ground Truth) verglichen werden. Er liefert detaillierte Metriken wie Genauigkeit, Präzision, Wiedererkennung und F1-Score.
  • Vorhersage-Modus: Wird verwendet, um das Modell auf neue, ungesehene Daten anzuwenden und Vorhersagen zu erstellen. Er liefert keine detaillierten Leistungskennzahlen, sondern ermöglicht es Ihnen zu sehen, wie das Modell bei realen Bildern abschneidet.

YOLO11 Vorhersagen ohne benutzerdefiniertes Training ausführen

Wenn Sie das Basismodell von YOLO11 testen möchten, um herauszufinden, ob es für Ihre Anwendung ohne eigenes Training verwendet werden kann, können Sie den Vorhersagemodus verwenden. Das Modell ist zwar auf Datensätzen wie COCO vortrainiert, aber wenn Sie die Vorhersagen auf Ihrem eigenen Datensatz ausführen, erhalten Sie einen schnellen Eindruck davon, wie gut es in Ihrem spezifischen Kontext funktionieren könnte.

Überanpassung und Unteranpassung beim maschinellen Lernen

Beim Testen eines Modells für maschinelles Lernen, insbesondere im Bereich der Computer Vision, ist es wichtig, auf Überanpassung und Unteranpassung zu achten. Diese Probleme können sich erheblich darauf auswirken, wie gut Ihr Modell mit neuen Daten funktioniert.

Überanpassung

Überanpassung liegt vor, wenn Ihr Modell die Trainingsdaten zu gut lernt, einschließlich des Rauschens und der Details, die sich nicht auf neue Daten verallgemeinern lassen. In der Computer Vision bedeutet dies, dass Ihr Modell mit Trainingsbildern gut zurechtkommt, aber mit neuen Bildern Schwierigkeiten hat.

Anzeichen für Überanpassung

  • Hohe Trainingsgenauigkeit, niedrige Validierungsgenauigkeit: Wenn Ihr Modell bei den Trainingsdaten sehr gut, bei den Validierungs- oder Testdaten jedoch schlecht abschneidet, liegt wahrscheinlich ein Overfitting vor.
  • Visuelle Inspektion: Manchmal können Sie eine Überanpassung feststellen, wenn Ihr Modell zu empfindlich auf kleine Änderungen oder irrelevante Details in Bildern reagiert.

Underfitting

Eine unzureichende Anpassung liegt vor, wenn Ihr Modell die zugrunde liegenden Muster in den Daten nicht erfassen kann. Beim Computer Vision erkennt ein unzureichend angepasstes Modell möglicherweise nicht einmal Objekte in den Trainingsbildern richtig.

Anzeichen einer Unterversorgung

  • Geringe Trainingsgenauigkeit: Wenn Ihr Modell in der Trainingsmenge keine hohe Genauigkeit erreichen kann, ist es möglicherweise unzureichend angepasst.
  • Visual Mis-classification: Consistent failure to recognize obvious features or objects suggests underfitting.

Ausgleich zwischen Überanpassung und Unteranpassung

Der Schlüssel liegt darin, ein Gleichgewicht zwischen Overfitting und Underfitting zu finden. Im Idealfall sollte ein Modell sowohl in den Trainings- als auch in den Validierungsdatensätzen gut abschneiden. Die regelmäßige Überwachung der Leistung Ihres Modells durch Metriken und visuelle Inspektionen sowie die Anwendung der richtigen Strategien können Ihnen helfen, die besten Ergebnisse zu erzielen.

Überblick über Overfitting und Underfitting

Datenlecks in der Computer Vision und wie man sie vermeidet

Beim Testen Ihres Modells ist es wichtig, ein Datenleck zu vermeiden. Ein Datenleck entsteht, wenn Informationen von außerhalb des Trainingsdatensatzes versehentlich zum Trainieren des Modells verwendet werden. Das Modell kann während des Trainings sehr genau erscheinen, aber es wird bei neuen, ungesehenen Daten nicht gut abschneiden, wenn Datenlecks auftreten.

Warum es zu Datenlecks kommt

Datenlecks können schwer zu erkennen sein und sind oft auf versteckte Verzerrungen in den Trainingsdaten zurückzuführen. Hier sind einige gängige Möglichkeiten, wie dies in der Computer Vision geschehen kann:

  • Kameraschwankungen: Unterschiedliche Winkel, Beleuchtung, Schatten und Kamerabewegungen können unerwünschte Muster erzeugen.
  • Overlay Bias: Logos, Zeitstempel oder andere Überlagerungen in Bildern können das Modell in die Irre führen.
  • Verzerrung von Schriftarten und Objekten: Bestimmte Schriftarten oder Objekte, die häufig in bestimmten Klassen vorkommen, können die Lernfähigkeit des Modells beeinträchtigen.
  • Räumliche Verzerrung: Ungleichgewichte bei der Verteilung von Vorder- und Hintergrund, Bounding Box und Objektpositionen können das Training beeinträchtigen.
  • Label- und Domain Bias: Falsche Labels oder Verschiebungen von Datentypen können zu Lecks führen.

Erkennen von Datenlecks

Um Datenlecks zu finden, können Sie:

  • Leistung prüfen: Wenn die Ergebnisse des Modells überraschend gut sind, könnte es undicht sein.
  • Achten Sie auf die Wichtigkeit der Merkmale: Wenn ein Merkmal viel wichtiger ist als andere, könnte dies auf eine undichte Stelle hinweisen.
  • Visuelle Inspektion: Überprüfen Sie, ob die Entscheidungen des Modells intuitiv sinnvoll sind.
  • Überprüfen Sie die Datentrennung: Vergewissern Sie sich, dass die Daten vor der Verarbeitung korrekt aufgeteilt wurden.

Vermeiden von Datenlecks

Um Datenlecks zu vermeiden, verwenden Sie einen vielfältigen Datensatz mit Bildern oder Videos von verschiedenen Kameras und Umgebungen. Prüfen Sie Ihre Daten sorgfältig und stellen Sie sicher, dass es keine versteckten Verzerrungen gibt, z. B. dass alle positiven Proben zu einer bestimmten Tageszeit aufgenommen wurden. Die Vermeidung von Datenlecks trägt dazu bei, dass Ihre Computer-Vision-Modelle in realen Situationen zuverlässiger und effektiver sind.

Was kommt nach der Modellprüfung?

Nach dem Testen Ihres Modells hängen die nächsten Schritte von den Ergebnissen ab. Wenn Ihr Modell gut abschneidet, können Sie es in einer realen Umgebung einsetzen. Wenn die Ergebnisse nicht zufriedenstellend sind, müssen Sie Verbesserungen vornehmen. Dies kann die Analyse von Fehlern, das Sammeln weiterer Daten, die Verbesserung der Datenqualität, die Anpassung von Hyperparametern und ein erneutes Training des Modells beinhalten.

Beteiligen Sie sich an der AI-Konversation

Die Zugehörigkeit zu einer Gemeinschaft von Computer-Vision-Enthusiasten kann dabei helfen, Probleme zu lösen und effizienter zu lernen. Hier finden Sie einige Möglichkeiten, Kontakte zu knüpfen, Hilfe zu suchen und Ihre Gedanken auszutauschen.

Ressourcen der Gemeinschaft

  • GitHub-Fragen: Erkunden Sie das YOLO11 GitHub-Repository und nutzen Sie die Registerkarte "Issues", um Fragen zu stellen, Fehler zu melden und neue Funktionen vorzuschlagen. Die Community und die Betreuer sind sehr aktiv und bereit zu helfen.
  • Ultralytics Discord-Server: Treten Sie dem Ultralytics Discord-Server bei, um mit anderen Benutzern und Entwicklern zu chatten, Unterstützung zu erhalten und Ihre Erfahrungen auszutauschen.

Offizielle Dokumentation

  • Ultralytics YOLO11 Dokumentation: In der offiziellen Dokumentation YOLO11 finden Sie detaillierte Anleitungen und hilfreiche Tipps zu verschiedenen Computer Vision Projekten.

Diese Ressourcen helfen Ihnen bei der Bewältigung von Herausforderungen und halten Sie auf dem Laufenden über die neuesten Trends und Praktiken in der Computer Vision Community.

Zusammenfassung

Der Aufbau vertrauenswürdiger Computer-Vision-Modelle beruht auf rigorosen Modelltests. Durch das Testen des Modells mit zuvor ungesehenen Daten können wir es analysieren und Schwachstellen wie Überanpassung und Datenlecks aufdecken. Die Behebung dieser Probleme vor dem Einsatz trägt dazu bei, dass das Modell in realen Anwendungen gut funktioniert. Es ist wichtig, daran zu denken, dass das Testen von Modellen genauso wichtig ist wie die Modellevaluierung, um den langfristigen Erfolg und die Effektivität des Modells zu gewährleisten.

FAQ

Was sind die Hauptunterschiede zwischen Modellevaluation und Modelltest in der Computer Vision?

Modellevaluierung und Modelltests sind unterschiedliche Schritte in einem Computer-Vision-Projekt. Die Modellevaluierung umfasst die Verwendung eines markierten Datensatzes zur Berechnung von Kennzahlen wie Genauigkeit, Präzision, Wiedererkennungswert und F1-Score, die Aufschluss über die Leistung des Modells mit einem kontrollierten Datensatz geben. Beim Testen des Modells hingegen wird die Leistung des Modells in realen Szenarien bewertet, indem es auf neue, ungesehene Daten angewendet wird, um sicherzustellen, dass das gelernte Verhalten des Modells mit den Erwartungen außerhalb der Bewertungsumgebung übereinstimmt. Eine ausführliche Anleitung finden Sie unter Schritte in einem Computer-Vision-Projekt.

Wie kann ich mein Modell Ultralytics YOLO11 an mehreren Bildern testen?

Um Ihr Ultralytics YOLO11 Modell an mehreren Bildern zu testen, können Sie den Vorhersagemodus verwenden. In diesem Modus können Sie das Modell auf neue, ungesehene Daten anwenden, um Vorhersagen zu generieren, ohne detaillierte Metriken bereitzustellen. Dies ist ideal für reale Leistungstests an größeren Bildsätzen, die in einem Ordner gespeichert sind. Für die Auswertung von Leistungskennzahlen sollten Sie stattdessen den Validierungsmodus verwenden.

Was sollte ich tun, wenn mein Computer-Vision-Modell Anzeichen von Über- oder Unteranpassung aufweist?

Um Überanpassung zu vermeiden:

  • Regularisierungstechniken wie Dropout.
  • Erhöhen Sie die Größe des Trainingsdatensatzes.
  • Vereinfachen Sie die Modellarchitektur.

Bekämpfung der Unteranpassung:

  • Verwenden Sie ein komplexeres Modell.
  • Bieten Sie mehr relevante Funktionen.
  • Erhöhen Sie die Trainingsiterationen oder Epochen.

Überprüfen Sie falsch klassifizierte Bilder, führen Sie eine gründliche Fehleranalyse durch und verfolgen Sie regelmäßig Leistungskennzahlen, um ein Gleichgewicht zu wahren. Weitere Informationen zu diesen Konzepten finden Sie in unserem Abschnitt über Overfitting und Underfitting.

Wie kann ich Datenlecks in der Computer Vision erkennen und vermeiden?

Aufspüren von Datenlecks:

  • Überprüfen Sie, ob die Testleistung nicht ungewöhnlich hoch ist.
  • Prüfen Sie die Bedeutung von Merkmalen für unerwartete Erkenntnisse.
  • Intuitive Überprüfung von Modellentscheidungen.
  • Achten Sie vor der Verarbeitung auf eine korrekte Datenteilung.

Um Datenverluste zu vermeiden:

  • Verwenden Sie verschiedene Datensätze mit unterschiedlichen Umgebungen.
  • Prüfen Sie die Daten sorgfältig auf versteckte Verzerrungen.
  • Stellen Sie sicher, dass sich keine Informationen zwischen Trainings- und Testsätzen überschneiden.

Detaillierte Strategien zur Vermeidung von Datenlecks finden Sie in unserem Abschnitt über Datenlecks in der Computer Vision.

Welche Schritte sollte ich nach dem Testen meines Computer-Vision-Modells unternehmen?

Wenn die Leistung des Modells nach dem Test den Projektzielen entspricht, können Sie mit der Einführung fortfahren. Wenn die Ergebnisse nicht zufriedenstellend sind, sollten Sie überlegen:

Gewinnen Sie Erkenntnisse aus dem Abschnitt Modellprüfung vs. Modellbewertung. Modellbewertung zur Verfeinerung und Verbesserung der Modelleffizienz in realen Anwendungen.

Wie führe ich YOLO11 Vorhersagen ohne benutzerdefiniertes Training durch?

Sie können Vorhersagen mit dem vortrainierten YOLO11 Modell auf Ihrem Datensatz durchführen, um zu sehen, ob es Ihren Anwendungsanforderungen entspricht. Nutzen Sie den Prognosemodus, um einen schnellen Eindruck von den Leistungsergebnissen zu erhalten, ohne dass Sie ein eigenes Training durchführen müssen.

📅 Created 6 months ago ✏️ Updated 11 days ago

Kommentare