Modellvorhersage mit Ultralytics YOLO
Einführung
Im Bereich des maschinellen Lernens und der Computer Vision wird der Prozess des Verstehens visueller Daten als 'Inferenz' oder 'Vorhersage' bezeichnet. Ultralytics YOLOv8 bietet eine leistungsstarke Funktion, die als Prognosemodus bekannt ist und für eine hochleistungsfähige, echtzeitfähige Inferenz auf einer breiten Palette von Datenquellen zugeschnitten ist.
Anschauen: Wie man die Ausgaben vom Ultralytics YOLOv8 Modell für individuelle Projekte extrahiert.
Anwendungen in der realen Welt
Herstellung | Sport | Sicherheit |
---|---|---|
Erkennung von Fahrzeugersatzteilen | Erkennung von Fußballspielern | Erkennung von stürzenden Personen |
Warum Ultralytics YOLO für Inferenz nutzen?
Hier sind Gründe, warum Sie den Prognosemodus von YOLOv8 für Ihre verschiedenen Inferenzanforderungen in Betracht ziehen sollten:
- Vielseitigkeit: Fähig, Inferenzen auf Bilder, Videos und sogar Live-Streams zu machen.
- Leistung: Entwickelt für Echtzeit-Hochgeschwindigkeitsverarbeitung ohne Genauigkeitsverlust.
- Einfache Bedienung: Intuitive Python- und CLI-Schnittstellen für schnelle Einsatzbereitschaft und Tests.
- Hohe Anpassbarkeit: Verschiedene Einstellungen und Parameter, um das Verhalten der Modellinferenz entsprechend Ihren spezifischen Anforderungen zu optimieren.
Schlüsselfunktionen des Prognosemodus
Der Prognosemodus von YOLOv8 ist robust und vielseitig konzipiert und verfügt über:
- Kompatibilität mit mehreren Datenquellen: Ganz gleich, ob Ihre Daten in Form von Einzelbildern, einer Bildersammlung, Videodateien oder Echtzeit-Videostreams vorliegen, der Prognosemodus deckt alles ab.
- Streaming-Modus: Nutzen Sie die Streaming-Funktion, um einen speichereffizienten Generator von
Results
-Objekten zu erzeugen. Aktivieren Sie dies, indem Siestream=True
in der Aufrufmethode des Predictors einstellen. - Batchverarbeitung: Die Möglichkeit, mehrere Bilder oder Videoframes in einem einzigen Batch zu verarbeiten, wodurch die Inferenzzeit weiter verkürzt wird.
- Integrationsfreundlich: Dank der flexiblen API leicht in bestehende Datenpipelines und andere Softwarekomponenten zu integrieren.
Ultralytics YOLO-Modelle geben entweder eine Python-Liste von Results
-Objekten zurück, oder einen speichereffizienten Python-Generator von Results
-Objekten, wenn stream=True
beim Inferenzvorgang an das Modell übergeben wird:
Predict
from ultralytics import YOLO
# Ein Modell laden
model = YOLO('yolov8n.pt') # vortrainiertes YOLOv8n Modell
# Batch-Inferenz auf einer Liste von Bildern ausführen
results = model(['im1.jpg', 'im2.jpg']) # gibt eine Liste von Results-Objekten zurück
# Ergebnisliste verarbeiten
for result in results:
boxes = result.boxes # Boxes-Objekt für Bbox-Ausgaben
masks = result.masks # Masks-Objekt für Segmentierungsmasken-Ausgaben
keypoints = result.keypoints # Keypoints-Objekt für Pose-Ausgaben
probs = result.probs # Probs-Objekt für Klassifizierungs-Ausgaben
from ultralytics import YOLO
# Ein Modell laden
model = YOLO('yolov8n.pt') # vortrainiertes YOLOv8n Modell
# Batch-Inferenz auf einer Liste von Bildern ausführen
results = model(['im1.jpg', 'im2.jpg'], stream=True) # gibt einen Generator von Results-Objekten zurück
# Generator von Ergebnissen verarbeiten
for result in results:
boxes = result.boxes # Boxes-Objekt für Bbox-Ausgaben
masks = result.masks # Masks-Objekt für Segmentierungsmasken-Ausgaben
keypoints = result.keypoints # Keypoints-Objekt für Pose-Ausgaben
probs = result.probs # Probs-Objekt für Klassifizierungs-Ausgaben
Inferenzquellen
YOLOv8 kann verschiedene Arten von Eingabequellen für die Inferenz verarbeiten, wie in der folgenden Tabelle gezeigt. Die Quellen umfassen statische Bilder, Videostreams und verschiedene Datenformate. Die Tabelle gibt ebenfalls an, ob jede Quelle im Streaming-Modus mit dem Argument stream=True
✅ verwendet werden kann. Der Streaming-Modus ist vorteilhaft für die Verarbeitung von Videos oder Live-Streams, da er einen Generator von Ergebnissen statt das Laden aller Frames in den Speicher erzeugt.
Tipp
Verwenden Sie stream=True
für die Verarbeitung langer Videos oder großer Datensätze, um den Speicher effizient zu verwalten. Bei stream=False
werden die Ergebnisse für alle Frames oder Datenpunkte im Speicher gehalten, was bei großen Eingaben schnell zu Speicherüberläufen führen kann. Im Gegensatz dazu verwendet stream=True
einen Generator, der nur die Ergebnisse des aktuellen Frames oder Datenpunkts im Speicher behält, was den Speicherverbrauch erheblich reduziert und Speicherüberlaufprobleme verhindert.
Quelle | Argument | Typ | Hinweise |
---|---|---|---|
Bild | 'image.jpg' |
str oder Path |
Einzelbilddatei. |
URL | 'https://ultralytics.com/images/bus.jpg' |
str |
URL zu einem Bild. |
Bildschirmaufnahme | 'screen' |
str |
Eine Bildschirmaufnahme erstellen. |
PIL | Image.open('im.jpg') |
PIL.Image |
HWC-Format mit RGB-Kanälen. |
OpenCV | cv2.imread('im.jpg') |
np.ndarray |
HWC-Format mit BGR-Kanälen uint8 (0-255) . |
numpy | np.zeros((640,1280,3)) |
np.ndarray |
HWC-Format mit BGR-Kanälen uint8 (0-255) . |
torch | torch.zeros(16,3,320,640) |
torch.Tensor |
BCHW-Format mit RGB-Kanälen float32 (0.0-1.0) . |
CSV | 'sources.csv' |
str oder Path |
CSV-Datei mit Pfaden zu Bildern, Videos oder Verzeichnissen. |
video ✅ | 'video.mp4' |
str oder Path |
Videodatei in Formaten wie MP4, AVI, usw. |
Verzeichnis ✅ | 'path/' |
str oder Path |
Pfad zu einem Verzeichnis mit Bildern oder Videos. |
glob ✅ | 'path/*.jpg' |
str |
Glob-Muster, um mehrere Dateien zu finden. Verwenden Sie das * Zeichen als Platzhalter. |
YouTube ✅ | 'https://youtu.be/LNwODJXcvt4' |
str |
URL zu einem YouTube-Video. |
stream ✅ | 'rtsp://example.com/media.mp4' |
str |
URL für Streaming-Protokolle wie RTSP, RTMP, TCP oder eine IP-Adresse. |
Multi-Stream ✅ | 'list.streams' |
str oder Path |
*.streams Textdatei mit einer Stream-URL pro Zeile, z.B. 8 Streams laufen bei Batch-Größe 8. |
Untenstehend finden Sie Codebeispiele für die Verwendung jedes Quelltyps:
Vorhersagequellen
Führen Sie die Inferenz auf einer Bilddatei aus.
Führen Sie die Inferenz auf dem aktuellen Bildschirminhalt als Screenshot aus.
Führen Sie die Inferenz auf einem Bild oder Video aus, das über eine URL remote gehostet wird.
Führen Sie die Inferenz auf einem Bild aus, das mit der Python Imaging Library (PIL) geöffnet wurde.
Führen Sie die Inferenz auf einem Bild aus, das mit OpenCV gelesen wurde.
Führen Sie die Inferenz auf einem Bild aus, das als numpy-Array dargestellt wird.
import numpy as np
from ultralytics import YOLO
# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')
# Ein zufälliges numpy-Array der HWC-Form (640, 640, 3) mit Werten im Bereich [0, 255] und Typ uint8 erstellen
quell = np.random.randint(low=0, high=255, size=(640, 640, 3), dtype='uint8')
# Inferenz auf der Quelle ausführen
ergebnisse = model(quell) # Liste von Results-Objekten
Führen Sie die Inferenz auf einem Bild aus, das als PyTorch-Tensor dargestellt wird. ```python import torch from ultralytics import YOLO
Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')
Ein zufälliger torch-Tensor der BCHW-Form (1, 3, 640, 640) mit Werten im Bereich [0, 1] und Typ float32 erstellen
quell = torch.rand(1, 3, 640, 640, dtype=torch.float32)
Inferenz auf der Quelle ausführen
ergebnisse = model(quell) # Liste von Results-Objekten