Zum Inhalt

Modellvorhersage mit Ultralytics YOLO

Ultralytics YOLO Ökosystem und Integrationen

Einführung

Im Bereich des maschinellen Lernens und der Computer Vision wird der Prozess des Verstehens visueller Daten als 'Inferenz' oder 'Vorhersage' bezeichnet. Ultralytics YOLOv8 bietet eine leistungsstarke Funktion, die als Prognosemodus bekannt ist und für eine hochleistungsfähige, echtzeitfähige Inferenz auf einer breiten Palette von Datenquellen zugeschnitten ist.



Anschauen: Wie man die Ausgaben vom Ultralytics YOLOv8 Modell für individuelle Projekte extrahiert.

Anwendungen in der realen Welt

Herstellung Sport Sicherheit
Ersatzteilerkennung für Fahrzeuge Erkennung von Fußballspielern Erkennung von stürzenden Personen
Erkennung von Fahrzeugersatzteilen Erkennung von Fußballspielern Erkennung von stürzenden Personen

Warum Ultralytics YOLO für Inferenz nutzen?

Hier sind Gründe, warum Sie den Prognosemodus von YOLOv8 für Ihre verschiedenen Inferenzanforderungen in Betracht ziehen sollten:

  • Vielseitigkeit: Fähig, Inferenzen auf Bilder, Videos und sogar Live-Streams zu machen.
  • Leistung: Entwickelt für Echtzeit-Hochgeschwindigkeitsverarbeitung ohne Genauigkeitsverlust.
  • Einfache Bedienung: Intuitive Python- und CLI-Schnittstellen für schnelle Einsatzbereitschaft und Tests.
  • Hohe Anpassbarkeit: Verschiedene Einstellungen und Parameter, um das Verhalten der Modellinferenz entsprechend Ihren spezifischen Anforderungen zu optimieren.

Schlüsselfunktionen des Prognosemodus

Der Prognosemodus von YOLOv8 ist robust und vielseitig konzipiert und verfügt über:

  • Kompatibilität mit mehreren Datenquellen: Ganz gleich, ob Ihre Daten in Form von Einzelbildern, einer Bildersammlung, Videodateien oder Echtzeit-Videostreams vorliegen, der Prognosemodus deckt alles ab.
  • Streaming-Modus: Nutzen Sie die Streaming-Funktion, um einen speichereffizienten Generator von Results-Objekten zu erzeugen. Aktivieren Sie dies, indem Sie stream=True in der Aufrufmethode des Predictors einstellen.
  • Batchverarbeitung: Die Möglichkeit, mehrere Bilder oder Videoframes in einem einzigen Batch zu verarbeiten, wodurch die Inferenzzeit weiter verkürzt wird.
  • Integrationsfreundlich: Dank der flexiblen API leicht in bestehende Datenpipelines und andere Softwarekomponenten zu integrieren.

Ultralytics YOLO-Modelle geben entweder eine Python-Liste von Results-Objekten zurück, oder einen speichereffizienten Python-Generator von Results-Objekten, wenn stream=True beim Inferenzvorgang an das Modell übergeben wird:

Predict

from ultralytics import YOLO

# Ein Modell laden
model = YOLO('yolov8n.pt')  # vortrainiertes YOLOv8n Modell

# Batch-Inferenz auf einer Liste von Bildern ausführen
results = model(['im1.jpg', 'im2.jpg'])  # gibt eine Liste von Results-Objekten zurück

# Ergebnisliste verarbeiten
for result in results:
    boxes = result.boxes  # Boxes-Objekt für Bbox-Ausgaben
    masks = result.masks  # Masks-Objekt für Segmentierungsmasken-Ausgaben
    keypoints = result.keypoints  # Keypoints-Objekt für Pose-Ausgaben
    probs = result.probs  # Probs-Objekt für Klassifizierungs-Ausgaben
from ultralytics import YOLO

# Ein Modell laden
model = YOLO('yolov8n.pt')  # vortrainiertes YOLOv8n Modell

# Batch-Inferenz auf einer Liste von Bildern ausführen
results = model(['im1.jpg', 'im2.jpg'], stream=True)  # gibt einen Generator von Results-Objekten zurück

# Generator von Ergebnissen verarbeiten
for result in results:
    boxes = result.boxes  # Boxes-Objekt für Bbox-Ausgaben
    masks = result.masks  # Masks-Objekt für Segmentierungsmasken-Ausgaben
    keypoints = result.keypoints  # Keypoints-Objekt für Pose-Ausgaben
    probs = result.probs  # Probs-Objekt für Klassifizierungs-Ausgaben

Inferenzquellen

YOLOv8 kann verschiedene Arten von Eingabequellen für die Inferenz verarbeiten, wie in der folgenden Tabelle gezeigt. Die Quellen umfassen statische Bilder, Videostreams und verschiedene Datenformate. Die Tabelle gibt ebenfalls an, ob jede Quelle im Streaming-Modus mit dem Argument stream=True ✅ verwendet werden kann. Der Streaming-Modus ist vorteilhaft für die Verarbeitung von Videos oder Live-Streams, da er einen Generator von Ergebnissen statt das Laden aller Frames in den Speicher erzeugt.

Tipp

Verwenden Sie stream=True für die Verarbeitung langer Videos oder großer Datensätze, um den Speicher effizient zu verwalten. Bei stream=False werden die Ergebnisse für alle Frames oder Datenpunkte im Speicher gehalten, was bei großen Eingaben schnell zu Speicherüberläufen führen kann. Im Gegensatz dazu verwendet stream=True einen Generator, der nur die Ergebnisse des aktuellen Frames oder Datenpunkts im Speicher behält, was den Speicherverbrauch erheblich reduziert und Speicherüberlaufprobleme verhindert.

Quelle Argument Typ Hinweise
Bild 'image.jpg' str oder Path Einzelbilddatei.
URL 'https://ultralytics.com/images/bus.jpg' str URL zu einem Bild.
Bildschirmaufnahme 'screen' str Eine Bildschirmaufnahme erstellen.
PIL Image.open('im.jpg') PIL.Image HWC-Format mit RGB-Kanälen.
OpenCV cv2.imread('im.jpg') np.ndarray HWC-Format mit BGR-Kanälen uint8 (0-255).
numpy np.zeros((640,1280,3)) np.ndarray HWC-Format mit BGR-Kanälen uint8 (0-255).
torch torch.zeros(16,3,320,640) torch.Tensor BCHW-Format mit RGB-Kanälen float32 (0.0-1.0).
CSV 'sources.csv' str oder Path CSV-Datei mit Pfaden zu Bildern, Videos oder Verzeichnissen.
video ✅ 'video.mp4' str oder Path Videodatei in Formaten wie MP4, AVI, usw.
Verzeichnis ✅ 'path/' str oder Path Pfad zu einem Verzeichnis mit Bildern oder Videos.
glob ✅ 'path/*.jpg' str Glob-Muster, um mehrere Dateien zu finden. Verwenden Sie das * Zeichen als Platzhalter.
YouTube ✅ 'https://youtu.be/LNwODJXcvt4' str URL zu einem YouTube-Video.
stream ✅ 'rtsp://example.com/media.mp4' str URL für Streaming-Protokolle wie RTSP, RTMP, TCP oder eine IP-Adresse.
Multi-Stream ✅ 'list.streams' str oder Path *.streams Textdatei mit einer Stream-URL pro Zeile, z.B. 8 Streams laufen bei Batch-Größe 8.

Untenstehend finden Sie Codebeispiele für die Verwendung jedes Quelltyps:

Vorhersagequellen

Führen Sie die Inferenz auf einer Bilddatei aus.

from ultralytics import YOLO

# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')

# Pfad zur Bilddatei definieren
quell = 'Pfad/zum/Bild.jpg'

# Inferenz auf der Quelle ausführen
ergebnisse = model(quell)  # Liste von Results-Objekten

Führen Sie die Inferenz auf dem aktuellen Bildschirminhalt als Screenshot aus.

from ultralytics import YOLO

# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')

# Aktuellen Screenshot als Quelle definieren
quell = 'Bildschirm'

# Inferenz auf der Quelle ausführen
ergebnisse = model(quell)  # Liste von Results-Objekten

Führen Sie die Inferenz auf einem Bild oder Video aus, das über eine URL remote gehostet wird.

from ultralytics import YOLO

# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')

# Remote-Bild- oder Video-URL definieren
quell = 'https://ultralytics.com/images/bus.jpg'

# Inferenz auf der Quelle ausführen
ergebnisse = model(quell)  # Liste von Results-Objekten

Führen Sie die Inferenz auf einem Bild aus, das mit der Python Imaging Library (PIL) geöffnet wurde.

from PIL import Image
from ultralytics import YOLO

# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')

# Ein Bild mit PIL öffnen
quell = Image.open('Pfad/zum/Bild.jpg')

# Inferenz auf der Quelle ausführen
ergebnisse = model(quell)  # Liste von Results-Objekten

Führen Sie die Inferenz auf einem Bild aus, das mit OpenCV gelesen wurde.

import cv2
from ultralytics import YOLO

# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')

# Ein Bild mit OpenCV lesen
quell = cv2.imread('Pfad/zum/Bild.jpg')

# Inferenz auf der Quelle ausführen
ergebnisse = model(quell)  # Liste von Results-Objekten

Führen Sie die Inferenz auf einem Bild aus, das als numpy-Array dargestellt wird.

import numpy as np
from ultralytics import YOLO

# Ein vortrainiertes YOLOv8n Modell laden
model = YOLO('yolov8n.pt')

# Ein zufälliges numpy-Array der HWC-Form (640, 640, 3) mit Werten im Bereich [0, 255] und Typ uint8 erstellen
quell = np.random.randint(low=0, high=255, size=(640, 640, 3), dtype='uint8')

# Inferenz auf der Quelle ausführen
ergebnisse = model(quell)  # Liste von Results-Objekten

Führen Sie die Inferenz auf einem Bild aus, das als PyTorch-Tensor dargestellt wird. ```python import torch from ultralytics import YOLO

Ein vortrainiertes YOLOv8n Modell laden

model = YOLO('yolov8n.pt')

Ein zufälliger torch-Tensor der BCHW-Form (1, 3, 640, 640) mit Werten im Bereich [0, 1] und Typ float32 erstellen

quell = torch.rand(1, 3, 640, 640, dtype=torch.float32)

Inferenz auf der Quelle ausführen

ergebnisse = model(quell) # Liste von Results-Objekten


Created 2023-11-13, Updated 2023-11-18
Authors: glenn-jocher (2)

Kommentare