Vai al contenuto

Visualizzare i risultati dell'inferenza in un terminale

Esempio di immagine Sixel nel terminale

Immagine tratta dal sito web di libsixel.

Motivazione

Quando ci si connette a un computer remoto, normalmente la visualizzazione dei risultati delle immagini non è possibile o richiede lo spostamento dei dati su un dispositivo locale dotato di interfaccia grafica. Il terminale integrato VSCode permette di visualizzare direttamente le immagini. Questa è una breve dimostrazione di come utilizzarlo insieme a ultralytics con Risultati delle previsioni.

Avvertenze

Compatibile solo con Linux e MacOS. Controlla il Repository VSCode, controlla Stato del problema, oppure documentazione per aggiornamenti sul supporto di Windows per la visualizzazione di immagini nel terminale con sixel.

I protocolli compatibili con il VSCode per la visualizzazione delle immagini tramite il terminale integrato sono sixel e iTerm. Questa guida illustra l'uso del programma sixel protocollo.

Processo

  1. Per prima cosa, devi attivare le impostazioni terminal.integrated.enableImages e terminal.integrated.gpuAcceleration in VSCode.

    "terminal.integrated.gpuAcceleration": "auto" # "auto" is default, can also use "on"
    "terminal.integrated.enableImages": false
    

    Impostazione delle immagini del terminale per l'abilitazione del VSCode

  2. Installa il programma python-sixel nel tuo ambiente virtuale. Si tratta di un forcella del PySixel che non viene più mantenuta.

    pip install sixel
    
  3. Carica un modello ed esegue l'inferenza, quindi traccia i risultati e li memorizza in una variabile. Per saperne di più sugli argomenti dell'inferenza e sulla gestione dei risultati, consulta la pagina della modalità di previsione.

    from ultralytics import YOLO
    
    # Load a model
    model = YOLO("yolov8n.pt")
    
    # Run inference on an image
    results = model.predict(source="ultralytics/assets/bus.jpg")
    
    # Plot inference results
    plot = results[0].plot()  # (1)!
    
    1. Vedi i parametri del metodo plot per vedere i possibili argomenti da utilizzare.
  4. Ora, usa OpenCV per convertire i dati numpy.ndarray a bytes dati. Quindi utilizza io.BytesIO per creare un oggetto "simile a un file".

    import io
    
    import cv2
    
    # Results image as bytes
    im_bytes = cv2.imencode(
        ".png",  # (1)!
        plot,
    )[1].tobytes()  # (2)!
    
    # Image bytes as a file-like object
    mem_file = io.BytesIO(im_bytes)
    
    1. È possibile utilizzare anche altre estensioni di immagini.
    2. Solo l'oggetto all'indice 1 che viene restituito è necessario.
  5. Crea un SixelWriter e poi utilizzare l'istanza .draw() per disegnare l'immagine nel terminale.

    from sixel import SixelWriter
    
    # Create sixel writer object
    w = SixelWriter()
    
    # Draw the sixel image in the terminal
    w.draw(mem_file)
    

Esempio di risultati dell'inferenza

Visualizza l'immagine nel terminale

Pericolo

L'utilizzo di questo esempio con video o fotogrammi GIF animati non è stato testato. Provaci a tuo rischio e pericolo.

Esempio di codice completo

import io

import cv2
from sixel import SixelWriter

from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n.pt")

# Run inference on an image
results = model.predict(source="ultralytics/assets/bus.jpg")

# Plot inference results
plot = results[0].plot()  # (3)!

# Results image as bytes
im_bytes = cv2.imencode(
    ".png",  # (1)!
    plot,
)[1].tobytes()  # (2)!

mem_file = io.BytesIO(im_bytes)
w = SixelWriter()
w.draw(mem_file)
  1. È possibile utilizzare anche altre estensioni di immagini.
  2. Solo l'oggetto all'indice 1 che viene restituito è necessario.
  3. Vedi i parametri del metodo plot per vedere i possibili argomenti da utilizzare.

Suggerimento

Potrebbe essere necessario utilizzare clear per "cancellare" la vista dell'immagine nel terminale.

DOMANDE FREQUENTI

Come posso visualizzare i risultati dell'inferenza di YOLO in un terminale VSCode su macOS o Linux?

Per visualizzare i risultati dell'inferenza di YOLO in un terminale VSCode su macOS o Linux, segui i seguenti passaggi:

  1. Abilita le impostazioni VSCode necessarie:

    "terminal.integrated.enableImages": true
    "terminal.integrated.gpuAcceleration": "auto"
    
  2. Installa la libreria sixel:

    pip install sixel
    
  3. Carica il tuo modello YOLO ed esegui l'inferenza:

    from ultralytics import YOLO
    
    model = YOLO("yolov8n.pt")
    results = model.predict(source="path_to_image")
    plot = results[0].plot()
    
  4. Converte l'immagine del risultato dell'inferenza in byte e la visualizza nel terminale:

    import io
    
    import cv2
    from sixel import SixelWriter
    
    im_bytes = cv2.imencode(".png", plot)[1].tobytes()
    mem_file = io.BytesIO(im_bytes)
    SixelWriter().draw(mem_file)
    

Per ulteriori dettagli, visita la pagina della modalità di previsione.

Perché il protocollo sixel funziona solo su Linux e macOS?

Il protocollo sixel è attualmente supportato solo su Linux e macOS perché queste piattaforme dispongono di funzionalità terminali native compatibili con la grafica sixel. Il supporto di Windows per la grafica dei terminali con sixel è ancora in fase di sviluppo. Per aggiornamenti sulla compatibilità con Windows, controlla lo stato del problema VSCode e la documentazione.

Cosa succede se ho problemi con la visualizzazione delle immagini nel terminale VSCode?

Se riscontri dei problemi nella visualizzazione delle immagini nel terminale VSCode utilizzando sixel:

  1. Assicurati che le impostazioni necessarie in VSCode siano abilitate:

    "terminal.integrated.enableImages": true
    "terminal.integrated.gpuAcceleration": "auto"
    
  2. Verifica l'installazione della libreria sixel:

    pip install sixel
    
  3. Controlla che il codice di conversione dei dati dell'immagine e di plottaggio non contenga errori. Ad esempio:

    import io
    
    import cv2
    from sixel import SixelWriter
    
    im_bytes = cv2.imencode(".png", plot)[1].tobytes()
    mem_file = io.BytesIO(im_bytes)
    SixelWriter().draw(mem_file)
    

Se i problemi persistono, consulta il repository VSCode e visita la sezione dei parametri del metodo di trama per ulteriori indicazioni.

YOLO può visualizzare i risultati dell'inferenza video nel terminale utilizzando sixel?

La visualizzazione dei risultati dell'inferenza video o dei fotogrammi GIF animati utilizzando sixel nel terminale non è ancora stata testata e potrebbe non essere supportata. Ti consigliamo di iniziare con immagini statiche e di verificarne la compatibilità. Prova a visualizzare i risultati video a tuo rischio e pericolo, tenendo conto dei limiti di prestazione. Per maggiori informazioni sulla rappresentazione dei risultati dell'inferenza, visita la pagina della modalità di previsione.

Come posso risolvere i problemi con il programma python-sixel biblioteca?

Per risolvere i problemi con il sistema python-sixel biblioteca:

  1. Assicurati che la libreria sia installata correttamente nel tuo ambiente virtuale:

    pip install sixel
    
  2. Verifica che siano presenti le dipendenze necessarie di Python e del sistema.

  3. Fai riferimento al repository GitHubpython -sixel per ulteriore documentazione e per il supporto della comunità.

  4. Ricontrolla il tuo codice per verificare la presenza di potenziali errori, in particolare l'utilizzo di SixelWriter e le fasi di conversione dei dati dell'immagine.

Per ulteriore assistenza su come lavorare con i modelli di YOLO e l'integrazione di sixel, consulta le pagine di documentazione sulla modalità di esportazione e di previsione.



Creato 2024-03-09, Aggiornato 2024-07-05
Autori: glenn-jocher (6), IvorZhu331 (1), Burhan-Q (1)

Commenti