पृथक विभाजन वस्तुएं

Q: What options are available for saving the isolated objects after segmentation?

Ultralytics YOLOv8 पृथक वस्तुओं को सहेजने के लिए दो मुख्य विकल्प प्रदान करता है: अधिक जानकारी के लिए, प्रेडिक्ट मोड अनुभाग पर जाएं।

Q: How can I crop isolated objects to their bounding boxes using Ultralytics YOLOv8?

पृथक ऑब्जेक्ट्स को उनके बाउंडिंग बॉक्स में क्रॉप करने के लिए: पूर्वानुमान मोड दस्तावेज़ीकरण में बाउंडिंग बॉक्स परिणामों के बारे में अधिक जानें।

Q: Why should I use Ultralytics YOLOv8 for object isolation in segmentation tasks?

Ultralytics YOLOv8 प्रदान करता है: उपयोग करने के लाभों का अन्वेषण करें YOLO सेगमेंट टास्क डॉक्यूमेंटेशन में.

Q: Can I save isolated objects including the background using Ultralytics YOLOv8?

हां, यह एक अंतर्निहित सुविधा है Ultralytics YOLOv8. predict() विधि में save_crop तर्क का उपयोग करें। उदाहरण के लिए: पूर्वानुमान मोड अनुमान तर्क अनुभाग में save_crop तर्क के बारे में अधिक पढ़ें.

सेगमेंट कार्य करने के बाद, कभी-कभी अनुमान परिणामों से पृथक वस्तुओं को निकालना वांछनीय होता है। यह मार्गदर्शिका इसका उपयोग करके इसे पूरा करने के तरीके पर एक सामान्य नुस्खा प्रदान करती हैUltralytics भविष्यवाणी मोड।

उदाहरण पृथक वस्तु विभाजन

पकाने की विधि के माध्यम से चलना

देखें Ultralytics आवश्यक पुस्तकालयों को स्थापित करने पर त्वरित पूर्वाभ्यास के लिए क्विकस्टार्ट इंस्टॉलेशन अनुभाग।
एक मॉडल लोड करें और चलाएं predict() एक स्रोत पर विधि।
```
from ultralytics import YOLO

# Load a model
model = YOLO("yolov8n-seg.pt")

# Run inference
results = model.predict()
```
कोई भविष्यवाणी तर्क नहीं?

स्रोत निर्दिष्ट किए बिना, पुस्तकालय से उदाहरण छवियों का उपयोग किया जाएगा:
```
'ultralytics/assets/bus.jpg'
'ultralytics/assets/zidane.jpg'
```
यह तेजी से परीक्षण के लिए सहायक है predict() विधि।
विभाजन मॉडल के बारे में अतिरिक्त जानकारी के लिए, पर जाएँ सेगमेंट कार्य पृष्ठ। इसके बारे में अधिक जानने के लिए predict() विधि, देखें भविष्यवाणी मोड दस्तावेज़ीकरण का अनुभाग।
अब परिणामों और आकृति पर पुनरावृति करें। उन वर्कफ़्लोज़ के लिए जो किसी छवि को फ़ाइल में सहेजना चाहते हैं, स्रोत छवि base-name और पता लगाना class-label बाद में उपयोग के लिए पुनर्प्राप्त किए जाते हैं (वैकल्पिक)।
```
from pathlib import Path

import numpy as np

# (2) Iterate detection results (helpful for multiple images)
for r in res:
    img = np.copy(r.orig_img)
    img_name = Path(r.path).stem  # source image base-name

    # Iterate each object contour (multiple detections)
    for ci, c in enumerate(r):
        # (1) Get detection class name
        label = c.names[c.boxes.cls.tolist().pop()]
```
1. डिटेक्शन परिणामों के साथ कार्य करने के बारे में अधिक जानने के लिए, पूर्वानुमान मोड के लिए बॉक्सेज़ अनुभाग देखें.
2. इसके बारे में अधिक जानने के लिए predict() परिणाम देखें भविष्यवाणी मोड के लिए परिणामों के साथ कार्य करना
फॉर-लूप

एक एकल छवि केवल एक बार पहले लूप को पुनरावृति करेगी। केवल एक ही पहचान के साथ एक एकल छवि प्रत्येक लूप को केवल एक बार पुनरावृति करेगी।
स्रोत छवि से एक बाइनरी मास्क उत्पन्न करने के साथ शुरू करें और फिर मास्क पर एक भरा हुआ समोच्च खींचें। यह ऑब्जेक्ट को छवि के अन्य भागों से अलग करने की अनुमति देगा। से एक उदाहरण bus.jpg पता चला में से एक के लिए person क्लास ऑब्जेक्ट्स को दाईं ओर दिखाया गया है।
```
import cv2

# Create binary mask
b_mask = np.zeros(img.shape[:2], np.uint8)

# (1) Extract contour result
contour = c.masks.xy.pop()
# (2) Changing the type
contour = contour.astype(np.int32)
# (3) Reshaping
contour = contour.reshape(-1, 1, 2)


# Draw contour onto mask
_ = cv2.drawContours(b_mask, [contour], -1, (255, 255, 255), cv2.FILLED)
```
1. अधिक जानकारी के लिए c.masks.xy देखना भविष्यवाणी मोड से मास्क अनुभाग.
2. यहाँ मूल्यों में डाली जाती है np.int32 के साथ संगतता के लिए drawContours() ओपनसीवी से फ़ंक्शन।
3. ओपनसीवी drawContours() फ़ंक्शन अपेक्षा करता है कि आकृति का आकार होगा [N, 1, 2] अधिक जानकारी के लिए नीचे अनुभाग का विस्तार करें।
यह समझने के लिए विस्तार करें कि परिभाषित करते समय क्या हो रहा है contour चर।
- c.masks.xy :: प्रारूप में मुखौटा समोच्च बिंदुओं के निर्देशांक प्रदान करता है (x, y). अधिक जानकारी के लिए, देखें भविष्यवाणी मोड से मास्क अनुभाग.
- .pop() ::जैसा masks.xy एक सूची है जिसमें एक एकल तत्व है, इस तत्व को pop() विधि।
- .astype(np.int32) ::का उपयोग करके masks.xy के डेटा प्रकार के साथ वापस आ जाएगा float32, लेकिन यह ओपनसीवी के साथ संगत नहीं होगा drawContours() फ़ंक्शन, इसलिए यह डेटा प्रकार को int32 अनुकूलता के लिए।
- .reshape(-1, 1, 2) :: डेटा को आवश्यक आकार में पुन: स्वरूपित करता है [N, 1, 2] कहां N समोच्च बिंदुओं की संख्या है, जिसमें प्रत्येक बिंदु एक एकल प्रविष्टि द्वारा दर्शाया गया है 1, और प्रविष्टि से बना है 2 मान। वही -1 यह दर्शाता है कि इस आयाम के साथ मानों की संख्या लचीली है।
के स्पष्टीकरण के लिए विस्तृत करें drawContours() संरूपण।
- एनकैप्सुलेट करना contour वर्ग कोष्ठक के भीतर चर, [contour], परीक्षण के दौरान वांछित समोच्च मुखौटा को प्रभावी ढंग से उत्पन्न करने के लिए पाया गया था।
- मूल्य -1 के लिए निर्दिष्ट drawContours() पैरामीटर फ़ंक्शन को छवि में मौजूद सभी आकृति को आकर्षित करने का निर्देश देता है।
- वही tuple (255, 255, 255) सफेद रंग का प्रतिनिधित्व करता है, जो इस बाइनरी मास्क में समोच्च खींचने के लिए वांछित रंग है।
- के जोड़ cv2.FILLED समोच्च सीमा से घिरे सभी पिक्सेल को समान रंग देगा, इस मामले में, सभी संलग्न पिक्सेल सफेद होंगे।
- देखना OpenCV प्रलेखन पर drawContours() अधिक जानकारी के लिए।
इसके बाद, इस बिंदु से छवि के साथ आगे बढ़ने के लिए 2 विकल्प हैं और प्रत्येक के लिए एक बाद का विकल्प है।

ऑब्जेक्ट अलगाव विकल्प
ब्लैक बैकग्राउंड पिक्सलपारदर्शी पृष्ठभूमि पिक्सेल
# Create 3-channel mask mask3ch = cv2.cvtColor(b_mask, cv2.COLOR_GRAY2BGR) # Isolate object with binary mask isolated = cv2.bitwise_and(mask3ch, img)

यह कैसे काम करता है?

सबसे पहले, बाइनरी मास्क को पहले सिंगल-चैनल इमेज से थ्री-चैनल इमेज में बदला जाता है। यह रूपांतरण बाद के चरण के लिए आवश्यक है जहां मुखौटा और मूल छवि संयुक्त हैं। सम्मिश्रण ऑपरेशन के साथ संगत होने के लिए दोनों छवियों में समान संख्या में चैनल होने चाहिए।

मूल छवि और तीन-चैनल बाइनरी मास्क को OpenCV फ़ंक्शन का उपयोग करके मर्ज कर दिया जाता है bitwise_and(). यह ऑपरेशन बरकरार रखता है केवल पिक्सेल मान जो शून्य से अधिक हैं (> 0) दोनों तस्वीरों से। चूंकि मास्क पिक्सल शून्य से अधिक हैं (> 0) केवल समोच्च क्षेत्र के भीतर, मूल छवि से शेष पिक्सेल वे हैं जो समोच्च के साथ ओवरलैप करते हैं।

ब्लैक पिक्सल के साथ अलग: उप-विकल्प

पूर्ण आकार की छवि

पूर्ण आकार की छवि रखने पर किसी अतिरिक्त कदम की आवश्यकता नहीं है।

उदाहरण पूर्ण आकार का आउटपुट

क्रॉप की गई वस्तु छवि

छवि को क्रॉप करने के लिए आवश्यक अतिरिक्त चरणों में केवल ऑब्जेक्ट क्षेत्र शामिल है।

# (1) Bounding box coordinates x1, y1, x2, y2 = c.boxes.xyxy.cpu().numpy().squeeze().astype(np.int32) # Crop image to object region iso_crop = isolated[y1:y2, x1:x2]

बाउंडिंग बॉक्स परिणामों के बारे में अधिक जानकारी के लिए, भविष्यवाणी मोड से बॉक्स अनुभाग देखें

यह कोड क्या करता है?

वही c.boxes.xyxy.cpu().numpy() कॉल बाउंडिंग बॉक्स को NumPy सरणी के रूप में पुनः प्राप्त करता है xyxy प्रारूप, जहां xmin, ymin, xmaxऔर ymax बाउंडिंग बॉक्स आयत के निर्देशांक का प्रतिनिधित्व करते हैं। देखना भविष्यवाणी मोड से बक्से अनुभाग अधिक जानकारी के लिए।

वही squeeze() ऑपरेशन NumPy सरणी से किसी भी अनावश्यक आयाम को हटा देता है, यह सुनिश्चित करता है कि इसका अपेक्षित आकार है।

का उपयोग कर समन्वय मूल्यों को परिवर्तित करना .astype(np.int32) बॉक्स को इससे डेटा प्रकार का समन्वय करता है float32 तक int32, उन्हें इंडेक्स स्लाइस का उपयोग करके छवि क्रॉपिंग के लिए संगत बनाना।

अंत में, बाउंडिंग बॉक्स क्षेत्र को इंडेक्स स्लाइसिंग का उपयोग करके छवि से क्रॉप किया जाता है। सीमाओं को [ymin:ymax, xmin:xmax] डिटेक्शन बाउंडिंग बॉक्स के निर्देशांक।
# Isolate object with transparent background (when saved as PNG) isolated = np.dstack([img, b_mask])

यह कैसे काम करता है?

NumPy का उपयोग करना dstack() फ़ंक्शन (गहराई-अक्ष के साथ सरणी स्टैकिंग) उत्पन्न बाइनरी मास्क के संयोजन के साथ, चार चैनलों के साथ एक छवि बनाएगा। यह ऑब्जेक्ट समोच्च के बाहर के सभी पिक्सेल को पारदर्शी होने की अनुमति देता है जब एक के रूप में सहेजना PNG रेती।

पारदर्शी पिक्सेल के साथ अलग: उप-विकल्प

पूर्ण आकार की छवि

पूर्ण आकार की छवि रखने पर किसी अतिरिक्त कदम की आवश्यकता नहीं है।

उदाहरण पूर्ण आकार का आउटपुट + पारदर्शी पृष्ठभूमि

क्रॉप की गई वस्तु छवि

छवि को क्रॉप करने के लिए आवश्यक अतिरिक्त चरणों में केवल ऑब्जेक्ट क्षेत्र शामिल है।

# (1) Bounding box coordinates x1, y1, x2, y2 = c.boxes.xyxy.cpu().numpy().squeeze().astype(np.int32) # Crop image to object region iso_crop = isolated[y1:y2, x1:x2]

बाउंडिंग बॉक्स परिणामों के बारे में अधिक जानकारी के लिए, भविष्यवाणी मोड से बॉक्स अनुभाग देखें

यह कोड क्या करता है?

उपयोग करते समय c.boxes.xyxy.cpu().numpy(), बाउंडिंग बॉक्स को NumPy सरणी के रूप में लौटाया जाता है, xyxy बॉक्स निर्देशांक प्रारूप, जो बिंदुओं के अनुरूप है xmin, ymin, xmax, ymax बाउंडिंग बॉक्स (आयत) के लिए, देखें भविष्यवाणी मोड से बक्से अनुभाग अधिक जानकारी के लिए।

जोड़ने squeeze() सुनिश्चित करता है कि किसी भी बाहरी आयाम को NumPy सरणी से हटा दिया गया है।

का उपयोग कर समन्वय मूल्यों को परिवर्तित करना .astype(np.int32) बॉक्स को इससे डेटा प्रकार का समन्वय करता है float32 तक int32 जो इंडेक्स स्लाइस का उपयोग करके छवि को क्रॉप करते समय संगत होगा।

अंत में बाउंडिंग बॉक्स के लिए छवि क्षेत्र को इंडेक्स स्लाइसिंग का उपयोग करके क्रॉप किया जाता है, जहां सीमा का उपयोग करके सेट किया जाता है [ymin:ymax, xmin:xmax] डिटेक्शन बाउंडिंग बॉक्स के निर्देशांक।
क्या होगा यदि मैं पृष्ठभूमि सहित फसली वस्तु चाहता हूं?

यह के लिए एक अंतर्निहित सुविधा है Ultralytics पुस्तकालय। देखें save_crop के लिए तर्क मोड अनुमान तर्कों की भविष्यवाणी करें विवरण के लिए।
आगे क्या करना है यह पूरी तरह से डेवलपर के रूप में आपके ऊपर छोड़ दिया गया है। एक संभावित अगले चरण का एक मूल उदाहरण (भविष्य में उपयोग के लिए फ़ाइल में छवि को सहेजना) दिखाया गया है।
- नोट: यह चरण वैकल्पिक है और यदि आपके विशिष्ट उपयोग के मामले के लिए आवश्यक नहीं है तो इसे छोड़ दिया जा सकता है।
उदाहरण अंतिम चरण
```
# Save isolated object to file
_ = cv2.imwrite(f"{img_name}_{label}-{ci}.png", iso_crop)
```
- इस उदाहरण में, img_name स्रोत छवि फ़ाइल का आधार-नाम है, label पता चला वर्ग-नाम है, और ci ऑब्जेक्ट डिटेक्शन का सूचकांक है (एक ही वर्ग के नाम के साथ कई उदाहरणों के मामले में)।

पूर्ण उदाहरण कोड

यहां, पिछले अनुभाग के सभी चरणों को कोड के एकल ब्लॉक में जोड़ा जाता है। बार-बार उपयोग के लिए, इसमें निहित कुछ या सभी कमांड करने के लिए फ़ंक्शन को परिभाषित करना इष्टतम होगा for-लूप, लेकिन यह पाठक के लिए एक अभ्यास है।

from pathlib import Path

import cv2
import numpy as np

from ultralytics import YOLO

m = YOLO("yolov8n-seg.pt")  # (4)!
res = m.predict()  # (3)!

# Iterate detection results (5)
for r in res:
    img = np.copy(r.orig_img)
    img_name = Path(r.path).stem

    # Iterate each object contour (6)
    for ci, c in enumerate(r):
        label = c.names[c.boxes.cls.tolist().pop()]

        b_mask = np.zeros(img.shape[:2], np.uint8)

        # Create contour mask (1)
        contour = c.masks.xy.pop().astype(np.int32).reshape(-1, 1, 2)
        _ = cv2.drawContours(b_mask, [contour], -1, (255, 255, 255), cv2.FILLED)

        # Choose one:

        # OPTION-1: Isolate object with black background
        mask3ch = cv2.cvtColor(b_mask, cv2.COLOR_GRAY2BGR)
        isolated = cv2.bitwise_and(mask3ch, img)

        # OPTION-2: Isolate object with transparent background (when saved as PNG)
        isolated = np.dstack([img, b_mask])

        # OPTIONAL: detection crop (from either OPT1 or OPT2)
        x1, y1, x2, y2 = c.boxes.xyxy.cpu().numpy().squeeze().astype(np.int32)
        iso_crop = isolated[y1:y2, x1:x2]

        # TODO your actions go here (2)

आबाद हो रही रेखा contour यहां एक लाइन में जोड़ा गया है, जहां इसे मल्टीपल अप में विभाजित किया गया था।
यहाँ क्या जाता है आप पर निर्भर है!
अतिरिक्त जानकारी के लिए भविष्यवाणी मोड देखें।
अधिक जानकारी के लिए सेगमेंट कार्य देखें.
परिणामों के साथ कार्य करना के बारे में अधिक जानें
सेगमेंटेशन मास्क परिणामों के बारे में अधिक जानें

अक्सर पूछे जाने वाले प्रश्न

मैं वस्तुओं का उपयोग करके वस्तुओं को कैसे अलग करूं Ultralytics YOLOv8 विभाजन कार्यों के लिए?

का उपयोग करके वस्तुओं को अलग करने के लिए Ultralytics YOLOv8, इन चरणों का पालन करें:

मॉडल लोड करें और अनुमान चलाएं:

from ultralytics import YOLO

model = YOLO("yolov8n-seg.pt")
results = model.predict(source="path/to/your/image.jpg")

एक बाइनरी मास्क उत्पन्न करें और आकृति बनाएं:

import cv2
import numpy as np

img = np.copy(results[0].orig_img)
b_mask = np.zeros(img.shape[:2], np.uint8)
contour = results[0].masks.xy[0].astype(np.int32).reshape(-1, 1, 2)
cv2.drawContours(b_mask, [contour], -1, (255, 255, 255), cv2.FILLED)

बाइनरी मास्क का उपयोग करके ऑब्जेक्ट को अलग करें:
```
mask3ch = cv2.cvtColor(b_mask, cv2.COLOR_GRAY2BGR)
isolated = cv2.bitwise_and(mask3ch, img)
```

अधिक जानकारी के लिए प्रेडिक्ट मोड और सेगमेंट टास्क पर गाइड देखें।

विभाजन के बाद पृथक वस्तुओं को बचाने के लिए क्या विकल्प उपलब्ध हैं?

Ultralytics YOLOv8 पृथक वस्तुओं को बचाने के लिए दो मुख्य विकल्प प्रदान करता है:

एक काले रंग की पृष्ठभूमि के साथ:

mask3ch = cv2.cvtColor(b_mask, cv2.COLOR_GRAY2BGR)
isolated = cv2.bitwise_and(mask3ch, img)

पारदर्शी पृष्ठभूमि के साथ:
```
isolated = np.dstack([img, b_mask])
```

अधिक जानकारी के लिए, प्रेडिक्ट मोड सेक्शन पर जाएं।

मैं अलग-अलग वस्तुओं को उनके बाउंडिंग बॉक्स का उपयोग करके कैसे क्रॉप कर सकता हूं Ultralytics YOLOv8?

पृथक वस्तुओं को उनके बाउंडिंग बॉक्स में क्रॉप करने के लिए:

बाउंडिंग बॉक्स निर्देशांक पुनः प्राप्त करें:
```
x1, y1, x2, y2 = results[0].boxes.xyxy[0].cpu().numpy().astype(np.int32)
```
पृथक छवि को क्रॉप करें:
```
iso_crop = isolated[y1:y2, x1:x2]
```

भविष्यवाणी मोड दस्तावेज़ीकरण में बाउंडिंग बॉक्स परिणामों के बारे में अधिक जानें।

मुझे क्यों उपयोग करना चाहिए Ultralytics YOLOv8 विभाजन कार्यों में ऑब्जेक्ट अलगाव के लिए?

Ultralytics YOLOv8 प्रदान करता है:

उच्च गति वास्तविक समय वस्तु का पता लगाने और विभाजन।
सटीक वस्तु अलगाव के लिए सटीक बाउंडिंग बॉक्स और मुखौटा पीढ़ी।
कुशल विकास के लिए व्यापक प्रलेखन और उपयोग में आसान एपीआई।

उपयोग करने के लाभों का अन्वेषण करें YOLO सेगमेंट टास्क डॉक्यूमेंटेशन में.

क्या मैं पृष्ठभूमि सहित अलग-अलग वस्तुओं को सहेज सकता हूं Ultralytics YOLOv8?

हां, यह एक अंतर्निहित सुविधा है Ultralytics YOLOv8. का उपयोग करें save_crop में तर्क predict() विधि। उदाहरण के लिए:

results = model.predict(source="path/to/your/image.jpg", save_crop=True)

कैंसर के लक्षणों के बारे में और पढ़ें। save_crop में तर्क मोड अनुमान तर्कों की भविष्यवाणी करें कर्तन।

बनाया गया 2023-11-27, अद्यतनित 2024-07-05
लेखक: ग्लेन-जोचर (12), इवोरझू 331 (1), रिजवान मुनव्वर (1), बुरहान-क्यू (1)

पृथक विभाजन वस्तुएं

पकाने की विधि के माध्यम से चलना

ऑब्जेक्ट अलगाव विकल्प

ब्लैक पिक्सल के साथ अलग: उप-विकल्प

पारदर्शी पिक्सेल के साथ अलग: उप-विकल्प