सामग्री पर जाएं

OBB के साथ DOTA डेटासेट

DOTA एक विशेष डेटासेट के रूप में खड़ा है, जो हवाई छवियों में वस्तु का पता लगाने पर जोर देता है। डेटासेट की DOTA श्रृंखला से उत्पन्न, यह ओरिएंटेड बाउंडिंग बॉक्स (OBB) के साथ हवाई दृश्यों की एक विविध सरणी को कैप्चर करने वाली एनोटेट की गई छवियां प्रदान करता है।

DOTA कक्षाएं दृश्य

प्रमुख विशेषताऐं

  • विभिन्न सेंसर और प्लेटफार्मों से संग्रह, 800 × 800 से 20,000 × 20,000 पिक्सेल तक की छवि आकार के साथ।
  • 18 श्रेणियों में 1.7M से अधिक ओरिएंटेड बाउंडिंग बॉक्स हैं।
  • मल्टीस्केल ऑब्जेक्ट डिटेक्शन शामिल है।
  • उदाहरणों को विशेषज्ञों द्वारा मनमाने ढंग से (8 d.o.f.) चतुर्भुज का उपयोग करके, विभिन्न पैमाने, अभिविन्यास और आकृतियों की वस्तुओं को कैप्चर करके एनोटेट किया जाता है।

डेटासेट संस्करण

डोटा-v1.0

  • इसमें 15 सामान्य श्रेणियां शामिल हैं।
  • 188,282 उदाहरणों के साथ 2,806 छवियां शामिल हैं।
  • विभाजित अनुपात: प्रशिक्षण के लिए 1/2, सत्यापन के लिए 1/6, और परीक्षण के लिए 1/3।

डोटा-v1.5

  • DOTA-v1.0 के समान छवियों को शामिल करता है।
  • बहुत छोटे उदाहरण (10 पिक्सेल से कम) भी एनोटेट किए जाते हैं।
  • एक नई श्रेणी का जोड़: "कंटेनर क्रेन"।
  • कुल 403,318 उदाहरण।
  • हवाई छवियों में ऑब्जेक्ट डिटेक्शन पर डीओएआई चैलेंज 2019 के लिए जारी किया गया।

डोटा-v2.0

  • Google Earth, GF-2 सैटेलाइट और दूसरी हवाई इमेज के संग्रह.
  • इसमें 18 सामान्य श्रेणियां शामिल हैं।
  • 1,793,658 उदाहरणों के साथ 11,268 छवियां शामिल हैं।
  • नई श्रेणियां पेश की गईं: "हवाई अड्डा" और "हेलीपैड"।
  • छवि विभाजन:
    • प्रशिक्षण: 1,830 उदाहरणों के साथ 268,627 छवियां।
    • सत्यापन: 81,048 उदाहरणों के साथ 593 छवियां।
    • टेस्ट-देव: 353,346 उदाहरणों के साथ 2,792 छवियां।
    • टेस्ट-चैलेंज: 1,090,637 उदाहरणों के साथ 6,053 छवियां।

डेटासेट संरचना

DOTA OBB ऑब्जेक्ट डिटेक्शन चुनौतियों के अनुरूप एक संरचित लेआउट प्रदर्शित करता है:

  • छवियां: विविध इलाकों और संरचनाओं को कैप्चर करने वाली उच्च-रिज़ॉल्यूशन हवाई छवियों का एक विशाल संग्रह।
  • ओरिएंटेड बाउंडिंग बॉक्स: घुमाए गए आयतों के रूप में एनोटेशन, जो वस्तुओं को उनके अभिविन्यास के बावजूद समाहित करते हैं, हवाई जहाज, जहाजों और इमारतों जैसी वस्तुओं को कैप्चर करने के लिए आदर्श हैं।

अनुप्रयोगों

DOTA विशेष रूप से हवाई छवि विश्लेषण के लिए तैयार किए गए मॉडल के प्रशिक्षण और मूल्यांकन के लिए एक बेंचमार्क के रूप में कार्य करता है। OBB एनोटेशन को शामिल करने के साथ, यह एक अनूठी चुनौती प्रदान करता है, विशेष ऑब्जेक्ट डिटेक्शन मॉडल के विकास को सक्षम करता है जो हवाई इमेजरी की बारीकियों को पूरा करता है.

डेटासेट YAML

आमतौर पर, डेटासेट में एक YAML (अभी तक एक और मार्कअप भाषा) फ़ाइल शामिल होती है जो डेटासेट के कॉन्फ़िगरेशन का विवरण देती है। DOTA v1 और DOTA v1.5 के लिए, Ultralytics प्रदान करता है DOTAv1.yaml और DOTAv1.5.yaml फ़ाइलें। इन पर अतिरिक्त विवरण के साथ-साथ DOTA v2 के लिए कृपया DOTA के आधिकारिक भंडार और दस्तावेज़ीकरण से परामर्श लें।

DOTAv1.yaml

# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA 1.0 dataset https://captain-whu.github.io/DOTA/index.html for object detection in aerial images by Wuhan University
# Documentation: https://docs.ultralytics.com/datasets/obb/dota-v2/
# Example usage: yolo train model=yolov8n-obb.pt data=DOTAv1.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota1  ← downloads here (2GB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/DOTAv1 # dataset root dir
train: images/train # train images (relative to 'path') 1411 images
val: images/val # val images (relative to 'path') 458 images
test: images/test # test images (optional) 937 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/yolov5/releases/download/v1.0/DOTAv1.zip

DOTA छवियों को विभाजित करें

DOTA डेटासेट को प्रशिक्षित करने के लिए, हम उच्च-रिज़ॉल्यूशन वाली मूल DOTA छवियों को मल्टीस्केल तरीके से 1024x1024 रिज़ॉल्यूशन वाली छवियों में विभाजित करते हैं।

छवियों को विभाजित करें

from ultralytics.data.split_dota import split_test, split_trainval

# split train and val set, with labels.
split_trainval(
    data_root="path/to/DOTAv1.0/",
    save_dir="path/to/DOTAv1.0-split/",
    rates=[0.5, 1.0, 1.5],  # multiscale
    gap=500,
)
# split test set, without labels.
split_test(
    data_root="path/to/DOTAv1.0/",
    save_dir="path/to/DOTAv1.0-split/",
    rates=[0.5, 1.0, 1.5],  # multiscale
    gap=500,
)

उपयोग

DOTA v1 डेटासेट पर किसी मॉडल को प्रशिक्षित करने के लिए, आप निम्न कोड स्निपेट का उपयोग कर सकते हैं। उपलब्ध तर्कों की पूरी सूची के लिए हमेशा अपने मॉडल के दस्तावेज़ीकरण का संदर्भ लें।

चेतावनी

कृपया ध्यान दें कि DOTAv1 डेटासेट में सभी छवियों और संबंधित एनोटेशन का उपयोग शैक्षणिक उद्देश्यों के लिए किया जा सकता है, लेकिन व्यावसायिक उपयोग निषिद्ध है। डेटासेट निर्माताओं की इच्छाओं के लिए आपकी समझ और सम्मान की बहुत सराहना की जाती है!

ट्रेन का उदाहरण

from ultralytics import YOLO

# Create a new YOLOv8n-OBB model from scratch
model = YOLO("yolov8n-obb.yaml")

# Train the model on the DOTAv2 dataset
results = model.train(data="DOTAv1.yaml", epochs=100, imgsz=640)
# Train a new YOLOv8n-OBB model on the DOTAv2 dataset
yolo obb train data=DOTAv1.yaml model=yolov8n-obb.pt epochs=100 imgsz=640

नमूना डेटा और एनोटेशन

डेटासेट पर एक नज़र डालने से इसकी गहराई का पता चलता है:

डेटासेट नमूना छवि

  • DOTA उदाहरण: यह स्नैपशॉट हवाई दृश्यों की जटिलता और ओरिएंटेड बाउंडिंग बॉक्स एनोटेशन के महत्व को रेखांकित करता है, वस्तुओं को उनके प्राकृतिक अभिविन्यास में कैप्चर करता है।

डेटासेट की समृद्धि हवाई इमेजरी के लिए विशेष रूप से ऑब्जेक्ट डिटेक्शन चुनौतियों में अमूल्य अंतर्दृष्टि प्रदान करती है।

प्रशंसा पत्र और पावती

अपने प्रयासों में DOTA का लाभ उठाने वालों के लिए, प्रासंगिक शोध पत्रों का हवाला देना उचित है:

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2021},
  volume={},
  number={},
  pages={1-1},
  doi={10.1109/TPAMI.2021.3117983}
}

इस डेटासेट को क्यूरेट करने में उनके सराहनीय प्रयास के लिए DOTA डेटासेट के पीछे की टीम का विशेष सम्मान। डेटासेट और इसकी बारीकियों की संपूर्ण समझ के लिए, कृपया आधिकारिक DOTA वेबसाइट पर जाएं।



Created 2023-11-12, Updated 2024-06-02
Authors: glenn-jocher (9), Laughing-q (1)

टिप्पणियाँ