OBB ile DOTA Veri Kümesi
DOTA, hava görüntülerinde nesne tespitini vurgulayan özel bir veri kümesi olarak duruyor. DOTA veri kümeleri serisinden kaynaklanan bu veri kümesi, Yönlendirilmiş Sınırlayıcı Kutular (OBB) ile çeşitli hava sahnelerini yakalayan açıklamalı görüntüler sunmaktadır.
Temel Özellikler
- Görüntü boyutları 800 × 800 ila 20.000 × 20.000 piksel arasında değişen çeşitli sensörlerden ve platformlardan toplama.
- 18 kategoride 1,7 milyondan fazla Yönlendirilmiş Sınırlayıcı Kutu içerir.
- Çok ölçekli nesne algılamayı kapsar.
- Örnekler, uzmanlar tarafından rastgele (8 d.o.f.) dörtgen kullanılarak, farklı ölçek, yön ve şekillerdeki nesneler yakalanarak notlandırılır.
Veri Kümesi Sürümleri
DOTA-v1.0
- 15 ortak kategori içerir.
- 188.282 örnek ile 2.806 görüntüden oluşmaktadır.
- Bölünmüş oranlar: Eğitim için 1/2, doğrulama için 1/6 ve test için 1/3.
DOTA-v1.5
- DOTA-v1.0 ile aynı görüntüleri içerir.
- Çok küçük örneklere de (10 pikselden az) açıklama eklenmiştir.
- Yeni bir kategori eklenmesi: "konteyner vinci".
- Toplam 403.318 örnek.
- Hava Görüntülerinde Nesne Algılama konulu DOAI Challenge 2019 için yayınlandı.
DOTA-v2.0
- Google Earth, GF-2 Uydu ve diğer hava görüntülerinden koleksiyonlar.
- 18 ortak kategori içerir.
- Tam 1.793.658 örnekle 11.268 görüntüden oluşmaktadır.
- Yeni kategoriler tanıtıldı: "havaalanı" ve "helikopter pisti".
- Görüntü bölünüyor:
- Eğitim: 268.627 örnek ile 1.830 görüntü.
- Doğrulama: 81.048 örnek ile 593 görüntü.
- Test-dev: 353.346 örnek ile 2.792 görüntü.
- Test mücadelesi: 1.090.637 örnek ile 6.053 görüntü.
Veri Kümesi Yapısı
DOTA, OBB nesne algılama zorlukları için özel olarak tasarlanmış yapılandırılmış bir düzen sergiler:
- Görüntüler: Çeşitli arazileri ve yapıları yakalayan yüksek çözünürlüklü hava görüntülerinden oluşan geniş bir koleksiyon.
- Yönlendirilmiş Sınırlayıcı Kutular: Uçak, gemi ve bina gibi nesneleri yakalamak için ideal olan, yönlerine bakılmaksızın nesneleri kapsayan döndürülmüş dikdörtgenler biçimindeki ek açıklamalar.
Uygulamalar
DOTA, havadan görüntü analizi için özel olarak tasarlanmış modelleri eğitmek ve değerlendirmek için bir ölçüt görevi görür. OBB ek açıklamalarının dahil edilmesiyle, hava görüntülerinin nüanslarına hitap eden özel nesne algılama modellerinin geliştirilmesine olanak tanıyan benzersiz bir zorluk sağlar.
Veri Kümesi YAML
Tipik olarak veri kümeleri, veri kümesinin yapılandırmasını detaylandıran bir YAML (Yet Another Markup Language) dosyası içerir. DOTA v1 ve DOTA v1.5 için Ultralytics şunları sağlar DOTAv1.yaml
ve DOTAv1.5.yaml
dosyaları. Bunlar ve DOTA v2 hakkında daha fazla ayrıntı için lütfen DOTA'nın resmi deposuna ve belgelerine bakın.
DOTAv1.yaml
# Ultralytics YOLO 🚀, AGPL-3.0 license
# DOTA 1.0 dataset https://captain-whu.github.io/DOTA/index.html for object detection in aerial images by Wuhan University
# Documentation: https://docs.ultralytics.com/datasets/obb/dota-v2/
# Example usage: yolo train model=yolov8n-obb.pt data=DOTAv1.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota1 ← downloads here (2GB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: ../datasets/DOTAv1 # dataset root dir
train: images/train # train images (relative to 'path') 1411 images
val: images/val # val images (relative to 'path') 458 images
test: images/test # test images (optional) 937 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/yolov5/releases/download/v1.0/DOTAv1.zip
Bölünmüş DOTA görüntüleri
DOTA veri kümesini eğitmek için, yüksek çözünürlüklü orijinal DOTA görüntülerini çok ölçekli bir şekilde 1024x1024 çözünürlüklü görüntülere ayırdık.
Bölünmüş görüntüler
from ultralytics.data.split_dota import split_trainval, split_test
# split train and val set, with labels.
split_trainval(
data_root='path/to/DOTAv1.0/',
save_dir='path/to/DOTAv1.0-split/',
rates=[0.5, 1.0, 1.5], # multiscale
gap=500
)
# split test set, without labels.
split_test(
data_root='path/to/DOTAv1.0/',
save_dir='path/to/DOTAv1.0-split/',
rates=[0.5, 1.0, 1.5], # multiscale
gap=500
)
Kullanım
DOTA v1 veri kümesi üzerinde bir modeli eğitmek için aşağıdaki kod parçacıklarını kullanabilirsiniz. Kullanılabilir argümanların kapsamlı bir listesi için her zaman modelinizin belgelerine bakın.
Uyarı
DOTAv1 veri setindeki tüm görüntülerin ve ilgili açıklamaların akademik amaçlarla kullanılabileceğini, ancak ticari kullanımın yasak olduğunu lütfen unutmayın. Veri setinin yaratıcılarının isteklerine göstereceğiniz anlayış ve saygı büyük takdir toplayacaktır!
Tren Örneği
Örnek Veriler ve Açıklamalar
Veri setine bir göz atmak, derinliğini göstermektedir:
- DOTA örnekleri: Bu anlık görüntü, hava sahnelerinin karmaşıklığının ve nesneleri doğal yönlerinde yakalayan Yönlendirilmiş Sınırlayıcı Kutu açıklamalarının öneminin altını çizmektedir.
Veri setinin zenginliği, hava görüntülerine özel nesne algılama zorlukları hakkında paha biçilmez bilgiler sunuyor.
Atıflar ve Teşekkür
Çalışmalarında DOTA'dan yararlananlar için ilgili araştırma makalelerine atıfta bulunmak yerinde olacaktır:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}
DOTA veri setlerinin arkasındaki ekibe, bu veri setinin küratörlüğünde gösterdikleri övgüye değer çaba için özel bir teşekkür notu. Veri setini ve nüanslarını kapsamlı bir şekilde anlamak için lütfen resmi DOTA web sitesini ziyaret edin.