مجموعة بيانات DOTA128
مقدمة
Ultralytics DOTA128 هي مجموعة بيانات كائنات موجهة صغيرة ومتعددة الاستخدامات object detection تتكون من 128 صورة من مجموعة DOTAv1، منها 128 للتدريب والتحقق. تعد مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج الصناديق المحيطة الموجهة (OBB)، أو لتجربة مناهج كشف جديدة. بفضل احتوائها على 128 صورة، فهي صغيرة بما يكفي لتكون قابلة للإدارة بسهولة، ومع ذلك فهي متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن الأخطاء والعمل كفحص سلامة قبل تدريب مجموعات بيانات أكبر.
هيكل مجموعة البيانات
- الصور: 128 بلاطة جوية (جميعها في مجلد train، وتستخدم لكل من train و val) مصدرها DOTAv1.
- الفئات: ترث فئات DOTAv1 الخمس عشرة مثل الطائرة، والسفينة، والمركبة الكبيرة.
- التصنيفات: صناديق محيطة موجهة بتنسيق YOLO محفوظة كـ
.txtملفات بجوار كل صورة.
هذه المجموعة من البيانات مخصصة للاستخدام مع Ultralytics Platform و YOLO26.
YAML الخاصة بمجموعة البيانات
يتم استخدام ملف YAML (Yet Another Markup Language) لتعريف تكوين مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، وغيرها من المعلومات ذات الصلة. في حالة مجموعة بيانات DOTA128، فإن dota128.yaml في https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.
# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license
# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128/
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
# └── dota128 ← downloads here (34 MB)
# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images
# Classes for DOTA 1.0
names:
0: plane
1: ship
2: storage tank
3: baseball diamond
4: tennis court
5: basketball court
6: ground track field
7: harbor
8: bridge
9: large vehicle
10: small vehicle
11: helicopter
12: roundabout
13: soccer ball field
14: swimming pool
# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zipالاستخدام
لتدريب نموذج YOLO26n-obb على مجموعة بيانات DOTA128 لمدة 100 عصور (epochs) بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسائط المتاحة، راجع التدريب.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)صور وشروحات توضيحية عينة
فيما يلي بعض الأمثلة لصور من مجموعة بيانات DOTA128، إلى جانب التعليقات التوضيحية المقابلة لها:
- صورة مجمعة (Mosaiced): توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات مجمعة بنظام الموزاييك (Mosaic). الموزاييك هو تقنية مستخدمة أثناء التدريب تقوم بدمج صور متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام كائنات ونسب عرض إلى ارتفاع وسياقات مختلفة.
يوضح المثال تنوع وتعقيد الصور في مجموعة بيانات DOTA128 وفوائد استخدام الفسيفساء (mosaicing) أثناء عملية التدريب.
الاقتباسات والتقديرات
إذا كنت تستخدم مجموعة بيانات DOTA في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية التالية:
@article{9560031,
author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
year={2021},
volume={},
number={},
pages={1-1},
doi={10.1109/TPAMI.2021.3117983}
}ملاحظة خاصة من الامتنان للفريق الذي يقف وراء مجموعات بيانات DOTA لجهودهم الجديرة بالثناء في تنظيم مجموعة البيانات هذه. للحصول على فهم شامل لمجموعة البيانات وفروقها الدقيقة، يرجى زيارة موقع DOTA الرسمي.
الأسئلة الشائعة
ما هي مجموعة بيانات DOTA128 وكيف يمكن استخدامها؟
مجموعة بيانات DOTA128 هي مجموعة بيانات كشف كائنات موجهة متعددة الاستخدامات تتكون من 128 صورة من مجموعة DOTAv1، مخزنة جميعاً في مجلد train. يستخدم كل من التدريب والتحقق نفس مجموعة الصور، مما يجعلها مثالية لسير عمل الاختبار والتصحيح السريع. إنها مثالية لاختبار وتصحيح نماذج OBB مثل Ultralytics YOLO26. نظراً لحجمها القابل للإدارة وتنوعها، فهي تساعد في تحديد أخطاء خط الأنابيب وإجراء فحوصات السلامة قبل نشر مجموعات بيانات أكبر. تعرف على المزيد حول كشف OBB مع Ultralytics YOLO26.
كيف أقوم بتدريب نموذج YOLO26 باستخدام مجموعة بيانات DOTA128؟
لتدريب نموذج YOLO26n-obb على مجموعة بيانات DOTA128 لمدة 100 حقبة (epoch) بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على خيارات وسيطة شاملة، راجع نموذج التدريب.
from ultralytics import YOLO
# Load a model
model = YOLO("yolo26n-obb.pt") # load a pretrained model (recommended for training)
# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)ما هي الميزات الرئيسية لمجموعة بيانات DOTA وأين يمكنني الوصول إلى ملف YAML؟
تشتهر مجموعة بيانات DOTA بمعيارها واسع النطاق والتحديات التي تقدمها لكشف الكائنات في الصور الجوية. توفر مجموعة DOTA128 الفرعية تنوعاً أكبر من DOTA8 مع بقائها قابلة للإدارة للاختبارات الأولية. يمكنك الوصول إلى dota128.yaml ملف، الذي يحتوي على المسارات والفئات وتفاصيل التكوين، على هذا رابط GitHub.
كيف تقارن DOTA128 بمتغيرات مجموعة بيانات DOTA الأخرى؟
تقع DOTA128 (128 صورة) بين DOTA8 (8 صور) ومجموعة بيانات DOTA-v1 مجموعة بيانات (1,869 صورة) من حيث الحجم:
- DOTA8: تحتوي على 8 صور فقط (4 تدريب، 4 تحقق) - مثالية للاختبارات السريعة وتصحيح الأخطاء
- DOTA128: تحتوي على 128 صورة (جميعها في مجلد train، وتستخدم لكل من train و val) - متوازنة بين الحجم والتنوع
- Full DOTA-v1: تحتوي على 1,869 صورة - شاملة ولكنها تستهلك موارد مكثفة
توفر DOTA128 أرضية وسطى جيدة، حيث توفر تنوعاً أكبر من DOTA8 مع بقائها أكثر قابلية للإدارة بكثير من مجموعة بيانات DOTA الكاملة للتجريب والتطوير الأولي للنماذج.
كيف تعمل الفسيفساء (mosaicing) على تعزيز تدريب النماذج باستخدام مجموعة بيانات DOTA128؟
تجمع الفسيفساء (mosaicing) بين صور متعددة في صورة واحدة أثناء التدريب، مما يزيد من تنوع الكائنات والسياقات داخل كل دفعة (batch). وهذا يحسن قدرة النموذج على التعميم على أحجام كائنات ونسب عرض إلى ارتفاع ومشاهد مختلفة. يمكن توضيح هذه التقنية بصرياً من خلال دفعة تدريب مكونة من صور DOTA128 المفسفسة، مما يساعد في تطوير نموذج قوي. استكشف المزيد حول تقنيات الفسيفساء والتدريب على التدريب.
لماذا يجب أن أستخدم Ultralytics YOLO26 لمهام كشف الكائنات الموجهة؟
يوفر Ultralytics YOLO26 قدرات كشف كائنات فورية متطورة، بما في ذلك ميزات مثل الصناديق المحيطة الموجهة (OBB)، تجزئة المثيلات (instance segmentation)، وخط أنابيب تدريب متعدد الاستخدامات للغاية. إنه مناسب لتطبيقات مختلفة ويوفر نماذج مدربة مسبقاً لضبط دقيق وفعال. استكشف المزيد حول المزايا والاستخدام في وثائق Ultralytics YOLO26.