مجموعة بيانات DOTA128#

Name: مجموعة بيانات DOTA128 OBB
Creator: Ultralytics
License: https://captain-whu.github.io/DOTA/dataset.html
Keywords: مجموعة بيانات DOTA128, Ultralytics, YOLO26, اكتشاف الكائنات, تصحيح الأخطاء, تدريب النماذج, الكشف الموجه عن الأجسام, YAML مجموعة البيانات

مقدمة#

تعد مجموعة بيانات DOTA128 من Ultralytics مجموعة بيانات صغيرة ومتعددة الاستخدامات لـ اكتشاف الكائنات الموجه، وتتكون من 128 صورة من مجموعة DOTAv1، وهي مخصصة للتدريب والتحقق. تعد مجموعة البيانات هذه مثالية لاختبار وتصحيح نماذج الصناديق المحيطة الموجهة (OBB)، أو لتجربة مناهج اكتشاف جديدة. وبفضل احتوائها على 128 صورة، فهي صغيرة بما يكفي لتكون سهلة الإدارة، ومع ذلك فهي متنوعة بما يكفي لاختبار خطوط أنابيب التدريب بحثاً عن الأخطاء والعمل كفحص أولي قبل تدريب مجموعات بيانات أكبر.

هيكل مجموعة البيانات#

الصور: 128 بلاطة جوية (كلها في مجلد التدريب، وتستخدم لكل من التدريب والتحقق) مصدرها DOTAv1.
الفئات: ترث 15 فئة من DOTAv1 مثل الطائرة والسفينة والمركبات الكبيرة.
التصنيفات: صناديق إحاطة موجهة بتنسيق YOLO محفوظة كملفات .txt بجانب كل صورة.
تنزيل: 34 ميجابايت، يتم جلبها تلقائيًا من أصول Ultralytics GitHub في المرة الأولى التي تقوم فيها بالتدريب.

مجموعة البيانات هذه مخصصة للاستخدام مع Ultralytics Platform و YOLO26.

YAML مجموعة البيانات#

يُستخدم ملف YAML لتحديد تهيئة مجموعة البيانات. وهو يحتوي على معلومات حول مسارات مجموعة البيانات، والفئات، وغيرها من المعلومات ذات الصلة. في حالة مجموعة بيانات DOTA128، يتم الاحتفاظ بملف dota128.yaml على الرابط https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/dota128.yaml.

ultralytics/cfg/datasets/dota128.yaml

# Ultralytics 🚀 AGPL-3.0 License - https://ultralytics.com/license

# DOTA128 dataset (128 images from the DOTAv1 split) by Ultralytics
# Documentation: https://docs.ultralytics.com/datasets/obb/dota128
# Example usage: yolo train model=yolo26n-obb.pt data=dota128.yaml
# parent
# ├── ultralytics
# └── datasets
#     └── dota128 ← downloads here (34 MB)

# Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..]
path: dota128 # dataset root dir
train: images/train # train images (relative to 'path') 128 images
val: images/train # val images (relative to 'path') 128 images

# Classes for DOTA 1.0
names:
  0: plane
  1: ship
  2: storage tank
  3: baseball diamond
  4: tennis court
  5: basketball court
  6: ground track field
  7: harbor
  8: bridge
  9: large vehicle
  10: small vehicle
  11: helicopter
  12: roundabout
  13: soccer ball field
  14: swimming pool

# Download script/URL (optional)
download: https://github.com/ultralytics/assets/releases/download/v0.0.0/dota128.zip

الاستخدام#

لتدريب نموذج YOLO26n-obb على مجموعة بيانات DOTA128 لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على قائمة شاملة بالوسيطات المتاحة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

صور وشروحات توضيحية عينة#

فيما يلي بعض الأمثلة للصور من مجموعة بيانات DOTA128، إلى جانب التعليقات التوضيحية المقابلة لها:

DOTA128 oriented bounding box dataset training mosaic

صورة مجمعة (Mosaiced Image): توضح هذه الصورة دفعة تدريب تتكون من صور مجموعة بيانات مجمعة. الفسيفساء (Mosaicing) هي تقنية تُستخدم أثناء التدريب تدمج صورًا متعددة في صورة واحدة لزيادة تنوع الكائنات والمشاهد داخل كل دفعة تدريب. يساعد هذا في تحسين قدرة النموذج على التعميم على أحجام كائنات ونسب عرض إلى ارتفاع وسياقات مختلفة.

يعرض المثال تنوع وتعقيد الصور في مجموعة بيانات DOTA128 وفوائد استخدام الفسيفساء (mosaicing) أثناء عملية التدريب.

الاقتباسات والشكر#

إذا كنت تستخدم مجموعة بيانات DOTA في بحثك أو عملك التطويري، يرجى الاستشهاد بالورقة البحثية التالية:

اقتباس

@article{9560031,
  author={Ding, Jian and Xue, Nan and Xia, Gui-Song and Bai, Xiang and Yang, Wen and Yang, Michael and Belongie, Serge and Luo, Jiebo and Datcu, Mihai and Pelillo, Marcello and Zhang, Liangpei},
  journal={IEEE Transactions on Pattern Analysis and Machine Intelligence},
  title={Object Detection in Aerial Images: A Large-Scale Benchmark and Challenges},
  year={2022},
  volume={44},
  number={11},
  pages={7778-7796},
  doi={10.1109/TPAMI.2021.3117983}
}

شكر خاص للفريق الذي يقف وراء مجموعات بيانات DOTA على جهودهم الجديرة بالثناء في تنظيم هذه المجموعة. للحصول على فهم شامل لمجموعة البيانات وفروقها الدقيقة، يرجى زيارة موقع DOTA الرسمي.

الأسئلة الشائعة#

ما هي مجموعة بيانات DOTA128 وكيف يمكن استخدامها؟#

مجموعة بيانات DOTA128 هي مجموعة بيانات متنوعة لاكتشاف الكائنات الموجهة تتكون من 128 صورة من مجموعة DOTAv1، وجميعها مخزنة في مجلد التدريب. يستخدم كل من التدريب والتحقق نفس مجموعة الصور، مما يجعلها مثالية لسير عمل الاختبار والتصحيح السريع. إنها مثالية لاختبار وتصحيح نماذج OBB مثل Ultralytics YOLO26. نظراً لحجمها القابل للإدارة وتنوعها، فهي تساعد في تحديد أخطاء خط أنابيب التدريب وإجراء فحوصات أولية قبل نشر مجموعات بيانات أكبر. تعرف على المزيد حول اكتشاف OBB مع Ultralytics YOLO26.

كيف يمكنني تدريب نموذج YOLO26 باستخدام مجموعة بيانات DOTA128؟#

لتدريب نموذج YOLO26n-obb على مجموعة بيانات DOTA128 لمدة 100 حقبة بحجم صورة 640، يمكنك استخدام مقتطفات الكود التالية. للحصول على خيارات وسيطات شاملة، راجع صفحة التدريب الخاصة بالنموذج.

مثال على التدريب

from ultralytics import YOLO

# Load a model
model = YOLO("yolo26n-obb.pt")  # load a pretrained model (recommended for training)

# Train the model
results = model.train(data="dota128.yaml", epochs=100, imgsz=640)

ما هي الميزات الرئيسية لمجموعة بيانات DOTA وأين يمكنني الوصول إلى ملف YAML؟#

تشتهر مجموعة بيانات DOTA بمعيارها واسع النطاق والتحديات التي تقدمها لاكتشاف الكائنات في الصور الجوية. توفر مجموعة DOTA128 الفرعية تنوعاً أكبر من DOTA8 مع بقائها قابلة للإدارة للاختبارات الأولية. يمكنك الوصول إلى ملف dota128.yaml الذي يحتوي على المسارات والفئات وتفاصيل التكوين، عبر رابط GitHub هذا.

كيف تقارن DOTA128 بمتغيرات مجموعة بيانات DOTA الأخرى؟#

تقع DOTA128 (128 صورة) بين DOTA8 (8 صور) ومجموعة بيانات DOTA-v1 الكاملة (1869 صورة) من حيث الحجم:

DOTA8: تحتوي على 8 صور فقط (4 للتدريب، 4 للتحقق) - مثالية للاختبارات السريعة والتصحيح
DOTA128: تحتوي على 128 صورة (كلها في مجلد التدريب، وتستخدم لكل من التدريب والتحقق) - متوازنة بين الحجم والتنوع
DOTA-v1 الكاملة: تحتوي على 1869 صورة - شاملة ولكنها تستهلك الكثير من الموارد

توفر DOTA128 نقطة وسط جيدة، حيث تقدم تنوعاً أكبر من DOTA8 مع بقائها أكثر قابلية للإدارة بكثير من مجموعة بيانات DOTA الكاملة للتجريب وتطوير النموذج الأولي.

كيف تعزز الفسيفساء (mosaicing) تدريب النموذج باستخدام مجموعة بيانات DOTA128؟#

تجمع الفسيفساء بين صور متعددة في صورة واحدة أثناء التدريب، مما يزيد من تنوع الكائنات والسياقات داخل كل دفعة (batch). وهذا يحسن قدرة النموذج على التعميم لأحجام كائنات ونسب عرض إلى ارتفاع ومشاهد مختلفة. يمكن توضيح هذه التقنية بصرياً من خلال دفعة تدريب تتكون من صور مجموعة بيانات DOTA128 المدمجة بالفسيفساء، مما يساعد في تطوير نموذج قوي. استكشف المزيد حول الفسيفساء وتقنيات التدريب على صفحة التدريب الخاصة بنا.

لماذا يجب أن أستخدم Ultralytics YOLO26 لمهام اكتشاف الكائنات الموجهة؟#

يوفر Ultralytics YOLO26 قدرات كشف عن الأجسام في الوقت الفعلي على أحدث مستوى، بما في ذلك ميزات مثل صناديق الإحاطة الموجهة (OBB)، وتجزئة الأجزاء، وخط أنابيب تدريب متعدد الاستخدامات للغاية. إنه مناسب لمختلف التطبيقات ويوفر نماذج مدربة مسبقاً لضبط دقيق وفعال. استكشف المزيد حول المزايا والاستخدام في وثائق Ultralytics YOLO26.

المساهمون

GLglenn-jocher² RAraimbekovm² LALaughing-q¹

تم الإنشاء قبل 4 أشهرتم التحديث قبل أسبوعين