Roboflow 100 مجموعة بيانات

Q: What is the Roboflow 100 dataset, and why is it significant for object detection?

مجموعة بيانات Roboflow 100 هي معيار لنماذج اكتشاف الأجسام. وهي تتألف من 100 مجموعة بيانات متنوعة مصدرها Roboflow Universe، وتغطي مجالات مثل الرعاية الصحية والصور الجوية وألعاب الفيديو. تكمن أهميتها في توفير طريقة موحدة لاختبار قدرة النموذج على التكيف والمتانة عبر مجموعة واسعة من سيناريوهات العالم الحقيقي، متجاوزةً بذلك المعايير التقليدية التي غالباً ما تكون محدودة المجال.

Q: Which domains are covered by the Roboflow 100 dataset?

تمتد مجموعة بيانات Roboflow 100 على سبعة مجالات متنوعة، مما يوفر تحديات فريدة لنماذج اكتشاف الأجسام: هذا التنوع يجعل من RF100 مورداً ممتازاً لتقييم قابلية تعميم نماذج الرؤية الحاسوبية.

Roboflow 100، برعاية Intelهي مجموعة بيانات معيارية رائدة للكشف عن الأجسام. يتضمن 100 مجموعة بيانات متنوعة تم أخذ عينات منها من أكثر من 90,000 مجموعة بيانات عامة متاحة على Roboflow Universe. صُمم هذا المعيار خصيصاً لاختبار قدرة نماذج الرؤية الحاسوبية، مثل نماذجUltralytics YOLO على التكيف مع مختلف المجالات، بما في ذلك الرعاية الصحية والصور الجوية وألعاب الفيديو.

الترخيص

تقدم Ultralytics خيارين للترخيص لاستيعاب حالات الاستخدام المختلفة:

رخصةAGPL-3.0 : تعتبر هذه الرخصة مفتوحة المصدر المعتمدة من OSI مثالية للطلاب والمتحمسين، حيث تعزز التعاون المفتوح ومشاركة المعرفة. راجع ملف LICENSE لمزيد من التفاصيل وزيارة صفحة ترخيصAGPL-3.0
ترخيص المؤسسة: صُمم هذا الترخيص للاستخدام التجاري، ويسمح هذا الترخيص بالتكامل السلس لبرامج Ultralytics ونماذج الذكاء الاصطناعي في المنتجات والخدمات التجارية. إذا كان السيناريو الخاص بك يتضمن تطبيقات تجارية، يُرجى التواصل عبر ترخيصUltralytics .

Roboflow 100 نظرة عامة

الميزات الرئيسية

مجالات متنوعة: يتضمن 100 مجموعة بيانات عبر سبعة مجالات متميزة: المجال الجوي، وألعاب الفيديو، والألعاب الإلكترونية، والميكروسكوبية، وتحت الماء، والوثائق، والكهرومغناطيسية، والعالم الحقيقي.
المقياس: يشتمل المقياس على 224,714 صورة في 805 فئات، وهو ما يمثل أكثر من 11,170 ساعة من جهد تصنيف البيانات.
التوحيد القياسي: تتم معالجة جميع الصور مسبقًا وتغيير حجمها إلى 640 × 640 بكسل لإجراء تقييم متسق.
تقييم نظيف: يركز على التخلص من غموض الفئات وتصفية الفئات ناقصة التمثيل لضمان تقييم أنظف للنموذج.
التعليقات التوضيحية: تتضمن المربعات المحدودة للأجسام، وهي مناسبة لتدريب وتقييم نماذج اكتشاف الأجسام باستخدام مقاييس مثل mAP.

هيكلية مجموعة البيانات

تم تنظيم مجموعة بيانات Roboflow 100 في سبع فئات، تحتوي كل منها على مجموعة فريدة من مجموعات البيانات والصور والفئات:

جوي: 7 مجموعات بيانات، 9,683 صورة، 24 فئة.
ألعاب الفيديو: 7 مجموعات بيانات، 11,579 صورة، 88 فئة.
مجهري: 11 مجموعة بيانات، 13,378 صورة، 28 فئة.
تحت الماء: 5 مجموعات بيانات، 18,003 صورة، 39 فئة.
المستندات: 8 مجموعات بيانات، 24,813 صورة، 90 فئة.
الكهرومغناطيسية: 12 مجموعة بيانات، 36,381 صورة، 41 فئة.
العالم الحقيقي: 50 مجموعة بيانات، 110,615 صورة، 495 فئة.

يوفر هذا الهيكل أرضية اختبار متنوعة وشاملة لنماذج الكشف عن الكائنات، مما يعكس مجموعة واسعة من سيناريوهات التطبيقات الواقعية الموجودة في مختلف حلولUltralytics .

المقارنة المعيارية

يتضمن القياس المعياري لمجموعة البيانات تقييم أداء نماذج التعلم الآلي على مجموعات بيانات محددة باستخدام مقاييس موحدة. تتضمن المقاييس الشائعة الدقة ومتوسط متوسط الدقة (mAP) ودرجة F1. يمكنك معرفة المزيد عن هذه المقاييس في دليل مقاييس أداءYOLO .

نتائج المقارنة المعيارية

سيتم تخزين نتائج المقارنة المعيارية باستخدام البرنامج النصي المقدم في ultralytics-benchmarks/ الدليل، وتحديدًا في evaluation.txt.

مثال للمقارنة المعيارية

يوضّح النص البرمجي التالي كيفية إجراء قياس برمجي لنموذج Ultralytics YOLO (على سبيل المثال، YOLOv11n) على جميع مجموعات البيانات المائة ضمن معيار Roboflow 100 باستخدام RF100Benchmark الفصل.

Python

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolo11s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

التطبيقات

يُعد Roboflow 100 معيارًا لا يُقدّر بثمن لمختلف التطبيقات المتعلقة بالرؤية الحاسوبية والتعلم العميق. يمكن للباحثين والمهندسين الاستفادة من هذا المعيار في:

تقييم أداء نماذج اكتشاف الأجسام في سياق متعدد المجالات.
اختبار قدرة النماذج ومتانتها على التكيف مع سيناريوهات العالم الحقيقي بما يتجاوز مجموعات البيانات المعيارية الشائعة مثل COCO أو PASCAL VOC.
قم بمقارنة قدرات نماذج اكتشاف الأجسام عبر مجموعات بيانات متنوعة، بما في ذلك مجالات متخصصة مثل الرعاية الصحية والصور الجوية وألعاب الفيديو.
قارن أداء النموذج عبر مختلف بنيات الشبكات العصبية وتقنيات التحسين.
تحديد التحديات الخاصة بالمجال المحدد التي قد تتطلب نصائح متخصصة في تدريب النماذج أو أساليب الضبط الدقيق مثل التعلم التحويلي.

للحصول على المزيد من الأفكار والإلهام حول التطبيقات الواقعية، استكشف أدلةنا حول المشاريع العملية أو اطلع على Ultralytics HUB للتدريب على النماذج المبسطة ونشرها.

الاستخدام

مجموعة بيانات Roboflow 100، بما في ذلك البيانات الوصفية وروابط التنزيل، متاحة على الموقع الرسمي مستودع GitHub Roboflow 100 GitHub. يمكنك الوصول إلى مجموعة البيانات والاستفادة منها مباشرةً من هناك لتلبية احتياجاتك في قياس الأداء. Ultralytics RF100Benchmark تعمل الأداة المساعدة على تبسيط عملية تنزيل مجموعات البيانات هذه وإعدادها للاستخدام مع نماذج Ultralytics .

عينة من البيانات والشروح

يتكون Roboflow 100 من مجموعات بيانات تحتوي على صور متنوعة تم التقاطها من زوايا ومجالات مختلفة. فيما يلي أمثلة على الصور المشروحة المضمنة في معيار RF100، والتي تعرض مجموعة متنوعة من الأشياء والمشاهد. يمكن لتقنيات مثل زيادة البيانات تعزيز التنوع أثناء التدريب.

عينة من البيانات والشروح

يمثل التنوع الذي نراه في معيار Roboflow 100 تقدمًا كبيرًا عن المعايير التقليدية، والتي غالبًا ما تركز على تحسين مقياس واحد ضمن مجال محدود. يساعد هذا النهج الشامل في تطوير نماذج رؤية حاسوبية أكثر قوة وتنوعاً قادرة على الأداء الجيد في العديد من السيناريوهات المختلفة.

الاستشهادات والشكر والتقدير

إذا كنت تستخدم مجموعة بيانات Roboflow 100 في عملك البحثي أو التطويري، يُرجى الاستشهاد بالورقة البحثية الأصلية:

BibTeX

@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

نعرب عن امتناننا لفريق Roboflow وجميع المساهمين لجهودهم الكبيرة في إنشاء مجموعة بيانات Roboflow 100 والحفاظ عليها كمصدر قيم لمجتمع الرؤية الحاسوبية.

إذا كنت مهتمًا باستكشاف المزيد من مجموعات البيانات لتعزيز مشاريعك في اكتشاف الأجسام والتعلم الآلي، فلا تتردد في زيارة مجموعة البيانات الشاملة لدينا، والتي تتضمن مجموعة متنوعة من مجموعات بيانات الاكتشاف الأخرى.

الأسئلة الشائعة

ما هي مجموعة البيانات Roboflow 100، ولماذا هي مهمة لاكتشاف الأجسام؟

مجموعة بيانات Roboflow 100 هي معيار لنماذج اكتشاف الأجسام. وهي تتألف من 100 مجموعة بيانات متنوعة مصدرها Roboflow Universe، وتغطي مجالات مثل الرعاية الصحية والصور الجوية وألعاب الفيديو. تكمن أهميتها في توفير طريقة موحدة لاختبار قدرة النموذج على التكيف والمتانة عبر مجموعة واسعة من سيناريوهات العالم الحقيقي، متجاوزةً بذلك المعايير التقليدية التي غالباً ما تكون محدودة المجال.

ما هي المجالات التي تغطيها مجموعة البيانات Roboflow 100؟

تمتد مجموعة بيانات Roboflow 100 على سبعة نطاقات متنوعة، مما يطرح تحديات فريدة لنماذج اكتشاف الأجسام:

من الجو: 7 مجموعات بيانات (على سبيل المثال، صور الأقمار الصناعية، مناظر من طائرة بدون طيار).
ألعاب الفيديو: 7 مجموعات بيانات (على سبيل المثال، كائنات من بيئات ألعاب مختلفة).
مجهري: 11 مجموعة بيانات (مثل الخلايا والجسيمات).
تحت الماء: 5 مجموعات بيانات (مثل الحياة البحرية والأجسام المغمورة).
المستندات: 8 مجموعات بيانات (مثل مناطق النصوص وعناصر النماذج).
الكهرومغناطيسية: 12 مجموعة بيانات (على سبيل المثال، البصمات الرادارية، وتصورات البيانات الطيفية).
العالم الحقيقي: 50 مجموعة بيانات (فئة واسعة تشمل الأشياء اليومية، والمشاهد، وتجارة التجزئة، وما إلى ذلك).

هذا التنوع يجعل من RF100 مورداً ممتازاً لتقييم قابلية تعميم نماذج الرؤية الحاسوبية.

ما الذي يجب أن أدرجه عند الاستشهاد بمجموعة البيانات Roboflow 100 في بحثي؟

عند استخدام مجموعة بيانات Roboflow 100، يُرجى الاستشهاد بالورقة البحثية الأصلية لإعطاء الفضل لمنشئيها. هنا هو الاقتباس الموصى به من BibTeX:

BibTeX

@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

لمزيد من الاستكشاف، يمكنك زيارة مجموعة بياناتنا الشاملة أو تصفح مجموعات بيانات الكشف الأخرى المتوافقة مع نماذج Ultralytics .

📅 تم إنشاؤها منذ 1 سنة مضت ✏️ تم التحديث منذ 20 يومًا

Roboflow 100 مجموعة بيانات

الميزات الرئيسية

هيكلية مجموعة البيانات

المقارنة المعيارية

التطبيقات

الاستخدام

عينة من البيانات والشروح

الاستشهادات والشكر والتقدير

الأسئلة الشائعة

ما هي مجموعة البيانات Roboflow 100، ولماذا هي مهمة لاكتشاف الأجسام؟

ما هي المجالات التي تغطيها مجموعة البيانات Roboflow 100؟

ما الذي يجب أن أدرجه عند الاستشهاد بمجموعة البيانات Roboflow 100 في بحثي؟

التعليقات