انتقل إلى المحتوى

Roboflow 100 مجموعة بيانات

Roboflow 100 ، تم تطويره بواسطة Roboflow وبرعاية إنتل ، هو معيار رائد للكشف عن الكائنات . ويشمل 100 مجموعة بيانات متنوعة تم أخذ عينات منها من أكثر من 90000 مجموعة بيانات عامة. تم تصميم هذا المعيار لاختبار قدرة النماذج على التكيف مع مختلف المجالات ، بما في ذلك الرعاية الصحية والصور الجوية وألعاب الفيديو.

Roboflow 100 نظرة عامة

الميزات الرئيسية

  • يتضمن 100 مجموعة بيانات عبر سبعة مجالات: الجوية ، وألعاب الفيديو ، والمجهرية ، وتحت الماء ، والمستندات ، والكهرومغناطيسية ، والعالم الحقيقي.
  • ويضم المعيار 224,714 صورة عبر 805 فئة، وذلك بفضل أكثر من 11,170 ساعة من جهود وضع العلامات.
  • يتم تغيير حجم جميع الصور إلى 640 × 640 بكسل ، مع التركيز على إزالة غموض الفصل وتصفية الفئات الممثلة تمثيلا ناقصا.
  • تتضمن التعليقات التوضيحية مربعات محيطة للكائنات ، مما يجعلها مناسبة للتدريب وتقييم نماذج اكتشاف الكائنات.

هيكل مجموعة البيانات

ال Roboflow يتم تنظيم 100 مجموعة بيانات في سبع فئات ، لكل منها مجموعة مميزة من مجموعات البيانات والصور والفئات:

  • جوي: يتكون من 7 مجموعات بيانات بإجمالي 9683 صورة ، تغطي 24 فئة متميزة.
  • ألعاب الفيديو: تتضمن 7 مجموعات بيانات تضم 11,579 صورة عبر 88 فئة.
  • المجهري: يضم 11 مجموعة بيانات مع 13378 صورة ، تغطي 28 فئة.
  • تحت الماء: يحتوي على 5 مجموعات بيانات ، تشمل 18003 صورة في 39 فئة.
  • المستندات: تتكون من 8 مجموعات بيانات تحتوي على 24813 صورة مقسمة إلى 90 فئة.
  • الكهرومغناطيسية: تتكون من 12 مجموعة بيانات ، بإجمالي 36381 صورة في 41 فئة.
  • العالم الحقيقي: أكبر فئة تضم 50 مجموعة بيانات ، وتقدم 110,615 صورة عبر 495 فئة.

يتيح هذا الهيكل أرضية اختبار متنوعة وواسعة النطاق لنماذج اكتشاف الأشياء ، مما يعكس سيناريوهات التطبيق في العالم الحقيقي.

قياس

تقيّم مجموعة البيانات المعيارية أداء نموذج التعلّم الآلي على مجموعات بيانات محددة باستخدام مقاييس معيارية مثل الدقة ومتوسط متوسط الدقة ودرجة F1.

قياس

سيتم تخزين نتائج المقارنة المعيارية في "ultralytics-benchmarks/evaluation.txt"

مثال للمقارنة المعيارية

from pathlib import Path
import shutil
import os
from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f'yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16')

        # Run validation and evaluate
        os.system(f'yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1')
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

التطبيقات

Roboflow 100 لا تقدر بثمن لمختلف التطبيقات المتعلقة برؤية الكمبيوتر والتعلم العميق. يمكن للباحثين والمهندسين استخدام هذا المعيار من أجل:

  • تقييم أداء نماذج الكشف عن الكائنات في سياق متعدد المجالات.
  • اختبر قدرة النماذج على التكيف مع سيناريوهات العالم الحقيقي بما يتجاوز التعرف على الأشياء الشائعة.
  • قم بقياس قدرات نماذج اكتشاف الكائنات عبر مجموعات البيانات المتنوعة ، بما في ذلك تلك الموجودة في مجال الرعاية الصحية والصور الجوية وألعاب الفيديو.

لمزيد من الأفكار والإلهام حول تطبيقات العالم الحقيقي ، تأكد من مراجعة أدلةنا حول مشاريع العالم الحقيقي.

استخدام

ال Roboflow تتوفر 100 مجموعة بيانات على كل من GitHub و Roboflow الكون.

يمكنك الوصول إليه مباشرة من Roboflow 100 مستودع جيثب. بالإضافة إلى ذلك ، على Roboflow الكون ، لديك المرونة لتنزيل مجموعات البيانات الفردية بمجرد النقر فوق زر التصدير داخل كل مجموعة بيانات.

عينة من البيانات والتعليقات التوضيحية

Roboflow يتكون 100 من مجموعات بيانات تحتوي على صور ومقاطع فيديو متنوعة تم التقاطها من زوايا ومجالات مختلفة. فيما يلي نظرة على أمثلة للصور المشروحة في معيار RF100.

عينة من البيانات والتعليقات التوضيحية

التنوع في Roboflow 100 معيار يمكن رؤيته أعلاه هو تقدم كبير من المعايير التقليدية التي غالبا ما تركز على تحسين مقياس واحد ضمن مجال محدود.

الاستشهادات والشكر

إذا كنت تستخدم Roboflow 100 مجموعة بيانات في أعمال البحث أو التطوير الخاصة بك ، يرجى الاستشهاد بالورقة التالية:

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

نتوجه بالشكر إلى Roboflow الفريق وجميع المساهمين لعملهم الشاق في إنشاء واستدامة Roboflow 100 مجموعة بيانات.

إذا كنت مهتما باستكشاف المزيد من مجموعات البيانات لتحسين مشاريع اكتشاف الكائنات والتعلم الآلي ، فلا تتردد في زيارة مجموعة البيانات الشاملة الخاصة بنا.



تم الإنشاء 2024-02-07، تم التحديث 2024-04-29
المؤلفون: رضوان مناور (2)، جلين-جوتشر (1)، أبيرامي-فينا (1)

التعليقات