انتقل إلى المحتوى

Roboflow 100 مجموعة بيانات

Roboflow 100، الذي طورته Roboflow برعاية Intel ، وهو معيار رائد للكشف عن الأجسام. يتضمن 100 مجموعة بيانات متنوعة تم أخذ عينات منها من أكثر من 90,000 مجموعة بيانات عامة. تم تصميم هذا المعيار لاختبار قدرة النماذج على التكيف مع مختلف المجالات، بما في ذلك الرعاية الصحية والصور الجوية وألعاب الفيديو.

Roboflow 100 نظرة عامة

الميزات الرئيسية

  • يتضمن 100 مجموعة بيانات عبر سبعة مجالات: الجوية ، وألعاب الفيديو ، والمجهرية ، وتحت الماء ، والمستندات ، والكهرومغناطيسية ، والعالم الحقيقي.
  • ويضم المعيار 224,714 صورة عبر 805 فئة، وذلك بفضل أكثر من 11,170 ساعة من جهود وضع العلامات.
  • يتم تغيير حجم جميع الصور إلى 640 × 640 بكسل ، مع التركيز على إزالة غموض الفصل وتصفية الفئات الممثلة تمثيلا ناقصا.
  • تتضمن التعليقات التوضيحية مربعات محيطة للكائنات ، مما يجعلها مناسبة للتدريب وتقييم نماذج اكتشاف الكائنات.

هيكل مجموعة البيانات

ال Roboflow يتم تنظيم 100 مجموعة بيانات في سبع فئات ، لكل منها مجموعة مميزة من مجموعات البيانات والصور والفئات:

  • جوي: يتكون من 7 مجموعات بيانات بإجمالي 9683 صورة ، تغطي 24 فئة متميزة.
  • ألعاب الفيديو: تتضمن 7 مجموعات بيانات تضم 11,579 صورة عبر 88 فئة.
  • المجهري: يضم 11 مجموعة بيانات مع 13378 صورة ، تغطي 28 فئة.
  • تحت الماء: يحتوي على 5 مجموعات بيانات ، تشمل 18003 صورة في 39 فئة.
  • المستندات: تتكون من 8 مجموعات بيانات تحتوي على 24813 صورة مقسمة إلى 90 فئة.
  • الكهرومغناطيسية: تتكون من 12 مجموعة بيانات ، بإجمالي 36381 صورة في 41 فئة.
  • العالم الحقيقي: أكبر فئة تضم 50 مجموعة بيانات ، وتقدم 110,615 صورة عبر 495 فئة.

يتيح هذا الهيكل أرضية اختبار متنوعة وواسعة النطاق لنماذج اكتشاف الأشياء ، مما يعكس سيناريوهات التطبيق في العالم الحقيقي.

قياس

تقيّم مجموعة البيانات المعيارية أداء نموذج التعلّم الآلي على مجموعات بيانات محددة باستخدام مقاييس معيارية مثل الدقة ومتوسط متوسط الدقة ودرجة F1.

قياس

سيتم تخزين نتائج المقارنة المعيارية في "ultralytics-benchmarks/evaluation.txt"

مثال للمقارنة المعيارية

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

التطبيقات

Roboflow 100 لا تقدر بثمن لمختلف التطبيقات المتعلقة برؤية الكمبيوتر والتعلم العميق. يمكن للباحثين والمهندسين استخدام هذا المعيار من أجل:

  • تقييم أداء نماذج الكشف عن الكائنات في سياق متعدد المجالات.
  • اختبر قدرة النماذج على التكيف مع سيناريوهات العالم الحقيقي بما يتجاوز التعرف على الأشياء الشائعة.
  • قم بقياس قدرات نماذج اكتشاف الكائنات عبر مجموعات البيانات المتنوعة ، بما في ذلك تلك الموجودة في مجال الرعاية الصحية والصور الجوية وألعاب الفيديو.

لمزيد من الأفكار والإلهام حول تطبيقات العالم الحقيقي ، تأكد من مراجعة أدلةنا حول مشاريع العالم الحقيقي.

استخدام

ال Roboflow تتوفر 100 مجموعة بيانات على كل من GitHub و Roboflow الكون.

يمكنك الوصول إليه مباشرة من Roboflow 100 مستودع جيثب. بالإضافة إلى ذلك ، على Roboflow الكون ، لديك المرونة لتنزيل مجموعات البيانات الفردية بمجرد النقر فوق زر التصدير داخل كل مجموعة بيانات.

عينة من البيانات والتعليقات التوضيحية

Roboflow يتكون 100 من مجموعات بيانات تحتوي على صور ومقاطع فيديو متنوعة تم التقاطها من زوايا ومجالات مختلفة. فيما يلي نظرة على أمثلة للصور المشروحة في معيار RF100.

عينة من البيانات والتعليقات التوضيحية

التنوع في Roboflow 100 معيار يمكن رؤيته أعلاه هو تقدم كبير من المعايير التقليدية التي غالبا ما تركز على تحسين مقياس واحد ضمن مجال محدود.

الاستشهادات والشكر

إذا كنت تستخدم Roboflow 100 مجموعة بيانات في أعمال البحث أو التطوير الخاصة بك ، يرجى الاستشهاد بالورقة التالية:

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

نتوجه بالشكر إلى Roboflow الفريق وجميع المساهمين لعملهم الشاق في إنشاء واستدامة Roboflow 100 مجموعة بيانات.

إذا كنت مهتما باستكشاف المزيد من مجموعات البيانات لتحسين مشاريع اكتشاف الكائنات والتعلم الآلي ، فلا تتردد في زيارة مجموعة البيانات الشاملة الخاصة بنا.

الأسئلة المتداولة

ما هي مجموعة البيانات Roboflow 100، ولماذا هي مهمة لاكتشاف الأجسام؟

مجموعة البيانات Roboflow 100، التي طورتها شركة Roboflow برعاية Intel ، وهي معيار حاسم للكشف عن الأجسام. وتضم 100 مجموعة بيانات متنوعة من أكثر من 90,000 مجموعة بيانات عامة، تغطي مجالات مثل الرعاية الصحية والصور الجوية وألعاب الفيديو. ويضمن هذا التنوع قدرة النماذج على التكيف مع مختلف سيناريوهات العالم الحقيقي، مما يعزز متانتها وأدائها.

كيف يمكنني استخدام مجموعة البيانات Roboflow 100 لقياس نماذج الكشف عن الأجسام الخاصة بي؟

لاستخدام مجموعة البيانات Roboflow 100 لقياس الأداء، يمكنك تنفيذ فئة RF100Benchmark من مكتبة Ultralytics . إليك مثال موجز:

مثال للمقارنة المعيارية

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

ما هي المجالات التي تغطيها مجموعة البيانات Roboflow 100؟

تمتد مجموعة البيانات Roboflow 100 على سبعة مجالات، يوفر كل منها تحديات وتطبيقات فريدة لنماذج اكتشاف الأجسام:

  1. جوي: 7 مجموعات بيانات، 9,683 صورة، 24 فئة
  2. ألعاب الفيديو: 7 مجموعات بيانات، 11,579 صورة، 88 فئة
  3. مجهري: 11 مجموعة بيانات، 13,378 صورة، 28 فئة
  4. تحت الماء: 5 مجموعات بيانات، 18,003 صورة، 39 فئة
  5. المستندات: 8 مجموعات بيانات، 24,813 صورة، 90 فئة
  6. الكهرومغناطيسية: 12 مجموعة بيانات، 36,381 صورة، 41 فئة
  7. العالم الحقيقي: 50 مجموعة بيانات، 110,615 صورة، 495 فئة

يسمح هذا الإعداد بإجراء اختبارات مكثفة ومتنوعة للنماذج عبر تطبيقات واقعية مختلفة.

كيف يمكنني الوصول إلى مجموعة بيانات Roboflow 100 وتنزيلها؟

يمكن الوصول إلى مجموعة البيانات Roboflow 100 على GitHub و Roboflow Universe. يمكنك تنزيل مجموعة البيانات بالكامل من GitHub أو تحديد مجموعات بيانات فردية على Roboflow Universe باستخدام زر التصدير.

ما الذي يجب أن أدرجه عند الاستشهاد بمجموعة البيانات Roboflow 100 في بحثي؟

عند استخدام مجموعة البيانات Roboflow 100 في بحثك، تأكد من الاستشهاد بها بشكل صحيح. إليك الاقتباس الموصى به:

اقتباس

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

لمزيد من التفاصيل، يمكنك الرجوع إلى مجموعة البيانات الشاملة الخاصة بنا.



تم الإنشاء 2024-02-07، تم التحديث 2024-07-04
المؤلفون: جلين-جوتشر (5)، رضوان منور (2)، أبيرامي فينا (1)

التعليقات