مجموعة بيانات Roboflow 100

تُعد Roboflow 100، برعاية Intel، مجموعة بيانات مرجعية رائدة في اكتشاف الكائنات. وهي تتضمن 100 مجموعة بيانات متنوعة. صُممت هذه المجموعة المرجعية خصيصاً لاختبار مدى تكيف نماذج رؤية الحاسوب، مثل نماذج Ultralytics YOLO، مع مجالات مختلفة، بما في ذلك الرعاية الصحية، والصور الجوية، وألعاب الفيديو.

الترخيص

توفر Ultralytics خيارين للترخيص لتلبية احتياجات حالات الاستخدام المختلفة:

  • ترخيص AGPL-3.0: هذا الترخيص مفتوح المصدر المعتمد من OSI مثالي للطلاب والهواة، حيث يعزز التعاون المفتوح وتبادل المعرفة. راجع ملف LICENSE لمزيد من التفاصيل، وقم بزيارة صفحة ترخيص AGPL-3.0 الخاصة بنا.
  • ترخيص المؤسسات (Enterprise License): صُمم هذا الترخيص للاستخدام التجاري، ويسمح بالتكامل السلس لبرمجيات ونماذج ذكاء اصطناعي من Ultralytics في المنتجات والخدمات التجارية. إذا كانت حالتك تتضمن تطبيقات تجارية، يرجى التواصل عبر تراخيص Ultralytics.

Roboflow 100 diverse object detection benchmark

الميزات الرئيسية

  • مجالات متنوعة: تتضمن 100 مجموعة بيانات عبر سبعة مجالات متميزة: الجوية، وألعاب الفيديو، والمجهرية، وتحت الماء، والمستندات، والكهرومغناطيسية، والعالم الحقيقي.
  • النطاق: تضم هذه المجموعة المرجعية 224,714 صورة عبر 805 فئة، وتمثل أكثر من 11,170 ساعة من جهود تصنيف البيانات.
  • التوحيد القياسي: تتم معالجة جميع الصور مسبقاً وتغيير حجمها إلى 640x640 بكسل لضمان تقييم ثابت.
  • تقييم نظيف: يركز على القضاء على غموض الفئات وتصفية الفئات غير الممثلة بشكل كافٍ لضمان تقييم نموذج أكثر دقة.
  • التعليقات التوضيحية: تتضمن مربعات الإحاطة للكائنات، وهي مناسبة لـ تدريب وتقييم نماذج اكتشاف الكائنات باستخدام مقاييس مثل mAP.

هيكل مجموعة البيانات

يتم تنظيم مجموعة بيانات Roboflow 100 في سبع فئات، تحتوي كل منها على مجموعة فريدة من مجموعات البيانات والصور والفئات:

  • الجوية: 7 مجموعات بيانات، 9,683 صورة، 24 فئة.
  • ألعاب الفيديو: 7 مجموعات بيانات، 11,579 صورة، 88 فئة.
  • المجهرية: 11 مجموعة بيانات، 13,378 صورة، 28 فئة.
  • تحت الماء: 5 مجموعات بيانات، 18,003 صورة، 39 فئة.
  • المستندات: 8 مجموعات بيانات، 24,813 صورة، 90 فئة.
  • الكهرومغناطيسية: 12 مجموعة بيانات، 36,381 صورة، 41 فئة.
  • العالم الحقيقي: 50 مجموعة بيانات، 110,615 صورة، 495 فئة.

يوفر هذا الهيكل أرضية اختبار متنوعة وواسعة لنماذج اكتشاف الكائنات، مما يعكس مجموعة واسعة من سيناريوهات التطبيقات الواقعية الموجودة في مختلف حلول Ultralytics.

قياس الأداء (Benchmarking)

يتضمن قياس أداء مجموعات البيانات تقييم أداء نماذج تعلم الآلة على مجموعات بيانات محددة باستخدام مقاييس موحدة. تشمل المقاييس الشائعة الدقة، ومتوسط دقة متوسط (mAP)، ودرجة F1. يمكنك معرفة المزيد حول هذه المقاييس في دليل مقاييس أداء YOLO الخاص بنا.

نتائج قياس الأداء

سيتم تخزين نتائج قياس الأداء باستخدام البرنامج النصي المقدم في دليل ultralytics-benchmarks/، وتحديداً في ملف evaluation.txt.

مثال على قياس الأداء

يوضح البرنامج النصي التالي كيفية قياس أداء نموذج Ultralytics YOLO برمجياً (على سبيل المثال، YOLO26n) على جميع مجموعات البيانات المئة ضمن مجموعة Roboflow 100 المرجعية باستخدام فئة RF100Benchmark.

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolo26s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

التطبيقات

تعد Roboflow 100 لا تقدر بثمن لمختلف التطبيقات المتعلقة بـ رؤية الحاسوب والتعلم العميق. يمكن للباحثين والمهندسين الاستفادة من هذه المجموعة المرجعية من أجل:

  • تقييم أداء نماذج اكتشاف الكائنات في سياق متعدد المجالات.
  • اختبار قدرة النماذج على التكيف والمتانة في سيناريوهات العالم الحقيقي بما يتجاوز مجموعات البيانات المرجعية الشائعة مثل COCO أو PASCAL VOC.
  • قياس قدرات نماذج اكتشاف الكائنات عبر مجموعات بيانات متنوعة، بما في ذلك مجالات متخصصة مثل الرعاية الصحية، والصور الجوية، وألعاب الفيديو.
  • مقارنة أداء النموذج عبر هياكل الشبكات العصبية وتقنيات التحسين المختلفة.
  • Identify domain-specific challenges that may require specialized model training tips or fine-tuning approaches like transfer learning.

For more ideas and inspiration on real-world applications, explore our guides on practical projects or check out Ultralytics Platform for streamlined model training and deployment.

الاستخدام

مجموعة بيانات Roboflow 100، بما في ذلك البيانات الوصفية وروابط التنزيل، متاحة على مستودع Roboflow 100 الرسمي على GitHub. يمكنك الوصول إلى مجموعة البيانات واستخدامها مباشرة من هناك لتلبية احتياجات قياس الأداء الخاصة بك. تُبسط أداة RF100Benchmark من Ultralytics عملية تنزيل وإعداد مجموعات البيانات هذه للاستخدام مع نماذج Ultralytics.

عينة البيانات والشروحات

تتكون Roboflow 100 من مجموعات بيانات ذات صور متنوعة التقطت من زوايا ومجالات مختلفة. أدناه أمثلة على الصور المعلقة المدرجة في مجموعة RF100 المرجعية، والتي تعرض تنوع الكائنات والمشاهد. يمكن لتقنيات مثل تعزيز البيانات تحسين التنوع بشكل أكبر أثناء التدريب.

Roboflow 100 sample images with annotations

يمثل التنوع الذي نراه في مجموعة Roboflow 100 المرجعية تقدماً كبيراً عن المعايير التقليدية، التي غالباً ما تركز على تحسين مقياس واحد ضمن نطاق محدود. يساعد هذا النهج الشامل في تطوير نماذج رؤية حاسوبية أكثر قوة وتعدداً في الاستخدامات قادرة على الأداء الجيد عبر مجموعة كبيرة من السيناريوهات المختلفة.

الاقتباسات والشكر

إذا كنت تستخدم مجموعة بيانات Roboflow 100 في عملك البحثي أو التطويري، يرجى الاستشهاد بالورقة البحثية الأصلية:

اقتباس
@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

نقدم خالص امتناننا لفريق Roboflow وجميع المساهمين على جهودهم الكبيرة في إنشاء وصيانة مجموعة بيانات Roboflow 100 كمورد قيم لمجتمع رؤية الحاسوب.

إذا كنت مهتماً باستكشاف المزيد من مجموعات البيانات لتعزيز مشاريع اكتشاف الكائنات والتعلم الآلي الخاصة بك، فلا تتردد في زيارة مجموعتنا الشاملة لمجموعات البيانات، والتي تتضمن مجموعة متنوعة من مجموعات بيانات الاكتشاف الأخرى.

الأسئلة الشائعة

ما هي مجموعة بيانات Roboflow 100، ولماذا هي مهمة لاكتشاف الكائنات؟

تعد مجموعة بيانات Roboflow 100 مرجعاً لنماذج اكتشاف الكائنات. وهي تتألف من 100 مجموعة بيانات متنوعة تغطي مجالات مثل الرعاية الصحية، والصور الجوية، وألعاب الفيديو. تكمن أهميتها في توفير طريقة موحدة لاختبار قدرة النموذج على التكيف والمتانة عبر مجموعة واسعة من سيناريوهات العالم الحقيقي، متجاوزة المعايير التقليدية التي غالباً ما تكون محدودة النطاق.

ما هي المجالات التي تغطيها مجموعة بيانات Roboflow 100؟

تمتد مجموعة بيانات Roboflow 100 عبر سبعة مجالات متنوعة، مما يوفر تحديات فريدة لنماذج اكتشاف الكائنات:

  1. الجوية: 7 مجموعات بيانات (مثل صور الأقمار الصناعية، ومشاهد الطائرات بدون طيار).
  2. ألعاب الفيديو: 7 مجموعات بيانات (مثل كائنات من بيئات ألعاب متنوعة).
  3. المجهرية: 11 مجموعة بيانات (مثل الخلايا، والجسيمات).
  4. تحت الماء: 5 مجموعات بيانات (مثل الحياة البحرية، والكائنات المغمورة).
  5. المستندات: 8 مجموعات بيانات (مثل مناطق النص، وعناصر النماذج).
  6. الكهرومغناطيسية: 12 مجموعة بيانات (مثل توقيعات الرادار، ومرئيات البيانات الطيفية).
  7. العالم الحقيقي: 50 مجموعة بيانات (فئة واسعة تشمل الأشياء اليومية، والمشاهد، وتجارة التجزئة، إلخ).

هذا التنوع يجعل من RF100 مورداً ممتازاً لتقييم قابلية التعميم لنماذج رؤية الحاسوب.

ما الذي يجب أن أضمنه عند الاستشهاد بمجموعة بيانات Roboflow 100 في بحثي؟

عند استخدام مجموعة بيانات Roboflow 100، يرجى الاستشهاد بالورقة الأصلية لمنح التقدير للمبدعين. إليك استشهاد BibTeX الموصى به:

اقتباس
@misc{rf100benchmark,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Year = {2022},
    Eprint = {arXiv:2211.13523},
    url = {https://arxiv.org/abs/2211.13523}
}

لمزيد من الاستكشاف، فكر في زيارة مجموعتنا الشاملة لمجموعات البيانات أو تصفح مجموعات بيانات الاكتشاف الأخرى المتوافقة مع نماذج Ultralytics.

التعليقات