सामग्री पर जाएं

Roboflow 100 डेटासेट

Roboflow 100, द्वारा विकसित Roboflow और इंटेल द्वारा प्रायोजित, एक ग्राउंडब्रेकिंग ऑब्जेक्ट डिटेक्शन बेंचमार्क है। इसमें 90,000 से अधिक सार्वजनिक डेटासेट से नमूने लिए गए 100 विविध डेटासेट शामिल हैं। यह बेंचमार्क स्वास्थ्य सेवा, हवाई इमेजरी और वीडियो गेम सहित विभिन्न डोमेन के लिए मॉडल की अनुकूलन क्षमता का परीक्षण करने के लिए डिज़ाइन किया गया है।

Roboflow 100 माथिview

प्रमुख विशेषताऐं

  • सात डोमेन में 100 डेटासेट शामिल हैं: हवाई, वीडियो गेम, सूक्ष्म, पानी के नीचे, दस्तावेज़, विद्युत चुम्बकीय, और वास्तविक दुनिया।
  • बेंचमार्क में 805 वर्गों में 224,714 छवियां शामिल हैं, 11,170 घंटे से अधिक लेबलिंग प्रयासों के लिए धन्यवाद।
  • सभी छवियों को 640x640 पिक्सेल में आकार दिया जाता है, जिसमें वर्ग की अस्पष्टता को खत्म करने और कम प्रतिनिधित्व वाले वर्गों को फ़िल्टर करने पर ध्यान केंद्रित किया जाता है।
  • एनोटेशन में वस्तुओं के लिए बाउंडिंग बॉक्स शामिल हैं, जो इसे ऑब्जेक्ट डिटेक्शन मॉडल के प्रशिक्षण और मूल्यांकन के लिए उपयुक्त बनाते हैं।

डेटासेट संरचना

वही Roboflow 100 डेटासेट को सात श्रेणियों में व्यवस्थित किया गया है, प्रत्येक में डेटासेट, छवियों और कक्षाओं का एक अलग सेट है:

  • हवाई: कुल 9,683 छवियों के साथ 7 डेटासेट शामिल हैं, जिसमें 24 अलग-अलग वर्ग शामिल हैं।
  • वीडियो गेम: 7 डेटासेट शामिल हैं, जिसमें 88 वर्गों में 11,579 छवियां हैं।
  • माइक्रोस्कोपिक: 13,378 छवियों के साथ 11 डेटासेट शामिल हैं, जो 28 वर्गों में फैले हुए हैं।
  • पानी के नीचे: 5 डेटासेट शामिल हैं, जिसमें 39 वर्गों में 18,003 छवियां शामिल हैं।
  • दस्तावेज़: 24,813 छवियों के साथ 8 डेटासेट होते हैं, जिन्हें 90 वर्गों में विभाजित किया जाता है।
  • विद्युत चुम्बकीय: 12 डेटासेट से बना, 41 वर्गों में कुल 36,381 छवियां।
  • वास्तविक दुनिया: 50 डेटासेट के साथ सबसे बड़ी श्रेणी, 110,615 वर्गों में 495 छवियों की पेशकश करती है।

यह संरचना ऑब्जेक्ट डिटेक्शन मॉडल के लिए एक विविध और व्यापक परीक्षण मैदान को सक्षम बनाती है, जो वास्तविक दुनिया के अनुप्रयोग परिदृश्यों को दर्शाती है।

बेंचमार्किंग

डेटासेट बेंचमार्किंग सटीकता, औसत औसत परिशुद्धता और F1-स्कोर जैसे मानकीकृत मीट्रिक का उपयोग करके विशिष्ट डेटासेट पर मशीन लर्निंग मॉडल के प्रदर्शन का मूल्यांकन करता है।

बेंचमार्किंग

बेंचमार्किंग परिणाम " में संग्रहीत किए जाएंगेultralytics-बेंचमार्क/evaluation.txt"

बेंचमार्किंग उदाहरण

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

अनुप्रयोगों

Roboflow कंप्यूटर दृष्टि और गहरी शिक्षा से संबंधित विभिन्न अनुप्रयोगों के लिए 100 अमूल्य है। शोधकर्ता और इंजीनियर इस बेंचमार्क का उपयोग कर सकते हैं:

  • बहु-डोमेन संदर्भ में ऑब्जेक्ट डिटेक्शन मॉडल के प्रदर्शन का मूल्यांकन करें।
  • सामान्य वस्तु मान्यता से परे वास्तविक दुनिया के परिदृश्यों के लिए मॉडल की अनुकूलन क्षमता का परीक्षण करें।
  • विभिन्न डेटासेट में ऑब्जेक्ट डिटेक्शन मॉडल की क्षमताओं को बेंचमार्क करें, जिनमें स्वास्थ्य सेवा, हवाई इमेजरी और वीडियो गेम शामिल हैं।

वास्तविक दुनिया के अनुप्रयोगों पर अधिक विचारों और प्रेरणा के लिए, वास्तविक दुनिया की परियोजनाओं पर हमारे गाइड देखना सुनिश्चित करें।

उपयोग

वही Roboflow 100 डेटासेट GitHub और दोनों पर उपलब्ध है Roboflow ब्रह्मांड

आप इसे सीधे से एक्सेस कर सकते हैं Roboflow 100 GitHub रिपॉजिटरी। इसके अलावा, पर Roboflow ब्रह्मांड, आपके पास प्रत्येक डेटासेट के भीतर निर्यात बटन पर क्लिक करके अलग-अलग डेटासेट डाउनलोड करने की सुविधा है।

नमूना डेटा और एनोटेशन

Roboflow 100 consists of datasets with diverse images and videos captured from various angles and domains. Here's a look at examples of annotated images in the RF100 benchmark.

नमूना डेटा और एनोटेशन

में विविधता Roboflow 100 बेंचमार्क जिसे ऊपर देखा जा सकता है, पारंपरिक बेंचमार्क से एक महत्वपूर्ण प्रगति है जो अक्सर एक सीमित डोमेन के भीतर एकल मीट्रिक को अनुकूलित करने पर ध्यान केंद्रित करता है।

प्रशंसा पत्र और पावती

यदि आप Roboflow आपके शोध या विकास कार्य में 100 डेटासेट, कृपया निम्नलिखित पेपर का हवाला दें:

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

हमारा धन्यवाद जाता है Roboflow टीम और सभी योगदानकर्ताओं को बनाने और बनाए रखने में उनकी कड़ी मेहनत के लिए Roboflow 100 डेटासेट।

यदि आप अपनी वस्तु का पता लगाने और मशीन लर्निंग परियोजनाओं को बढ़ाने के लिए अधिक डेटासेट की खोज करने में रुचि रखते हैं, तो हमारे व्यापक डेटासेट संग्रह पर जाने के लिए स्वतंत्र महसूस करें।



Created 2024-02-07, Updated 2024-06-02
Authors: glenn-jocher (4), RizwanMunawar (2), abirami-vina (1)

टिप्पणियाँ