Link to this sectionRoboflow 100 データセット#
Roboflow 100, sponsored by Intel, is a groundbreaking object detection benchmark dataset. It includes 100 diverse datasets. This benchmark is specifically designed to test the adaptability of computer vision models, like Ultralytics YOLO models, to various domains, including healthcare, aerial imagery, and video games.
Ultralytics は、さまざまなユースケースに対応するため、2つのライセンスオプションを提供しています。
- AGPL-3.0 ライセンス: このOSI承認済みオープンソースライセンスは、オープンなコラボレーションと知識の共有を促進するため、学生や愛好家に最適です。詳細については、LICENSE ファイルを参照し、AGPL-3.0 ライセンスページをご覧ください。
- エンタープライズライセンス: 開発および本番環境での利用向けに、このライセンスは内部ツール、自動化されたワークフロー、本番環境へのデプロイメントなど、ビジネス製品やサービスへのUltralyticsソフトウェアおよびAIモデルのシームレスな統合を可能にし、AGPL-3.0のオープンソース要件を回避します。利用を開始するには、Ultralytics Licensingよりお問い合わせください。
Link to this section主な機能#
- 多様なドメイン: 航空、ビデオゲーム、顕微鏡、水中、文書、電磁気、現実世界の7つの異なるドメインにわたる100のデータセットが含まれています。
- 規模: このベンチマークは805クラスにわたる224,714枚の画像で構成されており、11,170時間以上のデータラベリング作業に相当します。
- 標準化: 一貫した評価を行うため、すべての画像は前処理され、640x640ピクセルにリサイズされています。
- クリーンな評価: クラスの曖昧さを排除し、過小評価されているクラスを除外することに焦点を当て、よりクリーンなモデル評価を確実にします。
- Annotations: Includes bounding boxes for objects, suitable for training and evaluating object detection models using metrics like mAP.
Link to this sectionデータセット構造#
Roboflow 100 データセットは7つのカテゴリに分類されており、それぞれがデータセット、画像、クラスの独自のコレクションを含んでいます。
- 航空: 7データセット、9,683画像、24クラス。
- ビデオゲーム: 7データセット、11,579画像、88クラス。
- 顕微鏡: 11データセット、13,378画像、28クラス。
- 水中: 5データセット、18,003画像、39クラス。
- 文書: 8データセット、24,813画像、90クラス。
- 電磁気: 12データセット、36,381画像、41クラス。
- 現実世界: 50データセット、110,615画像、495クラス。
この構造は、物体検出モデルにとって多様かつ広範なテスト環境を提供し、さまざまなUltralytics ソリューションで見られる広範な現実世界のアプリケーションシナリオを反映しています。
Link to this sectionベンチマーク#
データセットのベンチマークとは、標準化された指標を使用して特定のデータセットに対する機械学習モデルのパフォーマンスを評価することです。一般的な指標には、精度、mAP、F1-スコアなどがあります。これらについての詳細は、YOLO パフォーマンス指標ガイドで学ぶことができます。
提供されたスクリプトを使用したベンチマーク結果は、ultralytics-benchmarks/ ディレクトリ内の evaluation.txt に保存されます。
以下のスクリプトは、RF100Benchmark クラスを使用して、Roboflow 100 ベンチマーク内の100すべてのデータセットに対して、Ultralytics YOLO モデル(例: YOLO26n)をプログラムでベンチマークする方法を示しています。
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolo26s.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove the 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")Link to this sectionアプリケーション#
Roboflow 100 は、コンピュータビジョンおよびディープラーニングに関連するさまざまなアプリケーションにおいて非常に価値があります。研究者やエンジニアは、このベンチマークを活用して次のことが可能です。
- マルチドメインのコンテキストで物体検出モデルのパフォーマンスを評価する。
- Test the adaptability and robustness of models to real-world scenarios beyond common benchmark datasets like COCO or PASCAL VOC.
- ヘルスケア、航空画像、ビデオゲームなどの専門分野を含む、多様なデータセット全体で物体検出モデルの機能をベンチマークする。
- 異なるニューラルネットワークアーキテクチャや最適化技術間でモデルのパフォーマンスを比較する。
- Identify domain-specific challenges that may require specialized model training tips or fine-tuning approaches like transfer learning.
For more ideas and inspiration on real-world applications, explore our guides on practical projects or check out Ultralytics Platform for streamlined model training and deployment.
Link to this section使用方法#
メタデータとダウンロードリンクを含む Roboflow 100 データセットは、公式の Roboflow 100 GitHub リポジトリで入手可能です。そこから直接データセットにアクセスし、ベンチマークのニーズに合わせて利用することができます。Ultralytics の RF100Benchmark ユーティリティを使用すると、Ultralytics モデルで使用するためのデータセットのダウンロードと準備のプロセスが簡素化されます。
Link to this sectionサンプルデータとアノテーション#
Roboflow 100 は、さまざまな角度やドメインからキャプチャされた多様な画像で構成されるデータセットです。以下は、RF100 ベンチマークに含まれるアノテーション付き画像の例であり、多様なオブジェクトやシーンを示しています。データ拡張などの技術は、トレーニング中の多様性をさらに向上させることができます。
Roboflow 100 ベンチマークに見られる多様性は、限られたドメイン内で単一の指標を最適化することに焦点を当てることが多い従来のベンチマークからの大きな進歩を表しています。この包括的なアプローチは、多くの異なるシナリオで優れたパフォーマンスを発揮できる、より堅牢で汎用性の高いコンピュータビジョンモデルの開発に役立ちます。
Link to this section引用と謝辞#
研究や開発作業で Roboflow 100 データセットを使用する場合は、元の論文を引用してください。
@misc{rf100benchmark,
Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
Year = {2022},
Eprint = {arXiv:2211.13523},
url = {https://arxiv.org/abs/2211.13523}
}Roboflow 100 データセットをコンピュータビジョンコミュニティにとって価値のあるリソースとして作成および維持するための多大な努力に対して、Roboflow チームとすべての貢献者に感謝の意を表します。
If you are interested in exploring more datasets to enhance your object detection and machine learning projects, feel free to visit our comprehensive dataset collection, which includes a variety of other detection datasets.
Link to this sectionFAQ#
Link to this sectionRoboflow 100 データセットとは何ですか?また、なぜそれが物体検出にとって重要なのでしょうか?#
Roboflow 100 データセットは、物体検出モデルのためのベンチマークです。これには、ヘルスケア、航空画像、ビデオゲームなどのドメインをカバーする100の多様なデータセットが含まれています。その重要性は、従来のドメインが限定されがちなベンチマークを超えて、幅広い現実世界のシナリオ全体でモデルの適応性と堅牢性をテストするための標準化された方法を提供していることにあります。
Link to this sectionRoboflow 100 データセットにはどのドメインが含まれていますか?#
Roboflow 100 データセットは7つの多様なドメインにわたっており、物体検出モデルにとって独自の課題を提供します。
- 航空: 7データセット(例:衛星画像、ドローン視点)。
- ビデオゲーム: 7データセット(例:さまざまなゲーム環境のオブジェクト)。
- 顕微鏡: 11データセット(例:細胞、粒子)。
- 水中: 5データセット(例:海洋生物、水没したオブジェクト)。
- 文書: 8データセット(例:テキスト領域、フォーム要素)。
- 電磁気: 12データセット(例:レーダー署名、スペクトルデータ視覚化)。
- 現実世界: 50データセット(日常のオブジェクト、シーン、小売などを含む幅広いカテゴリ)。
この多様性により、RF100 はコンピュータビジョンモデルの汎化性能を評価するための優れたリソースとなっています。
Link to this section研究で Roboflow 100 データセットを引用する際に何を含めるべきですか?#
Roboflow 100 データセットを使用する際は、作成者に敬意を表して元の論文を引用してください。推奨される BibTeX 引用は以下の通りです。
@misc{rf100benchmark,
Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
Year = {2022},
Eprint = {arXiv:2211.13523},
url = {https://arxiv.org/abs/2211.13523}
}さらなる調査については、当社の包括的なデータセットコレクションにアクセスするか、Ultralytics モデルと互換性のある他の検出データセットを閲覧することを検討してください。