Roboflow 100 Veri Kümesi
Roboflow 100, sponsored by Intel, is a groundbreaking object detection benchmark dataset. It includes 100 diverse datasets. This benchmark is specifically designed to test the adaptability of computer vision models, like Ultralytics YOLO models, to various domains, including healthcare, aerial imagery, and video games.
Ultralytics, farklı kullanım durumlarına uyum sağlamak için iki lisans seçeneği sunar:
- AGPL-3.0 Lisansı: Bu OSI onaylı açık kaynak lisansı, açık iş birliğini ve bilgi paylaşımını teşvik ettiği için öğrenciler ve meraklılar için idealdir. Daha fazla ayrıntı için LICENSE dosyasına bakın ve AGPL-3.0 Lisans sayfamızı ziyaret edin.
- Kurumsal Lisans: Geliştirme ve üretim kullanımı için bu lisans, Ultralytics yazılımının ve yapay zeka modellerinin, dahili araçlar, otomatik iş akışları ve üretim dağıtımları dahil olmak üzere iş ürünlerine ve hizmetlerine sorunsuz entegrasyonunu sağlar ve AGPL-3.0'ın açık kaynak gereksinimlerini atlar. Başlamak için lütfen Ultralytics Lisanslama aracılığıyla bizimle iletişime geç.
Temel Özellikler
- Çeşitli Alanlar: Hava, Video oyunları, Mikroskobik, Sualtı, Belgeler, Elektromanyetik ve Gerçek Dünya olmak üzere yedi farklı alanda 100 veri kümesi içerir.
- Ölçek: Kıyaslama, 11.170 saatin üzerinde veri etiketleme çabasını temsil eden 805 sınıfta 224.714 görüntüden oluşmaktadır.
- Standardizasyon: Tutarlı bir değerlendirme için tüm görüntüler ön işleme tabi tutulur ve 640x640 piksel olarak yeniden boyutlandırılır.
- Temiz Değerlendirme: Sınıf belirsizliğini ortadan kaldırmaya odaklanır ve daha temiz bir model değerlendirmesi sağlamak için yeterince temsil edilmeyen sınıfları filtreler.
- Annotations: Includes bounding boxes for objects, suitable for training and evaluating object detection models using metrics like mAP.
Veri Kümesi Yapısı
Roboflow 100 veri kümesi, her biri benzersiz bir veri kümesi, görüntü ve sınıf koleksiyonu içeren yedi kategoriye ayrılmıştır:
- Hava: 7 veri kümesi, 9.683 görüntü, 24 sınıf.
- Video Oyunları: 7 veri kümesi, 11.579 görüntü, 88 sınıf.
- Mikroskobik: 11 veri kümesi, 13.378 görüntü, 28 sınıf.
- Sualtı: 5 veri kümesi, 18.003 görüntü, 39 sınıf.
- Belgeler: 8 veri kümesi, 24.813 görüntü, 90 sınıf.
- Elektromanyetik: 12 veri kümesi, 36.381 görüntü, 41 sınıf.
- Gerçek Dünya: 50 veri kümesi, 110.615 görüntü, 495 sınıf.
This structure provides a diverse and extensive testing ground for object detection models, reflecting a wide array of real-world application scenarios found in various Ultralytics Solutions.
Kıyaslama
Veri kümesi kıyaslaması, makine öğrenimi modellerinin performansını standartlaştırılmış metrikler kullanarak belirli veri kümeleri üzerinde değerlendirmeyi içerir. Yaygın metrikler arasında doğruluk, ortalama Hassasiyet (mAP) ve F1-skoru bulunur. Bunlar hakkında daha fazla bilgiyi YOLO Performans Metrikleri rehberimizde bulabilirsin.
Sağlanan betiği kullanarak elde edilen kıyaslama sonuçları, ultralytics-benchmarks/ dizininde, özellikle evaluation.txt dosyasında saklanacaktır.
Aşağıdaki betik, RF100Benchmark sınıfını kullanarak bir Ultralytics YOLO modelinin (örneğin, YOLO26n) Roboflow 100 kıyaslamasındaki 100 veri kümesinin tamamında programatik olarak nasıl kıyaslanacağını gösterir.
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolo26s.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove the 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")Uygulamalar
Roboflow 100, bilgisayarlı görü ve derin öğrenme ile ilgili çeşitli uygulamalar için paha biçilmezdir. Araştırmacılar ve mühendisler bu kıyaslamadan şunlar için yararlanabilirler:
- Nesne algılama modellerinin performansını çok alanlı bir bağlamda değerlendirmek.
- Test the adaptability and robustness of models to real-world scenarios beyond common benchmark datasets like COCO or PASCAL VOC.
- Sağlık, hava görüntüleri ve video oyunları gibi özel alanlar da dahil olmak üzere çeşitli veri kümelerinde nesne algılama modellerinin yeteneklerini kıyaslamak.
- Farklı sinir ağı mimarileri ve optimizasyon teknikleri arasında model performansını karşılaştırmak.
- Identify domain-specific challenges that may require specialized model training tips or fine-tuning approaches like transfer learning.
For more ideas and inspiration on real-world applications, explore our guides on practical projects or check out Ultralytics Platform for streamlined model training and deployment.
Kullanım
Meta veriler ve indirme bağlantıları dahil Roboflow 100 veri kümesi, resmi Roboflow 100 GitHub deposunda mevcuttur. Veri kümesine oradan doğrudan erişebilir ve kıyaslama ihtiyaçların için kullanabilirsin. Ultralytics RF100Benchmark yardımcı programı, bu veri kümelerini Ultralytics modelleriyle kullanım için indirme ve hazırlama sürecini basitleştirir.
Örnek Veri ve Ek Açıklamalar
Roboflow 100, çeşitli açılardan ve alanlardan yakalanan farklı görüntülere sahip veri kümelerinden oluşur. Aşağıda, RF100 kıyaslamasına dahil edilen, nesnelerin ve sahnelerin çeşitliliğini gösteren açıklamalı görüntü örnekleri bulunmaktadır. Veri artırma gibi teknikler, eğitim sırasında çeşitliliği daha da artırabilir.
Roboflow 100 kıyaslamasında görülen çeşitlilik, genellikle sınırlı bir alan içindeki tek bir metriği optimize etmeye odaklanan geleneksel kıyaslamalara göre önemli bir ilerlemeyi temsil eder. Bu kapsamlı yaklaşım, çok sayıda farklı senaryoda iyi performans gösterebilen daha sağlam ve çok yönlü bilgisayarlı görü modelleri geliştirmeye yardımcı olur.
Alıntılar ve Teşekkür
Roboflow 100 veri kümesini araştırma veya geliştirme çalışmalarında kullanırsan, lütfen orijinal makaleyi kaynak göster:
@misc{rf100benchmark,
Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
Year = {2022},
Eprint = {arXiv:2211.13523},
url = {https://arxiv.org/abs/2211.13523}
}Roboflow 100 veri kümesini bilgisayarlı görü topluluğu için değerli bir kaynak olarak oluşturma ve sürdürme konusundaki önemli çabalarından dolayı Roboflow ekibine ve tüm katkıda bulunanlara şükranlarımızı sunarız.
If you are interested in exploring more datasets to enhance your object detection and machine learning projects, feel free to visit our comprehensive dataset collection, which includes a variety of other detection datasets.
SSS
Roboflow 100 veri kümesi nedir ve nesne algılama için neden önemlidir?
Roboflow 100 veri kümesi, nesne algılama modelleri için bir kıyaslamadır. Sağlık, hava görüntüleri ve video oyunları gibi alanları kapsayan 100 farklı veri kümesinden oluşur. Önemi, geleneksel, genellikle alan sınırlı kıyaslamaların ötesine geçerek, model uyarlanabilirliğini ve sağlamlığını çok çeşitli gerçek dünya senaryolarında test etmek için standartlaştırılmış bir yol sağlamasında yatar.
Roboflow 100 veri kümesi hangi alanları kapsar?
Roboflow 100 veri kümesi, nesne algılama modelleri için benzersiz zorluklar sunan yedi farklı alanı kapsar:
- Hava: 7 veri kümesi (örneğin, uydu görüntüleri, drone görünümleri).
- Video Oyunları: 7 veri kümesi (örneğin, çeşitli oyun ortamlarından nesneler).
- Mikroskobik: 11 veri kümesi (örneğin, hücreler, parçacıklar).
- Sualtı: 5 veri kümesi (örneğin, deniz yaşamı, batık nesneler).
- Belgeler: 8 veri kümesi (örneğin, metin bölgeleri, form öğeleri).
- Elektromanyetik: 12 veri kümesi (örneğin, radar imzaları, spektral veri görselleştirmeleri).
- Gerçek Dünya: 50 veri kümesi (günlük nesneler, sahneler, perakende vb. içeren geniş bir kategori).
Bu çeşitlilik, RF100'ü bilgisayarlı görü modellerinin genelleştirilebilirliğini değerlendirmek için mükemmel bir kaynak haline getirir.
Roboflow 100 veri kümesini araştırmamda alıntılarken neleri dahil etmeliyim?
Roboflow 100 veri kümesini kullanırken, yaratıcılara hakkını vermek için lütfen orijinal makaleyi alıntıla. İşte önerilen BibTeX alıntısı:
@misc{rf100benchmark,
Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
Year = {2022},
Eprint = {arXiv:2211.13523},
url = {https://arxiv.org/abs/2211.13523}
}Daha fazla keşif için kapsamlı veri kümesi koleksiyonumuzu ziyaret etmeyi veya Ultralytics modelleriyle uyumlu diğer algılama veri kümelerine göz atmayı düşünebilirsin.