Roboflow 100 Bộ dữ liệu
Roboflow 100, được phát triển bởi Roboflow và được tài trợ bởi Intel , là một chuẩn mực phát hiện đối tượng mang tính đột phá. Nó bao gồm 100 tập dữ liệu đa dạng được lấy mẫu từ hơn 90.000 tập dữ liệu công khai. Chuẩn mực này được thiết kế để kiểm tra khả năng thích ứng của các mô hình với nhiều lĩnh vực khác nhau, bao gồm chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử.
Các tính năng chính
- Bao gồm 100 tập dữ liệu trong bảy lĩnh vực: Trên không, Trò chơi điện tử, Kính hiển vi, Dưới nước, Tài liệu, Điện từ và Thế giới thực.
- Điểm chuẩn này bao gồm 224.714 hình ảnh trên 805 lớp, nhờ hơn 11.170 giờ nỗ lực ghi nhãn.
- Tất cả hình ảnh đều được thay đổi kích thước thành 640x640 pixel, tập trung vào việc loại bỏ sự mơ hồ về lớp và lọc ra các lớp chưa được đại diện đầy đủ.
- Chú thích bao gồm các hộp giới hạn cho các đối tượng, phù hợp cho việc đào tạo và đánh giá các mô hình phát hiện đối tượng.
Cấu trúc tập dữ liệu
Các Roboflow 100 tập dữ liệu được tổ chức thành bảy danh mục, mỗi danh mục có một tập hợp các tập dữ liệu, hình ảnh và lớp riêng biệt:
- Ảnh trên không : Bao gồm 7 tập dữ liệu với tổng cộng 9.683 hình ảnh, bao gồm 24 lớp riêng biệt.
- Trò chơi điện tử : Bao gồm 7 tập dữ liệu, có 11.579 hình ảnh thuộc 88 lớp.
- Kính hiển vi : Bao gồm 11 tập dữ liệu với 13.378 hình ảnh, trải dài trên 28 lớp.
- Dưới nước : Bao gồm 5 tập dữ liệu, bao gồm 18.003 hình ảnh trong 39 lớp.
- Tài liệu : Bao gồm 8 tập dữ liệu với 24.813 hình ảnh, được chia thành 90 lớp.
- Điện từ : Gồm 12 tập dữ liệu, tổng cộng 36.381 hình ảnh trong 41 lớp.
- Thế giới thực : Danh mục lớn nhất với 50 tập dữ liệu, cung cấp 110.615 hình ảnh trên 495 lớp.
Cấu trúc này cho phép có cơ sở thử nghiệm đa dạng và rộng rãi cho các mô hình phát hiện đối tượng, phản ánh các tình huống ứng dụng trong thế giới thực.
Đánh giá chuẩn
Đánh giá chuẩn bộ dữ liệu đánh giá hiệu suất của mô hình học máy trên các bộ dữ liệu cụ thể bằng các số liệu chuẩn hóa như độ chính xác , độ chính xác trung bình và điểm F1.
Đánh giá chuẩn
Kết quả đánh giá chuẩn sẽ được lưu trữ trong " ultralytics -benchmarks/evaluation.txt"
Ví dụ về chuẩn mực
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolo11s.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove the 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")
Ứng dụng
Roboflow 100 là vô giá đối với nhiều ứng dụng liên quan đến thị giác máy tính và học sâu . Các nhà nghiên cứu và kỹ sư có thể sử dụng chuẩn mực này để:
- Đánh giá hiệu suất của các mô hình phát hiện đối tượng trong bối cảnh đa miền.
- Kiểm tra khả năng thích ứng của mô hình với các tình huống thực tế vượt ra ngoài khả năng nhận dạng vật thể thông thường.
- Đánh giá chuẩn khả năng của các mô hình phát hiện đối tượng trên nhiều tập dữ liệu khác nhau, bao gồm dữ liệu trong chăm sóc sức khỏe, ảnh trên không và trò chơi điện tử.
Để có thêm ý tưởng và cảm hứng về các ứng dụng thực tế, hãy nhớ xem hướng dẫn của chúng tôi về các dự án thực tế .
Cách sử dụng
Các Roboflow 100 tập dữ liệu có sẵn trên cả GitHub và Roboflow Universe .
Bạn có thể truy cập trực tiếp từ Roboflow 100 kho lưu trữ GitHub. Ngoài ra, trên Roboflow Universe, bạn có thể linh hoạt tải xuống từng tập dữ liệu riêng lẻ chỉ bằng cách nhấp vào nút xuất trong mỗi tập dữ liệu.
Dữ liệu mẫu và chú thích
Roboflow 100 bao gồm các tập dữ liệu với nhiều hình ảnh và video khác nhau được chụp từ nhiều góc độ và phạm vi khác nhau. Sau đây là ví dụ về hình ảnh có chú thích trong chuẩn RF100.
Sự đa dạng trong Roboflow Điểm chuẩn 100 có thể thấy ở trên là một bước tiến đáng kể so với các điểm chuẩn truyền thống thường tập trung vào việc tối ưu hóa một số liệu duy nhất trong một phạm vi hạn chế.
Trích dẫn và Lời cảm ơn
Nếu bạn sử dụng Roboflow 100 tập dữ liệu trong công trình nghiên cứu hoặc phát triển của bạn, vui lòng trích dẫn bài báo sau:
Lời cảm ơn của chúng tôi gửi đến Roboflow nhóm và tất cả những người đóng góp vì đã làm việc chăm chỉ trong việc tạo ra và duy trì Roboflow 100 tập dữ liệu.
Nếu bạn muốn khám phá thêm nhiều tập dữ liệu hơn để nâng cao khả năng phát hiện đối tượng và dự án học máy của mình, hãy truy cập bộ sưu tập tập dữ liệu toàn diện của chúng tôi .
CÂU HỎI THƯỜNG GẶP
Cái gì là Roboflow 100 tập dữ liệu và tại sao nó lại quan trọng đối với việc phát hiện đối tượng?
Bộ dữ liệu Roboflow 100 , được phát triển bởi Roboflow và được tài trợ bởi Intel , là một chuẩn mực phát hiện đối tượng quan trọng. Nó có 100 tập dữ liệu đa dạng từ hơn 90.000 tập dữ liệu công khai, bao gồm các lĩnh vực như chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử. Sự đa dạng này đảm bảo rằng các mô hình có thể thích ứng với nhiều tình huống thực tế khác nhau, nâng cao độ mạnh mẽ và hiệu suất của chúng.
Làm thế nào tôi có thể sử dụng Roboflow 100 tập dữ liệu để đánh giá chuẩn các mô hình phát hiện đối tượng của tôi?
Để sử dụng Roboflow 100 tập dữ liệu để đánh giá chuẩn, bạn có thể triển khai lớp RF100Benchmark từ Ultralytics thư viện. Sau đây là một ví dụ ngắn gọn:
Ví dụ về chuẩn mực
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolo11n.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")
Những miền nào được bao phủ bởi Roboflow 100 tập dữ liệu?
Bộ dữ liệu Roboflow 100 bao gồm bảy miền, mỗi miền cung cấp những thách thức và ứng dụng riêng cho các mô hình phát hiện đối tượng :
- Trên không : 7 tập dữ liệu, 9.683 hình ảnh, 24 lớp
- Trò chơi điện tử : 7 tập dữ liệu, 11.579 hình ảnh, 88 lớp
- Kính hiển vi : 11 tập dữ liệu, 13.378 hình ảnh, 28 lớp
- Dưới nước : 5 tập dữ liệu, 18.003 hình ảnh, 39 lớp
- Tài liệu : 8 tập dữ liệu, 24.813 hình ảnh, 90 lớp
- Điện từ : 12 tập dữ liệu, 36.381 hình ảnh, 41 lớp
- Thế giới thực : 50 tập dữ liệu, 110.615 hình ảnh, 495 lớp
Thiết lập này cho phép thử nghiệm rộng rãi và đa dạng các mô hình trên nhiều ứng dụng thực tế khác nhau.
Làm thế nào để tôi truy cập và tải xuống Roboflow 100 tập dữ liệu?
Bộ dữ liệu Roboflow 100 có thể truy cập được trên GitHub và Roboflow Universe . Bạn có thể tải xuống toàn bộ bộ dữ liệu từ GitHub hoặc chọn từng bộ dữ liệu riêng lẻ trên Roboflow Vũ trụ sử dụng nút xuất.
Tôi nên bao gồm những gì khi trích dẫn Roboflow 100 tập dữ liệu trong nghiên cứu của tôi?
Khi sử dụng Roboflow 100 tập dữ liệu trong nghiên cứu của bạn, hãy đảm bảo trích dẫn đúng. Sau đây là trích dẫn được khuyến nghị:
Để biết thêm chi tiết, bạn có thể tham khảo bộ sưu tập dữ liệu toàn diện của chúng tôi.