Roboflow 100 Tập dữ liệu
Roboflow 100, phát triển bởi Roboflow và được tài trợ bởi Intel, là một tiêu chuẩn phát hiện đối tượng đột phá. Nó bao gồm 100 bộ dữ liệu đa dạng được lấy mẫu từ hơn 90.000 bộ dữ liệu công khai. Điểm chuẩn này được thiết kế để kiểm tra khả năng thích ứng của các mô hình với các lĩnh vực khác nhau, bao gồm chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử.
Các tính năng chính
- Bao gồm 100 bộ dữ liệu trên bảy miền: Trên không, Trò chơi điện tử, Microscopic, Dưới nước, Tài liệu, Điện từ và Thế giới thực.
- Điểm chuẩn bao gồm 224.714 hình ảnh trên 805 lớp, nhờ hơn 11.170 giờ nỗ lực dán nhãn.
- Tất cả các hình ảnh được thay đổi kích thước thành 640x640 pixel, tập trung vào việc loại bỏ sự mơ hồ của lớp và lọc ra các lớp ít được trình bày.
- Chú thích bao gồm các hộp giới hạn cho các đối tượng, làm cho nó phù hợp để đào tạo và đánh giá các mô hình phát hiện đối tượng.
Cấu trúc tập dữ liệu
Các Roboflow 100 tập dữ liệu được tổ chức thành bảy loại, mỗi loại có một bộ dữ liệu, hình ảnh và lớp riêng biệt:
- Trên không: Bao gồm 7 bộ dữ liệu với tổng số 9.683 hình ảnh, bao gồm 24 lớp riêng biệt.
- Trò chơi điện tử: Bao gồm 7 bộ dữ liệu, có 11.579 hình ảnh trên 88 lớp.
- Kính hiển vi: Bao gồm 11 bộ dữ liệu với 13.378 hình ảnh, trải dài 28 lớp.
- Dưới nước: Chứa 5 bộ dữ liệu, bao gồm 18.003 hình ảnh trong 39 lớp.
- Tài liệu: Gồm 8 bộ dữ liệu với 24.813 hình ảnh, được chia thành 90 lớp.
- Điện từ: Được tạo thành từ 12 bộ dữ liệu, tổng cộng 36.381 hình ảnh trong 41 lớp.
- Thế giới thực: Danh mục lớn nhất với 50 bộ dữ liệu, cung cấp 110.615 hình ảnh trên 495 lớp.
Cấu trúc này cho phép một nền tảng thử nghiệm đa dạng và rộng rãi cho các mô hình phát hiện đối tượng, phản ánh các kịch bản ứng dụng trong thế giới thực.
Điểm chuẩn
Điểm chuẩn tập dữ liệu đánh giá hiệu suất mô hình máy học trên các bộ dữ liệu cụ thể bằng cách sử dụng các số liệu được tiêu chuẩn hóa như độ chính xác, độ chính xác trung bình trung bình và điểm F1.
Điểm chuẩn
Kết quả benchmark sẽ được lưu trữ trong "ultralytics-điểm chuẩn/evaluation.txt"
Ví dụ đo điểm chuẩn
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove the 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")
Ứng dụng
Roboflow 100 là vô giá cho các ứng dụng khác nhau liên quan đến thị giác máy tính và học sâu. Các nhà nghiên cứu và kỹ sư có thể sử dụng điểm chuẩn này để:
- Đánh giá hiệu suất của các mô hình phát hiện đối tượng trong bối cảnh đa miền.
- Kiểm tra khả năng thích ứng của các mô hình với các tình huống trong thế giới thực ngoài nhận dạng đối tượng thông thường.
- Đánh giá khả năng của các mô hình phát hiện đối tượng trên các bộ dữ liệu đa dạng, bao gồm cả các mô hình trong chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử.
Để biết thêm ý tưởng và cảm hứng về các ứng dụng trong thế giới thực, hãy nhớ xem hướng dẫn của chúng tôi về các dự án trong thế giới thực.
Sử dụng
Các Roboflow Tập dữ liệu 100 có sẵn trên cả GitHub và Roboflow Vũ trụ.
Bạn có thể truy cập nó trực tiếp từ Roboflow Kho lưu trữ 100 GitHub. Ngoài ra, trên Roboflow Vũ trụ, bạn có thể linh hoạt tải xuống các bộ dữ liệu riêng lẻ bằng cách chỉ cần nhấp vào nút xuất trong mỗi tập dữ liệu.
Dữ liệu mẫu và chú thích
Roboflow 100 bao gồm các bộ dữ liệu với hình ảnh và video đa dạng được quay từ nhiều góc độ và lĩnh vực khác nhau. Dưới đây là ví dụ về hình ảnh được chú thích trong điểm chuẩn RF100.
Sự đa dạng trong Roboflow 100 điểm chuẩn có thể thấy ở trên là một tiến bộ đáng kể so với các điểm chuẩn truyền thống thường tập trung vào việc tối ưu hóa một số liệu duy nhất trong một miền hạn chế.
Trích dẫn và xác nhận
Nếu bạn sử dụng Roboflow 100 bộ dữ liệu trong công việc nghiên cứu hoặc phát triển của bạn, vui lòng trích dẫn bài báo sau:
Lời cảm ơn của chúng tôi dành cho Roboflow nhóm và tất cả những người đóng góp cho công việc khó khăn của họ trong việc tạo ra và duy trì Roboflow 100 tập dữ liệu.
Nếu bạn quan tâm đến việc khám phá nhiều bộ dữ liệu hơn để tăng cường các dự án phát hiện đối tượng và học máy, vui lòng truy cập bộ sưu tập dữ liệu toàn diện của chúng tôi.
FAQ
Cái gì Roboflow 100 tập dữ liệu, và tại sao nó lại quan trọng đối với việc phát hiện đối tượng?
Các Roboflow 100 Dataset, phát triển bởi Roboflow và được tài trợ bởi Intel, là một tiêu chuẩn phát hiện đối tượng quan trọng. Nó có 100 bộ dữ liệu đa dạng từ hơn 90.000 bộ dữ liệu công cộng, bao gồm các lĩnh vực như chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử. Sự đa dạng này đảm bảo rằng các mô hình có thể thích ứng với các tình huống thực tế khác nhau, nâng cao tính mạnh mẽ và hiệu suất của chúng.
Làm thế nào tôi có thể sử dụng Roboflow 100 bộ dữ liệu để đo điểm chuẩn cho các mô hình phát hiện đối tượng của tôi?
Để sử dụng Roboflow 100 tập dữ liệu để đo điểm chuẩn, bạn có thể triển khai lớp RF100Benchmark từ Ultralytics thư viện. Dưới đây là một ví dụ ngắn gọn:
Ví dụ đo điểm chuẩn
import os
import shutil
from pathlib import Path
from ultralytics.utils.benchmarks import RF100Benchmark
# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")
# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"
# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
path = Path(path)
if path.exists():
# Fix YAML file and run training
benchmark.fix_yaml(str(path))
os.system(f"yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16")
# Run validation and evaluate
os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)
# Remove 'runs' directory
runs_dir = Path.cwd() / "runs"
shutil.rmtree(runs_dir)
else:
print("YAML file path does not exist")
continue
print("RF100 Benchmarking completed!")
Những tên miền nào được bao phủ bởi Roboflow 100 tập dữ liệu?
Các Roboflow 100 bộ dữ liệu trải dài trên bảy miền, mỗi miền cung cấp các thách thức và ứng dụng độc đáo cho các mô hình phát hiện đối tượng:
- Trên không: 7 bộ dữ liệu, 9.683 hình ảnh, 24 lớp
- Trò chơi điện tử: 7 bộ dữ liệu, 11.579 hình ảnh, 88 lớp học
- Kính hiển vi: 11 bộ dữ liệu, 13.378 hình ảnh, 28 lớp
- Dưới nước: 5 bộ dữ liệu, 18.003 hình ảnh, 39 lớp
- Tài liệu: 8 bộ dữ liệu, 24.813 hình ảnh, 90 lớp
- Điện từ: 12 bộ dữ liệu, 36.381 hình ảnh, 41 lớp
- Thế giới thực: 50 bộ dữ liệu, 110.615 hình ảnh, 495 lớp
Thiết lập này cho phép thử nghiệm rộng rãi và đa dạng các mô hình trên các ứng dụng thực tế khác nhau.
Làm cách nào để truy cập và tải xuống Roboflow 100 tập dữ liệu?
Các Roboflow 100 tập dữ liệu có thể truy cập được trên GitHub và Roboflow Vũ trụ. Bạn có thể tải xuống toàn bộ tập dữ liệu từ GitHub hoặc chọn các bộ dữ liệu riêng lẻ trên Roboflow Vũ trụ sử dụng nút xuất.
Tôi nên bao gồm những gì khi trích dẫn Roboflow 100 tập dữ liệu trong nghiên cứu của tôi?
Khi sử dụng Roboflow 100 tập dữ liệu trong nghiên cứu của bạn, hãy đảm bảo trích dẫn chính xác. Dưới đây là trích dẫn được đề xuất:
Để biết thêm chi tiết, bạn có thể tham khảo bộ sưu tập tập dữ liệu toàn diện của chúng tôi.