Bỏ để qua phần nội dung

Roboflow 100 Tập dữ liệu

Roboflow 100, phát triển bởi Roboflow và được tài trợ bởi Intel, là một tiêu chuẩn phát hiện đối tượng đột phá. Nó bao gồm 100 bộ dữ liệu đa dạng được lấy mẫu từ hơn 90.000 bộ dữ liệu công khai. Điểm chuẩn này được thiết kế để kiểm tra khả năng thích ứng của các mô hình với các lĩnh vực khác nhau, bao gồm chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử.

Roboflow Tổng quan về 100

Các tính năng chính

  • Bao gồm 100 bộ dữ liệu trên bảy miền: Trên không, Trò chơi điện tử, Microscopic, Dưới nước, Tài liệu, Điện từ và Thế giới thực.
  • Điểm chuẩn bao gồm 224.714 hình ảnh trên 805 lớp, nhờ hơn 11.170 giờ nỗ lực dán nhãn.
  • Tất cả các hình ảnh được thay đổi kích thước thành 640x640 pixel, tập trung vào việc loại bỏ sự mơ hồ của lớp và lọc ra các lớp ít được trình bày.
  • Chú thích bao gồm các hộp giới hạn cho các đối tượng, làm cho nó phù hợp để đào tạo và đánh giá các mô hình phát hiện đối tượng.

Cấu trúc tập dữ liệu

Các Roboflow 100 tập dữ liệu được tổ chức thành bảy loại, mỗi loại có một bộ dữ liệu, hình ảnh và lớp riêng biệt:

  • Trên không: Bao gồm 7 bộ dữ liệu với tổng số 9.683 hình ảnh, bao gồm 24 lớp riêng biệt.
  • Trò chơi điện tử: Bao gồm 7 bộ dữ liệu, có 11.579 hình ảnh trên 88 lớp.
  • Kính hiển vi: Bao gồm 11 bộ dữ liệu với 13.378 hình ảnh, trải dài 28 lớp.
  • Dưới nước: Chứa 5 bộ dữ liệu, bao gồm 18.003 hình ảnh trong 39 lớp.
  • Tài liệu: Gồm 8 bộ dữ liệu với 24.813 hình ảnh, được chia thành 90 lớp.
  • Điện từ: Được tạo thành từ 12 bộ dữ liệu, tổng cộng 36.381 hình ảnh trong 41 lớp.
  • Thế giới thực: Danh mục lớn nhất với 50 bộ dữ liệu, cung cấp 110.615 hình ảnh trên 495 lớp.

Cấu trúc này cho phép một nền tảng thử nghiệm đa dạng và rộng rãi cho các mô hình phát hiện đối tượng, phản ánh các kịch bản ứng dụng trong thế giới thực.

Điểm chuẩn

Điểm chuẩn tập dữ liệu đánh giá hiệu suất mô hình máy học trên các bộ dữ liệu cụ thể bằng cách sử dụng các số liệu được tiêu chuẩn hóa như độ chính xác, độ chính xác trung bình trung bình và điểm F1.

Điểm chuẩn

Kết quả benchmark sẽ được lưu trữ trong "ultralytics-điểm chuẩn/evaluation.txt"

Ví dụ đo điểm chuẩn

import os
import shutil
from pathlib import Path

from ultralytics.utils.benchmarks import RF100Benchmark

# Initialize RF100Benchmark and set API key
benchmark = RF100Benchmark()
benchmark.set_key(api_key="YOUR_ROBOFLOW_API_KEY")

# Parse dataset and define file paths
names, cfg_yamls = benchmark.parse_dataset()
val_log_file = Path("ultralytics-benchmarks") / "validation.txt"
eval_log_file = Path("ultralytics-benchmarks") / "evaluation.txt"

# Run benchmarks on each dataset in RF100
for ind, path in enumerate(cfg_yamls):
    path = Path(path)
    if path.exists():
        # Fix YAML file and run training
        benchmark.fix_yaml(str(path))
        os.system(f"yolo detect train data={path} model=yolov8s.pt epochs=1 batch=16")

        # Run validation and evaluate
        os.system(f"yolo detect val data={path} model=runs/detect/train/weights/best.pt > {val_log_file} 2>&1")
        benchmark.evaluate(str(path), str(val_log_file), str(eval_log_file), ind)

        # Remove the 'runs' directory
        runs_dir = Path.cwd() / "runs"
        shutil.rmtree(runs_dir)
    else:
        print("YAML file path does not exist")
        continue

print("RF100 Benchmarking completed!")

Ứng dụng

Roboflow 100 là vô giá cho các ứng dụng khác nhau liên quan đến thị giác máy tính và học sâu. Các nhà nghiên cứu và kỹ sư có thể sử dụng điểm chuẩn này để:

  • Đánh giá hiệu suất của các mô hình phát hiện đối tượng trong bối cảnh đa miền.
  • Kiểm tra khả năng thích ứng của các mô hình với các tình huống trong thế giới thực ngoài nhận dạng đối tượng thông thường.
  • Đánh giá khả năng của các mô hình phát hiện đối tượng trên các bộ dữ liệu đa dạng, bao gồm cả các mô hình trong chăm sóc sức khỏe, hình ảnh trên không và trò chơi điện tử.

Để biết thêm ý tưởng và cảm hứng về các ứng dụng trong thế giới thực, hãy nhớ xem hướng dẫn của chúng tôi về các dự án trong thế giới thực.

Sử dụng

Các Roboflow Tập dữ liệu 100 có sẵn trên cả GitHubRoboflow Vũ trụ.

Bạn có thể truy cập nó trực tiếp từ Roboflow Kho lưu trữ 100 GitHub. Ngoài ra, trên Roboflow Vũ trụ, bạn có thể linh hoạt tải xuống các bộ dữ liệu riêng lẻ bằng cách chỉ cần nhấp vào nút xuất trong mỗi tập dữ liệu.

Dữ liệu mẫu và chú thích

Roboflow 100 consists of datasets with diverse images and videos captured from various angles and domains. Here's a look at examples of annotated images in the RF100 benchmark.

Dữ liệu mẫu và chú thích

Sự đa dạng trong Roboflow 100 điểm chuẩn có thể thấy ở trên là một tiến bộ đáng kể so với các điểm chuẩn truyền thống thường tập trung vào việc tối ưu hóa một số liệu duy nhất trong một miền hạn chế.

Trích dẫn và xác nhận

Nếu bạn sử dụng Roboflow 100 bộ dữ liệu trong công việc nghiên cứu hoặc phát triển của bạn, vui lòng trích dẫn bài báo sau:

@misc{2211.13523,
    Author = {Floriana Ciaglia and Francesco Saverio Zuppichini and Paul Guerrie and Mark McQuade and Jacob Solawetz},
    Title = {Roboflow 100: A Rich, Multi-Domain Object Detection Benchmark},
    Eprint = {arXiv:2211.13523},
}

Lời cảm ơn của chúng tôi dành cho Roboflow nhóm và tất cả những người đóng góp cho công việc khó khăn của họ trong việc tạo ra và duy trì Roboflow 100 tập dữ liệu.

Nếu bạn quan tâm đến việc khám phá nhiều bộ dữ liệu hơn để tăng cường các dự án phát hiện đối tượng và học máy, vui lòng truy cập bộ sưu tập dữ liệu toàn diện của chúng tôi.



Created 2024-02-07, Updated 2024-06-02
Authors: glenn-jocher (4), RizwanMunawar (2), abirami-vina (1)

Ý kiến